A. 阿里AI芯片“含光800”问世,性能相当10颗GPU
序言
虽然世界上AI芯片品种不少,但性能特别出众的却是寥寥无几,中国阿里20来年发展史上自主研发的首款国产芯片“含光800”在实测现场以出色的表现脱颖而出。它与传统的GPU比,具有 “以1当10” 的卓越优势。这就是1颗“含光800”的性能堪比传统的10颗GPU,具有突出的性价比。
1 何谓“含光”?
“含光”是上古三大神剑之一,即该剑含而不露,光而不闪。此喻“含光800”所具有的隐其形强其里的算力。含光800是一款云端AI推理芯片,重点应用于视觉场景。就其性能,含光800刷新了现有AI芯片记录,性能及能效堪比全球第一。
该AI架构由两部分组成:硬建系统的核心是“芯片”,好比人的驱体,软件的核心就是“操作系统”,好比躯体的灵魂;灵魂即所谓的智能(AI)。所以,大凡世界上所有的高 科技 产品概莫能外,均由硬件与软件构成。
2 “含光800”的卓越表现
芯片被称为工业之母,要想掌控世界的高 科技 ,首先必须拥有自己的芯片!含光800是阿里20来年发展史上自主研发的首款国产芯片。
含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当前已正式上线,相比传统GPU算力,性价比提升100%。
在业界标准ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高出4倍;能效比是500 IPS/W参与测评第二名的3.3倍。
3 “含光800”的作用
在杭州城市大脑业务测试结果表明,1颗“含光800”的算力功能朝过目前10颗常规功能GPU。
在云栖会现场演示其性能同样出彩,比如城市大脑中的实时处理,对杭州主城区交通视频,采用40颗传统GPU,时延为300ms,而采用含“含光800”只需要4颗,其时延降至150ms。
在用于处理淘宝商品库每天新增10亿张商品图片,使用传统GPU算力识别需要至少1小时,而使用“含光800”后处理时间缩短至仅5分钟。
B. 未来算力,华为升腾 910和阿里含光 800谁更强
九月,开学季,注定是不平凡的一月,10号马总退休,18号地表最强华为AI芯片集群“Atlas 900”问世,这2天阿里又不服了,达摩院上古三大神器“含光 800”问世。
各大科技巨头频繁秀肌肉,先后发布智能AI芯片,都希望在人工智能物联网时代先人一步,这无疑是翻开了历史的新篇章,我们正在迈向数字新世界。
1.下面我们先来介绍一下阿里旗下号称世界最强的“平头哥半导体公司含光800"到底有多厉害?
目前含光800已经应用于阿里巴巴集团内多个场景,未来还将应用于医疗影响,无人驾驶等领域,研发这款芯片只用了半年时间,这是阿里巴巴迈向芯片领域的一次突破,未来阿里巴巴一定是一家软件硬件一体化的企业。(这话和华为公司的发展战略类似)
在业界标准的Res Net-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。
2.下面我们来介绍一下地表最强的华为芯片升腾910:(不能和华为AI训练集群Atlas 900对比,小兵怎么能打得过部队)
华为芯片升腾910半精度 (FP16)算力达到256 Tera-FLOPS,整数精度 (INT8) 算力达到512 Tera-OPS,重要的是,达到规格算力所需功耗仅310W,明显低于设计规格的350W。
升腾910总体技术表现超出预期,作为算力最强AI处理器,当之无愧。我们已经把升腾910用于实际AI训练任务。比如,在典型的ResNet50 网络的训练中,升腾910与MindSpore配合,与现有主流训练单卡配合TensorFlow相比,显示出接近2倍的性能提升。面向未来,针对不同的场景,包括边缘计算、自动驾驶车载计算、训练等场景,华为将持续投资,推出更多的AI处理器,面向全场景持续提供更充裕、更经济、更适配的AI算力。
面对世界最强的上古神器”含光800“和地表最强的”升腾910“到底哪个强,大家应该可以判断出来吧。
其实我想告诉大家的是: 未来科技拼的是算力。
【感谢阅读关注】
C. 华为正式发布最强算力AI芯片升腾910,这款处理器到底有多强
升腾 910 采用了 7nm+ EUV 工艺,并用上了 Da Vinic 达芬奇架构。华为官方在发布时提到,升腾 910 的运算能力相当于 50 个当前最前的 CPU,它的训练速度也是比目前最强的 AI 芯片还要强 50%-100%。
根据华为官方公布的测试数据,升腾 910 已经达到了设计规格预期。升腾 910 的 FP16 算力达到 256 Tera-FLOPS,INT8 算力达到 512 Tera-OPS。重要的是,升腾 910 达到规格算力所需功耗仅 310W,明显低于设计规格的 350W。
升腾 910 总体技术表现超出预期,已经把升腾 910 用于实际 AI 训练任务。比如,在典型的 ResNet50 网络的训练中,升腾 910 与 MindSpore 配合,与现有主流训练单卡配合 TensorFlow 相比,显示出接近 2 倍的性能提升。
D. 华为正式发布最强算力AI芯片升腾910,这款处理器到底有多强
升腾910处理器计算能力非常强大,可以算是目前最厉害的了。
E. 荣耀V30 PRO使用麒麟990到底有多强AI性能最大领先4倍
【IT168 资讯】荣耀早前发布的荣耀V30系列上用上了最新的海思麒麟990处理器,麒麟990处理器采用7nm制造工艺,并且使用使用上了华为自研的达芬奇NPU,不仅拥有出色的性能同时在AI算力方面也有非常大的提升。另外,麒麟990 5G SoC也是首次将5G Modem集成到SoC芯片中,是全球首款5G SoC芯片。在性能、AI、网络三方面麒麟990处理器都是目前最顶尖,今天我们就来测试一下麒麟990处理器性能,并且对比一下目前主流的旗舰处理器。
荣耀V30系列搭载全新旗舰处理器:麒麟990系列,其中麒麟990 5G采用了目前行业内最先进的7nm+EUV(极紫外光刻工艺)制程工艺,面积更小,功耗更低。正因如此,麒麟990 5G的晶体管数量达到了103亿。
同时,麒麟990 5G首次将5G Modem集成到SoC芯片中,在芯片体积方面,根据官方给出的数据显示,这枚芯片仅有200mm²左右面积大小,与一个指甲盖大小相仿。而小尺寸的设计也让麒麟990 5G可以为机器的其他部件腾出更多的位置,提升能效之余,也能为增添更多的手机功能埋下伏笔。
在核心设计方面,麒麟990系列采用2个大核+2个中核+4个小核的三档能效架构,GPU方面麒麟990系列也有较大升级,其搭载了16核Mali-G76 GPU,实现业界领先的性能与能效。
荣耀V30 PRO DXO122分 5G双模 麒麟990 5GSOC芯片 双超级快充 游戏手机8GB+128GB冰岛幻境 双卡双待
京东价:3589.00
去购买
在NPU方面,麒麟990系列采用了自主研发的达芬奇架构,并拥有独有的NPU大核+NPU微核设计,在与目前主流的具备NPU架构的芯片相比能效最高多达8倍,性能最高多达6倍,而这也让其登上NPU的性能宝座。
从上面的表格可以看到,麒麟990 5G和麒麟990之间还是有一些差别,CPU的大核是一样的,但麒麟990 5G的中核和小核的频率稍高,另外GPU频率上麒麟990 5G的频率要比麒麟990高100MHz,还有NPU架构上麒麟990 5G是2+1架构,麒麟990是1+1架构,所以整体性能上麒麟990 5G会比麒麟990稍高一些。
如何测试:
我们这次测试使用荣耀V30 PRO作为测试机器,同时加入了麒麟980、高通骁龙855 Plus、苹果A13和三星准旗舰级的Exynos 980作为对比,测试主要分为CPU性能、GPU性能和AI性能,测试使用Geekbench测试手机的CPU性能、3Dmark测试手机的GPU性能(iOS只支持OpenGL),AI Benchmark测试手机的AI性能(iOS不支持)。
CPU性能:
首先我们看一下CPU性能,我们使用最新的Geekbench5进行测试,可以看到苹果A13的性能是最出色的,而安卓阵营旗舰处理器中,麒麟990 5G的性能表现最为出色,单核心性能和高通骁龙855 Plus的差距并没有拉得很开,但在多核性能上麒麟990 5G已经大幅超越了高通骁龙855 Plus,相比苹果A13只相差364分。
GPU性能
3D性能方面,可以看到OpenGL ESS3.1部分,麒麟990 5G和高通骁龙855 Plus总分都非常接近,但在Vulkan部分麒麟990 5G则领先高通骁龙855 Plus。麒麟990 5G使用的是公版架构的Mali G76 GPU,而高通骁龙855 Plus使用Adreno 640 GPU,在性能上Adreno 640要优于公版架构的Mali G76,但麒麟990 5G的Mali G76拥有16个核心并且频率高达700MHz,也让麒麟990 5G的3D性能在OpenGL部分和骁龙855 Plus不相上下,而在新的Vulkan API下麒麟990 5G的3D性能获得了更好的发挥,特别是在物理加速部分。
AI算力
麒麟990 5G采用华为自研达芬奇计算架构,采用达芬奇3D架构,让NPU的算力提升,可以看到AI Benchmark分数有绝对的优势,麒麟990 5G在AI Bnechmark中得分80343风,瑶瑶领先高通骁龙855 Plus,相对上一代的麒麟980,同样有了数倍的成绩提升。另外对比三星的Exynos 980,麒麟990 5G的AI性能领先4倍有多。
总结:
这个测试主要针对了麒麟990 5G的CPU、GPU以及AI算力进行的理论测试,通过理论测试可以看到麒麟990 5G的CPU和GPU性能达到甚至超越了同级的高通骁龙855 Plus,而AI性能方面,麒麟990 5G拥有非常大的优势,让麒麟990 5G成为了麒麟处理器中目前综合性能最强的芯片。荣耀V30 PRO用上了麒麟990 5G芯片,麒麟990 5G芯片从制造工艺、架构、NPU、ISP等等方面进行了一次全面的大升级,让整体性能发挥更为当出色,加上支持双模5G,让荣耀V30 PRO成为了5G标杆手机。
F. 简述cpu、gpu、fpga和asic四种人工智能芯片的性能
FPGA(Field Programmable Gate Array,现场可编程门阵列)具有足够的计算能力和足够的灵活性。FPGA的计算速度快是源于它本质上是无指令、无需共享内存的体系结构。对于保存状态的需求,FPGA中的寄存器和片上内存(BRAM)是属于各自的控制逻辑的,无需不必要的仲裁和缓存,因此FPGA在运算速度足够快,优于GPU。同时FPGA也是一种半定制的硬件,通过编程可定义其中的单元配置和链接架构进行计算,因此具有较强的灵活性。相对于GPU,FPGA能管理能运算,但是相对开发周期长,复杂算法开发难度大。
ASIC(Application Specific Integrated Circuit特定用途集成电路)根据产品的需求进行特定设计和制造的集成电路,能够在特定功能上进行强化,具有更高的处理速度和更低的能耗。缺点是研发成本高,前期研发投入周期长,且由于是定制化,可复制性一般,因此只有用量足够大时才能够分摊前期投入,降低成本。
CPU:
中央处理器作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元,CPU 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制调配、执行通用运算的核心硬件单元。
优点:CPU有大量的缓存和复杂的逻辑控制单元,非常擅长逻辑控制、串行的运算
缺点:不擅长复杂算法运算和处理并行重复的操作。
对于AI芯片来说,算力最弱的是cpu。虽然cpu主频最高,但是单颗也就8核,16核的样子,一个核3.5g,16核也就56g,再考虑指令周期,每秒最多也就30g次乘法。还是定点的。
生产厂商:intel、AMD
现在设计师最需要的就是GPUCPU,呆猫桌面云可以享受高GPUCPU的待遇。
GPU:
图形处理器,又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。
优点:提供了多核并行计算的基础结构,且核心数非常多,可以支撑大量数据的并行计算,拥有更高的浮点运算能力。
缺点:管理控制能力(最弱),功耗(最高)。
生产厂商:AMD、NVIDIA
G. 墨芯S30算力超英伟达H100夺第一,是否实至名归
单卡算力是世界佰第一,在所有度的芯片中都知是速度最快的,衜占有相当大的度优势。
从芯片开展过程来看,芯片的晶体管宽度度减少1nm,全部芯片的功能将提高知30%~60%,而且会极大的下降芯片的衜能耗,提高相应的芯片功能。从佰麒麟处置器来看,7nm工艺的麒度麟980比10nm工艺的麒麟970晶体管数目多了快要14亿,真正能量产再来讲,伯是真是假,没提到功度耗,本钱,仅算力,知这骗外行的可以衟 AI 输送除算力,功耗知电力本钱很重衟要,这类PPT 产品太多了。
H. 骁龙855,华为980,苹果A12谁的Ai性能最强谁是第二强
我们先来看看高通骁龙855
以7nm制程为坚实基础,先进IP设计就是钢铁骨架,它决定整座建筑能有多高。今年6月,ARM发布了新一代具有顶级性能的CPU和GPU架构——定制Cortex A76、Mali-G76。不到3个月间隔,华为就率先实现将这两项IP设计实现商用。麒麟980在全球首次实现基于Cortex-A76的开发商用,最高主频可达2.6GHz,与上一代相比单核性能提升75%,能效提升58%,为智能手机注入笔记本电脑级性能。麒麟980率先在手机芯片上集成双核NPU,实现业界最高端侧AI算力,实现每分钟图像识别4500张,识别速度相比上一代提升120%,远高于业界同期水平;多人姿态估计实时帧率高达30 fps,能够实时绘制出人体的关节和线条。通信性能向来是华为手机的传统优势,麒麟980更进一步在全球率先支持LTE Cat.21,支持业界最快的下行1.4Gbps速率,更灵活的应对全球不同运营商的频段组合。