⑴ 中金公司:东数西算蓄势待发 AI芯片有望受益
“东数西算”工程全面启动,西部数据中心更加聚焦存储备份、离线处理等任务。该机构分析师认为AI超算中心聚焦训练任务,强算力、高功耗、弱延时的特性与西部枢纽的功能定位切合,叠加AI的国家战略地位,该机构分析师预计AI超算中心有望受益于“东数西算”。 作为其中的算力基础,云端AI芯片市场空间广阔,该机构分析师预计全球云端AI芯片2025年市场规模将达到261亿美元。
摘要
AI芯片是人工智能的算力基础,云边端AI芯片阶梯式满足AI推理与训练需求。 在AIoT提供海量数据、深度学习算法日益成熟的当下,AI芯片作为AI应用落地的算力基础,重要性日益凸显。该机构分析师看到:1)终端AI芯片追求以低功耗完成推理任务,以实际落地场景需求为导向,在能耗/算力/时延/成本等方面存在差异;2)边缘AI芯片介于终端与云端之间,承接低时延/高隐私要求/高网络带宽占用的推理或训练任务;3)云端AI芯片以高算力/完成训练任务为目标,包括CPU/GPU/FPGA/ASIC等多种类型。该机构分析师认为,云端训练任务与西部枢纽的定位契合,云端AI芯片有望受益“东数西算”。
传统通用芯片CPU/GPU/FPGA部分适配AI需要,GPU凭借高算力成为主流选择。 传统CPU遵循串行的执行方式,运算单元占比小,各厂商尝试提高频率/增加计算单元/增加核数以提升算力,但受制于成本/功耗/技术难度,仍未出现适配AI要求的主流CPU产品。GPU运算单元占比高,适合并行处理大规模数据,虽然功耗及成本仍较高,但高算力适配深度学习等算法的数据处理需求,叠加成熟生态CUDA,GPU成为云端AI芯片的主流选择。此外,FPGA由于可编程而更具灵活性,相比于CPU/GPU/ASIC分别在算力/功耗/成本(小规模)上更具优势,该机构分析师认为在芯片需求未成规模、AI算法持续迭代的背景下,FPGA凭借可重构特性成为最佳选择之一。
在AI云端算力需求的推动下,ASIC/DPU等专用芯片应运而生。 由于ASIC为专用芯片,在研发成本、灵活性上所有欠缺,但其在特定使用场景下高算力/低功耗/小面积的优势仍吸引国内外厂商积极布局,如TPU、类脑芯片等。该机构分析师认为,AI渗透率的提升及RISC-V开源指令集的发展有望推动ASIC单位芯片成本的降低,形成“规模效应-成本下降-应用规模提升”的良性循环,有望成为未来的主流选择。DPU则通过卸载CPU网络传输、数据安全、存储加速等功能,优化数据中心的基础层运算任务,将CPU的算力释放至上层应用,在数据中心层面实现算力提升。该机构分析师认为,DPU有望与CPU、GPU三足鼎立,成为数据中心的核心算力支撑。
⑵ 进行异构计算时,GPU,FPGA,CPU,DSP这些平台各有什么特点如何选择
gpu的专业是图形处理,是只能进行浮点运算的处理器,浮点性能很顷侍高,fpga的优势可仔扮编程,就是可以进行硬件念乎灶的改动,但是性能低下,多用于嵌入式执行一些专用的低负载简单任务。cpu的通用处理器,可以进行整数浮点运算,但是浮点性能不如gpu,dsp类似于gpu,都是专攻浮点运算的,只不过dsp是用于影音的多媒体,浮点性能在晶圆规模与gpu差不多下性能差不多。
⑶ 为什么使用 fpga,相比 cpu,gpu,asic有什么特点
对比传统CPU、GPU、ASIC芯片,FPGA具有高性能、低消耗和灵活性等特点,具有广泛的应用市场。
与CPU/GPU相比,单位功耗性能和计算耗时均成量级提升,同时可实现出色的I/0集成。
1. FPGA、CPU、GUP对计算密集型和通信密集型任务耗时的比较
ASIC芯片设计成本随着制程提升呈指数级上升
⑷ 详解人工智能芯片CPU/GPU/FPGA有何差异
第一、IBM与全球第一大FPGA厂商Xilinx合作,主攻大数据和云计算方向,这引起Intel的巨大担忧。
Intel已经在移动处理器落后,大数据和云计算领域不能再落后。
第二、FPGA在云计算、大数据领域将深入应用。
Intel此次与Altera合作,将开放Intel处理器的内部接口,形成CPU+FPGA的组合模式。
其中FPGA用于整形计算,cpu进行浮点计算和调度,此组合的拥有更高的单位功耗性能和更低的时延。
第三、IC设计和流片成本。
随着半导体制程指数增长,FPGA在物联网领域将替代高价值、批量相对较小(5万片以下)、多通道计算的专用设备替代ASIC。
同时,FPGA开发周期比ASIC短50%,可以用来快速抢占市场。
⑸ 详解人工智能芯片 CPU/GPU/FPGA有何差异
GPU与CPU的区别:CPU的内核比较少(单核、双核、四核、八核等等),比较复杂,功能强大;GPU的内核比较多(好几百甚至上千个),但比较简单,功能单一,适合于进行像素级并行图形处理。虽然GPU最初是为图形处理而设计的,但由于它具有并行处理特性,现在已经将其应用到众多的需要并行处理的非图形领域了。例如DNA 排序、物理建模、消费者行为预测、GPU云服务器等等。
GPU与深度学习的关系:原本深度学习与图形无关,当然也与图形处理器GPU无关。深度学习需要大量的训练,训练算法并不复杂,但数据量大。如果用CPU进行训练,CPU的内核少,训练时间就长;而GPU的多内核优势在此时就发挥出来了。因此,玩深度学习的人,在进行训练时,就借用GPU的多内核、并行处理的优势,将GPU用到了非图形领域。
FPGA也有并行处理优势,也可以设计成具有多内核特点的硬件。所以,目前深度学习就存在采用GPU和FPGA这两大类硬件的现状。
⑹ 人工智能算力是什么意思
人工智能算力是指处理人工智能任务所需要的计算能力。随着人工智能的快速发展,越来越多的应用需要更强大的算力来支持。在过去,由于计算能力的限制,很多人工智能应用都只存在于理论层面。但是,随着计算能力的提升,人工智能应用的落地变得越来越容易。
目前,人工智能算力的主要来源是GPU、CPU和FPGA。GPU是目前最流行的人工智能算力来源之一,因为它们能够处理大量的并行计算。CPU也被广泛应用于人工智能算力中,因为它们能够提供更高的时钟速度和更广泛的软件支持。FPGA是一种可编银纳程逻辑芯片,可以快速适应各种计算任务,并提供更高的能效比。
除了硬件,人工智能算力还涉及到许多软件和算法方面的问题。例唯没如,深度学习需要大量的数据来训练模型,这就需要强大的数据处理能力。另外,一些特定的人工智能算法需要特殊的软件和算法支持,例如自然语言处理和计指搏纳算机视觉等。
在未来,人工智能算力将继续发挥着越来越重要的作用。随着人工智能应用的不断增长,对更强大的算力需求也会不断增加。因此,未来的人工智能算力将继续向更加高效和可扩展的方向发展。同时,随着人工智能技术的普及,越来越多的人将会参与到人工智能算力的开发中。
⑺ 从计算机硬件设计的角度分析如何提供更为丰富的算力
自上世纪90年代互联网技术诞生以来,移动互联网、云计算、大数据、人工智能等新一代信息技术的不断发展和逐步成熟,并日益深入的渗透到经济社会的各个领域,2020年全球范围内爆发的新冠疫情又进一步加速了这一趋势,数字经济已经成为世界经济发展的新阶段,即世界经济发展已经进入数字经济时代。
党中央、国务院和各级政府高度重视数字经济的发展。从2015年《中国制造2025》、《促进大数据发展行动纲要》等政策出台以来,中央和各级地方陆续以推出系列数字经济发展的措施,并支持雄安新区、浙江、福建等六个地区建设国家数字经济创新发展试验区,支持北京、上海、深圳、西安等地建设国家新一代人工智能创新发展试验区。2020年国家进一步提出加强新型基础设施建设,并明确将数据作为一种新型生产要素写入政策文件,这些将为数字经济的发展奠定更加坚实的基础。
农业经济时代,土地、水源和工具是关键资源。工业经济时代,能源、原材料、机器设备和生产工艺等是关键资源。那数字经济时代的关键资源是什么呢?数字经济时代的关键资源是数据、算力和算法。数据是数字经济时代的原材料,各种经济活动中都在源源不断的产生的数据,越来越多的组织也将数据当作一种资产,在政策层面数据已经成为一种新型生产要素。算力相当于数字经济时代的机器设备和生产力,面向各种场景的数据产品或应用都离不开算力的加工和计算,而且对算力的需求和要求也越来越高。算法是数字经济时代的生产工艺,面向图像、语音、自然语言处理等不同的应用场景和领域的算法也层出不穷,算法的提升和改进可以提高算力的效率和更多的挖掘数据价值。
本文重点分析算力方面内容,介绍算力市场总体情况,当前算力发展的特点和趋势,以及重点算力供应方式等。
一、算力需求快速增长,算力投资具有多重经济价值
算力即计算能力,核心是CPU、GPU、NPU、MCU等各类芯片,具体由计算机、服务器、高性能计算集群和各类智能终端等承载。数字经济时代,数据的爆炸式增长,算法的复杂程度不断提高,对算力需求越来越高。算力是数字经济发展的基础设施和核心生产力,对经济发展具有重要作用,根据IDC与浪潮联合发布的《2020全球计算力指数评估报告》,计算力指数平均每提高1点,数字经济和GDP将分别增长3.3‰和1.8‰。
随着数字经济的不断发展,人工智能、物联网、区块链、AR/VR 等数字经济的关键领域对算力的需求也将呈爆炸式增长。根据华为发布的《泛在算力:智能社会的基石》报告,预计到2030年人工智能、物联网、区块链、AR/VR 等总共对算力的需求将达到3.39万EFLOPS,并且将共同对算力形成随时、随地、随需、随形 (Anytime、Anywhere、AnyCapacity、Any Object) 的能力要求,其中人工智能算力将超过1.6万EFLOPS,接近整体算力需求的一半。OpenAI开发的GPT-3模型涉及1750亿个参数,对算力的需求达到3640PFLOPS,目前国内也有研究团队在跟进中文GPT-3模型的研究。
算力投资具有多重经济价值,不仅直接带动服务器行业及上游芯片、电子等行业的发展,而且算力价值的发挥将带动各行业转型升级和效率提升等,带来更大的间接经济价值。根据《泛在算力:智能社会的基石》报告,每投入1美元算力即可以带动芯片、服务器、数据中心、智能终端、高速网络等领域约4.7美元的直接产业产值增长;在传统工厂改造为智能化工厂的场景下,每1美元的算力投入,可以带动10美元的相关产值提升。
二、算力发展的特点及趋势
随着数据规模的增加和算法复杂度的提升,以及应用多样性的不断丰富,对算力提出的要求也越来越高,当前算力发展呈现出三方面的特点,一是多种架构百花齐放的状态,二是中心化的算力与边缘终端算力快速发展,三是专用算力日渐成势。
近年来多种算力架构并存并快速发展。曾经x86架构的算力占绝对优势,英特尔和AMD基本垄断了X86算力架构市场,海光信息通过跟AMD合作获得x86架构的授权;如今基于ARM架构的算力份额不断扩大,特别是在移动端ARM架构算力成为主流,华为海思等主要产品是基于ARM架构,另外天津飞腾的产品也是基于ARM架构。随着人工智能等算力需求的不断增加,GPU算力的需求不断增加,英伟达在GPU算力市场占有绝对优势,AMD也分了一杯羹,叠加比特币挖矿算力需求,导致市场上GPU卡供不应求。近几年国内也出现几个GPU方面的创业团队,如寒武纪、登临科技、燧原科技等。此外,Risc-V、存算一体化架构、类脑架构等算力也不断涌现,不过这些算力刚刚起步,在应用生态等方面还需要一定较长的培育过程。
中心化算力和边缘终端算力快速发展。随着7nm制程日渐成熟,基于7nm制程的CPU、GPU等算力性能得到极大提升,目前7nm制程算力主要是中心化算力,移动端智能手机的处理器算力部分也已经采用7nm制程。台积电的7nm制程已经实现规模化,并开始攻关3nm工艺制程;中芯国际7nm工艺制程仍在技术攻关当中。随着5G及物联网应用的不断增加,边缘终端算力的需求日益增加,特别是自动驾驶、智慧安防、智慧城市等领域算力需求。地平线自动驾驶芯片已经量产,英伟达jetson产品在嵌入式终端产品应用广泛,其他针对特定领域专用边缘终端芯片创业公司层出不穷。
针对图像、语音等特定领域的专用算力日渐成势。一方面是芯片工艺制程越来越逼近摩尔定律的极限,另一方面是物联网智能终端对功耗的要求等,针对特定领域的专用芯片层出不穷,并且越来越多的巨头参与其中。谷歌的TPU专为机器学习定制的算力,阿里平头哥的含光NPU专为神经网络定制的算力,赛灵思的FPGA算力,网络研发针对语音领域的鸿鹄芯片以及云知声、思必驰、探境科技等也推出智能语音相关的芯片,北京君正、云天励飞、依图科技和芯原微电子等推出针对视觉和视频处理相关的专用芯片。
三、算力供应以公有云和自建算力为主,多种方式相补充
当前的算力供给主要包括公有云、超算中心、自建算力、地方算力中心等方式。其中,公有云和自建算力中心是算力的主要来源方式,超算中心及地方算力中心等多种方式相互补充。
规模化的算力供应通常通过数据中来承载,新建数据中心的不断增加,将带动未来算力资源的供应不断扩大。据中国电子信息产业发展研究院统计数据,2019年中国数据中心数量大约为7.4万个,大约能占全球数据中心总量的23%,其中大型数据中心占比12.7%;在用数据中心机架规模达到265.8万架,同比增长28.7%;在建数据中心机架规模约185万架,同比增加约43万架。2020年国家大力支持“新基建”建设以来,数据中心作为“新基建”的重要内容,京津冀、长三角和珠三角等算力需求地区,以及中西部能源资源集中的区域,如内蒙、山西等,均在推进新的大中型数据中心的建设。
公有云以其稳定和易用等特点,成为许多企业特别是中小企业的算力首选方式。据不完全统计,阿里云服务器总数接近200万台,腾讯云服务器总数超过110万台,华为云、网络云、京东云、AWS等云厂商服务器总数未找到确切数据,保守估计各类云厂商服务器总数之和也超过500万台。而且在国家宣布大力支持“新基建”建设之后,腾讯宣布未来五年将投资5000亿元用于云计算、数据中心等新基建项目的进一步布局,阿里云宣布未来三年阿里将投2000亿元用于面向未来的数据中心建设及重大核心技术研发攻坚,网络宣布预计到2030年网络智能云服务器台数将超过500万台。各大云厂商仍在继续加大算力投入,公有云算力供应将会更加充裕。
自建算力以其安全性和自主性等特点,成为政府、大企业及其他关注安全的组织的算力首选方式。政府、银行及高校和央企等,通常通过自建或租赁数据中心的方式自建算力,满足自身各项业务的算力需求。许多互联网公司在刚开始时选择使用公有云服务,但规模发展到一定程度时通常都会开始自建或租赁数据中心的方式自建算力。其他有部分各种类型的企业,出于安全、商业机密和隐私等方面的考虑,不意愿把数据和业务等放到阿里云等公有云上,往往选择托管服务器的方式自建算力,规模更小企业直接就在本地使用。2020年6月快手宣布投资100亿元自建数据中心,计划部署30万台服务器,字节跳动等大型互联网公司都在不断加大数据中心的建设。
超算中心和地方算力中心作为算力供应有效的补充方式,适合于大规模计算需求的应用领域。截至2020年,科技部批准建立的国家超级计算中心共有八所,分别是国家超级计算天津中心、广州中心、深圳中心、长沙中心、济南中心、无锡中心、郑州中心和昆山中心。超算中心主要的算力资源以CPU为主,新建的超算中心及更新升级过程中超算中心逐步增加了异构GPU算力资源。超算中心较好的满足和弥补了高校科研中算力资源的需求,特别是在工业仿真、生物信息、新材料、气象、海洋等科学计算领域。国内主要省市地区基本都投资建设了当地算力中心,重点服务本地科研和产业发展的需求,如太原、苏州、福建等地,目前通常地方算力中心的规模并不大,计算节点数在200-500之间居多,主要服务于当地气象、工业仿真和生物信息等领域计算需求。此外,2020年以来,武汉、南京、珠海、许昌等地区正在建设人工智能计算中心,将在一定程度上弥补当前规模化AI算力不足的情况。
结语
算力作为数字经济的基础设施,也是数字经济时代的生产力和引擎,越来越成为数字经济时代国家竞争力的体现。根据IDC与浪潮联合发布的《2020全球计算力指数评估报告》,中国和美国的算力建设在全球处于领先地位,美国的算力无论在规模、效率、应用水平等方面都领先于中国。此外,从算力芯片供应角度看,美国的英特尔、AMD、英伟达等企业几乎占了全球的绝大部分的市场份额。可见,中国在算力建设和发展仍然需要加大投入和加强研发等,发挥优势的同时弥补不足,从而为数字经济长期发展奠定更加坚实的基础。
⑻ 给人工智能提供算力的芯片有哪些类型
给人工智能提供算力的芯片类型有gpu、fpga和ASIC等。
GPU,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器,与CU类似,只不过GPU是专为执行复杂的数学和几何计算而设计的,这些计算是图形渲染所必需的。
FPGA能完成任何数字器件的功能的芯片,甚至是高性能CPU都可以用FPGA来实现。 Intel在2015年以161亿美元收购了FPGA龙 Alter头,其目的之一也是看中FPGA的专用计算能力在未来人工智能领域的发展。
ASIC是指应特定用户要求或特定电子系统的需要而设计、制造的集成电路。严格意义上来讲,ASIC是一种专用芯片,与传统的通用芯片有一定的差异。是为了某种特定的需求而专门定制的芯片。谷歌最近曝光的专用于人工智能深度学习计算的TPU其实也是一款ASIC。
(8)cpugpufpga算力计算扩展阅读:
芯片又叫集成电路,按照功能不同可分为很多种,有负责电源电压输出控制的,有负责音频视频处理的,还有负责复杂运算处理的。算法必须借助芯片才能够运行,而由于各个芯片在不同场景的计算能力不同,算法的处理速度、能耗也就不同在人工智能市场高速发展的今天,人们都在寻找更能让深度学习算法更快速、更低能耗执行的芯片。
⑼ 简述cpu、gpu、fpga和asic四种人工智能芯片的性能
FPGA(Field Programmable Gate Array,现场可编程门阵列)具有足够的计算能力和足够的灵活性。FPGA的计算速度快是源于它本质上是无指令、无需共享内存的体系结构。对于保存状态的需求,FPGA中的寄存器和片上内存(BRAM)是属于各自的控制逻辑的,无需不必要的仲裁和缓存,因此FPGA在运算速度足够快,优于GPU。同时FPGA也是一种半定制的硬件,通过编程可定义其中的单元配置和链接架构进行计算,因此具有较强的灵活性。相对于GPU,FPGA能管理能运算,但是相对开发周期长,复杂算法开发难度大。
ASIC(Application Specific Integrated Circuit特定用途集成电路)根据产品的需求进行特定设计和制造的集成电路,能够在特定功能上进行强化,具有更高的处理速度和更低的能耗。缺点是研发成本高,前期研发投入周期长,且由于是定制化,可复制性一般,因此只有用量足够大时才能够分摊前期投入,降低成本。
CPU:
中央处理器作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元,CPU 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制调配、执行通用运算的核心硬件单元。
优点:CPU有大量的缓存和复杂的逻辑控制单元,非常擅长逻辑控制、串行的运算
缺点:不擅长复杂算法运算和处理并行重复的操作。
对于AI芯片来说,算力最弱的是cpu。虽然cpu主频最高,但是单颗也就8核,16核的样子,一个核3.5g,16核也就56g,再考虑指令周期,每秒最多也就30g次乘法。还是定点的。
生产厂商:intel、AMD
现在设计师最需要的就是GPUCPU,呆猫桌面云可以享受高GPUCPU的待遇。
GPU:
图形处理器,又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。
优点:提供了多核并行计算的基础结构,且核心数非常多,可以支撑大量数据的并行计算,拥有更高的浮点运算能力。
缺点:管理控制能力(最弱),功耗(最高)。
生产厂商:AMD、NVIDIA
⑽ 算力涵盖gpu+cpu+fpga和各种各样的asic专用芯片吗
是的,算力可以涵盖 GPU、CPU、FPGA 以及各种各样的 ASIC 专用芯片。
GPU(图形处理单元)是一种专门用于处理图形和视频的芯片,常用于游戏、视频编辑、人工智能等领域。
CPU(中央处理器)是计算机的核心处理器,负责执行计算机程序中的指令。
FPGA(可编程逻辑门阵列)是一种可以在硬件层面上实现各种逻辑功能的芯片,在机器学习、通信、计算机视觉等领域有广泛应用。
ASIC(专用集成电路)是为特定应用而设计的集成电路,具有高度专业化、高效率、低成本的优势。在区块链、密码学等领域有广泛应用。
总的来说,算力可以涵盖各种计算资源,包括 CPU、GPU、FPGA 和 ASIC 等,用于处理各种不同的计算任务。