『壹』 行至XPU平台节点 半导体三雄必有一战
英特尔这几年估计心很累。
除了PC销量下滑、工艺进展迟滞,当英伟达股价上涨、新型AI处理器问世、AMD收购赛灵思、苹果发布新芯片……英特尔每每都要被拖出来吊打一次。
是廉颇老矣?还是大象善舞本来就不容易?
从英特尔现在的业务情况来看,传统PC业务已经从原来的八成下降到现在的五成,而数据中心则一路上扬,营收从原来的二成增长到了五成。或许老牌 科技 企业都逃不开波峰低谷的发展周期,于是转型就成为必然。
从2017年开始,英特尔就宣称自己是一家数据公司,因为“数据才是未来的石油”。2018年底,英特尔宣布最新战略目标,即以制程和封装、XPU架构、内存和存储、互连、安全、软件六大技术支柱为核心,明确了“以PC为中心”转向“以数据为中心”的转型目标。
而就在昨晚,英特尔正式发布其首款数据中心独立图形显卡——服务器GPU,以及oneAPI Gold工具包。这也意味着,英特尔六大战略中的XPU架构(XPU架构中的“X”指的是包含 CPU、GPU、专用加速器以及FPGA 的混合架构)集齐最后一条“神龙”;软件方面,one API Gold继Beta版本发布一年后,也完成了阶段性的跃升。软硬件共同发力,英特尔卯足力气搅动数据中心本来就不平静的池水。
局势已经非常明朗,英特尔、英伟达、AMD都在打造自家的XPU架构,通过收购也好、自研也罢,在硬件架构和软件工具上的布局都是一副当仁不让的态势。
英特尔加速计算20年坎坷路
英特尔不是没有过独立显卡GPU的尝试,只不过是20年前。2009年末,英特尔宣布取消“Larrabee”图形芯片项目,将重注都押在多核的技术路径上。
彼时,英伟达已经推出Tesla,大举进攻。AMD也在2006年收购了ATI后正式进入显卡领域,虽然在CPU和GPU面临着英特尔和英伟达的双重夹击,却也是成就今天三足鼎立局面的关键一步。
英特尔在集成显卡这条路的经济账没毛病。将图像处理的部分整合到CPU中,这样一来核心显卡始终是和CPU一体的,必要时还是需要调用部分CPU的运算能力来提高图像处理效率。当性能需要提升时怎么办?增加核显,还可以提高处理器价格,间接增加利润。或许正因如此,英特尔没有太大动力去开发独显GPU,在宣布取消Larrabee项目时,信誓旦旦表示不会推出独立显卡GPU,至少短期内不会。
被停掉的Larrabee后来成为了至强融核(Xeon Phi)协处理器的原型,这是英特尔首款集成众核(Many Integrated Core,MIC)架构的产品,用作高性能计算的超级计算机或服务器的加速卡,顺应了高性能计算市场的异构需求。Xeon Phi也一度被用到超级计算机上,雄霸世界超算榜单,例如我国的天河一号、天河二号,直到2015年4月被美国禁止向中国超算中心出口Xeon Phi。
受市场需求颓势的主要影响,2018年开始,代号为Knight Landing的Xeon Phi 7210、7230等产品列入停产计划;去年,代号为Knight Mill的Xeon Phi处理器也启动停产计划,并宣布将在今年7月31日停止出货。
而就在英特尔在加速计算曲折前进的这些年,英伟达GPU一骑绝尘,AMD也在CPU和GPU双线开花。虽说船大不好调头,但作为巨头,必要时确实要勇于自我piapia打脸。
2017年末,原AMD RTG总裁、显卡首席架构师Raja Kori离开AMD,加入英特尔。当时业界就推断英特尔可能要重启独显计划,直到Xeon Phi陆续停产,这一猜想在去年达到沸点。
直到今年8月的架构日上,英特尔曝光了针对数据中心的首款基于 Xe 架构的独立图形显卡,有关英特尔开发独显GPU的传言正式得到验证。
Xe GPU的出现,从多个维度补充了英特尔缺失的拼图。它正式宣告英特尔进军高端GPU领域,将触角伸向移动端、桌面端、云 游戏 、数据中心、高性能计算等多个领域。此外,它作为英特尔向量计算的代表产品,进一步补全了英特尔的XPU组合。
XPU架构成为必争之地
仅有CPU一条路确实走不通,这一点AMD的方向从一开始就是正确的,英特尔这些年也通过买买买扩充了XPU架构。
2015~2019这几年间,英特尔都有重磅收购,几乎都是围绕这个架构理念展开的。2015年收购FPGA供应商Altera,2016年收购AI芯片供应商Nervana,2017年收购了ADAS芯片供应商Mobileye和AI芯片供应商Movidius,2018年收购eASIC,2019年收购云端AI芯片供应商Habana Labs。
直到昨天正式推出针对数据中心的首款服务器GPU,至此,XPU全家桶已配齐。如果说英特尔之前搁置GPU计划是出于市场策略和技术瓶颈,那么,今天重返这一市场,难度就会低吗?英伟达的GPU性能不够好吗?AMD的性价比它不香吗?用户选择英特尔的理由是什么?
据英特尔的技术大拿表示,在过去的20年里,英特尔其实一直在提供集成图形显卡。而显然,随着工作负载和性能需求都在上升,AI和流媒体在这些工作负载中的占比也在上升。英特尔正在扩展为更为坚实的Linux堆栈,并将从数据中心一些独特的用例开始,比如安卓云 游戏 和流媒体服务。
这是非常明智的一个起步。安卓云 游戏 在全球 游戏 开发生态系统中占据74%的市场份额,增长空间非常大;而流媒体服务涉及高密度的媒体转码和编码,现在小视频、直播盛行,有着巨量的用户市场。英特尔希望通过至强可扩展处理器与全新服务器GPU的组合,加上开源和授权的软件组件,通过较低的总体拥有成本(TCO),为安卓云 游戏 以及实时顶级视频直播的高密度媒体转编码提供高密度、低时延的解决方案。
但不管怎样,英特尔这一次押注数据中心GPU,将会是更为艰难的挑战。首先庞大的研发投入仍然必不可少,更重要的是,这一次要突围的技术需要多点开花,要在AI、5G、自动驾驶等领域都要持续投入,基础研发上既要保持专注还要保证核心竞争优势,软件要更易用,生态要更强大。
互相渗透的软件生态
XPU的确很强大,但是想要把整个计算系统打通,除了硬件,软件平台也是要搭建的。因为涉及到具体的开发工作,在不同架构之间切换并不容易,尤其是想要跨厂商进行切换的时候,这也是业内普遍的痛点。
英特尔曾在2019年的SuperComputing大会上首次提出oneAPI,并表示这是为实现统一、简化的跨架构编程模型所提出的愿景,希望能够不受限于单一厂商专用的代码构建,且能实现原有代码的集成。借助oneAPI,开发者可以针对他们要解决的特定问题选择最佳的加速器架构,且无需为一个架构和平台再重写软件。这不仅能够释放底层硬件的性能潜力,同时能降低软件开发和维护成本。继Beta版本发布一年后,相信这次最新发布的Gold版本在代码稳定性、成熟度以及性能表现方面值得期待。
既然支持跨架构、跨厂商的切换,那么不妨设想一下,如果英特尔、英伟达和AMD的芯片同在一个系统中,oneAPI是否可以提供支持?
对这一问题,英特尔方面给出的答案是肯定的,哪怕这个系统中没有英特尔的芯片,也是可以支持的。这意味着什么?它将成为开放的行业规范,任何人都可以运用它,它甚至可以进入英伟达、AMD的生态系统。面对竞争,英特尔向友商敞开怀抱,并且进入他们的阵营拥抱他们和他们的盟友。oneAPI就是英特尔在软件乃至生态层面最大的雄心。
英伟达的做法异曲同工。在2019年法兰克福国际超算大会上,英伟达已经宣布其CUDA编程架构开放支持Arm CPU架构,向Arm生态系统提供全堆栈的AI、HPC软件,可支持所有AI框架、600多个HPC应用程序的加速,其中包括所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,比如支持OpenACC的PGI编译器和性能分析器。而堆栈优化完成后,NVIDIA将为所有主流CPU架构提供加速,包括x86、POWER、Arm。
AMD几年前也开始了这样的尝试,其Radeon开放运算平台ROCm,希望通过CUDA编译代码转换,进一步支持英伟达的 CUDA平行运算平台,开始了在软件平台上对英伟达的追赶。
写在最后
5G、AI都在催生计算场景的多样性和更为丰富的内涵。未来的数据是多样化的,需要通过多种硬件计算组合来应对多种数据类型,谁能挖掘出最优化的算力组合,谁就能让数据发挥出最大价值。异构计算,不仅是解决摩尔定律走入绝境的一种方法,更是未来所需。这就是为什么英特尔、英伟达、AMD纷纷在构建自己的XPU平台。
不过,当三大巨头纷纷端出自己的全家桶时,一个挑战是共通的:进步绝不仅体现在处理性能的提升上,更大的难题在于:如何牢牢抓住应用需求,用极为丰富、灵活的组合给出最优化、最适配的方案?
『贰』 英特尔发布新一代AI芯片,吞吐量较A100翻倍
英特尔发布新一代AI芯片,吞吐量较A100翻倍
英特尔发布新一代AI芯片,吞吐量较A100翻倍,芯片制造商英特尔发布一款专注于人工智能计算的全新芯片Gaudi2,希望借此挑战英伟达在人工智能芯片市场的主导地位。英特尔发布新一代AI芯片,吞吐量较A100翻倍。
针对AI加速,英特尔发布专用于高性能深度学习AI训练的英特尔Habana Gaudi2 AI处理器,以及第二代云端AI推理芯片Greco。
第二代Gaudi训练芯片和Greco推理芯片均采用7nm工艺,较上一代16nm有所提升。Gaudi2可拥有高达96GB HBM2e内存,以及24个集成的100GbE RoCE端口。
据介绍,在训练主流计算机视觉和自然语言处理模型时,Gaudi2的吞吐量可达到英伟达A100的两倍。
Habana客户现可使用Gaudi2处理器,其第二代Greco推理芯片将从今年下半年开始提供给客户。
英特尔还宣布其代号为Arctic Sound-M(ATS-M)的英特尔数据中心GPU将于2022年第三季度发布。
作为面向多媒体转码、视觉图形处理和云端推理的单一GPU解决方案,ATS-M是英特尔在该领域首款配备AV1硬件编码器的独立GPU。
它是一颗支持高质量转码和高性能的强大GPU,能够提供每秒150万亿次运算(150TOPS)。
开发人员可以利用oneAPI支持的开放软件堆栈,轻松地开展面向ATS-M的设计工作。
ATS-M将拥有两种不同的产品外形设计,并将获得超过15款来自戴尔、Supermicro、浪潮和新华三等合作伙伴的系统设计。
随后,英特尔首次进行了其软件基础设施计划Endgame项目的概念演示。
应用程序可以充分利用这个软件基础设施层,使设备能利用网络中其他设备的计算资源,从而提供始终可用、低时延、连续的计算服务。
例如,在一台设备上运行要求苛刻的GPU工作负载时,可以感知并利用来自更高性能计算设备上的额外图形处理算力,以增强用户体验。
Endgame项目正在开发中,英特尔在今年开始该技术的beta测试。
5月11日消息,当地时间周二芯片制造商英特尔发布一款专注于人工智能计算的全新芯片Gaudi2,希望借此挑战英伟达在人工智能芯片市场的主导地位。
Gaudi2是由英特尔旗下Habana实验室开发的第二代人工智能处理器。Habana实验室曾是一家以色列人工智能芯片初创公司,被英特尔于2019年底斥资20亿美元收购。近年来,数据中心常用的人工智能计算业务飞速增长,相关创企纷纷获得巨额投资。
眼下很多人工智能研究员和企业已经习惯使用英伟达的软件平台CUDA,英特尔想要从英伟达手中抢夺市场份额并非易事。除了推出用于人工智能计算的新芯片之外,英特尔还表示一直在进行软件开发。
“CUDA并不是英伟达能够长期屹立不倒的护城河,”Habana实验室首席商务官艾塔·麦地纳(Eitan Medina)表示。他补充称,英特尔开发的软件平台采用开放标准,可以从软件开发网站GitHub免费下载和使用。“现在的问题是,谁能更高效地完成这项工作?”
麦地纳表示,Gaudi2的处理速度是Habana实验室之前所开发人工智能芯片的两倍,由台积电的7纳米制程代工制造。相比之下,Habana实验室之前推出的人工智能芯片采用的16纳米制程工艺。
英特尔还推出一款用于人工智能推理工作的芯片Greco,能够利用人工智能算法预测或识别物体。
英特尔数据中心和人工智能负责人桑德拉·里维拉(Sandra Rivera)表示,未来五年,人工智能芯片市场预计将以每年25%的速度增长,规模会达到500亿美元左右。她说:“我们打算通过投资和创新来引领市场发展。”她补充说,会向软件领域进行更多投资,其中既有扩大英特尔的团队,也有收购其他公司。
GPU、AI 芯片、通用化云算力软件,英特尔在创新峰会上告诉我们,它仍然是那家站在最前沿的科技公司。
本周二,英特尔推出了一款名为 Gaudi2 的 AI 芯片,这家公司正在大力进军英伟达主导的人工智能芯片市场。
Gaudi2 是以色列人工智能芯片初创公司 Habana Labs 的第二代处理器,英特尔于 2019 年以约 20 亿美元的价格收购了该公司。近年来,AI 研究人员和公司已经习惯使用英伟达软件平台 CUDA,因此从后者手中抢夺市场份额一直是一个挑战。除了用于人工智能计算的新芯片外,英特尔一直专注于软件研发。
相对于前代 AI 处理器 Greco 和 Goya,Gaudi2 的速度有了显著提升,其采用台积电 7 纳米制程,Tensor 处理器内核数量增加到 24 个,封装内存容量从 32GB(HBM2)增加至 96GB(HBM2E),板载 SRAM 增加了一倍(从 24MB 到 48MB)。
「这是第一个也是唯一一个集成了如此大内存的 AI 加速器,」Habana Labs 的首席运营官 Eitan Medina 表示。该处理器的 TDP 为 600W,但仍然使用被动冷却,不需要液冷。
英特尔展示了 Gaudi2 与竞争对手在热门任务上的一些性能比较。在 ResNet-50 模型训练中,Gaudi2 的'吞吐量是一代产品的 3.2 倍,英伟达 80GB A100 的 1.9 倍,V100 的 4.1 倍。在其他一些基准测试中,Gaudi 和 80GB A100 之间的差距更加明显:对于 BERT Phase-2 训练吞吐量,Gaudi-2 比 80GB A100 高出 2.8 倍。
不过,英特尔并没有和英伟达最新的 H100 进行对比。
英特尔表示,基于与第一代 Gaudi 相同的体系架构,Habana Gaudi2 处理器大幅提高了训练性能。用户在云端运行 Amazon EC2 DL1 实例以及本地运行 Supermicro Gaudi 训练服务器时,其性价比比现有 GPU 解决方案提升了 40%。
与此同时,英特尔还推出了一款名为 Greco 的推理芯片。Gaudi2 处理器目前已经开售,而 Greco 预计将在今年下半年开始为选定的客户提供样品。
昨天英特尔推出的 12 代酷睿 CPU HX55 系列不同于此前产品,可以实现接近桌面版的能力,其拥有最多 8 个性能 P 核、8 个能效 E 核,最多 16 个核心、24 个线程,还有 30MB 三级缓存,核显最多包含 32 个执行单元。
除此之外,H55 系列内存支持双通道 DDR5-4800 或者 DDR4-3200,最多安装四条 128G 内存,以及四块共计 16TB 的 SSD 固态硬盘,它也支持 PCIe 5.0。
HX55 系列一共有七款产品,覆盖从 i5 到 i9,基础功耗均为 33W,最高睿频功耗达到 157W。
旗舰型号是 i9-12950HX,8P+8E 16 核心 24 线程,三级缓存 30MB,P 核频率为 3.6-5.0GHz,E 核频率达到 1.7-3.6GHz,集成核显 32 单元,频率为 1.55GHz。
性能方面,以最高端的 i9-12900HX 为例,对比上代顶级 CPU i9-11980HK,新芯片单核性能提升 17%,多核性能提升 64%,3D 渲染性能增加了 81%,AutoDesk 专业创作性能提升了 12-28%。
随着新 CPU 的发布,一系列电脑厂商的游戏笔记本、移动工作站新品即将陆续上市。
除了新的硬件产品之外,英特尔昨天还首次进行了软件基础设施计划「Project Endgame」的概念演示。应用程序可以利用该软件基础设施层,使设备能利用网络中其他设备的计算资源,从而提供始终可用、低时延、连续的计算服务。
英特尔首席架构师 Raja Kori 现场展示了 Endgame,在一台笔记本上运行虚幻引擎 5 Demo 时卡顿非常明显,在开启持续计算基础设施后,软件可以感知并利用来自附近更高性能计算设备上的额外图形处理算力(一台外星人主机),帧率瞬间升级到了台式机水平。
这一能力也将在未来的元宇宙应用中发挥重要作用。英特尔表示,Endgame 项目正在开发中,预计今年开始 beta 测试。
『叁』 与其跟特斯拉讲武德,不如找华为谈合作
文|江小花
不是我们进入了汽车行业,而是汽车走到了我们的领域。不是我们要来颠覆汽车行业,是汽车行业自己需要进化。
不是软件定义汽车,而是汽车智能化需要软件,让硬件变得更智能。智能硬件和软件,好像就是华为的两大主要优势。
在你们眼里,汽车产业可能在走下坡路,在华为眼里,形势比一片大好还要好。
华为并不着急,他们看的很清楚,不管是传统车企,还是造车新势力,但凡不能独力成为一个特斯拉,那么最终,一个能力强大,又隐忍友善的全栈解决方案合作伙伴,就是大多数整车企业进化到5G时代的必然选择,华为显然很有信心在全球范围内成为最令人满意的那一枚。
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。
『肆』 华为不造车,却造出汽车内核
本报记者陶震
就如同所有使用英特尔处理器的电脑都要贴上“IntelInside”标签、所有应用徕卡摄像头的手机都要打上“LEICA”标志、所有采用杜比音效的音响都印有“DolbyAudio”认证一样,未来,所有基于华为全栈智能汽车解决方案开发的汽车都会打上“HI(HUAWEIIntelligence,即华为智能)”品牌标识。HI品牌的出现,标志着智能汽车将内置华为的核心技术和关键要素,华为也将用“HUAWEIInside”的方式,把数字世界带入每一辆车。
华为智能汽车解决方案BU总裁王军(右)
华为智能汽车解决方案BUADS智能驾驶产品线总裁和首席架构师苏箐(左)
目前,特斯拉量产提供的L2级自动驾驶技术,是以美国日常高速公路通勤为基础建构,并不能满足我国上下班高频使用场景中的复杂工况,而华为HIADS自动驾驶已完成L4级自动驾驶架构,实现了复杂城区、城市环路、高速、自动泊车等全场景覆盖。作为首批试乘华为ADS自动驾驶汽车的媒体,《环球时报》记者在华为上海研究所周边的综合路况中,就能够感受到ADS自动驾驶的连贯性,车辆可根据高阶单车智能和高精地图,在驾驶员不介入的情况下,实现自动变道、行人避让、红绿灯启停等高阶操作,完成全场景自动驾驶。据悉,ADS系统将于2022年第一季度量产。
与车企共创价值
华为一再强调,华为不造车,要帮助车企造好车。华为的入局,势必将扩大汽车产业的发展格局,为汽车产业的转型升级注入强大的技术储备,并为汽车产业形态变迁输入领先的专业能力。
受制于公司架构、人才结构、核心技术和盈利模式等影响,大型汽车企业转型开发智能网联电动车软硬件能力相对欠缺。而华为入局后为车企开放的,不仅是制造智能网联电动车所需的技术能力,更是背后帮助其攻关技术难题的研发团队。
“华为目前在汽车产业的优势和能力聚焦在软件、算法和生态中,其中核心能力的构建放在生态,也就是数据应用和操作系统上。”据王军介绍,目前,华为拥有庞大的研发团队和科学家支持智能汽车研究,其中,华为智能汽车解决方案BU团队共有4千人,做基础科学和理论研究的2012实验室中也有500余名负责AOS、VOS的研发人员,此外,还有大量负责HOS研发的软件开发人员。
“软件和算法未来将会深入到智能网联电动车中,但这方面能力的构建是需要长期积累的,这也是华为的优势。我们希望和车企互通有无,车企更懂汽车和用户,我们更懂ICT技术,结合起来共同给消费者带来更好的价值。”王军说。未来,华为这种优势技术共融的共创品牌模式也将改变汽车主机厂与供应商传统的“买卖法则”,成为汽车产业全新的商业模式。
曾凭一“企”之力,修改ICT行业准则,重构产业边界,改变科技发展强弱之势的华为,正在让数字世界的惠及面更为宽广。正如华为智能汽车解决方案BU的愿景所言,华为要把数字世界带入每一辆车,帮助车企解决产业转型的技术难题,提供“从零到整”的解决方案。
本文图片来自华为智能汽车解决方案BU官方
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。
『伍』 pi币基础币怎么算
pi 币基础币 = 每天 0.1pix24 小时 =2.4 。在 2020 年 12 月 8 日时,进行 PI 币挖矿的矿工已经累计达到了 1000 万人次,而 PI 币平台所设定的规则是,挖矿的人数每翻十倍,系统算力就会衰减一次,在达到 1000 万人次时, PI 币的算力就衰减了四次。截至到 2021 年 8 月 4 日, PI 币的挖矿矿工还没有达到 1 亿人次,因此基础币的计算还是以算力衰减了四次进行。
PI 币又被称为派币,具体是指 PCHAIN Network 平台上的原生代币。 PI 币的英文名是 PCHAIN , 2018 年的儿童节当日, PI 币正式上线,并且发行总量为 2100000000PI 。 PI 币首的发团队总共由四个创始人构成,其中团队的领导人是 Dr.Feng Cao ,负责团队内部的分工协调等工作, Kevin Zheng 是数据工程师,负责 PI 币数据库的建立以及算法的修正, Frank Ma 主管区块链,负责对区块链项目进行优化, Steven Lv 是团队的首席架构师,负责该币整体的结构搭建。