A. GPU云计算平台哪家的算力比较强
上海世纪互联新上线的GPU云平台算力就很强,他们用的是NVDIA的DGX A100,是现目前市场上竞争力十分强的人工智能服务器,单台的算力就有5Peta Flops,多台组成集群的话,算力更加吓人,比起市面上很多的云平台都要强很多。
B. 鑷鍔ㄩ┚椹堕潻鍛斤細瑙e瘑绔鍒扮鑳屽悗鐨勬暟鎹銆佺畻鍔涘拰AI濂囪抗
浣滆厊姣鏈鏅鸿屾暟鎹鏅鸿兘绉戝﹀ 璐虹繑
缂栬緫|绁ュ▉
浜斻佹湭鏉ヨ秼鍔杩囧幓涓骞达紝澶ц瑷妯″瀷鐨勫彂灞曟濊矾缁欑鍒扮鑷鍔ㄩ┚椹跺緢澶氬惎鍙戯紝鍦ㄦā鍨嬨佹暟鎹涓婇兘鍊煎緱鍊熼壌銆
鍦ㄨ嚜鐒惰瑷澶勭悊棰嗗煙锛孋hatgpt浣滀负鍩虹妯″瀷灞曠ず浜嗘瀬寮虹殑娉涘寲鑳藉姏銆傛渶杩戯紝瀛︽湳鐣岀殑鐮旂┒鍦ㄨ瑷-瑙嗚夊ぇ妯″瀷涓婁篃鍙栧緱浜嗙獊鐮存ц繘灞曪紝杩欑嶅熀纭妯″瀷鏃犵枒浼氳╄嚜鍔ㄩ┚椹跺傝檸娣荤考銆
鐗规柉鎷夈乄ayve绛夊叕鍙镐篃鎻愬嚭灏哤orld Model浣滀负鑷鍔ㄩ┚椹跺熀纭妯″瀷鐨勬濊矾銆俉orld model鏄涓绉嶅熀浜庤嗛戞潵棰勬祴鏈鏉ヤ笘鐣岀殑妯″瀷锛屼緥濡傜壒鏂鎷夌殑world model鍙浠ユ牴鎹畃rompt缁欏嚭鐨勫姩浣滄潵鍋氬嚭鍙嶉堬紝骞剁敓鎴愭湭鏉ョ殑涓栫晫鍥惧儚锛岃屼笖鑳戒繚璇佸氳嗚掋佹椂搴忕殑涓鑷存с
澶ц瑷妯″瀷鍘嬬缉浜嗕汉绫荤殑澶ч儴鍒嗙煡璇嗭紝褰撶劧涔熷寘鎷椹鹃┒鐭ヨ瘑銆傚彲浠ラ氳繃涓嶭LM杩涜屼氦浜掞紝鎻愬彇椹鹃┒甯歌瘑銆備緥濡備紶缁熺殑鍗犵敤
銆愭湰鏂囨潵鑷鏄撹溅鍙蜂綔鑰匟iEV澶ц挏绮掞紝鐗堟潈褰掍綔鑰呮墍鏈,浠讳綍褰㈠紡杞杞借疯仈绯讳綔鑰呫傚唴瀹逛粎浠h〃浣滆呰傜偣锛屼笌鏄撹溅鏃犲叧銆
C. 1万个A100的算力是多少
NVIDIA A100是一种高性能计算加速器,它的算力可以通过浮点运算每秒测量来衡量。具体而言,A100在FP32精度下的猜蚂算力为19.5 TFLOPS(万亿次浮点运算每秒),在FP64精度下的算力为9.7 TFLOPS。
因此,1万个A100的穗孙埋算力在FP32精度下为:
19.5 TFLOPS × 10,000 = 195 PFLOPS(千万亿次浮点运算每秒)
在FP64精度下的算力为:
9.7 TFLOPS × 10,000 = 97 PFLOPS(千万亿次浮点运算每秒)
需要注意凯搭的是,这只是理论上的峰值算力,实际应用中的性能可能会受到多种因素的影响,例如算法的复杂度、数据传输瓶颈等。
D. 鑻变紵杈惧拰AMD鏂渚涳紒瀵逛腑鍥借秴绠楀奖鍝嶅氬ぇ
鑻变紵杈惧拰AMD鏂渚涳紒瀵逛腑鍥借秴绠楀奖鍝嶅氬ぇ锛
缇庡浗鍙堝嚭鏂版嫑浜嗭紒缇庡浗闄愬埗鑻变紵杈俱丄MD绛夊叏鐞冮《绾ц姱鐗囧叕鍙革紝鍚戜腑鍥藉嚭鍙i珮鎬ц兘GPU锛岃繖浠朵簨鎯呭傚悓涓嶄箙鍓嶆柇渚涜姱鐗囪捐″伐鍏稥DA涓鏍凤紝涓鐐归兘涓嶈╀汉鎰熷埌鎰忓栵紝閭d箞鎴戜滑瑕侀棶鐨勫氨鏄缇庡浗鐨勭戞妧闇告潈涓讳箟锛屼細璧板埌浣曠嶇▼搴︼紝浠ュ強鏈鏈鍏抽敭鐨勶紝瀵逛腑鍥界戞妧浜т笟鐨勫彂灞曞奖鍝嶅張鏈夊氬ぇ锛岀壒鍒鏄鎴戜滑閮介潪甯稿叧娉ㄧ殑瀵逛腑鍥借秴绾ц$畻鑳藉姏鐨勫彂灞曪紝鍙堜細浜х敓澶氬ぇ鐨勫奖鍝嶅憿锛
棣栧厛绗涓鐐癸紝缇庡浗杩欐℃柇渚汚MD鍜岃嫳浼熻揪鐨勯珮鎬ц兘GPU鑺鐗囷紝鍏舵牳蹇冪洰鏍囨墍閽堝圭殑闈炲父娓呮氾紝灏辨槸涓鍥界殑瓒呯骇璁$畻鑳藉姏锛屼互鍙夾I浜哄伐鏅鸿兘璁$畻锛屽悓鏃朵細娉㈠強浜掕仈缃戙佸ぇ鏁版嵁鍜屼簯璁$畻绛夋秹鍙婄畻鍔涚殑鍩虹鎬ц兘鍔涳紝鑰岃繖浜涗篃姝f槸鐩鍓嶄腑鍥藉彂灞曟暟瀛楃粡娴庛佸熀浜庣戞妧鐨勬柊鍩哄缓锛屾墍蹇呴』鍏峰囩殑鍩虹鎬ф潯浠讹紝搴旇ヨ村舰寮忎笉鍙璋撲笉涓ュ郴銆
8鏈31鏃ワ紝缇庡浗鏀垮簻鍛戒护鑺鐗囧巶鍟哊VIDIA锛堣嫳浼熻揪锛夊仠姝㈠悜涓鍥介攢鍞閮ㄥ垎楂樻ц兘GPU锛屾牴鎹璺閫忕ぞ鎶ラ亾锛屽彟涓瀹禔MD锛堣秴濞佸崐瀵间綋锛変篃绉版敹鍒颁簡鐩稿叧鐨勭佹㈠懡浠ゃ傚叕鍛婄О锛屾柊鐨勮稿彲瑕佹眰鍙鑳戒細褰卞搷鍏鍙稿強鏃跺畬鎴怘100寮鍙戞垨鏀鎸丄100鐜版湁瀹㈡埛鐨勮兘鍔涖
閭d箞鍓嶉潰鎵璇寸殑浠涔圓100銆丠100杩欎簺鑺鐗囩┒绔熸槸浠涔堝憿锛熶负浣曚細浜х敓杩欎箞閲嶈佺殑褰卞搷鍛锛烝100鍜孒100鑺鐗囧湪鐩稿叧棰嗗煙绌剁珶鏈夊氬己鎮嶅憿锛熻灏侀攣鐨勮繖浜涗骇鍝侊紝閮芥槸鍏锋湁瓒冲熷弻绮惧害璁$畻鑳藉姏鐨勯珮绔疓PU锛岀浉姣斾簬鑻变紵杈惧墠涓浠g殑GPU锛孉100鐨勬ц兘鎻愬崌浜20鍊嶏紝闈炲父閫傚悎浜庝汉宸ユ櫤鑳姐佹暟鎹鍒嗘瀽銆佺戝﹁$畻鍜屼簯鍥惧舰宸ヤ綔璐熻浇銆
璇ヨ姱鐗囩敱540浜夸釜鏅朵綋绠$粍鎴愶紝骞跺叿鏈夐拡瀵圭█鐤忕煩闃佃繍绠楃殑鍔犻熷姛鑳斤紝瀵逛簬AI鎺ㄧ悊鍜岃缁冩潵璇寸壒鍒鏈夌敤銆傚綋鐒讹紝鎴戜滑浠NVIDIA锛堣嫳浼熻揪锛夊厛杩汫PU鑺鐗囦负渚嬶紝鍚戝ぇ瀹朵粙缁嶇編鍥芥帴杩炲嚭鎷涚殑褰卞搷锛屽苟闈炶佸勮嚜鑿茶杽鍞辫“鑷宸憋紝涔熶笉鏄楂樺懠鎴戜滑涓嶆曠編鍥藉繀璐ョ殑鍙e彿锛岃屾槸瑕佸憡鐭ヤ竴涓鐪熸槸鐨勭幇鐘讹紝褰㈠娍鍙浠ヨ存槸姣旇緝涓ュ郴锛岄渶瑕佹i潰鍔犱互搴斿广
缇庡浗杩欐$殑闄愬埗鎺鏂斤紝鍏堕拡瀵规ф瀬寮猴紝灏盢VIDIA鏉ヨ达紝鏄浠A100绠楀姏涓哄熀鍑嗭紝姣斿畠鍏堣繘鐨勬墍鏈夋樉鍗′骇鍝侀兘浼氬彈闄愩傞櫎浜哊VIDIA锛堣嫳浼熻揪锛夛紝AMD涔熷凡鏀跺埌鏂扮殑璁稿彲瑕佹眰锛屽皢闃绘㈠叾MI250锛6nm宸ヨ壓锛岄珮绮惧害璁$畻鑺鐗囷級鑺鐗囧嚭鍙e埌涓鍥姐
鍏跺疄鎴戜滑蹇呴』鐪嬪埌锛岀編鍥界殑鏀挎不榛戞墜娣卞叆鍒板叏鐞冪殑绉戞妧渚涘簲閾句箣涓锛屼腑鍥界殑绉戞妧鍙戝睍鏄剧劧浼氬彈鍒板奖鍝嶏紝浣嗘槸缇庡浗鏂归潰灏变細姣鍙戞棤鎹熷悧锛熸樉鐒朵笉鏄锛屾瘮濡傛渶鐩存帴鐨勶紝缇庡浗绂佷护涓鍙戝嚭鏉ワ紝AMD鍜孨VIDIA鐨勮偂浠蜂竴搴﹀氨鍒嗗埆涓嬭穼浜2.38%鍜2.42%锛岃繕鏄鑰佺敓甯歌皥鐨勯昏緫锛屼腑鍥界殑甯傚満鏄濂舵按锛屾病鏈夊競鍦虹殑婊嬫鼎锛岀戞妧鍏鍙搁潬浠涔堟潵鎸佺画鐨勬姇鍏ュ拰鍒涙柊鍛锛
鍥犳わ紝鍦ㄧ編鍥戒富鍔ㄩ鍑轰竴涓宸ㄥぇ甯傚満鐨勫悓鏃讹紝涓鍥界殑鐩稿叧浼佷笟寮濮嬪姞澶ф姇璧勭爺鍙戠殑鍔涘害锛屾e湪鍏ㄥ姏浠ヨ荡鍦板崰棰嗚繖浜涘競鍦虹┖鐧姐9鏈1鏃ワ紝澶栦氦閮ㄥ彂瑷浜烘豹鏂囨枌瀵规ゅ洖搴旂О锛岀編鏂圭殑鍋氭硶鏄鍏稿瀷鐨勭戞妧闇告潈涓讳箟锛岀編鏂逛竴鍐嶆硾鍖栧浗瀹跺畨鍏ㄦ傚康锛屾互鐢ㄥ浗瀹跺姏閲忥紝浼佸浘鍒╃敤鑷韬绉戞妧浼樺娍锛岄亸鍒舵墦鍘嬫柊鍏村競鍦哄拰鍙戝睍涓鍥藉跺彂灞曪紝姝や妇杩濆弽甯傚満缁忔祹瑙勫垯锛岀牬鍧忓浗闄呯粡璐哥З搴忋備腑鏂瑰规ゅ潥鍐冲弽瀵广
褰撶劧锛岃查亾鐞嗕篃鏄涓鍥炰簨锛岀編鍥芥柟闈㈢殑鏀挎不榛戞墜骞叉壈鍏ㄧ悆绉戞妧渚涘簲閾剧殑涓炬帾锛屼竴瀹氫細鎸佺画鍦拌繘琛屼笅鍘伙紝鎴戜滑瑕佸仛鐨勪簨鎯呬篃寰堟竻妤氫簡锛岃嚜绔嬭嚜寮哄姞澶т汉鎵嶅煿鍏诲姏搴﹀拰鍒涙柊鎶曞叆瑙勬ā锛屽笇鏈涜兘澶熸棭鏃ユ憜鑴卞綋鍓嶇戞妧渚涘簲閾惧彈闄愮殑鍥板冦
E. 英伟达发布史上最强计算平台,黄教主:自动驾驶不再担心算力问题
原本应该在今年 3 月份于加州圣何塞举办的英伟达 GTC 2020 大会,因为全球性新冠病毒肺炎的爆发而不得不推迟举行。
比原计划晚了将近 2 个月,英伟达 GTC 2020 终于在 5 月 14 日回归。
不过这一次开发者们没办法在线下集会,只能通过线上直播观看「皮衣教主」黄仁勋的主题演讲。老黄此次是在他硅谷的家中完成了这场别开生面的「Kitchen Keynote」。
虽然是厨房举行,英伟达依然爆出「核弹」,发布了全新一代的 GPU 架构 Ampere(安培)。
在自动驾驶方向上,英伟达通过两块 Orin SoC 和两块基于安培架构的 GPU 组合,实现了前所未有的?2000 TOPS?算力的 Robotaxi 计算平台,整体功耗为?800W。
有业界观点认为,实现 L2 自动驾驶需要的计算力小于 10 TOPS,L3 需要的计算力为 30 - 60 TOPS,L4 需要的计算力大于 100 TOPS,L5 需要的计算力至少为 1000 TOPS。
现在的英伟达自动驾驶计算平台已经建立起了从?10TOPS/5W,200TOPS/45W?到?2000 TOPS/800W?的完整产品线,分别对应前视模块、L2+ADAS?以及?Robotaxi?的各级应用。
从产品线看,英伟达?Drive AGX?将全面对标 Mobileye?EyeQ?系列,希望成为量产供应链中的关键厂商。
1、全新 GPU 架构:Ampere(安培)
2 个月的等待是值得的,本次 GTC 上,黄仁勋重磅发布了英伟达全新一代 GPU 架构 Ampere(安培)以及基于这一架构的首款 GPU NVIDIA A100。
A100 在整体性能上相比于前代基于 Volta 架构的产品有 20 倍的提升,这颗 GPU 将主要用于数据分析、专业计算以及图形处理。
在安培架构之前,英伟达已经研发了多代 GPU 架构,它们都是以科学发展史上的伟人来命名的。
比如 Tesla(特斯拉)、Fermi(费米)、Kepler(开普勒)、Maxwell(麦克斯维尔)、Pascal(帕斯卡)、Volta(伏特)以及 Turing(图灵)。
这些核心架构的升级正是推动英伟达各类 GPU 产品整体性能提升的关键。
针对基于安培架构的首款 GPU A100,黄仁勋细数了它的五大核心特点:
集成了超过 540 亿个晶体管,是全球规模最大的 7nm 处理器;引入第三代张量运算指令 Tensor Core 核心,这一代 Tensor Core 更加灵活、速度更快,同时更易于使用;采用了结构化稀疏加速技术,性能得以大幅提升;支持单一 A100 GPU 被分割为多达 7 块独立的 GPU,而且每一块 GPU 都有自己的资源,为不同规模的工作提供不同的计算力;集成了第三代 NVLink 技术,使 GPU 之间高速连接速度翻倍,多颗 A100 可组成一个巨型 GPU,性能可扩展。
这些优势累加起来,最终让 A100 相较于前代基于 Volta 架构的 GPU 在训练性能上提升了?6 倍,在推理性能上提升了?7 倍。
最重要的是,A100 现在就可以向用户供货,采用的是台积电的 7nm 工艺制程生产。
阿里云、网络云、腾讯云这些国内企业正在计划提供基于 A100 GPU 的服务。
2、Orin+安培架构 GPU:实现 2000TOPS 算力
随着英伟达全新 GPU 架构安培的推出,英伟达的自动驾驶平台(NVIDIA Drive)也迎来了一次性能的飞跃。
大家知道,英伟达此前已经推出了多代 Drive AGX 自动驾驶平台以及 SoC,包括?Drive AGX Xavier、Drive AGX Pegasus?以及?Drive AGX Orin。
其中,Drive AGX Xavier 平台包含了两颗 Xavier SoC,算力可以达到 30TOPS,功耗为 30W。
最近上市的小鹏 P7 上就量产搭载了这一计算平台,用于实现一系列 L2 级自动辅助驾驶功能。
Drive AGX Pegasus 平台则包括了两颗 Xavier SoC 和两颗基于图灵架构的 GPU,算力能做到 320TOPS,功耗为 500W。
目前有文远知行这样的自动驾驶公司在使用这一计算平台。
在 2019 年 12 月的 GTC 中国大会上,英伟达又发布了最新一代的自动驾驶计算 SoC Orin。
这颗芯片由 170 亿个晶体管组成,集成了英伟达新一代 GPU 架构和 Arm Hercules CPU 内核以及全新深度学习和计算机视觉加速器,最高每秒可运行 200 万亿次计算。
相较于上一代 Xavier 的性能,提升了 7 倍。
如今,英伟达进一步将自动驾驶计算平台的算力往前推进,通过将两颗 Orin SoC 和两块基于安培架构的 GPU 集成起来,达到惊人的 2000TOPS 算力。
相较于 Drive AGX Pegasus 的性能又提升了 6 倍多,相应地,其功耗为 800W。
按一颗 Orin SoC 200TOPS 算力来计算,一块基于安培架构的 GPU 的算力达到了 800TOPS。
正因为高算力,这个平台能够处理全自动驾驶出租车运行所需的更高分辨率传感器输入和更先进的自动驾驶深度神经网络。
对于高阶自动驾驶技术的发展而言,英伟达正在依靠 Orin SoC 和安培 GPU 架构在计算平台方面引领整个行业。
当然,作为一个软件定义的平台,英伟达 Drive AGX 具备很好的可扩展性。
特别是随着安培 GPU 架构的推出,该平台已经可以实现从入门级 ADAS 解决方案到 L5 级自动驾驶出租车系统的全方位覆盖。
比如英伟达的 Orin 处理器系列中,有一款低成本的产品可以提供 10TOPS 的算力,功耗仅为 5W,可用作车辆前视 ADAS 的计算平台。
换句话说,采用英伟达 Drive AGX 平台的开发者在单一平台上仅基于一种架构便能开发出适应不同细分市场的自动驾驶系统,省去了单独开发多个子系统(ADAS、L2+ 等系统)的高昂成本。
不过,想采用 Orin 处理器的厂商还得等一段时间,因为这款芯片会从 2021 年开始提供样品,到?2022 年下半年才会投入生产并开始供货。
3、英伟达自动驾驶「朋友圈」再扩大
本届 GTC 上,英伟达的自动驾驶「朋友圈」继续扩大。
中国自动驾驶公司小马智行(Pony.ai)、美国电动车创业公司?Canoo?和法拉第未来(Faraday Future)加入到英伟达的自动驾驶生态圈,将采用英伟达的 Drive AGX 计算平台以及相应的配套软件。
小马智行将会基于 Drive AGX Pegasus 计算平台打造全新一代 Robotaxi 车型。
此前,小马智行已经拿到了丰田的 4 亿美金投资,不知道其全新一代 Robotaxi 会不会基于丰田旗下车型打造。
美国的电动汽车初创公司 Canoo 推出了一款专门用于共享出行服务的电动迷你巴士,计划在 2021 年下半年投入生产。
为了实现辅助驾驶的系列功能,这款车型会搭载英伟达 Drive AGX Xavier 计算平台。前不久,Canoo 还和现代汽车达成合作,要携手开发电动汽车平台。
作为全球新造车圈内比较特殊存在的法拉第未来,这一次也加入到了英伟达的自动驾驶生态圈。
FF 首款量产车 FF91 上的自动驾驶系统将基于 Drive AGX Xavier 计算平台打造,全车搭载了多达 36 颗各类传感器。
法拉第未来官方称 FF91 有望在今年年底开始交付,不知道届时会不会再一次跳票。
作为 GPU 领域绝对霸主的英伟达,在高算力的数据中心 GPU 以及高性能、可扩展的自动驾驶计算平台的加持下,已经建起了一个完整的集数据收集、模型训练、仿真测试、远程控制和实车应用的软件定义的自动驾驶平台,实现了端到端的完整闭环。
同时,其自动驾驶生态圈也在不断扩大,包括汽车制造商、一级供应商、传感器供应商、Robotaxi 研发公司和软件初创公司在内的数百家自动驾驶产业链上的企业已经在基于英伟达的计算硬件和配套软件开发、测试和应用自动驾驶车辆。
未来,在整个自动驾驶产业里,以计算芯片为核心优势,英伟达的触角将更加深入,有机会成为产业链条上不可或缺的供应商。
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。
F. 鑻变紵杈綼100鏄惧崱浠锋牸浠嬬粛
鑻变紵杈綼100鏄惧崱鏄涓撲笟绾х殑鏄惧崱璁惧囷紝瀹冧笉鍚屼簬鎴戜滑鏃ュ父鎵鐔熺煡鐨勬父鎴忔樉鍗★紝鎷ユ湁瓒呭己鐨勬ц兘鍜岀畻鍔涳紝褰撶劧浠锋牸涔熼潪甯歌吹锛岄偅涔堝叿浣撶殑鑻变紵杈綼100鏄惧崱浠锋牸鏄澶氬皯鍛銆
鑻变紵杈綼100鏄惧崱浠锋牸锛
A10040G锟75599鍏
A10080G锟91999鍏
鍥犱负瀹冩槸楂樼涓撲笟绾х殑澶у瀷鏄惧崱锛屾墍浠ヤ环鏍间細闈炲父璐点
鑻变紵杈綼100鏄惧崱鐩稿叧浠嬬粛锛
1銆乤100鏄惧崱閲囩敤浜7nm鍒剁▼宸ヨ壓+Ampere鏋舵瀯锛
鎷ユ湁540浜夸釜鏅朵綋绠锛岃秴杩6912涓狢UDA鏍稿績锛屾槸鐩鍓嶅叏鐞冩渶澶х殑鏄惧崱澶勭悊鍣ㄣ
2銆佹ц兘鏂归潰锛屽畠鐩告瘮浜庝笂浠g殑杩炴帴閫熷害鎻愬崌鍒颁簡涓ゅ锛
鍙屽悜甯﹀芥彁鍗囪嚦50GB/s锛屼紶杈撻熷害杈惧埌浜600GB/s銆
3銆佸逛簬鏅閫氫汉鏉ヨ达紝杩欐炬樉鍗$殑鎬ц兘鏄杩囪浇鐨勶紝涔熸棤娉曞湪鏅閫氱殑涓浜虹數鑴戜笂瀹夎呬娇鐢ㄣ