1. 256TOPS、35W,後摩用一顆晶元掀起智能駕駛新戰事
本不平靜的智能駕駛晶元江湖,再添新變局。
5 月 10 日,後摩智能重磅發布智能駕駛晶元鴻途™H30,該晶元物理算力高達 256TOPS@INT8,與時下備受追捧的 256TOPS 英偉達 Orin X 不相上下,典型功耗只有 35W,能效比之高可見一斑。
這塊晶元性能如此強勁的背後,在於其採用了顛覆性的底層架構設計——存算一體。
與大多數晶元基於馮·諾依曼架構打造不同,存算一體通過在存儲單元內完成部分或全部的運算,極大地解決了晶元性能受存儲帶寬限制的瓶頸,且降低了功耗需求。
鴻途™H30 的推出對於行業來說具有重大的隱含意義,其大算力、極致能效比、超低延時、低成本等特性,正好吻合智能汽車對於晶元的需求。
當下,智能駕駛行業正在面臨性能提升、成本下探的關鍵發展期,作為國內首款存算一體智駕晶元,該晶元註定將引發一系列的連鎖反應。
在發布會現場,後摩還專門推出了基於鴻途™H30 打造的智能駕駛硬體平台——力馭®,其 CPU 算力高達 200 Kdmips,AI 算力為 256Tops,支持多感測器輸入,能夠為智能駕駛提供更充沛的算力支持;在功耗上,力馭®平台僅為 85W,可採用更加靈活的散熱方式,實現更低成本的便捷部署。
衡量一款晶元好不好,除了看硬體上的「硬實力」,還要看軟體上的易用性,這其中工具鏈發揮著重要的作用。信曉旭認為,除了追求晶元在 PPA 指標上的競爭力之外,還要確保在軟體工具鏈的競爭力,「要打造高效,易用的軟體開發工具鏈,讓演算法開發人員用得舒服、用得爽。」
汽車之心了解到,為了幫助客戶和合作夥伴用好晶元,後摩基於鴻途™H30 晶元自主研發了一款軟體開發工具鏈——後摩大道™,以無侵入式的底層架構創新保障了通用性的同時,進一步實現了鴻途™H30 的高效、易用。
信曉旭表示,在晶元和工具鏈的雙重配合下,後摩能夠向智能駕駛市場提供更優選擇。他透露,鴻途™H30 將於今年 6 月份開始給 Alpha 客戶送測。
「我們的研發人員還在加班加點地調試,進行送測之前的最後准備工作,這將會是後摩用存算一體重構智能駕駛晶元的開端。」
03、格局未定的智能駕駛晶元江湖,再次迎來大洗牌
在後摩發布鴻途™H30 之前,似乎沒有玩家在晶元底層架構做改動,即使是打響大算力晶元前裝量產第一槍的國際巨頭英偉達,目前也是沿著馮·諾伊曼架構不斷迭代自己的產品。
然而隨著智能駕駛往更高階和更普及化方向發展,對於架構創新的呼喚,顯得愈發緊迫。
一方面,從高速公路、快速路到城區道路,智能駕駛面臨的場景越來越復雜,為了識別各種異形物,玩家們部署了 Transformer 等大模型,由此也帶來算力需求的急劇上升,業內估計從當前火熱的城市 NOA 到未來走向 L3/L4 級自動駕駛,晶元算力將從幾百 TOPS 往上千 TOPS 增長,然而在傳統的馮·諾依曼架構設計下,存儲帶寬制約算力向上拓展的空間;
另一方面,智能駕駛功能正在加速向下滲透,工信部數據顯示,2022 年,智能網聯乘用車 L2 級及以上輔助駕駛系統的市場滲透率提升至 34.9%,較 2021
【本文來自易車號作者汽車之心,版權歸作者所有,任何形式轉載請聯系作者。內容僅代表作者觀點,與易車無關】
2. 華為正式發布最強算力AI晶元升騰910,這款處理器到底有多強
升騰 910 採用了 7nm+ EUV 工藝,並用上了 Da Vinic 達芬奇架構。華為官方在發布時提到,升騰 910 的運算能力相當於 50 個當前最前的 CPU,它的訓練速度也是比目前最強的 AI 晶元還要強 50%-100%。
根據華為官方公布的測試數據,升騰 910 已經達到了設計規格預期。升騰 910 的 FP16 算力達到 256 Tera-FLOPS,INT8 算力達到 512 Tera-OPS。重要的是,升騰 910 達到規格算力所需功耗僅 310W,明顯低於設計規格的 350W。
升騰 910 總體技術表現超出預期,已經把升騰 910 用於實際 AI 訓練任務。比如,在典型的 ResNet50 網路的訓練中,升騰 910 與 MindSpore 配合,與現有主流訓練單卡配合 TensorFlow 相比,顯示出接近 2 倍的性能提升。
3. 英偉達新款Thor晶元發布 算力2000TOPS/極氪品牌2025年搭載
易車訊 日前,我們從相關渠道獲悉,英偉達新款智能汽車晶元THOR發布,算力高達2000TOPS。據悉,該SoC晶元內部擁有770億個晶體管,算力高達2000TOPS,或者是2000TFLOP,將於2024年量產,吉利旗下極氪品牌將於2025年搭載。
易車App提供銷量、熱度、點評、降價、新能源、實測、安全、零整比、保有量等榜單數據。如需更多數據,請到易車App查看。
4. 鍗庝負鏈寮鴻姱鐗囬簰楹9000鎬庝箞鏍鳳紵
楹掗簾9000鏄涓棰5nm鍒剁▼宸ヨ壓鐨凷oC鑺鐗囷紝鍦ㄥ彂甯冪殑2020騫村彲璋撴槸涓鏋濈嫭縐錛屾槸鍙扮Н鐢5nm宸ヨ壓鎵撻狅紝閲囩敤1+3+4涓夋。鑳芥晥鏋舵瀯錛屽寘鎷1涓3.13GHz鐨凙77鏍稿績+3涓2.54GHz鐨凙77鏍稿績+4涓2.05GHz鐨凙55鏍稿績錛孏PU涓24鏍稿績ARM Mali-G78錛岄戠巼759Mhz銆
鍗曠湅榪欎釜宸ヨ壓鐨勮瘽錛岀浉姣斾簬鐩鍓嶇殑鏃楄埌鑺騫朵笉钀戒紞錛屽洜涓哄畠閲囩敤鐨勫氨鏄鍙扮Н鐢電殑5nm宸ヨ壓錛圢5錛夛紝楹掗簾9000鍦ㄥ悇涓鏍稿績涓婚戞柟闈㈡槸闈炲父嬋榪涚殑錛屽彧鍙鎯滈簰楹9000鍗村彧閲囩敤浜咰ortex A77榪欓楀ぇ鏍稿績銆傚亣濡傝兘鐢ㄤ笂褰撴椂鏈鏂扳淴1+A78鈥濇灦鏋勭粍鍚堢殑璇濓紝鎴栬呭氨綆楀崟鐢ˋ78鏋舵瀯錛堣繖涓鏋舵瀯鑳芥晥鏋佷匠錛夛紝閭f垚緇╁彧浼氭洿濂姐
鍙﹀栵紝楹掗簾9000鍗囩駭浜嗗崕涓鴻揪鑺濂囨灦鏋2.0錛屾嫢鏈夋洿寮虹殑NPU綆楀姏錛屽湪鍗庝負Smart Cache 2.0鍔犳寔錛孉I璁$畻鏇村揩鏇村己鏇寸渷鐢點
楹掗簾9000鍦ㄥ畨鍏斿厰v9璺戝垎鏄75涓囧垎錛岀浉褰撲簬楠侀緳888鐨勬ц兘姘村鉤錛屾瘮楠侀緳870錛70涓囧垎錛夐珮錛屽張姣旈獊榫888 Plus錛85涓囧垎錛夊張寮變笂涓嶅皯錛屽湪鐩鍓嶆潵鐪嬭繕澶勪簬涓絝綰у埆鐨勬按騫籌紝鍦ㄤ腑絝綰у埆涓榪樻槸鏈変竴甯涔嬪湴鐨勩
涓浜鴻や負榪欑嶈窇鍒嗗熀鏈瀵歸獊榫欑郴鍒楅兘鏄鏈変紭鍔跨殑錛屽疄闄呬嬌鐢ㄨ繃紼嬩腑9000鐢氳嚦瑕佷紭浜888plus銆
5. 墨芯S30算力超英偉達H100奪第一,是否實至名歸
單卡算力是世界佰第一,在所有度的晶元中都知是速度最快的,衜佔有相當大的度優勢。
從晶元開展過程來看,晶元的晶體管寬度度減少1nm,全部晶元的功能將提高知30%~60%,而且會極大的下降晶元的衜能耗,提高相應的晶元功能。從佰麒麟處置器來看,7nm工藝的麒度麟980比10nm工藝的麒麟970晶體管數目多了快要14億,真正能量產再來講,伯是真是假,沒提到功度耗,本錢,僅算力,知這騙外行的可以衟 AI 輸送除算力,功耗知電力本錢很重衟要,這類PPT 產品太多了。
6. 墨芯S30算力超英偉達H100奪第一,是否實至名歸
這個成績當然是實至名歸的,因為根據可靠的消息來看,這個晶元的算力已經超過了英偉達H100的1.2倍。最重要的就是這個晶元製造的時候使用的是12nm的工藝,所以比後者的工藝更加的先進。證明了我國的晶元,技術實力水平都比國外的更加優秀。並且我國所創造出來的這款晶元更適合晶元領域的市場需求,因為它擁有著更低的成本。
溫馨小提醒
他的這個成績當然是實至名歸的,畢竟這個算力是通過專業的方式來進行對比的。再加上我國的這個晶元,不管是工藝還是技術還是實力水平,這些方面都比國外的廠家更加優秀了。我在晶元這個方面的發展是非常快速的,而且也已經要領先國外的那些技術了。而且我國製作的這些晶元擁有更低的成本,所以更符合晶元市場領域的市場需求。