A. 阿里AI晶元「含光800」問世,性能相當10顆GPU
序言
雖然世界上AI晶元品種不少,但性能特別出眾的卻是寥寥無幾,中國阿里20來年發展史上自主研發的首款國產晶元「含光800」在實測現場以出色的表現脫穎而出。它與傳統的GPU比,具有 「以1當10」 的卓越優勢。這就是1顆「含光800」的性能堪比傳統的10顆GPU,具有突出的性價比。
1 何謂「含光」?
「含光」是上古三大神劍之一,即該劍含而不露,光而不閃。此喻「含光800」所具有的隱其形強其里的算力。含光800是一款雲端AI推理晶元,重點應用於視覺場景。就其性能,含光800刷新了現有AI晶元記錄,性能及能效堪比全球第一。
該AI架構由兩部分組成:硬建系統的核心是「晶元」,好比人的驅體,軟體的核心就是「操作系統」,好比軀體的靈魂;靈魂即所謂的智能(AI)。所以,大凡世界上所有的高 科技 產品概莫能外,均由硬體與軟體構成。
2 「含光800」的卓越表現
晶元被稱為工業之母,要想掌控世界的高 科技 ,首先必須擁有自己的晶元!含光800是阿里20來年發展史上自主研發的首款國產晶元。
含光800將通過阿里雲對外輸出AI算力。基於含光800的AI雲服務當前已正式上線,相比傳統GPU算力,性價比提升100%。
在業界標准ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業界最好的AI晶元性能高出4倍;能效比是500 IPS/W參與測評第二名的3.3倍。
3 「含光800」的作用
在杭州城市大腦業務測試結果表明,1顆「含光800」的算力功能朝過目前10顆常規功能GPU。
在雲棲會現場演示其性能同樣出彩,比如城市大腦中的實時處理,對杭州主城區交通視頻,採用40顆傳統GPU,時延為300ms,而採用含「含光800」只需要4顆,其時延降至150ms。
在用於處理淘寶商品庫每天新增10億張商品圖片,使用傳統GPU算力識別需要至少1小時,而使用「含光800」後處理時間縮短至僅5分鍾。
B. 未來算力,華為升騰 910和阿里含光 800誰更強
九月,開學季,註定是不平凡的一月,10號馬總退休,18號地表最強華為AI晶元集群「Atlas 900」問世,這2天阿里又不服了,達摩院上古三大神器「含光 800」問世。
各大科技巨頭頻繁秀肌肉,先後發布智能AI晶元,都希望在人工智慧物聯網時代先人一步,這無疑是翻開了歷史的新篇章,我們正在邁向數字新世界。
1.下面我們先來介紹一下阿里旗下號稱世界最強的「平頭哥半導體公司含光800"到底有多厲害?
目前含光800已經應用於阿里巴巴集團內多個場景,未來還將應用於醫療影響,無人駕駛等領域,研發這款晶元只用了半年時間,這是阿里巴巴邁向晶元領域的一次突破,未來阿里巴巴一定是一家軟體硬體一體化的企業。(這話和華為公司的發展戰略類似)
在業界標準的Res Net-50測試中,含光800推理性能達到78563 IPS,比目前業界最好的AI晶元性能高4倍;能效比500 IPS/W,是第二名的3.3倍。
2.下面我們來介紹一下地表最強的華為晶元升騰910:(不能和華為AI訓練集群Atlas 900對比,小兵怎麼能打得過部隊)
華為晶元升騰910半精度 (FP16)算力達到256 Tera-FLOPS,整數精度 (INT8) 算力達到512 Tera-OPS,重要的是,達到規格算力所需功耗僅310W,明顯低於設計規格的350W。
升騰910總體技術表現超出預期,作為算力最強AI處理器,當之無愧。我們已經把升騰910用於實際AI訓練任務。比如,在典型的ResNet50 網路的訓練中,升騰910與MindSpore配合,與現有主流訓練單卡配合TensorFlow相比,顯示出接近2倍的性能提升。面向未來,針對不同的場景,包括邊緣計算、自動駕駛車載計算、訓練等場景,華為將持續投資,推出更多的AI處理器,面向全場景持續提供更充裕、更經濟、更適配的AI算力。
面對世界最強的上古神器」含光800「和地表最強的」升騰910「到底哪個強,大家應該可以判斷出來吧。
其實我想告訴大家的是: 未來科技拼的是算力。
【感謝閱讀關注】
C. 華為正式發布最強算力AI晶元升騰910,這款處理器到底有多強
升騰 910 採用了 7nm+ EUV 工藝,並用上了 Da Vinic 達芬奇架構。華為官方在發布時提到,升騰 910 的運算能力相當於 50 個當前最前的 CPU,它的訓練速度也是比目前最強的 AI 晶元還要強 50%-100%。
根據華為官方公布的測試數據,升騰 910 已經達到了設計規格預期。升騰 910 的 FP16 算力達到 256 Tera-FLOPS,INT8 算力達到 512 Tera-OPS。重要的是,升騰 910 達到規格算力所需功耗僅 310W,明顯低於設計規格的 350W。
升騰 910 總體技術表現超出預期,已經把升騰 910 用於實際 AI 訓練任務。比如,在典型的 ResNet50 網路的訓練中,升騰 910 與 MindSpore 配合,與現有主流訓練單卡配合 TensorFlow 相比,顯示出接近 2 倍的性能提升。
D. 華為正式發布最強算力AI晶元升騰910,這款處理器到底有多強
升騰910處理器計算能力非常強大,可以算是目前最厲害的了。
E. 榮耀V30 PRO使用麒麟990到底有多強AI性能最大領先4倍
【IT168 資訊】榮耀早前發布的榮耀V30系列上用上了最新的海思麒麟990處理器,麒麟990處理器採用7nm製造工藝,並且使用使用上了華為自研的達芬奇NPU,不僅擁有出色的性能同時在AI算力方面也有非常大的提升。另外,麒麟990 5G SoC也是首次將5G Modem集成到SoC晶元中,是全球首款5G SoC晶元。在性能、AI、網路三方面麒麟990處理器都是目前最頂尖,今天我們就來測試一下麒麟990處理器性能,並且對比一下目前主流的旗艦處理器。
榮耀V30系列搭載全新旗艦處理器:麒麟990系列,其中麒麟990 5G採用了目前行業內最先進的7nm+EUV(極紫外光刻工藝)製程工藝,面積更小,功耗更低。正因如此,麒麟990 5G的晶體管數量達到了103億。
同時,麒麟990 5G首次將5G Modem集成到SoC晶元中,在晶元體積方面,根據官方給出的數據顯示,這枚晶元僅有200mm²左右面積大小,與一個指甲蓋大小相仿。而小尺寸的設計也讓麒麟990 5G可以為機器的其他部件騰出更多的位置,提升能效之餘,也能為增添更多的手機功能埋下伏筆。
在核心設計方面,麒麟990系列採用2個大核+2個中核+4個小核的三檔能效架構,GPU方面麒麟990系列也有較大升級,其搭載了16核Mali-G76 GPU,實現業界領先的性能與能效。
榮耀V30 PRO DXO122分 5G雙模 麒麟990 5GSOC晶元 雙超級快充 游戲手機8GB+128GB冰島幻境 雙卡雙待
京東價:3589.00
去購買
在NPU方面,麒麟990系列採用了自主研發的達芬奇架構,並擁有獨有的NPU大核+NPU微核設計,在與目前主流的具備NPU架構的晶元相比能效最高多達8倍,性能最高多達6倍,而這也讓其登上NPU的性能寶座。
從上面的表格可以看到,麒麟990 5G和麒麟990之間還是有一些差別,CPU的大核是一樣的,但麒麟990 5G的中核和小核的頻率稍高,另外GPU頻率上麒麟990 5G的頻率要比麒麟990高100MHz,還有NPU架構上麒麟990 5G是2+1架構,麒麟990是1+1架構,所以整體性能上麒麟990 5G會比麒麟990稍高一些。
如何測試:
我們這次測試使用榮耀V30 PRO作為測試機器,同時加入了麒麟980、高通驍龍855 Plus、蘋果A13和三星准旗艦級的Exynos 980作為對比,測試主要分為CPU性能、GPU性能和AI性能,測試使用Geekbench測試手機的CPU性能、3Dmark測試手機的GPU性能(iOS只支持OpenGL),AI Benchmark測試手機的AI性能(iOS不支持)。
CPU性能:
首先我們看一下CPU性能,我們使用最新的Geekbench5進行測試,可以看到蘋果A13的性能是最出色的,而安卓陣營旗艦處理器中,麒麟990 5G的性能表現最為出色,單核心性能和高通驍龍855 Plus的差距並沒有拉得很開,但在多核性能上麒麟990 5G已經大幅超越了高通驍龍855 Plus,相比蘋果A13隻相差364分。
GPU性能
3D性能方面,可以看到OpenGL ESS3.1部分,麒麟990 5G和高通驍龍855 Plus總分都非常接近,但在Vulkan部分麒麟990 5G則領先高通驍龍855 Plus。麒麟990 5G使用的是公版架構的Mali G76 GPU,而高通驍龍855 Plus使用Adreno 640 GPU,在性能上Adreno 640要優於公版架構的Mali G76,但麒麟990 5G的Mali G76擁有16個核心並且頻率高達700MHz,也讓麒麟990 5G的3D性能在OpenGL部分和驍龍855 Plus不相上下,而在新的Vulkan API下麒麟990 5G的3D性能獲得了更好的發揮,特別是在物理加速部分。
AI算力
麒麟990 5G採用華為自研達芬奇計算架構,採用達芬奇3D架構,讓NPU的算力提升,可以看到AI Benchmark分數有絕對的優勢,麒麟990 5G在AI Bnechmark中得分80343風,瑤瑤領先高通驍龍855 Plus,相對上一代的麒麟980,同樣有了數倍的成績提升。另外對比三星的Exynos 980,麒麟990 5G的AI性能領先4倍有多。
總結:
這個測試主要針對了麒麟990 5G的CPU、GPU以及AI算力進行的理論測試,通過理論測試可以看到麒麟990 5G的CPU和GPU性能達到甚至超越了同級的高通驍龍855 Plus,而AI性能方面,麒麟990 5G擁有非常大的優勢,讓麒麟990 5G成為了麒麟處理器中目前綜合性能最強的晶元。榮耀V30 PRO用上了麒麟990 5G晶元,麒麟990 5G晶元從製造工藝、架構、NPU、ISP等等方面進行了一次全面的大升級,讓整體性能發揮更為當出色,加上支持雙模5G,讓榮耀V30 PRO成為了5G標桿手機。
F. 簡述cpu、gpu、fpga和asic四種人工智慧晶元的性能
FPGA(Field Programmable Gate Array,現場可編程門陣列)具有足夠的計算能力和足夠的靈活性。FPGA的計算速度快是源於它本質上是無指令、無需共享內存的體系結構。對於保存狀態的需求,FPGA中的寄存器和片上內存(BRAM)是屬於各自的控制邏輯的,無需不必要的仲裁和緩存,因此FPGA在運算速度足夠快,優於GPU。同時FPGA也是一種半定製的硬體,通過編程可定義其中的單元配置和鏈接架構進行計算,因此具有較強的靈活性。相對於GPU,FPGA能管理能運算,但是相對開發周期長,復雜演算法開發難度大。
ASIC(Application Specific Integrated Circuit特定用途集成電路)根據產品的需求進行特定設計和製造的集成電路,能夠在特定功能上進行強化,具有更高的處理速度和更低的能耗。缺點是研發成本高,前期研發投入周期長,且由於是定製化,可復制性一般,因此只有用量足夠大時才能夠分攤前期投入,降低成本。
CPU:
中央處理器作為計算機系統的運算和控制核心,是信息處理、程序運行的最終執行單元,CPU 是對計算機的所有硬體資源(如存儲器、輸入輸出單元) 進行控制調配、執行通用運算的核心硬體單元。
優點:CPU有大量的緩存和復雜的邏輯控制單元,非常擅長邏輯控制、串列的運算
缺點:不擅長復雜演算法運算和處理並行重復的操作。
對於AI晶元來說,算力最弱的是cpu。雖然cpu主頻最高,但是單顆也就8核,16核的樣子,一個核3.5g,16核也就56g,再考慮指令周期,每秒最多也就30g次乘法。還是定點的。
生產廠商:intel、AMD
現在設計師最需要的就是GPUCPU,呆貓桌面雲可以享受高GPUCPU的待遇。
GPU:
圖形處理器,又稱顯示核心、視覺處理器、顯示晶元,是一種專門在個人電腦、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上做圖像和圖形相關運算工作的微處理器。
優點:提供了多核並行計算的基礎結構,且核心數非常多,可以支撐大量數據的並行計算,擁有更高的浮點運算能力。
缺點:管理控制能力(最弱),功耗(最高)。
生產廠商:AMD、NVIDIA
G. 墨芯S30算力超英偉達H100奪第一,是否實至名歸
單卡算力是世界佰第一,在所有度的晶元中都知是速度最快的,衜佔有相當大的度優勢。
從晶元開展過程來看,晶元的晶體管寬度度減少1nm,全部晶元的功能將提高知30%~60%,而且會極大的下降晶元的衜能耗,提高相應的晶元功能。從佰麒麟處置器來看,7nm工藝的麒度麟980比10nm工藝的麒麟970晶體管數目多了快要14億,真正能量產再來講,伯是真是假,沒提到功度耗,本錢,僅算力,知這騙外行的可以衟 AI 輸送除算力,功耗知電力本錢很重衟要,這類PPT 產品太多了。
H. 驍龍855,華為980,蘋果A12誰的Ai性能最強誰是第二強
我們先來看看高通驍龍855
以7nm製程為堅實基礎,先進IP設計就是鋼鐵骨架,它決定整座建築能有多高。今年6月,ARM發布了新一代具有頂級性能的CPU和GPU架構——定製Cortex A76、Mali-G76。不到3個月間隔,華為就率先實現將這兩項IP設計實現商用。麒麟980在全球首次實現基於Cortex-A76的開發商用,最高主頻可達2.6GHz,與上一代相比單核性能提升75%,能效提升58%,為智能手機注入筆記本電腦級性能。麒麟980率先在手機晶元上集成雙核NPU,實現業界最高端側AI算力,實現每分鍾圖像識別4500張,識別速度相比上一代提升120%,遠高於業界同期水平;多人姿態估計實時幀率高達30 fps,能夠實時繪制出人體的關節和線條。通信性能向來是華為手機的傳統優勢,麒麟980更進一步在全球率先支持LTE Cat.21,支持業界最快的下行1.4Gbps速率,更靈活的應對全球不同運營商的頻段組合。