⑴ 濡備綍鍒╃敤浜戜富鏈虹畻鍔涘仛娓叉煋浣滀笟綆$悊錛
浜戦炰簯鍏變韓浜戞岄潰錛屾彁渚涜捐℃覆鏌撲竴浣撳寲鍜岃捐′豢zhen涓浣撳寲綆℃帶騫沖彴錛屾瘡涓浣嶈捐″憳鐧誨綍鍏變韓浜戞岄潰錛屽叡浜浜戜富鏈洪泦緹ょ畻鍔涳紝鐩存帴鍒╃敤浜戜富鏈洪棽緗綆楀姏錛岃繘琛屾覆鏌撳拰浠縵hen璁$畻錛岀緝鐭璁$畻鏃墮棿錛屽苟涓斾笉褰卞搷鍏朵粬媧昏穬鐢ㄦ埛姝e父綆楀姏浣跨敤闇奼傦紱涔熷彲浠ユ覆鏌撳拰浠縵hen鐩存帴鎻愪氦鍒癏PC楂樻ц兘璁$畻涓撴満錛岃嚜鍔ㄥ畬鎴愯$畻浣滀笟浠誨姟錛岃嚜鍔ㄦ寜鐓ц懼畾鐨勭洰褰曚笅杞芥湰鍦頒簯妗岄潰鍒跺畾鐩褰曪紝濡傛灉鏈夊氫釜HPC浣滀笟錛屽彲浠ヨ嚜鍔ㄦ帓闃燂紝鏈夋潈闄愬憳宸ワ紝涔熷彲浠ヨ繘琛岄噸鏂版帓鍗曞拰鎻掑崟綆$悊錛屾瀬澶у姞閫烪PC楂樻ц兘璁$畻鏁堢巼銆傝捐″憳鎸夌収涓婅堪涓ょ嶆柟寮忥紝榪涜屾覆鏌撲豢zhen璁$畻錛屽湪璁$畻鏈熼棿錛岃繕鍙浠ユe父鐧誨綍浜戞岄潰鍋氫紒涓氳捐′笟鍔★紝浜掍笉褰卞搷錛屽厖鍒嗗埄鐢ㄦ椂闂達紝鍔犲揩璁捐¤繘搴︺
⑵ 華為發布最強AI訓練集群Atlas 900的意義何在
日前,在華為全聯接2019大會上,華為副董事長胡厚昆發布了Atlas 900 AI訓練集群。
此次發布的Atlas 900 AI訓練集群由數千顆升騰910 AI處理器互聯構成,每顆升騰910 AI處理器內置32個達芬奇AI Core,單晶元提供比業界高一倍的算力。集群總算力達到256P~1024P FLOPS @FP16,相當於50萬台PC的計算能力。
華為已在華為雲上部署了一個Atlas 900 AI訓練集群,集群規模為1024顆升騰910 AI處理器。華為以極優惠的價格,面向全球科研機構和大學,即刻開放申請使用。
傳統上,我們對華為的認知是一個做基站的通訊業廠商,後來華為開始做手機,是一個手機廠商,而事實上,華為還有一個企業業務BG,為企業服務也是華為的重要業務。
那麼,華為搞這個Atlas 900 AI訓練集群的目的是什麼?這個東西到底有多先進?其意義何在呢?
一、 升騰910的實力
最近幾年,隨著深度學習演算法的突破,人工智慧開始熱了起來。但是人工智慧的計算模式與傳統的CPU計算不太一樣,這讓算力成了瓶頸。
一開始,人們用很多CPU組成傳統的超級計算機,做AI計算。
後來,人們用GPU並行計算的優勢,把GPU做人工智慧計算。我們熟悉的AlphaGO,就是在nVIDIA的GPU上訓練的。
但是,從理論角度,GPU設計出來是跑 游戲 ,跑設計的,而不是為了計算的。後來nVIDIA的黃老闆發現,這么強大的計算能力只用來玩 游戲 太浪費,搞出來通用計算,GPU才能跑計算。
而那個時候,深度學習還沒突破,人工智慧還沒熱鬧起來,所以GPU跑AI計算其實也是兼職,不是專職。
最後,人們乾脆搞專門的晶元用來做AI計算,谷歌在搞,網路在搞,中科院投資的寒武紀在搞。
華為一開始是買的寒武紀的IP,用在自己的麒麟970上面,但是很快華為發現這個東西自己也可以來,於是就開發出達芬奇架構,搞出來升騰910。
按照華為的數據,在7nm工藝上,升騰910相比Nvidia 12nm下的Tesla V100要快一倍。
因為Tesla V100不僅算AI,也要當超算的加速器用,閹割一下還得當顯卡用,所以晶體管不能全部用在算AI上。
而升騰910是專用的,這個差別,類似於CPU挖礦,GPU挖礦和礦機晶元挖礦的區別。
從專用晶元比較,網路的昆侖,寒武紀公布的晶元算力效率也很強大。但是它們相比華為的硬體實力有很大差距。
所以,華為的產品已經流片上線,它們的產品還在PPT和流片實驗階段。
目前,你能用上的AI計算,華為的方案是最強的。
二、 華為的意圖
目前,華為的升騰910和Atlas 900 AI訓練集群對外不銷售,而是通過網路提供廉價的算力。
從成本上看,Atlas 900 AI訓練集群採用「HCCS、 PCIe 4.0、100G以太」三類高速互聯方式,高速低延遲互聯的另外一個涵義就是「貴!」。
而升騰910用7nm流片,7nm本身就很貴,nVIDIA還用便宜的12nm,華為用昂貴的7nm加上昂貴的高速互聯,成本應該高很多。
但是,華為偏偏不高價賣。
nVIDIA的Tesla V100一個賣1萬美元。谷歌對外租,但是你要租一個32核的算力一個小時24美元,租一年優惠價是37842美元。
華為的價格還沒出來,但是華為說了會以極優惠的價格,面向全球科研機構和大學。
華為高成本搭建算力平台,低價出租,這是做慈善嗎?
當然不是,華為的意圖也很有意思。
現在人工智慧熱,相當於淘金。而華為,nVIDIA和谷歌(未來也許有網路、寒武紀)是賣水的。
在通訊行業,電信運營商是淘金的,華為、諾基亞,愛立信是賣水的。
華為知道賣水能發財,目前這個布局期,我賣便宜點,盡量讓淘金者喝我的水,然後習慣用我的杯子,我的水桶(AI配套的軟體框架),等你習慣了,整個AI業界都用我的算力。我再舒舒服服的收費,淘金者就只能從我這買水了。
這個策略,和當年微軟縱容盜版Windows一樣,你習慣用Windows不是個系統問題,而是整個生態都在Windows下沒法換了。X86處理器也沒法換。
這是華為的意圖。
三、 華為的AI大局缺一個網路
我們知道,當年在桌面計算上。是Wintel聯盟,英特爾出硬體,微軟出軟體,搭建生態系統。
後來移動領域,是AA,ARM和安卓,ARM和蘋果。
華為要搞這個,不僅是開放算力的問題,還需要有一個搞軟體,搞應用的把算力需求放到華為平台上來。
這個人是誰呢?網路最合適 。
網路深耕AI的年頭很長,布局時間和谷歌差不多,其他家的AI還在概念的時候,網路的AI已經落地到工業企業,用於質檢,物流,客服很多領域了。
網路的做法是,前台服務結合行業,後台算力在網路的AI雲上,網路提供軟體框架,落地到解決方案。網路雲端相當於AI的大系統。
華為的AI賣水要成功,需要和網路結合起來,華為AI提供算力,網路把華為的AI算力,做成AI雲平台,讓應用端直接調用,應用端解決實際問題。
最後是任何行業需要AI提高效率,那麼它就用網路AI雲平台的方案,直接調動功能。而網路AI再使用華為的AI計算硬體的算力。
華為與網路聯手,或者能夠變成AI時代的Wintel。
⑶ 我國算力資源分布特徵
集中分布。
我國算力資源有8個算力樞紐,10大數字中心集群,主要分布在在京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節點,呈集中分布。
算力,也稱哈希率,是比特幣網路處理能力的度量單位。即為計算機計算哈希函數輸出的速度。比特幣網路必須為了安全目的而進行密集的數學和加密相關操作。
⑷ 華為最新發布的Atlas 900號稱全球最快的AI訓練集群,到底有什麼過人的地方
據悉,Atlas 900由數千顆升騰處理器組成,可以讓AI訓練工作效率提升數十萬倍。假設一次訓練需5個月,而使用Atlas 900僅需要數十秒!在衡量AI計算能力的金標准ResNet-50模型訓練中,Atlas 900隻用了59.8秒就完成了訓練,比原世界紀錄快了10秒。打個比方,相當於短跑冠軍跑完終點,喝完一瓶水才等到第二名。
除此之外,Atlas 90在自動駕駛、氣象預測、石油勘探等特定領域也能大展拳腳。其實,AI智能技術早已結合各行各業,發展得如火如荼,混搭跨界出了新火花。
今年七月,全球首個完全由人工智慧(AI)研製的葯物就已經進入人體試驗階段,原先研製一種疫苗,需要醫葯公司數千人連續工作5年,耗費數億美元,而有了AI技術的幫助,一個小型科研團隊只用兩年左右就開發完成。AI既簡化了疫苗的研製流程、大幅降低了成本,又提高了疫苗的有效性。