A. 500p算力是什麼概念
50億億概念。P是一個數量級,10的15次方,500P就是50億億,50PFlops算力就意味著每秒有50億億次的浮點運算能力。算力也稱哈希率是比特幣網路處理能力的度量單位。腔核即為計算機(CPU)計算哈希埋坦函數輸出的速彎圓桐度。
B. 人工智慧計算中心有什麼用途
當前,各行各業對適配AI模型的訓練需求呈爆發式增長,而一個高質量的AI模型是通過訓練和持續迭代優化而來的。當大模型、多模態演算法模型訓練逐漸成為主流,人工智慧算力需求每3.5個月就翻一番,企業在AI研發中進行模型訓練的算力成本居高不下。因此,能否為企業和科研機構提供可持續、高適配、高彈性的訓練算力成為衡量各地人工智慧計算中心「含金量」的核心指標。如果沒有技術足夠成熟的訓練晶元來提供訓練算力保障,就難以保障平台產出演算法模型的效率,那麼以億為成本而建設的人工智慧計算中心也就成了「雷聲大雨點小」的空殼工程。
訓練晶元和推理晶元之別
在實際的人工智慧計算中心硬體布局中,晶元主要適配於推理和訓練兩大場景。訓練晶元和推理晶元之間的邏輯差別可以理解為:訓練晶元像老師,一遍一遍教一個完全不認字的小孩從零開始識字,一遍不會就再教一遍,直到教會為止;而推理晶元則是已經學會識字的小孩,閱讀不同的書本時,可以識別出書本中的字。
換句話說,訓練是從現有的數據中學習新的能力,而推理則是將已經訓練好的能力運用到實際場景中。離開了訓練的推理,就相當於空中樓閣。所以,相較於推理晶元,訓練晶元是人工智慧不斷進化的基礎,也是眾多AI晶元廠商需要著力攻克的研發高地。
訓練晶元有哪些特點
那麼,與推理晶元相比,訓練晶元在技術上具有哪些特點?
首先,訓練晶元具備浮點運算能力。復雜模型的訓練過程中,需通過精細的浮點表達能力對上千億個浮點參數進行微調數十萬步。無浮點運算能力的晶元如用於訓練將增加約40%的額外操作,以及至少4倍的內存讀寫次數。
其次,訓練晶元具有專用AI加速單元,並具有高能效比的特點。當前有個別廠商採用2016年國外品牌GPU架構,缺少AI加速單元,導致其AI訓練能效比差,且能耗劇增。與之相比,配置矩陣加速單元的訓練晶元可使AI訓練效率提升10倍。
為AI產業提供充沛算力,需要在AI處理器硬體上有扎實的技術積累。據了解,目前許多人工智慧計算中心使用的由升騰910AI訓練處理器,原生具備訓練能力,集群性能業界領先。目前,該集群可以在28秒完成基於Resnet-50模型訓練(持續保持業界第一),並且性能還將持續提升。同樣,基於升騰AI基礎軟硬體平台的「鵬城雲腦II」榮獲AIPerf(世界人工智慧算力)第一名,並再次刷新IO500(高性能計算存儲系統性能排行榜-全系統輸入輸出和10節點系統)兩項世界冠軍。
訓練晶元市場前景廣闊
隨著自動駕駛、生物信息識別、機器人、自動巡檢等人工智慧終端產品和應用越來越普遍化,人工智慧產業集群的價值不可估量。在從理論走向應用的產業化過程中,訓練晶元作為算力平台的「心臟」,其市場也持續蓬勃發展。
研究機構賽迪顧問發布的報告顯示,從2019年到2021年,中國雲端訓練AI晶元市場累計增長了約127%。2021年,雲端訓練晶元市場規模將達到139.3億元。據預測,從2019年到2024年,雲端訓練晶元的年復合增長率或達到32%。
以全國第一個人工智慧計算中心——武漢人工智慧計算中心為例,其一期建設規模為100P FLOPS AI算力,今年5月31投運當天算力負載便達到了90%,投運之後持續滿負荷運行。如今,武漢人工智慧計算中心仍在持續擴容中。9月初正式上線的西安未來人工智慧計算中心一期規劃300PFLOPSFP16(每秒30億億次半精度浮點計算)計算能力。作為西北地區首個大規模人工智慧算力集群,其算力平台承載力達到了當下我國同類平台中的領先的水平。
市場的高速增長預示著,當人工智慧發展到深水區階段,各行各業對AI訓練算力的需求將長期保持幾何級增長。而訓練晶元作為訓練算力的引擎,也是人工智慧模型訓練的「基礎中的基礎」,也將作為人工智慧計算中心的靈魂得到更廣泛的重視。相信,在我國極為豐富的AI應用生態優勢引領下,無論是訓練晶元還是推理晶元,都將得到更為長足的快速發展。
人工智慧計算中心是智慧城市建設、企業智能化升級、人工智慧企業集約集聚的核心,我們這邊就是處於智慧城市的建設中,用的是華為這邊提供的解決方案,他們的人工智慧計算中心要更加穩定靠譜,提供的服務也要好很多。
C. 深圳之後「第二城」:華為布局西安,劍指「每秒百億億次」
由華為參與建設, 規劃算力比肩深圳「鵬城雲腦」的人工智慧計算中心 ,落戶西安。
科技 發展到當下,「人工智慧」已是新一輪 科技 革命和產業變革的重要驅動力量,並成為新的國家發展戰略之一。西安, 也是「國家新一代人工智慧創新發展試驗區」。
這個堪稱「最強大腦」,它給我們帶來什麼?
落地: 全球領先的算力中心
綜合相關報道: 西安,是深圳鵬城雲腦外全國第二大人工智慧計算中心 。
公開新聞顯示,「未來人工智慧計算中心」定位極高: 「立足西安,依託秦創原,面向西北, 領先全球的新一代人工智慧計算平台 。」建成後:
「將用於自動駕駛、智慧醫療、智慧城市、智慧交通、智慧礦山等多種應用場景,支撐 國家戰略任務落地、促進經濟與產業發展 融合。」
該中心分兩期建設實施,這個 新一代人工智慧計算平台 核心 算力 如何?
一期,為算力為 300PFLOPS FP16 (每秒30億億次) 人工智慧計算中心;二期,為高層產業研發中心。2025年,目標算力規模達 1000PFLOPS FP16 (每秒100億億次) 。
作為專業術語的「算力」,可能很多人並不了解。 如果進行對比,深圳鵬城雲腦II已成為世界最強的AI算力中心。
華為升騰計算業務總裁許映童表示:華為將 助力西安打造人工智慧「一中心四平台」整體框架 ,通過建設集約化、統一化的人工智慧計算中心,實現政、產、學、研、用五位一體,通過算力集群,賦能產業集群, 推動陝西人工智慧產業數字化與智能化加速發展。
在已有各類超算中心情況下,「AI計算」能量在哪?
要知道,人工智慧 (AI ) 應用場景不斷擴展,幾乎涵蓋了人類 社會 每個領域。 由華為與深圳鵬城實驗室共建的「鵬城雲腦」,走在世界的前列 。
發展: 它究竟多驚人?
那麼,「鵬城雲腦II」究竟有多強?
2020年10月運行的當年,已初展身手:接連奪得 IO500總排行榜、10節點排行榜兩項冠軍 和 AIPerf500的世界冠軍 ,「沖擊高性能計算領域最權威的全球性榜單」成為現實。
2021年7月1日,國際超級計算新一期排行榜中: 「鵬城雲腦II」再次刷新世界紀錄,蟬聯全系統輸入輸出和10節點規模系統兩項世界冠軍 。
「鵬城雲腦II」,已成為 全球計算密度最高,訓練速度最快的AI基礎設施 。
盡管,傳統超算和AI超算有所不同。但是,「鵬城雲腦II」1000P的AI算力—— 每秒百億億次 ,也幾乎堪稱世界最強大的超級計算。
西安「未來人工智慧計算中心」2025年算力規劃,將比肩深圳「鵬城雲腦II」 ——相當於50萬台高性能PC算力之和:
24小時內,能處理 100億 張圖像,
或 1千萬小時 語音 (40萬天)
或 1萬天 (27年) 自動駕駛數據等;
面對有 20萬顆 星星的星空圖,
一位天文學家,定位需耗費 169天 ,
這里可縮短至10秒。
那麼, 「鵬城雲腦-II」可以做什麼 ?
主要提供人工智慧研究必須的計算力資源、存儲資源、網路資源、數據資源和研究環境,覆蓋人工智慧基礎研究、重大應用、操作系統、數據資源共享、產業服務等專門研究實驗領域。
它向深圳衛生 健康 、公安交警、巴士交通等提供服務,並服務於國家重大戰略需求、大規模挑戰性科學計算等關鍵領域。
所以,它不僅是深圳的,它更是國家的國之重器。 毫不誇張,「鵬城雲腦-II」是國家科研類新基建工程,將推進我國自主核心技術的發展,提升粵港澳大灣區乃至全國AI產業國際競爭力。
時代: 迎接一個新的開始
對西安來說,在回歸製造業的同時,要通過科研和創新實現產業升級和迭代。
目前西安,相對優勢愈加明顯——強大學府資源、科研實力和創新基底。同時, 隨著經濟的實質性增強以及產業結構的變化,省市兩級推動西安「國家綜合性科學中心」建設 。
比如「秦創原」,舉全省之力推動。在2020年3月9日, 科技 部網站公布 「支持西安建設國家新一代人工智慧創新發展試驗區」。
這,既是對西安人工智慧產業的期許,也是對西安人工智慧實力的認可。
截至2020年,西安有人工智慧企業150餘家,年產值約120億。西安規劃提出到2022年,實現人工智慧總體發展水平全國領先,打造5-7個產業聚集區, 產業規模超過200億,相關產業規模突破1000億。
2021年《全球AI最具創新力城市榜單》中: 西安名列中國第7名,全球第60名。 華為共建的「未來人工智慧計算中心」,無疑「錦上添花」。
結合深圳「鵬城雲腦」經驗, 西安「未來人工智慧計算中心」除擁有世界最強算力外,可能會實現:
「將進一步推動了制度創新、政策創新,有助於加快實現人工智慧對經濟 社會 發展的帶動和支撐作用,加快形成國家新一代人工智慧試驗區的西安方案。」
可以說,它將成為中國科研類新基建工程。對大力當下發展的西安而言,更值得期待。
對於「人工智慧(AI)」,學界有不少說法,包括
《時間簡史》作者「斯蒂芬·霍金」表示:
「完全人工智慧的發展,可能意味著人類的終結。一旦人類開發出人工智慧,它就會自行起飛並以越來越快的速度重新設計自己。受緩慢生物進化限制的人類,無法競爭並會被取代。」
D. 專家預計東數西算工程可撬動8倍的相關產業投資
專家預計東數西算工程可撬動8倍的相關產業投資
專家預計東數西算工程可撬動8倍的相關產業投資,17日,國家發改委批復了4個算力樞紐節點建設文件,至此,全國八大算力樞紐節點建設正式全面啟動,專家預計東數西算工程可撬動8倍的相關產業投資。
國家發展改革委等部門17日正式發布消息,同意京津冀、長三角、粵港澳大灣區、成渝等地啟動建設全國一體化算力網路國家樞紐節點。至此,全國一體化大數據中心體系完成總體布局設計,「東數西算」工程正式全面啟動。
所謂「東數西算」,「數」指的是數據,「算」指的是算力。「通俗地講,即把東部的數據傳輸到西部進行計算和處理,如同南水北調、西電東送。『東數西算』是國家又一項重要戰略工程,以一體化思路,推動東西部數據中心與網路、雲、算力、數據要素、應用和安全等協同發展。」中國信息通信研究院雲計算與大數據研究所副所長李潔解釋說。
「東數西算」8大算力樞紐
和10個集群全部落地
同一天,京津冀、長三角、粵港澳大灣區、成渝等全國一體化算力網路4大國家樞紐節點落地。再加上去年12月貴州、內蒙古、甘肅、寧夏啟動建設全國一體化算力網路國家樞紐節點獲得批復,「東數西算」8大算力樞紐和10個集群全部落地。
其中,京津冀樞紐規劃設立張家口數據中心集群;長三角樞紐規劃設立長三角生態綠色一體化發展示範區數據中心集群和蕪湖數據中心集群;成渝樞紐規劃設立天府數據中心集群和重慶數據中心集群;粵港澳大灣區樞紐規劃設立韶關數據中心集群,起步區邊界為韶關高新區。
「國家樞紐節點將成為推動數字經濟發展的『糧倉』和『血庫』,在打造數字城市、提供超級算力、構建城市智慧大腦、提高政府治理能力和水平、保障國家網路和信息安全等方面發揮著關鍵作用,是關系國家安全、穩定、發展的重要戰略性基礎設施。」工業和信息化部信息通信經濟專家委員會委員馮傑說。
每年投資體量將達數千億元
有力帶動產業上下游投資
「東數西算」建設將拉動哪些上下游產業鏈發展,帶動多少投資?
有權威機構和專家估算,「東數西算」工程每年投資體量將達數千億元,對相關產業拉動作用會達到1:8。這也意味著該工程將大大超過「西氣東輸」和「南水北調」工程。這恰恰是中國「數字經濟」的力量。
「數據中心產業鏈既包括傳統的土建工程,還涉及IT設備製造、信息通信,基礎軟體、綠色能源供給等,產業鏈條長、覆蓋門類廣、帶動效應大。以統籌優化布局,促進數據中心精準發力,將有力帶動產業上下游投資。」國家發展改革委新高司相關負責人說。
從相關研究報告的量化數據顯示,計算力指數平均每提高1個百分點,數字經濟和GDP將分別增長3.3%。和1.8%。。
事實上,伴隨著5G、人工智慧等新技術快速發展,我國數據資源存儲、計算和應用需求不斷提升,帶動著數據中心規模的高速增長,近5年我國數據中心機架年均規模增速超過30%。
華為、世紀互聯等眾多公司
積極布局「東數西算」
上海證券報記者了解到,包括華為、世紀互聯、中國電信、網路等多家頭部企業在積極參與「東數西算」工程中。
「我們積極參與『東數西算』工程,業務布局和國家戰略高度一致。」華為雲負責人告訴記者,華為公司在2017年就提出了南貴北烏的雲數據中心布局,在貴安新區和烏蘭察布大數據產業園均規劃建設超大型數據中心基地,遠期伺服器均達到100萬台以上。
「世紀互聯成立於1996年,在1999年建成我國第一座第三方數據中心機房。在公司發展的前20多年,資源布局主要集中在一線城市及其周邊。在國家『東數西算』工程和一體化大數據中心協同創新發展指引下,世紀互聯將通過新建項目向中西部地區傾斜和東部數據中心功能提升兩項措施並舉。其中,公司將逐漸加大在西部地區布局建設大型與超大型數據中心的比例,預計未來5年在西部地區的數據中心投資增速將是東部的兩倍。」世紀互聯集團輪值CEO王世琪告訴記者。
「我們位於西部樞紐節點內的數據中心,可以充分利用西部在氣候、環境等方面的優勢,將綠色和智能技術融入整體設計中,大幅降低數據中心的PUE和企業的運營成本,能效比PUE僅1.12,未來滿負荷運行的情況下預計每年可節省電力10.1億度,減少碳排放81萬噸,相當於年植樹3567萬棵。」華為雲負責人說。
17日,國家發改委批復了4個算力樞紐節點建設文件,至此,全國八大算力樞紐節點建設正式全面啟動,根據測算,十四五期間,每年將新增4000億元以上相關投資。今後,國內大數據產業也將形成「東數西算」的格局。
國家發改委批復的全國八大算力樞紐節點,4個分布京津冀、長三角、粵港澳、成渝等算力需求較大的地區附近;4個分布在貴州、內蒙古、甘肅、寧夏等可再生能源豐富的地區。國家發改委表示,目前,我國數據中心大多分布在東部,在土地、能源等資源緊張的形勢下,在東部大規模發展數據中心成本高昂,難以為繼;要利用西部清潔能源豐富的優勢,支撐東部對算力的高需求。
中國工程院院士 清華大學教授 鄭緯民:東部土地資源有限,電比較貴,一個大概100PFlops(每秒浮點運算次數)的計算中心,在東部一年要花五六千萬元電費。因此,現在要想辦法把東部的數據傳到西部去。
國家發改委表示,未來,國內新的大規模數據中心增量將重點布局在八大算力樞紐節點,這樣的布局,既要服務於重大區域發展戰略實施的需求,也考慮到了網路時延要求。對於網路時延要求較高的業務,要就近建設,對網路時延要求不高的業務,比如離線分析、存儲備份等,就可以率先轉移到西部算力樞紐節點承接。今後,全國范圍內的大型、超大型數據中心原則上將在這八大算力樞紐節點內建設。
國家發改委高技術司副司長 孫偉:要像「南水北調」「西電東送」一樣,推動全國一體化的'數據中心布局建設,擴大算力設施的規模,提高算力使用效率,實現全國算力規模化、集約化發展。
(央視財經《正點財經》)
近日,國家發展改革委、中央網信辦、工業和信息化部、國家能源局聯合印發通知,同意在京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節點,並規劃了10個國家數據中心集群。至此,全國一體化大數據中心體系完成總體布局設計,「東數西算」工程正式全面啟動。
南都記者注意到,受此消息影響,截至2月18日收盤,雲計算指數、大數據指數多股掀起漲停潮——首都在線、雲賽智聯、數據港、佳力圖、美利雲、浙大網新等漲停。
預計每年拉動4000億元投資
「東數西算」,「數」指的是數據,「算」指的是算力。通俗來講,「即把東部的數據傳輸到西部進行計算和處理。
國家發改委高技術司副司長孫偉介紹,我國西部地區資源充裕,特別是可再生能源豐富,具備發展數據中心、承接東部算力需求的潛力。「要像』南水北調』』西電東送』一樣,充分發揮我國體制機制優勢,從全國角度一體化布局,優化資源配置,提升資源使用效率。」
按照全國一體化大數據中心體系布局,8個國家算力樞紐節點(京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏)將作為我國算力網路的骨幹連接點,發展數據中心集群,開展數據中心與網路、雲計算、大數據之間的協同建設,並作為國家「東數西算」工程的戰略支點,推動算力資源有序向西轉移,促進解決東西部算力供需失衡問題。
每個算力樞紐內,都規劃設立了1至2個數據中心集群。算力樞紐和集群的關系,類似於交通樞紐和客運車站。
國家發展改革委創新驅動發展中心副主任徐彬說,數據中心集群將匯聚大型、超大型數據中心,具體承接數據流量。集群將獲得更好的政策支持、配套保障,同時在綠色節能、資源利用率、安全保障水平等方面也會有更嚴格的要求。
圍繞8個國家算力樞紐節點,10個國家數據中心集群分別是張家口集群、長三角生態綠色一體化發展示範區集群、蕪湖集群、韶關集群、天府集群、重慶集群、貴安集群、和林格爾集群、慶陽集群、中衛集群。
10個國家數據中心集群分布。來源:國家發改委
據了解,「東數西算」工程數據中心產業鏈條長、投資規模大,帶動效應強。國家發改委預計,該項工程將帶動信息通信、IT設備製造、基礎軟體、綠色能源供給以及土建工程等產業鏈發展。有業內人士測算,通過算力樞紐和數據中心集群建設,將有力帶動產業上下游投資,預計啟動後將每年拉動4000億元投資。
國盛證券研報分析,算力、流量持續高速增長是必然趨勢,配套基礎設施持續建設擴容是剛性需求,未來3-5年具有高確定性。算力、流量乃至應用的發展將帶動移動網路建設力度,5G及相關產業鏈作為核心也將持續受益。
為什麼要打造「東數西算」
根據相關數據,截至目前,我國數據中心規模已達500萬標准機架,算力達到130EFLOPS(每秒一萬三千億億次浮點運算)。隨著數字技術向經濟社會各領域全面持續滲透,全社會對算力需求仍十分迫切,預計每年仍將以20%以上的速度快速增長。
算力已成為國民經濟發展的重要基礎設施。加快推動算力建設,將有效激發數據要素創新活力,加速數字產業化和產業數字化進程,催生新技術、新產業、新業態、新模式,支撐經濟高質量發展。
近年來,隨著數據中心規模快速發展,對能源、土地、氣候等條件提出了更高要求。一些東部地區應用需求很大,但能耗指標緊張、電力成本高,大規模發展數據中心的難度和局限性大;而一些西部地區可再生能源豐富,氣候適宜,但存在網路帶寬小、跨省數據傳輸費用高等瓶頸,無法有效承接東部需求。
國家發改委解釋稱,近年來,隨著各行業數字化轉型升級進度加快,特別是5G、人工智慧、物聯網等新技術的快速普及應用,全社會數據總量爆發式增長,數據存儲、計算、傳輸、應用的需求大幅提升。因此,全國一體化算力網路國家樞紐節點,作為是我國算力網路的骨幹節點,加快建設也就成了當務之急。
因此,迫切需要加大國家算力網路的頂層設計,盡快轉變以網為中心的發展模式,圍繞數據中心重構網路格局。
哪些數據送往西部去算?來源:國家發改委
南都記者獲悉,早在2021年5月,國家發改委等四部門印發《全國一體化大數據中心協同創新體系算力樞紐實施方案》,其中明確提到,支持開展「東數西算」示範工程,深化東西部算力協同。
《「十四五」信息通信行業發展規劃》明確,到2025年,數據中心布局實現東中西部協調發展,集約化、規模化發展水平顯著提高,形成數網協同、數雲協同、雲邊協同、綠色智能的多層次算力設施體系,算力水平大幅提升,人工智慧、區塊鏈等設施服務能力顯著增強。
此外,國務院印發《「十四五」數字經濟發展規劃》提出,加快實施「東數西算」工程,推進雲網協同發展,提升數據中心跨網路、跨地域數據交互能力,加強面向特定場景的邊緣計算能力,強化算力統籌和智能調度。
粵港澳大灣區樞紐啟動
粵港澳大灣區作為8個國家算力樞紐節點之一,如何發展備受關注。南都記者獲悉,近日,國家發展改革委、中央網信辦、工業和信息化部、國家能源局復函同意粵港澳大灣區啟動建設全國一體化算力網路國家樞紐節點(以下簡稱「粵港澳大灣區樞紐」)。
根據復函,粵港澳大灣區樞紐將於韶關高新區設立數據中心集群,承接廣州、深圳等地實時性算力需求,引導溫冷業務向西部遷移,構建輻射華南乃至全國的實時性算力中心。
根據國家樞紐節點建設要求,粵港澳大灣區國家樞紐節點將建立包含韶關數據中心集群、城市數據中心和邊緣計算、西部地區國家樞紐節點等省外數據中心在內的三個層次的數據中心空間布局結構。
其中,韶關數據中心集群提升網路級別至國家級骨幹網路樞紐節點,引導全省大型、超大型(3000架以上)數據中心集聚,省內其他地區原則上不再新建大型、超大型數據中心。到2025年,韶關數據中心集群將建成50萬架標准機架、500萬台伺服器規模,投資超500億元(不含伺服器及軟體),以承載低時延類業務(時延要求小於20ms)的大型、超大型數據中心為主,輔助建設部分確需在省內建設、承載中時延要求業務(時延要求20ms-50ms)的大型、超大型數據中心。
在韶關數據中心集群建設的結構上,國家發改委明確要求,建設應符合新型數據中心發展要求,盡快啟動起步區建設,逐步落地重點建設項目,項目建設主體原則上為數據中心相關行業骨幹企業,支持發展大型、超大型數據中心,建設內容將涵蓋綠色低碳數據中心建設、網路服務質量提高、算力高效調度、安全保障能力提升等。
E. 壁仞科技發布首款通用GPU晶元BR100,產品性能處於一個什麼水平
這個晶元能處於領先地位,由於他這個晶元和半導體還採取了最高端的科研領域,也會讓人們的體驗帶來享受。
F. 英偉達秀全球最大GPU,黃仁勛從烤箱里拿出的產品果然「爆了」
SegmentFault 思否報道丨公眾號:SegmentFault
是他,還是那個男人,那個熟悉的皮夾克。
5 月 14 日 晚,黃仁勛在廚房召開了英偉達 GTC 2020 線上發布會。由於新冠病毒疫情影響,英偉達原計劃的現場活動被迫取消,定於 3 月 24 日通過媒體發布的新聞稿也未見蹤影。千呼萬喚中,黃仁勛終於在烤箱前和大家見面了。
本屆 GTC 從預熱開始就不走尋常路,黃仁勛在大會前一天曬出了自己從烤箱里拿出了 全新的安培(Ampere)架構 GPU NVIDIA A100 。
令人頗感意外的是,雖然無法舉辦線下活動,英偉達竟然連線上直播都懶得辦,直接播放了黃仁勛在自家廚房裡錄制的視頻完成了新品發布。果然是手裡有「硬貨」就不在乎形式了。
英偉達的首款安培架構 GPU 可以算「史上最強」了,基於 7nm 工藝製程,擁有 540 億晶體管,面積為826mm²,與 Volta 架構相比性能提升了 20 倍 ,既可以做訓練也可以做推理。
NVIDIA A100 具有 TF32的第三代 Tensor Core 核心,能在不更改任何代碼的情況下將 FP32 精度下的 AI 性能提高 20倍,達到19.5萬億次/秒 。
多實例 GPU-MG 可將單個 A100 GPU 分割為 7 個獨立的 GPU,根據任務不同提供不同的計算力,實現最佳利用率和投資回報率的最大化。
NVIDIA A100 新的效率技術利用了AI數學固有的稀疏性,優化之後性能提升了一倍。
英偉達將 NVIDIA A100 的特性總結為以下 5 點:
黃仁勛說:「Ampere架構的突破性設計為英偉達第八代GPU提供了迄今為止最大的性能飛躍, 集 AI 訓練和推理於一身,並且其性能相比於前代產品提升了高達 20 倍 。這是有史以來首次,可以在一個平台上實現對橫向擴展以及縱向擴展的負載的加速。A100 將在提高吞吐量的同時,降低數據中心的成本。」
NVIDIA A100 是第一個基於 NVIDIA 安培架構的 GPU,提供了在 NVIDIA 八代 GPU 里最大的性能提升,它還可用於數據分析,科學計算和雲圖形,並已全面投產並交付給全球客戶。
全球 18 家領先的服務提供商和系統構建商正在將 NVIDIA A100 整合到他們的服務和產品中,其中包括阿里雲、AWS、網路雲、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。
黃仁勛還介紹了基於 NVIDIA A100 的第三代 AI 系統 DGX-A100 AI。DGX-A100 AI 是世界上第一台單節點 AI 算力達到 5 PFLOPS 的伺服器 ,每台 DGX A100 可以分割為多達 56 個獨立運行的實例,還集合了 8 個 NVIDIA A100 GPU,每個 GPU 均支持 12 路 NVLink 互連匯流排。
據了解,與其他高端 CPU 伺服器相比,DGXA100 的 AI 計算性能高 150 倍、內存帶寬高 40 倍、IO 帶寬高 40 倍。
黃仁勛說:「AI已經被應用到雲計算、 汽車 、零售、醫療等眾多領域,AI演算法也正變得越來越復雜和多樣。ResNet模型的算力需求從2016年到現在已經增加了3000倍,我們需要更好的解決方案。」
如此強大的 DGX-A100 AI 售價自然也不便宜,標價 19.9 萬美元,約合人民幣 141 萬元。
此外,黃仁勛還提到了英偉達新一代 DGXSuper POD 集群,由 140 台DGXA100系統組成,AI算力達 700 Petaflops,相當於數千台伺服器的性能 。
據了解,首批 DGXSuper POD 將部署在美國能源部阿貢國家實驗室,用於新冠病毒疫情相關的研究。
除了以上兩款重磅產品,黃仁勛還宣布推出了 NVIDIA Merlin,這是一個用於構建下一代推薦系統的端到端框架,該系統正迅速成為更加個性化互聯網的引擎。Merlin將創建一個 100 TB 數據集推薦系統所需的時間從四天減少到 20 分鍾。
英偉達此次還推出了眾多 AI 領域相關產品,包括 乙太網智能網卡 Mellanox ConnectX-6 Lx SmartNIC、EGX 邊緣 AI 平台和一系列軟體更新擴展。
1.乙太網智能網卡 Mellanox ConnectX-6 Lx SmartNIC
ConnectX-6 Lx 是業界首個為 25Gb/s 優化的安全智能網卡,可提供兩個 25Gb/s 埠或一個 50Gb/s 埠。
2.EGX 邊緣 AI 平台
EGX Edge AI 平台是首款基於 NVIDIA 安培架構的邊緣 AI 產品,可接收高達 200Gbps 的數據,並將其直接發送到 GPU 內存進行 AI 或 5G 信號處理。
3.Spark 3.0
英偉達還宣布在 Spark 3.0 上支持 NVIDIA GPU 加速,基於 RAPIDS 的 Spark 3.0,打破了提取,轉換和載入數據的性能基準。它已經幫助 Adobe Intelligent Services 將計算成本降低了90%。
4.NVIDIA Jarvis
黃仁勛在發布會中詳細介紹了 NVIDIA Jarvis,這是一個新的端到端平台,可以充分發揮英偉達 AI 平台的強大功能,創建實時多模態對話式 AI。
5.Misty 交互 AI
現場演示中,一個名為 Misty 的 AI系統展示了實時理解並回答一系列有關天氣的復雜問題的交互過程。
自動駕駛方面,英偉達也將安培架構嵌入了新的 NVIDIA DRIVE 平台。據了解,小馬智行、法拉第未來等自動駕駛企業已宣布採用 NVIDIA DRIVE AGX 計算平台。
英偉達的 NVIDIA Isaac 軟體定義的機器人平台還將用於寶馬集團工廠。英偉達機器人技術全球生態系統涵蓋配送、零售、自主移動機器人、農業、服務業、物流、製造和醫療保健各個行業。
英偉達這場時隔 3 年的發布會可謂誠意滿滿,首次推出的安培架構給足了驚喜,性能提升 20 倍的 NVIDIA A100 GPU 可謂性能飛躍。
雖然發布會並不是現場直播,但依舊爆點十足。一台就比千台強的 DGX-A100 AI 也印證了黃仁勛那就經典名言「買的越多,賺的越多」。英偉達的 AI 解決方案已經覆蓋了各行各業,強大的 AI 生態正在形成。
中國工程院院士倪光南曾表示:「晶元設計門檻極高,只有極少數企業能夠承受中高端晶元研發成本,這也制約了晶元領域創新。」
英偉達在本屆 GTC 上推出的安培架構和基於此的一系列 AI 平台無一部顯示了一個 AI 晶元巨頭的實力,又一次樹立了性能標桿。
根據 Gartner 的預測數據 ,未來 5 年內全球人工智慧晶元市場規模將呈飆升趨勢 ,自 2018 年的 42.7 億美元 ,升高至 343 億美元 ,增長已超過 7 倍,可見 AI 晶元市場有較大增長空間。
盡管與西方發達國家相比,中國的 AI 晶元研發還存在一定差距,但過去兩年中,中國 AI 晶元初創企業已獲得了數億美元的資金。華為等公司也開發了令人印象深刻的晶元設計。
但晶元開發極具復雜性,中國人才的短缺以及缺乏多家全球銷售排名前 15 位的中國半導體公司的情況表明,中國仍需要取得重大進展,才能在半導體領域與美國匹敵。
G. 100p計算能力相當於多少台計算機
100P計算能力相當於50萬台計算機。
在目前537PFLOPS為全球第一的當下,要實現1000P,也就是百億億次,就需要頂尖科學家們不斷地研究不斷地努力。實際上,目前包括中國、美國在內的許多國家的頂尖科學家都在為之努力,但好消息還未出現。也因此,上文媒體所述的1000P並不是基於537P而言的。其二,此1000P非彼1000P。縱觀上文我們已經可以斷定媒體所說的1000P並不是超算意義上的1000P了,那麼,既然不是,為何會有相同的叫法,二者有有何區別呢?這要從超算TOP500榜單的評判標准來解讀,正常來說,入圍超算計算機都要進行一項LINPACK測試,用以考察平台的雙精度浮點計算能力。換言之,目前TOP500榜單上的TOP1的富岳超算的537PFLOPS成績,就是基於雙精度浮點程序的計算而取得的。但被媒體「誇誇而談」的「1000P」並非如此,基於上文所說的平台為人工智慧應用行業,所以,其運行的測試程序為Resnet-50,這一程序所測算出來的「1000P」實際上是基於半精度浮點環境所獲得的。雖然同樣具有權威性,但對比雙精度,此1000P只能代表平台的半精度能力。其三,則是人工智慧計算機與高性能計算機並非一回事。高性能計算機,大家應該都有聽說過,它可以算作是科研應用的基礎。人們常常提及的大氣物理、流體力學、生物工程、媒體影像等,都可以通過高性能計算機來實現。可以說,高性能計算機是一種基石,它的能力越強,越能為日後各類應用的崛起提供更穩固的地基。所以,我們才會在小說《三體》中看到的「鎖死人類的高性能計算機」以「阻礙人類發展」。在一定程度上,高性能計算機確實是人類發展的助推器。相反,人工智慧並非如此,雖然人工智慧也能深入各行各業,也對算力要求頗高,但它目前仍然無法與高性能計算機同日而語。得益於近幾年深度學習、機器學習、神經網路應用的崛起,人工智慧確實也越來越被大眾所熟知,並且成了很多企業趨之若鶩的技術,但它只能針對特定業務、特定場景產生的應用需求,並不能覆蓋整個行業。所以,人工智慧與高性能計算根本就不是一回事,無論是從覆蓋范圍、應用場景,還是從算力表現來看,人工智慧都只算高性能計算的一個小分支。即便目前人工智慧的發展前景被很多專業人士看好,但百川歸海,它的發展依然是基於高性能計算的發展的。1000確實大於537,但維度不同、基準不同,誰又敢百分百保證1+1就一定等於2呢?
H. 1P算力是每秒多少次計算
一個PFLOPS(petaFLOPS)等於每秒一千萬億(=10^15)次的浮點運算
一、TOPS
TOPS是Tera Operations Per Second的縮寫,1TOPS代表處理器每秒鍾可進行一萬億次(10^12)操作。
與此對應的還有GOPS(Giga Operations Per Second),MOPS(Million Operation Per Second)算力單位。1GOPS代表處理器每秒鍾可進行十億次(109)操作,1MOPS代表處理器每秒鍾可進行一百萬次(106)操作。TOPS同GOPS與MOPS可以換算,都代表每秒鍾能處理的次數,單位不同而已。
在某些情況下,還使用 TOPS/W 來作為評價處理器運算能力的一個性能指標,TOPS/W 用於度量在1W功耗的情況下,處理器能進行多少萬億次操作。
二、GOPS
OPS與FLOPS類似,只不過OPS一個是操作次數,FLOPS一個是浮點操作次數。
FLOP與GOPS之間的換算
(FLOP與GOPS之間的換算需要查相關資料,後續查找資料給出)
不確定的看法是OPS是操作數量,FLOPS為浮點操作數量,兩者可近似於相等,FLOPS比OPS稍大。
三、GOPS與FLOPS
1、FLOPS定義
是「每秒所執行的浮點運算次數」(floating-point operations per second)的縮寫。它常被用來估算電腦的執行效能,尤其是在使用到大量浮點運算的科學計算領域中。正因為FLOPS字尾的那個S,代表秒,而不是復數,所以不能省略掉。
在這里所謂的「浮點運算」,實際上包括了所有涉及小數的運算。這類運算在某類應用軟體中常常出現,而它們也比整數運算更花時間。現今大部分的處理器中,都有一個專門用來處理浮點運算的「浮點運算器」(FPU)。也因此FLOPS所量測的,實際上就是FPU的執行速度。而最常用來測量FLOPS的基準程式(benchmark)之一,就是Linpack。
2、FLOPS換算
一個MFLOPS(megaFLOPS)等於每秒一百萬(=10^6)次的浮點運算,
一個GFLOPS(gigaFLOPS)等於每秒十億(=10^9)次的浮點運算,
一個TFLOPS(teraFLOPS)等於每秒一萬億(=10^12)次的浮點運算,(1太拉)
一個PFLOPS(petaFLOPS)等於每秒一千萬億(=10^15)次的浮點運算,
前標的十進制與二進制
此處存在疑問,從M到G再到T,到底是1024近似為1000,還是採用二進制的乘以1024,還是確實為十進制的1000
傾向於FLOP的前標與內存一樣,是以二進制算,每進一級是1024為單位的。
但是10243是1073741824,可以近似為109。所以採用10^3來近似1024問題不大。
I. 台式電腦計算能力
單個處理器浮點計算能力為3Tflops
mpe浮點計算能力為8gflops
cpe浮點計算能力為11gflops
神威太湖之光系統峰值運算能力達到了100pflops。
這里有必要提到浮點運算能力指計算機浮點計算的處理能力,計算機有專用於浮點處理的浮點運算器FPU.
家用計算機2G赫茲,4g赫茲指的是計算機的主頻,主頻為4g赫茲,的計算機浮點處理能力在4gflops左右。不過主頻並不等於浮點處理能力。
主頻的意思是每秒能處理計算機時鍾周期的個數。每秒鍾處理的越多計算機的處理能力越強。
cpu的主頻不代表,cpu的處理能力,指令流水線對cpu處理能力的影響。
時鍾周期是cpu運算的基本單位,一次浮點計算可能需要幾次到幾十次時鍾周期。所以主頻和浮點處理能力的關系也就很明顯了。
J. 「東數西算」的智慧大腦!26座城市搶建智算中心
智東西(公眾號:dxcom)
作者 | 楊暢
編輯 | 李水青
智東西2月25日消息,近日,「東數西算」國家項目正式啟動,為數據中心產業帶來了重要利好信號。(《 歷史 時刻!「東數西算」國家工程全面啟動》)
作為數據中心中領域的一顆「明珠」,智算中心也引起行業關注。
一般認為,智算中心全稱是人工智慧計算中心,主要是為人工智慧(AI)應用提供所需算力服務、數據服務和演算法服務,由AI晶元和算力機組等設備組成,與雲計算中心、超算中心有一定區別。企業和研究機構可以依託智算中心提供的強大算力,驅動AI模型進行數據深度加工,實現AI應用創新。
「東數西算」國家項目強調在京津冀、長三角、成渝等八大樞紐間建設算力網路,支持全國各地日益增長的算力需求。而沿著這張算力網路「地圖」,我們發現智算中心已經「遍地開花」。
細數過來,從2021年到2022年開年,全國有不下20座城市建成或正在建智算中心,智算中心數量達到27個,而其中位於八大樞紐的就有12個,接近50%。
「東數西算」工程國家算力樞紐節點范圍內的智算中心
那麼具體有哪些城市在建設或者規劃建設智算中心?「東數西算」工程會對智算中心帶來什麼樣的影響?各地智算中心項目建設進度如何?可能會對當地AI產業有何影響?
智東西通過調查2021年以來各地規劃、建設和建成的智算中心,並與業內人士交流,來與大家一起探討這些問題。
據智東西統計,從2021年1月1日到2022年2月15日,全國共有至少26個城市在推動或剛剛完成當地智算中心的建設,這些城市中既有省會城市,例如南京、西安,也有非省會城市,像許昌、青島。
其中,不少城市已經在本地建設了像大數據中心、雲計算中心、國家超算中心等信息基礎設施。不過這些中心並不能替代智算中心,它們之間的功能存在差異——像雲計算中心,主要是提供雲服務,超算中心主要為科學研究提供超算服務,智算中心則主要是為企業和科研院所提供普惠AI算力服務。
此外,中信所《人工智慧計算中心發展白皮書(2021)》中指出,智算中心借鑒了超級計算(高性能計算)中心和雲計算數據中心大規模並行計算和數據處理的技術架構,但它是以AI專用晶元為計算算力底座的。上述三類中心的軟體和業務架構不一樣,不過雲數據中心和超算中心也可以通過延展建設,來對外提供智能算力。
據我們統計,2021年,全國建成並投入運營或試運營的智算中心有8個,分別是武漢人工智慧計算中心、合肥先進計算中心、南京智能計算中心、中國電信京津冀大數據智能算力中心、浙江(長三角)新一代全功能智能超算中心、西安未來人工智慧計算中心、中原人工智慧計算中心、哈爾濱人工智慧先進計算中心,投運時間分別是5月、6月、7月、8月、9月、9月、10月和12月。這些智算中心中大部分都有二期建設規劃。
截至目前,2021年和2022年各地投入運營的智算中心情況
一些智算中心並沒有直接用「智算中心」或「人工智慧計算中心」命名,而是採用「先進計算中心」或「智能超算中心」的命名方式,但它們也提供智能算力,所以也可以算作智算中心,例如合肥先進計算中心和浙江(長三角)新一代全功能智能超算中心。
不同智算中心的測算算力時採用的算力測試基準有所差別,使用算力單位略有不同,但是無論是「1 P OpS」、「1 PFLOPS FP16」、「1 Petaflops」還是「1 P」,都相當於每秒可進行一千萬億次運算。
2022年開年以來,國內已經有一個新投運的智算中心,是位於上海的商湯 科技 人工智慧計算中心。
很多城市是正在建設智算中心,從2021年1月1日到2022年2月15日,全國共有至少18個城市簽約、開工、招標、計劃建設智算中心項目,其中已經宣布開工建設的至少有6個城市,分別是合肥、慶陽、大連、沈陽、深圳、長沙。
截至目前,2021年和2022年各地規劃或已經開始建設的智算中心情況
對比2021年之前的各地智算中心建設情況來看,2020年之前的智算中心項目更少一些。不過,部分2021年開工建成的智算中心其實在2020年就已經立項招標和預研規劃,比如武漢人工智慧計算中心項目。
智算中心並不是2021年才有的新類型數據中心,我國較早建成的智算中心還有深圳鵬城雲腦、曠視蕪湖AI超算中心等。2018年,鵬城雲腦I初步建成並上線運行,算力達到100 PFLOPS(1 PFLOPS相當於每秒運算能力為一千萬億次)。
從全國智算中心的地理位置分布來看,目前,東部、中部和西部都有省市在部署智算中心。作為數據中心的一種,各地的智算中心建設規劃難免會受到「東數西算」政策的影響。
特別是國家發改委等部門在《全國一體化大數據中心協同創新體系算力樞紐實施方案》等文件中指出:「原則上,對於在國家樞紐節點之外新建的數據中心,地方政府不得給予土地、財稅等方面的優惠政策。」智算中心作為各地政府主導的項目,極有可能受到影響,但是並不一定會大批向西部地區遷移。因為智算中心主要面向AI相關產業,這些業務對於網路通信的要求也比較高,在這方面,東部地區略有優勢。
中科曙光高級副總裁任京暘告訴智東西,「東數西算」工程會促進智算中心的發展,預計在全國一體化算力網路國家樞紐節點建設中,規劃的數據中心項目會配置一定規模的智能算力,有些項目還可能是直接以智算中心的形態出現。
另外,從這些智算中心公布的算力規模情況來看, 100P算力是很多智算中心的起步目標 。
一般認為,100P大約相當於5萬台高性能電腦的算力。拿科研場景為例,天文學家在20萬顆天體的星空圖中要定位某種特徵星體,如果算力不夠,耗時可能要超100天,如果擁有100P算力,定位星體所需時間僅為100秒。
任京暘說,一般智算中心提到的100P是指FP16或INT16,即半精度算力,就現階段而言,以100P起步,能實現比較大的規模效益。
從需求角度看,智算中心作為城市級公共算力平台,要滿足區域內政府、企業、高校等各類用戶的算力需求,起步規模不宜過小,否則無法支撐類似大模型訓練等大算力需求,也不足以發揮集約共享的規模效益。
任京暘補充道,從投資角度看,智算中心發展尚處於初期階段,建設、運營、應用與生態建設等投入較大,需要結合地方財政承受能力做出合理評估,根據實際需求進行適度的超前部署。
大部分智算中心都是分期建設的,建成一期,就可以投入運營一期,後期再根據運行情況和產業發展需求進行二期、三期建設。
例如武漢人工智慧計算中心,該智算中心在2021年5月完成了一期項目建設工作,並開始為企業提供AI算力,但很快飽和了。於是,武漢人工智慧計算中心又進行了二期項目擴容工作,將算力規模從100P擴容到200P。武漢人工智慧計算中心相關負責人在接受媒體采訪時說,現在二期算力也接近飽和,隨著准備進行進一步的算力擴容工作。
武漢人工智慧計算中心
根據各智算中心的數據,至少數百家企業已經簽約智算中心,例如武漢人工智慧計算中心已經為多家高校和科研院所、100多家企業提供算力,南京智能計算中心已經吸引超40家產學研機構入駐。
一個智算中心可以同時支撐的產業場景很多,例如自動駕駛、智慧醫療、智慧城市、智慧交通、智慧礦山、智能製造等等,主要看當地的需求,一般都是為了支撐當地的優勢產業更好發展。比如,青島靠近海域,其人工智慧計算中心招標文件就有提到青島人工智慧計算中心要支撐青島優勢產業集群,比如智能家居、智能製造等產業智能化持續領先,並著重強調支撐當地智慧海洋經濟的發展。
上述智算中心都並不局限於支撐單一產業。不過,也有一些城市選擇建設針對性更強的智算中心,像山西晉城建設了專門面向煤炭行業的智算中心(智能礦山創新實驗室創新成果&計算中心)。該智算中心由華為、晉能控股等企業參與建設,主要是為推動山西煤礦智能化建設。
智能礦山創新實驗室創新成果&計算中心
在智算中心建設過程中,市政和建築設計企業背後的AI和ICT企業是重要角色,例如曙光、華為、浪潮、騰訊、商湯 科技 等企業。
在 探索 智算中心過程中,作為計算領域的頭部玩家曙光提出了「5A級」智算中心建設方案,從開放、融合、綠色、普惠、服務五個方面,進行智算中心相關的實踐和 探索 。目前,曙光5A級智算中心已在廣東珠海、安徽合肥、浙江桐鄉等地陸續落成,其江蘇崑山等地的智算中心也進入建設階段。
合肥先進計算中心
曙光智算中心會採用兼容多種晶元、演算法、模型等的多元協作方式以實現多元算力提供。例如曙光參建的合肥先進計算中心不僅能提供智能算力,還能提供高性能計算所需算力。在降低智算中心、數據中心能耗方面,曙光研發有浸沒式相變液冷技術,可使智算中心的PUE值降至1.04到1.05。
華為應該是比較早嘗試智算中心的企業,而且也是參與各地智算中心建設最多的企業之一。華為升騰計算業務總裁許映童曾在2021世界人工智慧大會期間透露,華為希望在2021年內啟動超20個智算中心建設。
包括「鵬城雲腦II」、「武漢人工智慧計算中心」在內的幾個華為承建的智算中心項目幾乎都是使用華為的Atlas 900 AI集群架構,來實現AI算力供給的。Atlas 900 AI集群架構是由數千顆升騰910 AI處理器構成,其總算力達到256P 1024 PFLOPS FP16。
鵬城雲腦
浪潮在智算中心方面也有多年的研究,無論是智算中心運行過程中算力生產、算力聚合、算力調度還是算力釋放環節,浪潮都分別有相應的技術和軟硬體支撐。南京智能計算中心就是採用了浪潮AI伺服器算力機組和寒武紀思元270和思元290智能晶元及加速卡。
南京智能計算中心
作為數據中心行業的重要玩家,騰訊將其在數據中心方面的 探索 應用在了智算中心建設中,像騰訊智慧產業長三角(合肥)智算中心建設中就用到了騰訊第四代T-Block等高端模塊化技術,支持項目快速交付。騰訊第四代T-Block等高端模塊化技術就是將IT、空調等數據中心的各個功能模塊化,以實現按需靈活配置。
商湯 科技 是從2018年開始進行人工智慧計算中心預研工作的,2020年7月開始商湯 科技 人工智慧計算中心建設工作。2022年1月24日,商湯 科技 人工智慧計算中心啟動運營。商湯 科技 人工智慧計算中心的峰值算力高達3740 Petaflops,這背後包含了商湯 科技 的多種技術突破,包括高性能計算、分布式調度、硬體/軟體協同設計等。
商湯 科技 人工智慧計算中心
我們通過調查2021年以來建設和建成的智算中心,發現越來越多的城市已經開始了智算中心建設。這體現了各地對於AI產業的重視。從一些現有的智算中心建設工期來看,一般一期建設大概時間在半年到一年不等,今年可能會有更多在建的智算中心建成並投運。另外,「東數西算」工程也會對新的智算中心的規劃、建設產生多重影響。
目前參與智算中心建設的企業相對有限,隨著各地對智算中心建設需求的增加以及一些新玩家加入,智算中心領域玩家可能會面臨更激烈的競爭。