① 算力可貴,效率價高:智算中心憑啥是築基新基建的最優解
在「新基建」浪潮下,人工智慧正成為經濟增長的新引擎,各行各業開啟智能化升級轉型。算力在其中扮演了重要角色,是國家未來競爭力的集中體現。但事實是,在發展的過程中,高速增長的海量數據與更加復雜的模型,正在為算力帶來更大的挑戰,主要體現為算力不足,效率不高。
算力誠可貴:數據、演算法需要更多算力支撐
眾所周知,在人工智慧發展的三要素中,無論是數據還是演算法,都離不開算力的支撐,算力已成為人工智慧發展的關鍵要素。
IDC發布的《數據時代2025》報告顯示,2018年全球產生的數據量為33ZB (1ZB=1萬億GB),到2025年將增長到175ZB,其中,中國將在2025年以48.6ZB的數據量及27.8%的佔比成為全球最大的數據匯集地。
另據賽迪顧問數據顯示,到2030年數據原生產業規模量占整體經濟總量的15%,中國數據總量將超過4YB,佔全球數據量30%。數據資源已成為關鍵生產要素,更多的產業通過利用物聯網、工業互聯網、電商等結構或非結構化數據資源來提取有價值信息,而海量數據的處理與分析對於算力的需求將十分龐大。
演算法上,先進模型的參數量和復雜程度正呈現指數級的增長趨勢。此前 Open AI 發表的一項研究就顯示,每三到四個月,訓練這些大型模型所需的計算資源就會翻一番(相比之下,摩爾定律有 18 個月的倍增周期)。2012 至 2018 年間,深度學習前沿研究所需的計算資源更是增加了 30 萬倍。
到2020年,深度學習模型對算力的需求達到了每天百億億次的計算需求。2020年2月,微軟發布了最新的智能感知計算模型Turing-NLG,參數量高達到175億,使用125POPS AI計算力完成單次訓練就需要一天以上。隨後,OpenAI又提出了GPT-3模型,參數量更達到1750億,對算力的消耗達到3640 PetaFLOPS/s-day。而距離GPT-3問世不到一年,更大更復雜的語言模型,即超過一萬億參數的語言模型SwitchTransformer即已問世。
由此可見,高速增長的海量數據與更加復雜的模型,正在給算力帶來更大的挑戰。如果算力不能快速增長,我們將不得不面臨一個糟糕的局面:當規模龐大的數據用於人工智慧的訓練學習時,數據量將超出內存和處理器的承載上限,整個深度學習訓練過程將變得無比漫長,甚至完全無法實現最基本的人工智慧。
效率價更高:環境與實際成本高企,提升效率迫在眉睫
在計算工業行業,有個假設是「數字處理會變得越來越便宜」。但斯坦福人工智慧研究所副所長克里斯托弗•曼寧表示,對於現有的AI應用來說卻不是這樣,特別是因為不斷增加的研究復雜性和競爭性,使得最前沿模型的訓練成本還在不斷上升。
根據馬薩諸塞大學阿默斯特校區研究人員公布的研究論文顯示,以常見的幾種大型 AI 模型的訓練周期為例,發現該過程可排放超過 626000 磅二氧化碳,幾乎是普通 汽車 壽命周期排放量的五倍(其中包括 汽車 本身的製造過程)。
例如自然語言處理中,研究人員研究了該領域中性能取得最大進步的四種模型:Transformer、ELMo、BERT和 GPT-2。研究人員在單個 GPU 上訓練了至少一天,以測量其功耗。然後,使用模型原始論文中列出的幾項指標來計算整個過程消耗的總能量。
結果顯示,訓練的計算環境成本與模型大小成正比,然後在使用附加的調整步驟以提高模型的最終精度時呈爆炸式增長,尤其是調整神經網路體系結構以盡可能完成詳盡的試驗,並優化模型的過程,相關成本非常高,幾乎沒有性能收益。BERT 模型的碳足跡約為1400 磅二氧化碳,這與一個人來回坐飛機穿越美洲的排放量相當。
此外,研究人員指出,這些數字僅僅是基礎,因為培訓單一模型所需要的工作還是比較少的,大部分研究人員實踐中會從頭開發新模型或者為現有模型更改數據集,這都需要更多時間培訓和調整,換言之,這會產生更高的能耗。根據測算,構建和測試最終具有價值的模型至少需要在六個月的時間內訓練 4789 個模型,換算成碳排放量,超過 78000 磅。而隨著 AI 算力的提升,這一問題會更加嚴重。
另據 Synced 最近的一份報告,華盛頓大學的 Grover 專門用於生成和檢測虛假新聞,訓練較大的Grover Mega模型的總費用為2.5萬美元;OpenAI 花費了1200萬美元來訓練它的 GPT-3語言模型;谷歌花費了大約6912美元來訓練 BERT,而Facebook針對當前最大的模型進行一輪訓練光是電費可能就耗費數百萬美元。
對此,Facebook人工智慧副總裁傑羅姆•佩森蒂在接受《連線》雜志采訪時認為,AI科研成本的持續上漲,或導致我們在該領域的研究碰壁,現在已經到了一個需要從成本效益等方面考慮的地步,我們需要清楚如何從現有的計算力中獲得最大的收益。
在我們看來,AI計算系統正在面臨計算平台優化設計、復雜異構環境下計算效率、計算框架的高度並行與擴展、AI應用計算性能等挑戰。算力的發展對整個計算需求所造成的挑戰會變得更大,提高整個AI計算系統的效率迫在眉睫。
最優解:智算中心大勢所趨,應從國家公共設施屬性做起
正是基於上述算力需求不斷增加及所面臨的效率提升的需要,作為建設承載巨大AI計算需求的算力中心(數據中心)成為重中之重。
據市場調研機構Synergy Research Group的數據顯示,截至到2020年第二季度末,全球超大規模數據中心的數量增長至541個,相比2015年同期增長一倍有餘。另外,還有176個數據中心處於計劃或建設階段,但作為傳統的數據中心,隨之而來的就是能耗和成本的大幅增加。
這里我們僅以國內的數據中心建設為例,現在的數據中心已經有了驚人的耗電量。據《中國數據中心能耗現狀白皮書》顯示,在中國有 40 萬個數據中心,每個數據中心平均耗電 25 萬度,總體超過 1000 億度,這相當於三峽和葛洲壩水電站 1 年發電量的總和。如果折算成碳排放則大概是 9600 萬噸,這個數字接近目前中國民航年碳排放量的 3 倍。
但根據國家的標准,到2022年,數據中心平均能耗基本達到國際先進水平,新建大型、超大型數據中心的 PUE(電能使用效率值,越低代表越節能)達到 1.4 以下。而且北上廣深等發達地區對於能耗指標控制還非常嚴格,這與一二線城市集中的數據中心需求形成矛盾,除了降低 PUE,同等計算能力提升伺服器,尤其是數據中心的的計算效率應是正解。
但眾所周知的事實是,面對前述龐大的AI計算需求和提升效率的挑戰,傳統數據中心已經越來越難以承載這樣的需求,為此,AI伺服器和智算中心應運而生。
與傳統的伺服器採用單一的CPU不同,AI伺服器通常搭載GPU、FPGA、ASIC等加速晶元,利用CPU與加速晶元的組合可以滿足高吞吐量互聯的需求,為自然語言處理、計算機視覺、語音交互等人工智慧應用場景提供強大的算力支持,已經成為人工智慧發展的重要支撐力量。
值得一提的是,目前在AI伺服器領域,我們已經處於領先的地位。
近日,IDC發布了2020HI《全球人工智慧市場半年度追蹤報告》,對2020年上半年全球人工智慧伺服器市場進行數據洞察顯示,目前全球半年度人工智慧伺服器市場規模達55.9億美元(約326.6億人民幣),其中浪潮以16.4%的市佔率位居全球第一,成為全球AI伺服器頭號玩家,華為、聯想也殺入前5(分別排在第四和第五)。
這里業內也許會好奇,緣何中國會在AI伺服器方面領跑全球?
以浪潮為例,自1993年,浪潮成功研製出中國首台小型機伺服器以來,經過30年的積累,浪潮已經攻克了高速互聯晶元,關鍵應用主機、核心資料庫、雲數據中心操作系統等一系列核心技術,在全球伺服器高端俱樂部里佔有了重要一席。在AI伺服器領域,從全球最高密度AGX-2到最高性能的AGX-5,浪潮不斷刷新業界最強的人工智慧超級伺服器的紀錄,這是為了滿足行業用戶對人工智慧計算的高性能要求而創造的。浪潮一直認為,行業客戶希望獲得人工智慧的能力,但需要掌握了人工智慧落地能力的和技術的公司進行賦能,浪潮就可以很好地扮演這一角色。加快人工智慧落地速度,幫助企業用戶打開了人工智慧應用的大門。
由此看,長期的技術創新積淀、核心技術的掌握以及對於產業和技術的准確判斷、研發是領跑的根本。
至於智算中心,去年發布的《智能計算中心規劃建設指南》公布了智能計算中心技術架構,基於最新人工智慧理論,採用領先的人工智慧計算架構,通過算力的生產、聚合、調度和釋放四大作業環節,支撐和引領數字經濟、智能產業、智慧城市和智慧 社會 應用與生態 健康 發展。
通俗地講,智慧時代的智算中心就像工業時代的電廠一樣,電廠是對外生產電力、配置電力、輸送電力、使用電力;同理智算中心是在承載AI算力的生產、聚合、調度和釋放過程,讓數據進去讓智慧出來,這就是智能計算中心的理想目標。
需要說明的是,與傳統數據中心不同,「智算中心」不僅把算力高密度地集中在一起,而且要解決調度和有效利用計算資源、數據、演算法等問題,更像是從計算器進化到了大腦。此外,其所具有的開放標准,集約高效、普適普惠的特徵,不僅能夠涵蓋融合更多的軟硬體技術和產品,而且也極大降低了產業AI化的進入和應用門檻,直至普惠所有人。
其實我們只要仔細觀察就會發現,智算中心包含的算力的生產、聚合、調度和釋放,可謂集AI能力之大成,具備全棧AI能力。
這里我們不妨再次以浪潮為例,看看何謂全棧AI能力?
比如在算力生產層面,浪潮打造了業內最強最全的AI計算產品陣列。其中,浪潮自研的新一代人工智慧伺服器NF5488A5在2020年一舉打破MLPerf AI推理&訓練基準測試19項世界紀錄(保證充足的算力,解決了算力提升的需求);在算力調度層面,浪潮AIStation人工智慧開發平台能夠為AI模型開發訓練與推理部署提供從底層資源到上層業務的全平台全流程管理支持,幫助企業提升資源使用率與開發效率90%以上,加快AI開發應用創新(解決了算力的效率問題);在聚合算力方面,浪潮持續打造更高效率更低延遲硬體加速設備與優化軟體棧;在算力釋放上,浪潮AutoML Suite為人工智慧客戶與開發者提供快速高效開發AI模型的能力,開啟AI全自動建模新方式,加速產業化應用。
那麼接下來的是,智算中心該遵循怎樣的發展路徑才能充分發揮它的作用,物盡其用?
IDC調研發現,超過九成的企業正在使用或計劃在三年內使用人工智慧,其中74.5%的企業期望在未來可以採用具備公用設施意義的人工智慧專用基礎設施平台,以降低創新成本,提升算力資源的可獲得性。
由此看,智能計算中心建設的公共屬性原則在當下和未來就顯得尤為重要,即智能計算中心並非是盈利性的基礎設施,而是應該是類似於水利系統、水務系統、電力系統的公共性、公益性的基礎設施,其將承載智能化的居民生活服務、政務服務智能化。因此,在智能計算中心規劃和建設過程中,要做好布局,它不應該通過市場競爭手段來實現,而要體現政府在推進整個 社會 智能化進程的規劃、節奏、布局。
總結: 當下,算力成為推動數字經濟的根基和我國「新基建「的底座已經成為共識,而如何理性看待其發展中遇到的挑戰,在不斷高升算力的前提下,提升效率,並採取最佳的發展策略和形式,找到最優解,將成為政府相關部門以及相關企業的重中之重。
② 投資40億,商湯科技AI超算中心建築形如「晶元」
近日,上海自貿區臨港新片區「新基建」標桿項目——商湯 科技 上海新一代人工智慧計算與賦能平台EPC項目(即「AI超算中心」)首節鋼柱順利開吊,建築進入鋼結構主體施工階段。該項目是繼商湯 科技 總部大廈之後,商湯 科技 在上海的又一「超級工程」。
項目佔地面積58000平方米,建築面積129850平方米,投資金額40億元,位於上海臨港重裝備產業園區H34-07a地塊。工程整建設內容有:A1-A6超算中心、運維中心、220kV變電站、柴油機發電機房、地下水池泵房及連廊等,建設周期預計從2020年9月至2021年10月。
項目的獨一無二在於其空間結構和設計手法令建築與景觀融為一體。建築由五個方形單元組成,以 科技 晶元為設計構思,富有 科技 的未來性美感。建築群統一的整體風格與單體均衡的體量尺度相結合,配合穿插交錯的道路網路以及空間布局,為使用者帶來豐富獨特的空間體驗。
每個建築組團的兩內座庭院面向園區景觀打開,成為貫穿建築和景觀的過渡空間。立面玻璃幕牆之間留有細長的白色橫線設計,使建築整體富有動感韻律。
據悉,項目計劃於2021年底落成。
附:商湯 科技 總部大廈
由德國gmp建築事務所設計的商湯 科技 總部大廈,位於上海漕河涇開發公園與中環路之間,整個大樓長170米,最寬處28米,高36米。
建築體為一座橫向的棱形玻璃大樓,坐落於兩個錐形的清水混凝土基座之上,形如巨型「航母」。兩個支座支撐起一座橋梁般的建築,以最小的首層佔地面積最大程度上實現了建築東西側空間上的聯通。
大樓獨特的設計,獲得了德國設計委員會旗下的Iconic Award 2018(標志性設計獎)辦公建築類別Selection。
③ 打贏AI爭奪戰,要靠一張算力網
AI算力是未來國家、城市、企業的核心競爭力。
文丨華商韜略 陳必章
在人工智慧時代,AI算力就是電,AI計算中心就是電廠。
電力時代,我們構建了一張「電網」,如今隨著國內各地人工智慧計算中心的相繼落地,我們正在編織一張AI算力網路。
目前,人工智慧的發展已提升到國家戰略層面,加快人工智慧產業發展,保障和提供充沛的AI算力,對於贏在AI時代的國家、城市和企業來說,已經是迫在眉睫的問題。
【沒有算力 就像沒有電】
最近這段時間,全國很多地方政府和企業領導最鬧心的事情什麼?
答案可能是兩個字:缺電。
但這個鬧心的事情還沒解決,在全球各國,乃至一國之內的不同地區,又開始面臨一個像電力一樣,決定國計民生的關鍵要素。
這個關鍵要素就是AI算力。
AI算力,顧名思義,就是支撐AI的計算能力。 此處的計算不是加減乘除,而是對世界萬物的計算,是萬物互聯、人工智慧之下的高度復雜、無所不在的計算。
不同於傳統算力,AI算力為了支撐AI模型的開發、訓練和推理,對並行處理能力的要求特別高,也因此需要專門的AI晶元和框架。
比如, 具備強大浮點運算能力的AI晶元,才能夠通過訓練、持續迭代優化提供滿足行業企業智能化轉型的高質量AI模型。 復雜模型訓練中,需對上千億個浮點參數進行微調數十萬步,需要精細的浮點表達能力。如果沒有強大的訓練晶元,則難以保障演算法模型產出的效率。千億級中文NLP(自然語言處理)大模型「鵬程·盤古」,面向生物醫學領域的「鵬程·神農」平台的發布,都離不開AI晶元的支撐。
再比如,被視為「AI領域操作系統」的AI框架,90%的AI應用是基於AI框架層來開發。在該領域國內 科技 企業已取得重大成果: 業界領先的AI計算框架升思MindSpore,是一款支持端、邊、雲全場景的深度學習訓練推理框架。 除具備自主可控的優勢之外,一套框架即可支持AI+科學計算等多樣性應用。當前升思MindSpore社區累計下載量超過60萬,有超過100家高校選擇升思MindSpore進行教學。
正是有了這些AI晶元和AI框架釋放出的AI算力,我們才能加速進入萬物互聯和人工智慧時代。
今天,從每個人手裡的手機,到企業的雲上平台,再到城市大腦……我們的生產和生活越來越依賴於AI,越來越深入向AI獲取力量。
對中國來說,AI是從製造大國向製造強國轉型升級的關鍵。 最近多年,眾多城市都在努力爭奪各種資源提升城市的發展力和競爭力,而AI算力就是未來發展最重要的「資源」。
在人工智慧的世界,沒有AI算力,就像沒有電。
AI算力已滲入到我們生活和生產的方方面面,以大家較為熟悉的醫院葯房取葯為例:
拿到處方葯單,在葯房前排隊等候,由醫務人員拿著處方照單分葯,這種漫長的等待和焦慮,很多人都有切身體會。現在,已經有企業開發出利用人工智慧技術進行全自動補發葯品的機器人,用到了3D視覺定位、機器人智能抓取、智能視覺復核技術,能夠確保100%補葯准確率,而且效率也更高,發葯速度可以達到每小時2500盒,8秒鍾就可以處理一個訂單。在葯品發放過程中,系統可以自主調度搬運葯品,不需要人工的干預。
它帶來的最直觀的改變,就是可以把葯品分揀的時間從原來的50秒縮短到3秒,患者只需要一分鍾就能取到葯品。
這個過程中,怎麼識別處方單,怎麼准確分揀並發放葯品?要實現這些功能就得看這個機器人使用的AI系統能算得有多快、多好、多准,這就是AI算力。
【要有電 就得有電廠和電網】
AI算力如此重要,但很多企業缺乏足夠的資金來搭建自己的AI算力。那AI算力需求該如何被滿足,國家、城市又該如何提供足夠的AI算力支持,推動AI產業發展並贏得AI時代的競爭力呢?答案是, 要讓AI算力成為公共資源,配套建立新型基礎設施。
這種新型的算力基礎設施就是人工智慧計算中心,用回電氣時代的比喻,那就是要建電廠和電網。
首先是,加快人工智慧計算中心的建設。
人工智慧計算中心,是以基於人工智慧晶元構建的人工智慧計算機集群為基礎,涵蓋了基建基礎設施、硬體基礎設施和軟體基礎設施的完整系統,其核心功能就是,提供從底層晶元算力釋放到頂層應用使能的人工智慧全棧能力,也就是輸出AI算力。
人工智慧計算中心除了是提供公共算力服務的平台,還同時應該是應用創新的孵化平台、產業聚合發展平台和科研創新人才培養平台。只有同時扮演好這些角色,才能打通「政產學研用」,集中最多的力量,形成產業匯聚力並提升AI競爭力。
目前,全世界都在加快人工智慧計算中心建設。尤其是美國,它一方面千方百計地打壓其它國家的發展,一方面則大手筆投入加強本國人工智慧的發展,拜登政府更一度公布了3000億美元的投資計劃,捍衛美國在人工智慧領域的領先地位,而其中很重要的投入,就是加強數據中心和智算中心的新基建。
中國當然不會輕易錯過人工智慧產業發展帶來的機遇。早在2017年,國務院就發布了《新一代人工智慧發展規劃》,並強調要「建設高效能的計算基礎設施」。去年疫情期間,中央進一步明確提出新基建戰略,而加強數據中心和人工智慧計算中心建設,則是整個新基建的重中之重。
因為,沒有強大的算力,以數字化為著眼點的新基建七大領域幾乎都無法實現其建設目標。
國家戰略指引,市場前景召喚,甚至經濟轉型升級的壓力下,諸多地方政府都已積極行動,牽頭人工智慧計算中心建設,並以此為基礎提升本地算力水平,構築數字時代的核心競爭力。
今年5月31日, 科技 部批復的15個國家人工智慧創新發展試驗區中,武漢的人工智慧計算中心已率先竣工並投入運營;西安未來人工智慧計算中心也已經上線,其它省市的人工智慧計算中心建設也陸續規劃中。
武漢人工智慧計算中心投運以後,為武漢乃至湖北地區的經濟發展、科研創新、企業轉型等提供了算力支撐。
比如,武漢大學基於武漢人工智慧計算中心打造了全球首個遙感專用框架武漢.LuojiaNet,針對「大幅面、多通道」遙感影像,在整圖分析和數據集極簡讀取處理等方面實現了重大突破。
再比如,中科院自動化所利用該中心的算力支持,研發了全球首個視頻生成多模態大模型——紫東.太初。作為業內首個千億級三模態大模型,紫東.太初的視頻理解與描述性能已做到全球第一,不僅具有多任務聯合學習能力,還能通過學習實現AI化的圖文搜索,以及音頻、短視頻、MV製作,極大縮短音視頻的創造時間。
9月份,西北地區第一個人工智慧計算中心落子西北重鎮西安市,一期規劃具備300P AI算力的西安未來人工智慧計算中心,基於升騰AI基礎軟硬體平台建設,將提供精準可靠的模型訓練及推理。
西安未來人工智慧計算中心,已經簽約了西安電子 科技 大學遙感項目、西北工業大學語音大模型項目、陝西師范大學「MindSpore研究室」多個項目,在支撐西安「6+5+6+1」現代產業體系發展的同時,也會強化西安乃至整個西北地區的人工智慧產業集群,為西北地區人工智慧產業的發展提供算力支持。
剛剛上線的西安未來人工智慧計算中心,算力使用率已快接近滿負荷狀態。當地各行業企業、科研機構、高校對於算力的渴求可見一斑。
其次,高效利用人工智慧計算中心的算力資源。
當越來越多人工智慧計算中心建成、投運,如何讓它們的算力更高效並服務到更多的行業和企業?如何避免各地算力分布不均衡、使用效率不一致的情況?如何讓沒有規劃建設人工智慧計算中心的地方,也能享受到AI算力的使能?人工智慧計算中心之間的互聯、協同、共享,成為需要各界考慮的一個問題。
這就需要人工智慧算力網路了,就像電網之於電廠和用電對象。
有了算力網路,我們就能將分布在各地的人工智慧計算中心節點連接起來,動態實時根據算力資源狀態和需求,實現統籌分配和調度計算任務,構成全國范圍內的感知、分配、調度人工智慧中心的算力網路,然後在此基礎上匯聚和共享算力、數據、演算法資源。
最重要的是,有了這張網,更多的行業和企業,就能像現在用電一樣使用AI算力了。
那麼,算力網路這張網還會給整個人工智慧行業有哪些作用呢?
首先是算力的匯聚, 就是把不同地區、不同城市的算力資源高速互聯,實現跨節點之間的算力合理調度,資源彈性分配,這有利於提升各個人工智慧計算中心的利用率,實現對於整體能耗的節省,後續可支持跨節點分布學習,為大模型的研究提供超級算力。
其次是數據的匯聚, 政府牽頭與各行業企業合作,在達成人工智慧領域的公共數據開放之後,可依託人工智慧計算中心匯聚高質量的開源、開放的人工智慧數據集,能夠促進人工智慧領域的演算法開發和行業落地。
最後是生態的匯聚, 各個人工智慧計算中心之間,統一互聯標准、應用介面標准,實現網路內大模型能力開放與應用創新成果共享,強化跨區域科研和產業協作,為全國范圍用戶進行人工智慧應用創新提供更多的資源選擇和更便捷的合作方式,加速產業聚合,激活產業共融共生。
簡單總結算力網路,就是匯聚大數據+大算力,使能大模型和重大科研創新,孵化新應用。進而實現算力網路化,降低算力成本,提升計算能效。
科技 部在三年行動規劃中指出,要「布局若幹人工智慧計算中心,形成廣域協同的人工智慧平台」。在這一規劃的指引下,人工智慧計算中心陸續在許多城市落地。就在剛剛結束的HC2021上,20多個人工智慧計算中心建設城市聯合點亮了「人工智慧算力網路」。
這張人工智慧行業的算力網路,已經開始編織構建。
【AI算力建設 不是從長計議而是迫在眉睫】
2020年,麻省理工學院計算機科學家、並行計算先驅Charles Leiserson在《科學》雜志上撰文指出:
深度學習正逼近現有晶元的算力極限。
事實上,過去十年,人類最好的AI演算法對算力的需求幾乎增長了100萬倍,平均每3.4個月翻一倍。
相比之下,全球AI算力的增長卻十分有限。
需求與供給之間的巨大鴻溝,促使各國政府,尤其是中、美、歐、日等AI技術領先的地區大力建設AI算力。
沒有強大AI算力,一個國家或地區必然在未來的 科技 競爭中處於劣勢。
從當前算力基礎設施建設進度來看,深圳、武漢、西安等城市均已建成人工智慧計算中心並投入運營,成都、河南等城市正在建設中,北京、南京、上海等地的人工智慧計算中心加速建設,也是蓄勢待發。
未來,一旦人工智慧計算中心全部建成,並組成人工智慧算力網路,不但將為 社會 提供跨地域、源源不斷的超級算力。而且,還能夠實現跨區域的科研和產業協作,使能大模型和重大科研創新,為千行百業孵化新應用。
最終,使得人工智慧賦能更多的行業和場景,讓我們在未來國家之間的產業和 科技 競爭中立於不敗之地。
——END——
版權所有,禁止私自轉載!
④ 「東數西算」的智慧大腦!26座城市搶建智算中心
智東西(公眾號:dxcom)
作者 | 楊暢
編輯 | 李水青
智東西2月25日消息,近日,「東數西算」國家項目正式啟動,為數據中心產業帶來了重要利好信號。(《 歷史 時刻!「東數西算」國家工程全面啟動》)
作為數據中心中領域的一顆「明珠」,智算中心也引起行業關注。
一般認為,智算中心全稱是人工智慧計算中心,主要是為人工智慧(AI)應用提供所需算力服務、數據服務和演算法服務,由AI晶元和算力機組等設備組成,與雲計算中心、超算中心有一定區別。企業和研究機構可以依託智算中心提供的強大算力,驅動AI模型進行數據深度加工,實現AI應用創新。
「東數西算」國家項目強調在京津冀、長三角、成渝等八大樞紐間建設算力網路,支持全國各地日益增長的算力需求。而沿著這張算力網路「地圖」,我們發現智算中心已經「遍地開花」。
細數過來,從2021年到2022年開年,全國有不下20座城市建成或正在建智算中心,智算中心數量達到27個,而其中位於八大樞紐的就有12個,接近50%。
「東數西算」工程國家算力樞紐節點范圍內的智算中心
那麼具體有哪些城市在建設或者規劃建設智算中心?「東數西算」工程會對智算中心帶來什麼樣的影響?各地智算中心項目建設進度如何?可能會對當地AI產業有何影響?
智東西通過調查2021年以來各地規劃、建設和建成的智算中心,並與業內人士交流,來與大家一起探討這些問題。
據智東西統計,從2021年1月1日到2022年2月15日,全國共有至少26個城市在推動或剛剛完成當地智算中心的建設,這些城市中既有省會城市,例如南京、西安,也有非省會城市,像許昌、青島。
其中,不少城市已經在本地建設了像大數據中心、雲計算中心、國家超算中心等信息基礎設施。不過這些中心並不能替代智算中心,它們之間的功能存在差異——像雲計算中心,主要是提供雲服務,超算中心主要為科學研究提供超算服務,智算中心則主要是為企業和科研院所提供普惠AI算力服務。
此外,中信所《人工智慧計算中心發展白皮書(2021)》中指出,智算中心借鑒了超級計算(高性能計算)中心和雲計算數據中心大規模並行計算和數據處理的技術架構,但它是以AI專用晶元為計算算力底座的。上述三類中心的軟體和業務架構不一樣,不過雲數據中心和超算中心也可以通過延展建設,來對外提供智能算力。
據我們統計,2021年,全國建成並投入運營或試運營的智算中心有8個,分別是武漢人工智慧計算中心、合肥先進計算中心、南京智能計算中心、中國電信京津冀大數據智能算力中心、浙江(長三角)新一代全功能智能超算中心、西安未來人工智慧計算中心、中原人工智慧計算中心、哈爾濱人工智慧先進計算中心,投運時間分別是5月、6月、7月、8月、9月、9月、10月和12月。這些智算中心中大部分都有二期建設規劃。
截至目前,2021年和2022年各地投入運營的智算中心情況
一些智算中心並沒有直接用「智算中心」或「人工智慧計算中心」命名,而是採用「先進計算中心」或「智能超算中心」的命名方式,但它們也提供智能算力,所以也可以算作智算中心,例如合肥先進計算中心和浙江(長三角)新一代全功能智能超算中心。
不同智算中心的測算算力時採用的算力測試基準有所差別,使用算力單位略有不同,但是無論是「1 P OpS」、「1 PFLOPS FP16」、「1 Petaflops」還是「1 P」,都相當於每秒可進行一千萬億次運算。
2022年開年以來,國內已經有一個新投運的智算中心,是位於上海的商湯 科技 人工智慧計算中心。
很多城市是正在建設智算中心,從2021年1月1日到2022年2月15日,全國共有至少18個城市簽約、開工、招標、計劃建設智算中心項目,其中已經宣布開工建設的至少有6個城市,分別是合肥、慶陽、大連、沈陽、深圳、長沙。
截至目前,2021年和2022年各地規劃或已經開始建設的智算中心情況
對比2021年之前的各地智算中心建設情況來看,2020年之前的智算中心項目更少一些。不過,部分2021年開工建成的智算中心其實在2020年就已經立項招標和預研規劃,比如武漢人工智慧計算中心項目。
智算中心並不是2021年才有的新類型數據中心,我國較早建成的智算中心還有深圳鵬城雲腦、曠視蕪湖AI超算中心等。2018年,鵬城雲腦I初步建成並上線運行,算力達到100 PFLOPS(1 PFLOPS相當於每秒運算能力為一千萬億次)。
從全國智算中心的地理位置分布來看,目前,東部、中部和西部都有省市在部署智算中心。作為數據中心的一種,各地的智算中心建設規劃難免會受到「東數西算」政策的影響。
特別是國家發改委等部門在《全國一體化大數據中心協同創新體系算力樞紐實施方案》等文件中指出:「原則上,對於在國家樞紐節點之外新建的數據中心,地方政府不得給予土地、財稅等方面的優惠政策。」智算中心作為各地政府主導的項目,極有可能受到影響,但是並不一定會大批向西部地區遷移。因為智算中心主要面向AI相關產業,這些業務對於網路通信的要求也比較高,在這方面,東部地區略有優勢。
中科曙光高級副總裁任京暘告訴智東西,「東數西算」工程會促進智算中心的發展,預計在全國一體化算力網路國家樞紐節點建設中,規劃的數據中心項目會配置一定規模的智能算力,有些項目還可能是直接以智算中心的形態出現。
另外,從這些智算中心公布的算力規模情況來看, 100P算力是很多智算中心的起步目標 。
一般認為,100P大約相當於5萬台高性能電腦的算力。拿科研場景為例,天文學家在20萬顆天體的星空圖中要定位某種特徵星體,如果算力不夠,耗時可能要超100天,如果擁有100P算力,定位星體所需時間僅為100秒。
任京暘說,一般智算中心提到的100P是指FP16或INT16,即半精度算力,就現階段而言,以100P起步,能實現比較大的規模效益。
從需求角度看,智算中心作為城市級公共算力平台,要滿足區域內政府、企業、高校等各類用戶的算力需求,起步規模不宜過小,否則無法支撐類似大模型訓練等大算力需求,也不足以發揮集約共享的規模效益。
任京暘補充道,從投資角度看,智算中心發展尚處於初期階段,建設、運營、應用與生態建設等投入較大,需要結合地方財政承受能力做出合理評估,根據實際需求進行適度的超前部署。
大部分智算中心都是分期建設的,建成一期,就可以投入運營一期,後期再根據運行情況和產業發展需求進行二期、三期建設。
例如武漢人工智慧計算中心,該智算中心在2021年5月完成了一期項目建設工作,並開始為企業提供AI算力,但很快飽和了。於是,武漢人工智慧計算中心又進行了二期項目擴容工作,將算力規模從100P擴容到200P。武漢人工智慧計算中心相關負責人在接受媒體采訪時說,現在二期算力也接近飽和,隨著准備進行進一步的算力擴容工作。
武漢人工智慧計算中心
根據各智算中心的數據,至少數百家企業已經簽約智算中心,例如武漢人工智慧計算中心已經為多家高校和科研院所、100多家企業提供算力,南京智能計算中心已經吸引超40家產學研機構入駐。
一個智算中心可以同時支撐的產業場景很多,例如自動駕駛、智慧醫療、智慧城市、智慧交通、智慧礦山、智能製造等等,主要看當地的需求,一般都是為了支撐當地的優勢產業更好發展。比如,青島靠近海域,其人工智慧計算中心招標文件就有提到青島人工智慧計算中心要支撐青島優勢產業集群,比如智能家居、智能製造等產業智能化持續領先,並著重強調支撐當地智慧海洋經濟的發展。
上述智算中心都並不局限於支撐單一產業。不過,也有一些城市選擇建設針對性更強的智算中心,像山西晉城建設了專門面向煤炭行業的智算中心(智能礦山創新實驗室創新成果&計算中心)。該智算中心由華為、晉能控股等企業參與建設,主要是為推動山西煤礦智能化建設。
智能礦山創新實驗室創新成果&計算中心
在智算中心建設過程中,市政和建築設計企業背後的AI和ICT企業是重要角色,例如曙光、華為、浪潮、騰訊、商湯 科技 等企業。
在 探索 智算中心過程中,作為計算領域的頭部玩家曙光提出了「5A級」智算中心建設方案,從開放、融合、綠色、普惠、服務五個方面,進行智算中心相關的實踐和 探索 。目前,曙光5A級智算中心已在廣東珠海、安徽合肥、浙江桐鄉等地陸續落成,其江蘇崑山等地的智算中心也進入建設階段。
合肥先進計算中心
曙光智算中心會採用兼容多種晶元、演算法、模型等的多元協作方式以實現多元算力提供。例如曙光參建的合肥先進計算中心不僅能提供智能算力,還能提供高性能計算所需算力。在降低智算中心、數據中心能耗方面,曙光研發有浸沒式相變液冷技術,可使智算中心的PUE值降至1.04到1.05。
華為應該是比較早嘗試智算中心的企業,而且也是參與各地智算中心建設最多的企業之一。華為升騰計算業務總裁許映童曾在2021世界人工智慧大會期間透露,華為希望在2021年內啟動超20個智算中心建設。
包括「鵬城雲腦II」、「武漢人工智慧計算中心」在內的幾個華為承建的智算中心項目幾乎都是使用華為的Atlas 900 AI集群架構,來實現AI算力供給的。Atlas 900 AI集群架構是由數千顆升騰910 AI處理器構成,其總算力達到256P 1024 PFLOPS FP16。
鵬城雲腦
浪潮在智算中心方面也有多年的研究,無論是智算中心運行過程中算力生產、算力聚合、算力調度還是算力釋放環節,浪潮都分別有相應的技術和軟硬體支撐。南京智能計算中心就是採用了浪潮AI伺服器算力機組和寒武紀思元270和思元290智能晶元及加速卡。
南京智能計算中心
作為數據中心行業的重要玩家,騰訊將其在數據中心方面的 探索 應用在了智算中心建設中,像騰訊智慧產業長三角(合肥)智算中心建設中就用到了騰訊第四代T-Block等高端模塊化技術,支持項目快速交付。騰訊第四代T-Block等高端模塊化技術就是將IT、空調等數據中心的各個功能模塊化,以實現按需靈活配置。
商湯 科技 是從2018年開始進行人工智慧計算中心預研工作的,2020年7月開始商湯 科技 人工智慧計算中心建設工作。2022年1月24日,商湯 科技 人工智慧計算中心啟動運營。商湯 科技 人工智慧計算中心的峰值算力高達3740 Petaflops,這背後包含了商湯 科技 的多種技術突破,包括高性能計算、分布式調度、硬體/軟體協同設計等。
商湯 科技 人工智慧計算中心
我們通過調查2021年以來建設和建成的智算中心,發現越來越多的城市已經開始了智算中心建設。這體現了各地對於AI產業的重視。從一些現有的智算中心建設工期來看,一般一期建設大概時間在半年到一年不等,今年可能會有更多在建的智算中心建成並投運。另外,「東數西算」工程也會對新的智算中心的規劃、建設產生多重影響。
目前參與智算中心建設的企業相對有限,隨著各地對智算中心建設需求的增加以及一些新玩家加入,智算中心領域玩家可能會面臨更激烈的競爭。
⑤ 信息化建設項目初步設計需要設計圖嗎
你好,是需要設計圖的。初步設計是工程建設前期工作的重要環
節,是對審批通過的可行性研究報告的完善和
細化,是下一階段進行施工圖設計的重要依據。近年來,我國政務信息化邁入了創新發展的新階段,本文就政務信息化工程的初步設計說明、初步設計圖紙、初步設計概算的要點進行了分析閘述。
⑥ 深圳之後「第二城」:華為布局西安,劍指「每秒百億億次」
由華為參與建設, 規劃算力比肩深圳「鵬城雲腦」的人工智慧計算中心 ,落戶西安。
科技 發展到當下,「人工智慧」已是新一輪 科技 革命和產業變革的重要驅動力量,並成為新的國家發展戰略之一。西安, 也是「國家新一代人工智慧創新發展試驗區」。
這個堪稱「最強大腦」,它給我們帶來什麼?
落地: 全球領先的算力中心
綜合相關報道: 西安,是深圳鵬城雲腦外全國第二大人工智慧計算中心 。
公開新聞顯示,「未來人工智慧計算中心」定位極高: 「立足西安,依託秦創原,面向西北, 領先全球的新一代人工智慧計算平台 。」建成後:
「將用於自動駕駛、智慧醫療、智慧城市、智慧交通、智慧礦山等多種應用場景,支撐 國家戰略任務落地、促進經濟與產業發展 融合。」
該中心分兩期建設實施,這個 新一代人工智慧計算平台 核心 算力 如何?
一期,為算力為 300PFLOPS FP16 (每秒30億億次) 人工智慧計算中心;二期,為高層產業研發中心。2025年,目標算力規模達 1000PFLOPS FP16 (每秒100億億次) 。
作為專業術語的「算力」,可能很多人並不了解。 如果進行對比,深圳鵬城雲腦II已成為世界最強的AI算力中心。
華為升騰計算業務總裁許映童表示:華為將 助力西安打造人工智慧「一中心四平台」整體框架 ,通過建設集約化、統一化的人工智慧計算中心,實現政、產、學、研、用五位一體,通過算力集群,賦能產業集群, 推動陝西人工智慧產業數字化與智能化加速發展。
在已有各類超算中心情況下,「AI計算」能量在哪?
要知道,人工智慧 (AI ) 應用場景不斷擴展,幾乎涵蓋了人類 社會 每個領域。 由華為與深圳鵬城實驗室共建的「鵬城雲腦」,走在世界的前列 。
發展: 它究竟多驚人?
那麼,「鵬城雲腦II」究竟有多強?
2020年10月運行的當年,已初展身手:接連奪得 IO500總排行榜、10節點排行榜兩項冠軍 和 AIPerf500的世界冠軍 ,「沖擊高性能計算領域最權威的全球性榜單」成為現實。
2021年7月1日,國際超級計算新一期排行榜中: 「鵬城雲腦II」再次刷新世界紀錄,蟬聯全系統輸入輸出和10節點規模系統兩項世界冠軍 。
「鵬城雲腦II」,已成為 全球計算密度最高,訓練速度最快的AI基礎設施 。
盡管,傳統超算和AI超算有所不同。但是,「鵬城雲腦II」1000P的AI算力—— 每秒百億億次 ,也幾乎堪稱世界最強大的超級計算。
西安「未來人工智慧計算中心」2025年算力規劃,將比肩深圳「鵬城雲腦II」 ——相當於50萬台高性能PC算力之和:
24小時內,能處理 100億 張圖像,
或 1千萬小時 語音 (40萬天)
或 1萬天 (27年) 自動駕駛數據等;
面對有 20萬顆 星星的星空圖,
一位天文學家,定位需耗費 169天 ,
這里可縮短至10秒。
那麼, 「鵬城雲腦-II」可以做什麼 ?
主要提供人工智慧研究必須的計算力資源、存儲資源、網路資源、數據資源和研究環境,覆蓋人工智慧基礎研究、重大應用、操作系統、數據資源共享、產業服務等專門研究實驗領域。
它向深圳衛生 健康 、公安交警、巴士交通等提供服務,並服務於國家重大戰略需求、大規模挑戰性科學計算等關鍵領域。
所以,它不僅是深圳的,它更是國家的國之重器。 毫不誇張,「鵬城雲腦-II」是國家科研類新基建工程,將推進我國自主核心技術的發展,提升粵港澳大灣區乃至全國AI產業國際競爭力。
時代: 迎接一個新的開始
對西安來說,在回歸製造業的同時,要通過科研和創新實現產業升級和迭代。
目前西安,相對優勢愈加明顯——強大學府資源、科研實力和創新基底。同時, 隨著經濟的實質性增強以及產業結構的變化,省市兩級推動西安「國家綜合性科學中心」建設 。
比如「秦創原」,舉全省之力推動。在2020年3月9日, 科技 部網站公布 「支持西安建設國家新一代人工智慧創新發展試驗區」。
這,既是對西安人工智慧產業的期許,也是對西安人工智慧實力的認可。
截至2020年,西安有人工智慧企業150餘家,年產值約120億。西安規劃提出到2022年,實現人工智慧總體發展水平全國領先,打造5-7個產業聚集區, 產業規模超過200億,相關產業規模突破1000億。
2021年《全球AI最具創新力城市榜單》中: 西安名列中國第7名,全球第60名。 華為共建的「未來人工智慧計算中心」,無疑「錦上添花」。
結合深圳「鵬城雲腦」經驗, 西安「未來人工智慧計算中心」除擁有世界最強算力外,可能會實現:
「將進一步推動了制度創新、政策創新,有助於加快實現人工智慧對經濟 社會 發展的帶動和支撐作用,加快形成國家新一代人工智慧試驗區的西安方案。」
可以說,它將成為中國科研類新基建工程。對大力當下發展的西安而言,更值得期待。
對於「人工智慧(AI)」,學界有不少說法,包括
《時間簡史》作者「斯蒂芬·霍金」表示:
「完全人工智慧的發展,可能意味著人類的終結。一旦人類開發出人工智慧,它就會自行起飛並以越來越快的速度重新設計自己。受緩慢生物進化限制的人類,無法競爭並會被取代。」
⑦ 想問一下智算中心的建設是怎樣的包含了哪些方面
智算中心的建設主要包括四個方面的要點:
一、全方位提升AI算力生產供應,而且智算中心是以新型硬體架構和人工智慧演算法為模型,必須要保證長期發展需求以及規劃建設的技術領先性;
二、促進數據開放共享,匯聚各行業領域數據資源,通過海量數據開放共享,全面提升AI演算法訓練數據質量,使沉澱的數據資源在各個應用場景中實現價值最大化;
三、培育區域智能生態,以智能算力生態聚合帶動多層級產業生態體系的形成,助推數字經濟與傳統產業深度融合,加速孵化新業態;
四、推動AI產業創新聚集,在政府主導下,科創企業、科研機構和傳統企業發揮各自在AI方面的技術優勢、加速AI應用場景落地,助力傳統產業轉型升級,催生經濟新業態新模式,優化公共服務供給。
⑧ 什麼是人工智慧計算中心 一中心四平台
1、2020年10月11日,在武漢市國家新一代人工智慧創新發展試驗區啟動儀式上,中國科學技術信息研究所、華為技術有限公司聯合發布《人工智慧計算中心發展白皮書》,共4個章節,分別介紹了人工智慧計算中心的概念、發展現狀、總體架構和關鍵技術以及加快發展我國人工智慧計算中心的建議。
2、會上,武漢人工智慧計算中心項目正式啟動建設。計算中心將圍繞武漢市國家新一代人工智慧創新發展試驗區,重點打造一中心四平台,以人工智慧計算中心為主體,提供公共算力服務平台、應用創新孵化平台、產業聚合發展平台和科研創新人才培養平台,助力武漢市智能製造、智慧醫療、智能數字設計與建造、智能網聯汽車產業發展。
3、「不要盲目地重復建設和盲目地去搶占計算中心這樣的基礎資源,未來整體的全球經濟可能不會迅速走出低谷,在財力有限的情況下,我們要聚集有限的資源和財力,打造支撐人工智慧產業和生態發展的基礎設施。」趙志耘說:人工智慧技術仍在不斷演進和變化,人工智慧計算中心在建設過程中也會不斷面臨新的形勢和挑戰。我國人工智慧計算中心的重點工作是解決「自主化」的問題,讓關鍵技術安全、可靠。
4、趙志耘表示,我國已經批復的人工智慧試驗區有13個,未來還將批復其他的人工智慧試驗區。選擇第一個計算中心開工建設的實驗區發布「白皮書」,具有標志性的意義,它將引領未來實驗區的建設。