1. 給人工智慧提供算力的晶元有哪些類型
給人工智慧提供算力的晶元類型有gpu、fpga和ASIC等。
GPU,是一種專門在個人電腦、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上圖像運算工作的微處理器,與CU類似,只不過GPU是專為執行復雜的數學和幾何計算而設計的,這些計算是圖形渲染所必需的。
FPGA能完成任何數字器件的功能的晶元,甚至是高性能CPU都可以用FPGA來實現。 Intel在2015年以161億美元收購了FPGA龍 Alter頭,其目的之一也是看中FPGA的專用計算能力在未來人工智慧領域的發展。
ASIC是指應特定用戶要求或特定電子系統的需要而設計、製造的集成電路。嚴格意義上來講,ASIC是一種專用晶元,與傳統的通用晶元有一定的差異。是為了某種特定的需求而專門定製的晶元。谷歌最近曝光的專用於人工智慧深度學習計算的TPU其實也是一款ASIC。
(1)谷歌人工智慧算力擴展閱讀:
晶元又叫集成電路,按照功能不同可分為很多種,有負責電源電壓輸出控制的,有負責音頻視頻處理的,還有負責復雜運算處理的。演算法必須藉助晶元才能夠運行,而由於各個晶元在不同場景的計算能力不同,演算法的處理速度、能耗也就不同在人工智慧市場高速發展的今天,人們都在尋找更能讓深度學習演算法更快速、更低能耗執行的晶元。
2. alphago需要多少算力
4個Tesla P100。AlphaGo是一代TPU4個,因此只要4個TeslaP100就已經具備了相對應的計算力。AlphaGo是一款由谷歌旗下DeepMind公司開發的人工智慧程序,曾擊敗了包括世界排名第一的柯潔在內的眾多職業圍棋手。
3. alpha-go的計算能力等同於多少台伺服器
找到一篇文章
這么說吧:1997年下贏國際象棋冠軍卡斯帕羅夫的「深藍」是一台超級計算機,而即將和李世石對決圍棋的AlphaGo卻是谷歌旗下公司DeepMind開發出來的人工智慧程序。強行把這二者拉在一起比較……少年我們還是來談談世界和平吧。不過AlphaGo作為程序,最終還是要運轉在計算機上才能去和人類比個高下的。所以把問題換成「即將和人類下圍棋的那台計算機到底比深藍厲害多少倍?」
我們還是能夠簡單計算一下給出大致答案的。畢竟在衡量計算機性能方面,我們已經有了一個相當統一的標准:每秒浮點運算次數,為了方便起見,我們下面一律稱之為「FLOPS」。
千萬別被「浮點運算」這個計算機術語嚇跑,說人話的話,浮點運算其實就是帶小數的四則運算,比如1.2加2.1就是一個典型的浮點運算。如果你的小學數學老師不是美國人的話,那麼我們估計這會兒你早就心算出結果是3.3了。不過這對計算機來說,這個問題沒那麼簡單。
我們知道,計算機是以0和1構成的二進制數字進行運算的,比如在基礎的二進制里,1就是1,2就變成了10,3是11,4是100……這種運算方式讓我們可以用最簡單的電路元件組裝出穩定有效的計算機器,但它也帶來一個問題:計算機能夠處理的數字只有整數。如果想不藉助任何其他的數學方法,用0和1表示一個0.1……少年我們真的還是來談談世界和平吧。
解決這個問題的辦法很簡單:0.1可以看成是1除以10的結果,我們想讓計算機計算一個帶小數點的數字,只要告訴CPU這是一個被1後面加了多少個0整除的整數就行了。不過這樣一來,計算機在處理小數點的時候,就多了好幾個運算步驟。所以進行浮點運算的速度也就成了衡量計算機性能的標准。
拿在國際象棋上擊敗人類的深藍來說,它的計算能力是11.38 GFLOPS,意思就是深藍能在每秒鍾里計算113.8億次帶小數的加減乘除。而在二戰期間幫助美國設計製造原子彈的第一台通用計算機ENIAC,它的性能只有300 FLOP。
在今天看來,深藍的性能怎麼樣?三個字:弱爆了。單就PC中使用的CPU來說,早在2006年,英特爾推出的第一代酷睿2就已經穩穩地超過了深藍。這還沒有算上顯卡里GPU帶來的效果加成,今天最普通的集成顯卡,其性能也已經超過了700 GFLOPS。如果真要在性能上比個高下,深藍這種上個世紀的超級計算機,就算組團也不一定能單挑你面前的這台筆記本電腦。
那麼今天的超級計算機已經達到了什麼樣的性能水平?我們國家的天河二號是世界最快的超級計算機,它浮點運算能力已經達到了33.86 PFLOPS。也就是說,深藍要在性能上增長到自身的30萬倍,才能和天河二號相提並論。
不過對於深藍來說,這樣的比較實在是太不公平。因為即便在當年,深藍也不是速度最快的超級計算機。相比之下,只有通過谷歌AlphaGo使用的電腦,我們才能比較出這20年裡,我們的計算機到底經過了怎樣驚人的發展。
根據谷歌團隊發表在《自然》雜志上的論文, AlphaGo最初是在谷歌的一台計算機上「訓練」人工智慧下圍棋的。按照論文里的描述,谷歌利用這台計算機,讓AlphaGo的圍棋水平提升到了與歐洲冠軍樊麾接近的地步。不過論文除了提到這台計算機裝有48個CPU和8個GPU之外,對計算機的性能連一個數字都沒有提到。好在AlphaGo是在雲計算平台上運行的,我們只要找來競爭對手的計算機數據比較,就可以了解到大概了。
比如說去年12月,阿里雲對外開放的高性能計算服務。按照阿里雲的描述,這些計算機的單機浮點運算能力是11 TFLOPS,而且同樣可以用來訓練人工智慧自行學習。如果谷歌的計算機性能與阿里雲接近的話,那麼AlphaGo所驅動的硬體,性能至少是深藍的1000倍。
但故事到這里還沒有完,AlphaGo並非只有「單機版」一個版本。為了達到更高的運算能力,谷歌還把AlphaGo接入到了1202個CPU組成的網路之中。聯網後的AlphaGo算力猛增24倍,一下子從「單機版」不到職業二段的水平,跳躍到了職業五段上下的水準。
所以AlphaGo比深藍厲害多少倍?估計這會你已經得出答案了:2.5萬倍。從這個角度,我們也能看出來,圍棋究竟是怎樣復雜的一種智力游戲,以至於計算機的性能需要20年的提高,才能在象棋上戰勝人類後,再在圍棋棋盤面前,坐到人類頂尖選手的對面。不過歸根揭底,AlphaGo最重要的成就並不是採用了性能多麼優秀的電腦,而是第一次讓程序可以以人類的方式思考、學習和提高。所以過幾天的比賽,無論誰輸誰贏,我們見證的都是一個嶄新紀元的開端。
當然別忘了關注新浪科技,我們到時候會在最前方,帶你迎接這個新紀元的第一道曙光。
4. GoogleAI晶元TPU核心架構--脈動陣列SystolicArray
從2016年至2023,谷歌推出了四代自家人工智慧加速晶元——TPU(Tensor Processing Unit)。TPU專為人工智慧應用場景提供硬體級的算力支持,其中關鍵硬體是其「矩陣乘法單元」。該單元採用獨特的Systolic Array(脈動陣列),以針對性的提升AI任務中的卷積、矩陣乘等矩陣運算速度和降低功耗。
在神經網路中,CPU和GPU是神經網路的基礎。CPU計算資源有限,每次計算需要取數+運算,得到一個標量結果;早期GPU的SIMD使用大量計算資源,雖然每個運算單元單次得到一個乘法結果,但通過並行計算,可以在CPU計算[公式]的時間內,計算出整個[公式];然而,由於CPU和GPU都是基於傳統馮諾依曼結構,每次計算都需要訪問存儲,取操作數,導致性能無法滿足需求。
而TPU利用Systolic Array脈沖陣列,通過一次性取數,在陣列里脈動傳輸實現Reuse,實現高計算吞吐量,同時顯著降低耗電量、佔用空間更小。對於矩陣的卷積,TPU採用了上述脈沖陣列,具體數據流向如下:先將權重矩陣的每個值取出存放在運算單元,作為一個乘數;再將例如3*3的輸入矩陣特殊排列,「流動」地廣播到各個運算單元,作蘆寬為另一個乘數。矩陣流動完成後,就可以得到輸出矩陣。
總體來看,TPU的架構主要是圍繞由脈沖陣列組成的矩陣乘法單元構建的。搭配如Unified Buffer/Weight FIFO等數據單元,以及卷積後需要的激活池化等計算單元。
進一步了解Systolic Array以及為什麼要使用Systolic Array,可以從最早的論文中得知。作為一個專用架構,脈動陣列主要關注以下問題:綜合這些考量,就有了如上的設計原則:對於卷積運算的特性[公式],用互相連接的Processing Unit來替代單獨的處理單元。PE只需要設計簡單的乘加邏輯,控制邏輯也很簡單,實現了高速、復用、簡單等目標需求。
權重向量、輸入向量、輸出向量是卷積運算中關心的元素。對於一個流動性設計的脈沖陣列,實現卷積的方式為,將這三種矩陣分為三類在陣列里操作:
第一種:提前讀取[公式]到[公式]權重參數到PE內,第一個時刻計算出[公式],第二個時刻計算出[公式],第三個時刻計算出[公式]並輸出;
第二種:輸入x的移動方式不變,每個時刻向後移動一次;但是權重參數不再預先讀取存放不動,而是在幾個PE之間循環移動。這樣三個Cycle後第一個PE會產生輸出向量的第一項[公式],同理第二個PE會產生輸出向量的第二項[公式]。
有了以上的理解,TPU內,脈動陣列仔寬對三維張量的計算流程也很好理解。只要我們在橫向連接PE的同時,也支持縱向連接,就會得到Google展示的架構:2D脈動陣列可以採用權值和輸入分別移動,而輸出固定的流動方式,生成結果的過程如下。
5. 谷歌號稱實現的「量子霸權」,究竟霸了個什麼權
前段時間,谷歌在 NASA 上發表了一篇論文草稿, 宣稱「谷歌的 AI Quantum 研究小組的 53 量子比特處理器實現了「量子霸權,目前最強超算需要花費 10000 年的計算在量子計算機上只用 200 秒就夠了」 。不過沒多久這篇論文就被撤回了。
( 利用可編程超導處理器實現量子優勢 )
雖說後來有人解釋說是論文還在審查,被 NASA 提早發布了。可不是發了果照再撤回大家就能當沒發生過。 又是最強又是霸權的,吃瓜群眾早都興奮了 。
連明年的美國總統候選人 Andrew Yang 都發聲:世界上再沒有破解不了的代碼了。
霸權通常和地位聯系在一起,像什麼世界霸權,軍事霸權,文化霸權什麼的,很容易給人一種處在能夠操控、壓制他人的強勢地位的感覺。一聽到 XX 霸權這樣的詞語,總會讓我們心頭一顫。
那這個「量子霸權」究竟霸了個什麼權,對我們又有什麼影響呢?
為了不讓大家產生什麼誤解,先告訴大家結論: 「量子霸權」和我們所理解的霸權根本不是一回事 ,而且就目前來看, 短時間內也不會對我們帶來任何影響 。
「量子霸權」,翻譯自 Quantum Supremacy ,最早出現在 《 MIT Technology Review 》( 麻省理工 科技 評論,是由麻省理工學院出版的雜志 ) 關於谷歌與 IBM 開展量子計算研究競爭的評述中。
他們認為, 當量子計算機發展到 50 量子比特的時候,就能實現 「 量子霸權 」,超過世界上任何傳統計算機,能夠解決傳統計算機解決不了的問題 。
如果不是很了解量子的概念,大可以先把量子計算機當成一種先進的電腦,量子比特當成一種特別的比特。
大家都知道傳統計算機是靠數字 0 和 1 的二進制進行存儲和運算的,一個比特代表一個數,一堆比特就成了數據。量子比特則是可以同時表達 1 和 0 的另類。
我們把小黑胖比作比特,方便大家理解。
小黑胖可以吃雞腿,也能啃豬蹄,但從常識來說,同一時間他只能吃其中一種。
但量子小黑胖就不一樣了, 他能在吃雞腿的同時也在啃豬蹄 ,如果不掰開他的嘴看看,你永遠不知道他吃什麼。
於是有人預言,當 50 個量子小黑胖一起吃東西時,就能吃掉不管多少個普通小黑胖都沒法在一頓飯的時間里吃掉的肉山。
可誰也不知道那麼多量子小黑胖在一起會不會打起來;會不會乾脆打起來了麻將,不吃東西了。
於是大家決定, 如果誰成功湊齊這么多量子小黑胖並讓他們吃掉那座肉山,就說他實現了「 量子霸權 」 。
事情就是這樣
相信有差友都開始罵人了, 這是哪門子的「 霸權 」啊?
雖然不存在什麼量子小黑胖,也沒人能一邊吃雞腿同時啃豬蹄,更理解不了為什麼掰開嘴之後里邊只剩下了一種食物,但「量子霸權」就是這么回事。
谷歌針對某個問題,弄出了這么一台量子計算機。然後證明了在這個問題上最厲害的超算都算不過量子計算機。
不過天見可憐,估計評述的作者也想不到,他只是想感慨量子計算機的算力優勢,沒想到這個單詞在中國朋友這還有這么復雜的意思。
其實讓托尼來形容,估計也想不出啥准確的詞,或許可以叫 「 量子牛逼 」 ?
至於它的算力有多強,給大家舉個栗子。
0 就像硬幣的正面, 1 就像硬幣的反面,傳統計算機裡面,每次拋硬幣要麼是正面要麼是反面。
如果扔兩枚硬幣,傳統計算機要像小孩子一樣,同一時刻只能在正正、正反、反正、反反這四種狀態中選一種。而量子不做選擇,所有狀態同時全都要。
可能差友對這種近乎耍賴的行為沒什麼概念,那我們再換顆實際點的栗子。
大家說好去找萬匹絲,路飛坐船從東海出發,你鳴人卻用多重影分身分頭找。還敢說你鳴本開沒開掛!
雖說不管多麼復雜的演算法,通過不斷重復的計算都能得到答案,但是有些問題算起來就是成千上萬年,得到答案的時候可能早都不需要了。
為什麼現在的人工智慧更像個人工智障,為什麼人類遲遲破了不了基因的秘密,為什麼郵遞員的最短路線算不出來。。。 還不是因為算不過來 !
但這些為什麼大部分都會在量子計算下被摧枯拉朽地解決。
毫無疑問,現在的密碼對上量子計算機的下場只有一個, 輸的連褲衩都不剩 。
傳統加密方式在掛壁面前毫無意義,個人的、銀行的、機關的,就連區塊鏈的秘鑰被試出來也就是分分鍾的事。。。
現有的加密演算法
不過這是「 現在 」的密碼系統對比有了完善演算法的「完全體」量子計算機的情況, 現在真正意義上的量子計算機還沒影呢 。
2000 年時 IBM 首席科學家迪文森佐提出了量子計算機應該滿足的五條標准, 可現在還沒誰能全部達標( 包括谷歌這次 ) ,谷歌這次的演算法和密碼破解也沒一毛錢關系。
算力會進步,加密方式也在變強。
512 位的 RSA 加密演算法在 1999 年就被破解了。
768 位的 RSA 加密演算法也只撐了 10 年 。
雖然目前廣泛採用的 RSA 1024 還好好的,但居安思危,早有人提議啟用 RSA 2048 ,甚至是 RSA 4096 。
就連數字證書中常用的 SHA-1 演算法,在 2017 年也被谷歌破解。
但,目前為止也沒見哪個國家的核彈密匙被盜用。
退一萬步 ,量子計算的對手也該是同樣開掛的量子加密。
就像矛和盾,鐵矛刺穿木盾當然毫不費力,但因此就說矛比盾強,邊上的鐵盾肯定不樂意。
道理是這么個道理,不過大家肯定還關心: 咱們國家有鐵盾了沒,厚實不?
雖然量子計算方面各國還是一個你追我趕的狀態,但在量子加密領域我國可以說是一騎絕塵。
早在 2016 年,我國就已經把量子衛星「 墨子號 」送上天,並在 2017 年通過 「 墨子號 」 與奧地利科學家進行了量子加密的視頻通話~
除了盾硬,矛也得造。政府的大力扶持, 科技 企業的不斷投入, 我國在量子計算領域也穩坐第一梯隊 。
阿里巴巴達摩院 2017 年就和中科院合作成立了 「 中科院阿里巴巴量子計算實驗室 」,與一眾 科技 巨頭爭奪 「 量子霸權 」。
華為投入研究量子計算之餘,也在提升行業生態和人才基數:華為雲提供雲量子模擬,沃土計劃培養未來量子計算人才。
「 量子霸權 」才是個開頭呢,後面的 科技 競爭還需要源源不斷的人才支撐。
托尼沒這么大本事弄出一大塊人才成長的沃土,但有平均水準超高的差友們啊!雖說沒誰看這么篇文章就要努力研究量子 科技 去,但多少能讓更多人知道量子計算是怎麼回事。
哪怕只有一點點, 社會 關於量子 科技 的環境都在變好。
這就值了。
6. ai綆楀姏cpo鍥涘墤瀹㈡槸鍝鍑犱釜ai綆楀姏榫欏ご
銆銆"AI綆楀姏 CPO 鍥涘墤瀹"鎸囩殑鏄鍦ˋI綆楀姏棰嗗煙涓錛屽崜瓚婄殑浜у搧鍜屾湇鍔℃墍甯︽潵鐨勫洓澶ф牳蹇冧環鍊箋傚叾鍥涚嶅熀鏈鐨勬牳蹇冧環鍊間負錛
銆銆1. 楂樻晥鎬(Efficiency)錛氫富瑕佷綋鐜板湪涓篈I璁$畻宸ヤ綔鎻愪緵鐨勯珮宄版ц兘鍔涳紝鍖呮嫭紜浠剁殑浼樺寲鍜岃蔣浠舵灦鏋勭殑浼樺寲銆
銆銆2. 紼沖畾鎬(Stability)錛氫綋鐜板湪鏈嶅姟鍜岀‖浠跺鉤鍙扮殑楂樺彲闈犳с佽繍琛岀殑騫崇ǔ鎬у拰榪炵畫鎬с
銆銆3. 鐏墊椿鎬(Flexibility)錛氫富瑕佹寚鍦ㄤ笉鍚岄渶奼傜殑鎯呭喌涓嬶紝澶勭悊娑堣垂鑰呯殑闇奼傛槸鍚﹁兘澶熸彁渚涘叏鏂逛綅鐨凙I綆楀姏澶勭悊錛屼粠鑰屼負娑堣垂鑰呮彁渚涙洿鐏墊椿鐨勯夋嫨甯傚満銆
銆銆4. 鎬т環姣(Cost-effectiveness)錛氫富瑕佷綋鐜板湪涓哄㈡埛鎻愪緵浜嗕環鏍煎悎鐞嗙殑楂樺搧璐ˋI綆楀姏鏈嶅姟錛屽苟涓斾笌鍏朵粬鍚岀被鍏鍙哥浉姣旓紝鎻愪緵鏇村ソ鐨勬т環姣斻
銆銆鍥犳わ紝"AI綆楀姏 CPO鍥涘墤瀹"鏄鎸囪繖鍥涗釜鏍稿績浠峰兼墍浠h〃鐨勫叿浣撲駭鍝佸拰鏈嶅姟錛岃岃繖鍥涚嶄駭鍝佸拰鏈嶅姟鐨勬彁渚涜呭寘鎷琋VIDIA銆両ntel銆丄MD鍜孉rm絳夊叕鍙搞
銆銆AI綆楀姏 CPO 鍥涘墤瀹㈡寚鐨勬槸錛歂VIDIA銆佽嫳浼熻揪(AMD)銆丟oogle鍜孖ntel鍥涘跺叕鍙搞
銆銆榪欏洓瀹跺叕鍙擱兘鍦ㄤ漢宸ユ櫤鑳介嗗煙涓鍙戞尌鐫闈炲父閲嶈佺殑浣滅敤錛屼粬浠鐨勪駭鍝佸拰鎶鏈涓轟漢宸ユ櫤鑳藉簲鐢ㄦ彁渚涗簡涓嶅彲鎴栫己鐨勬敮鎸併傚叾涓錛孨VIDIA 琚璁や負鏄 GPU 鎶鏈鐨勪唬琛錛岃嫳浼熻揪鍒欐槸 CPU 棰嗗煙鐨勪紭縐浼佷笟錛孏oogle 鍒欓氳繃 TensorFlow 騫沖彴絳夊伐鍏鳳紝鎺ㄥ姩浜嗘満鍣ㄥ︿範鎶鏈鐨勫彂灞曪紝鑰 Intel 鍒欏甫棰嗙潃琛屼笟鍚戠潃 AIoT 鏂瑰悜鍙戝睍銆
銆銆鍊煎緱娉ㄦ剰鐨勬槸錛岄殢鐫浜哄伐鏅鴻兘鐨勪笉鏂鍙戝睍錛屾柊鐨勬妧鏈鍜屼紒涓氫篃浼氫笉鏂娑岀幇錛屽洜姝よ繖涓鍚嶅崟鍙鑳戒細鏍規嵁甯傚満鍜屾妧鏈鐨勫彉鍖栬屽彂鐢熸敼鍙樸
銆銆ai綆楀姏cpo鍥涘墤瀹㈤氬父鎸囩殑鏄浜戣$畻棰嗗煙鐨勫洓涓涓昏佸巶鍟嗭紝鍗充簹椹閫夾WS銆佸井杞疉zure銆佽胺姝孋loud鍜岄樋閲屼簯銆傝繖浜涘叕鍙告彁渚涗簡寮哄ぇ鐨勪漢宸ユ櫤鑳借$畻鑳藉姏錛屽彲浠ュ府鍔╀紒涓氫互浣庡粔鐨勬垚鏈浣跨敤澶ц勬ā鐨凙I璁$畻璧勬簮鏉ヨ繘琛屾暟鎹鍒嗘瀽銆佹満鍣ㄥ︿範絳変換鍔°