『壹』 行至XPU平台節點 半導體三雄必有一戰
英特爾這幾年估計心很累。
除了PC銷量下滑、工藝進展遲滯,當英偉達股價上漲、新型AI處理器問世、AMD收購賽靈思、蘋果發布新晶元……英特爾每每都要被拖出來吊打一次。
是廉頗老矣?還是大象善舞本來就不容易?
從英特爾現在的業務情況來看,傳統PC業務已經從原來的八成下降到現在的五成,而數據中心則一路上揚,營收從原來的二成增長到了五成。或許老牌 科技 企業都逃不開波峰低谷的發展周期,於是轉型就成為必然。
從2017年開始,英特爾就宣稱自己是一家數據公司,因為「數據才是未來的石油」。2018年底,英特爾宣布最新戰略目標,即以製程和封裝、XPU架構、內存和存儲、互連、安全、軟體六大技術支柱為核心,明確了「以PC為中心」轉向「以數據為中心」的轉型目標。
而就在昨晚,英特爾正式發布其首款數據中心獨立圖形顯卡——伺服器GPU,以及oneAPI Gold工具包。這也意味著,英特爾六大戰略中的XPU架構(XPU架構中的「X」指的是包含 CPU、GPU、專用加速器以及FPGA 的混合架構)集齊最後一條「神龍」;軟體方面,one API Gold繼Beta版本發布一年後,也完成了階段性的躍升。軟硬體共同發力,英特爾卯足力氣攪動數據中心本來就不平靜的池水。
局勢已經非常明朗,英特爾、英偉達、AMD都在打造自家的XPU架構,通過收購也好、自研也罷,在硬體架構和軟體工具上的布局都是一副當仁不讓的態勢。
英特爾加速計算20年坎坷路
英特爾不是沒有過獨立顯卡GPU的嘗試,只不過是20年前。2009年末,英特爾宣布取消「Larrabee」圖形晶元項目,將重注都押在多核的技術路徑上。
彼時,英偉達已經推出Tesla,大舉進攻。AMD也在2006年收購了ATI後正式進入顯卡領域,雖然在CPU和GPU面臨著英特爾和英偉達的雙重夾擊,卻也是成就今天三足鼎立局面的關鍵一步。
英特爾在集成顯卡這條路的經濟賬沒毛病。將圖像處理的部分整合到CPU中,這樣一來核心顯卡始終是和CPU一體的,必要時還是需要調用部分CPU的運算能力來提高圖像處理效率。當性能需要提升時怎麼辦?增加核顯,還可以提高處理器價格,間接增加利潤。或許正因如此,英特爾沒有太大動力去開發獨顯GPU,在宣布取消Larrabee項目時,信誓旦旦表示不會推出獨立顯卡GPU,至少短期內不會。
被停掉的Larrabee後來成為了至強融核(Xeon Phi)協處理器的原型,這是英特爾首款集成眾核(Many Integrated Core,MIC)架構的產品,用作高性能計算的超級計算機或伺服器的加速卡,順應了高性能計算市場的異構需求。Xeon Phi也一度被用到超級計算機上,雄霸世界超算榜單,例如我國的天河一號、天河二號,直到2015年4月被美國禁止向中國超算中心出口Xeon Phi。
受市場需求頹勢的主要影響,2018年開始,代號為Knight Landing的Xeon Phi 7210、7230等產品列入停產計劃;去年,代號為Knight Mill的Xeon Phi處理器也啟動停產計劃,並宣布將在今年7月31日停止出貨。
而就在英特爾在加速計算曲折前進的這些年,英偉達GPU一騎絕塵,AMD也在CPU和GPU雙線開花。雖說船大不好調頭,但作為巨頭,必要時確實要勇於自我piapia打臉。
2017年末,原AMD RTG總裁、顯卡首席架構師Raja Kori離開AMD,加入英特爾。當時業界就推斷英特爾可能要重啟獨顯計劃,直到Xeon Phi陸續停產,這一猜想在去年達到沸點。
直到今年8月的架構日上,英特爾曝光了針對數據中心的首款基於 Xe 架構的獨立圖形顯卡,有關英特爾開發獨顯GPU的傳言正式得到驗證。
Xe GPU的出現,從多個維度補充了英特爾缺失的拼圖。它正式宣告英特爾進軍高端GPU領域,將觸角伸向移動端、桌面端、雲 游戲 、數據中心、高性能計算等多個領域。此外,它作為英特爾向量計算的代表產品,進一步補全了英特爾的XPU組合。
XPU架構成為必爭之地
僅有CPU一條路確實走不通,這一點AMD的方向從一開始就是正確的,英特爾這些年也通過買買買擴充了XPU架構。
2015~2019這幾年間,英特爾都有重磅收購,幾乎都是圍繞這個架構理念展開的。2015年收購FPGA供應商Altera,2016年收購AI晶元供應商Nervana,2017年收購了ADAS晶元供應商Mobileye和AI晶元供應商Movidius,2018年收購eASIC,2019年收購雲端AI晶元供應商Habana Labs。
直到昨天正式推出針對數據中心的首款伺服器GPU,至此,XPU全家桶已配齊。如果說英特爾之前擱置GPU計劃是出於市場策略和技術瓶頸,那麼,今天重返這一市場,難度就會低嗎?英偉達的GPU性能不夠好嗎?AMD的性價比它不香嗎?用戶選擇英特爾的理由是什麼?
據英特爾的技術大拿表示,在過去的20年裡,英特爾其實一直在提供集成圖形顯卡。而顯然,隨著工作負載和性能需求都在上升,AI和流媒體在這些工作負載中的佔比也在上升。英特爾正在擴展為更為堅實的Linux堆棧,並將從數據中心一些獨特的用例開始,比如安卓雲 游戲 和流媒體服務。
這是非常明智的一個起步。安卓雲 游戲 在全球 游戲 開發生態系統中占據74%的市場份額,增長空間非常大;而流媒體服務涉及高密度的媒體轉碼和編碼,現在小視頻、直播盛行,有著巨量的用戶市場。英特爾希望通過至強可擴展處理器與全新伺服器GPU的組合,加上開源和授權的軟體組件,通過較低的總體擁有成本(TCO),為安卓雲 游戲 以及實時頂級視頻直播的高密度媒體轉編碼提供高密度、低時延的解決方案。
但不管怎樣,英特爾這一次押注數據中心GPU,將會是更為艱難的挑戰。首先龐大的研發投入仍然必不可少,更重要的是,這一次要突圍的技術需要多點開花,要在AI、5G、自動駕駛等領域都要持續投入,基礎研發上既要保持專注還要保證核心競爭優勢,軟體要更易用,生態要更強大。
互相滲透的軟體生態
XPU的確很強大,但是想要把整個計算系統打通,除了硬體,軟體平台也是要搭建的。因為涉及到具體的開發工作,在不同架構之間切換並不容易,尤其是想要跨廠商進行切換的時候,這也是業內普遍的痛點。
英特爾曾在2019年的SuperComputing大會上首次提出oneAPI,並表示這是為實現統一、簡化的跨架構編程模型所提出的願景,希望能夠不受限於單一廠商專用的代碼構建,且能實現原有代碼的集成。藉助oneAPI,開發者可以針對他們要解決的特定問題選擇最佳的加速器架構,且無需為一個架構和平台再重寫軟體。這不僅能夠釋放底層硬體的性能潛力,同時能降低軟體開發和維護成本。繼Beta版本發布一年後,相信這次最新發布的Gold版本在代碼穩定性、成熟度以及性能表現方面值得期待。
既然支持跨架構、跨廠商的切換,那麼不妨設想一下,如果英特爾、英偉達和AMD的晶元同在一個系統中,oneAPI是否可以提供支持?
對這一問題,英特爾方面給出的答案是肯定的,哪怕這個系統中沒有英特爾的晶元,也是可以支持的。這意味著什麼?它將成為開放的行業規范,任何人都可以運用它,它甚至可以進入英偉達、AMD的生態系統。面對競爭,英特爾向友商敞開懷抱,並且進入他們的陣營擁抱他們和他們的盟友。oneAPI就是英特爾在軟體乃至生態層面最大的雄心。
英偉達的做法異曲同工。在2019年法蘭克福國際超算大會上,英偉達已經宣布其CUDA編程架構開放支持Arm CPU架構,向Arm生態系統提供全堆棧的AI、HPC軟體,可支持所有AI框架、600多個HPC應用程序的加速,其中包括所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟體開發工具,比如支持OpenACC的PGI編譯器和性能分析器。而堆棧優化完成後,NVIDIA將為所有主流CPU架構提供加速,包括x86、POWER、Arm。
AMD幾年前也開始了這樣的嘗試,其Radeon開放運算平台ROCm,希望通過CUDA編譯代碼轉換,進一步支持英偉達的 CUDA平行運算平台,開始了在軟體平台上對英偉達的追趕。
寫在最後
5G、AI都在催生計算場景的多樣性和更為豐富的內涵。未來的數據是多樣化的,需要通過多種硬體計算組合來應對多種數據類型,誰能挖掘出最優化的算力組合,誰就能讓數據發揮出最大價值。異構計算,不僅是解決摩爾定律走入絕境的一種方法,更是未來所需。這就是為什麼英特爾、英偉達、AMD紛紛在構建自己的XPU平台。
不過,當三大巨頭紛紛端出自己的全家桶時,一個挑戰是共通的:進步絕不僅體現在處理性能的提升上,更大的難題在於:如何牢牢抓住應用需求,用極為豐富、靈活的組合給出最優化、最適配的方案?
『貳』 英特爾發布新一代AI晶元,吞吐量較A100翻倍
英特爾發布新一代AI晶元,吞吐量較A100翻倍
英特爾發布新一代AI晶元,吞吐量較A100翻倍,晶元製造商英特爾發布一款專注於人工智慧計算的全新晶元Gaudi2,希望藉此挑戰英偉達在人工智慧晶元市場的主導地位。英特爾發布新一代AI晶元,吞吐量較A100翻倍。
針對AI加速,英特爾發布專用於高性能深度學習AI訓練的英特爾Habana Gaudi2 AI處理器,以及第二代雲端AI推理晶元Greco。
第二代Gaudi訓練晶元和Greco推理晶元均採用7nm工藝,較上一代16nm有所提升。Gaudi2可擁有高達96GB HBM2e內存,以及24個集成的100GbE RoCE埠。
據介紹,在訓練主流計算機視覺和自然語言處理模型時,Gaudi2的吞吐量可達到英偉達A100的兩倍。
Habana客戶現可使用Gaudi2處理器,其第二代Greco推理晶元將從今年下半年開始提供給客戶。
英特爾還宣布其代號為Arctic Sound-M(ATS-M)的英特爾數據中心GPU將於2022年第三季度發布。
作為面向多媒體轉碼、視覺圖形處理和雲端推理的單一GPU解決方案,ATS-M是英特爾在該領域首款配備AV1硬體編碼器的獨立GPU。
它是一顆支持高質量轉碼和高性能的強大GPU,能夠提供每秒150萬億次運算(150TOPS)。
開發人員可以利用oneAPI支持的開放軟體堆棧,輕松地開展面向ATS-M的設計工作。
ATS-M將擁有兩種不同的產品外形設計,並將獲得超過15款來自戴爾、Supermicro、浪潮和新華三等合作夥伴的系統設計。
隨後,英特爾首次進行了其軟體基礎設施計劃Endgame項目的概念演示。
應用程序可以充分利用這個軟體基礎設施層,使設備能利用網路中其他設備的計算資源,從而提供始終可用、低時延、連續的計算服務。
例如,在一台設備上運行要求苛刻的GPU工作負載時,可以感知並利用來自更高性能計算設備上的額外圖形處理算力,以增強用戶體驗。
Endgame項目正在開發中,英特爾在今年開始該技術的beta測試。
5月11日消息,當地時間周二晶元製造商英特爾發布一款專注於人工智慧計算的全新晶元Gaudi2,希望藉此挑戰英偉達在人工智慧晶元市場的主導地位。
Gaudi2是由英特爾旗下Habana實驗室開發的第二代人工智慧處理器。Habana實驗室曾是一家以色列人工智慧晶元初創公司,被英特爾於2019年底斥資20億美元收購。近年來,數據中心常用的人工智慧計算業務飛速增長,相關創企紛紛獲得巨額投資。
眼下很多人工智慧研究員和企業已經習慣使用英偉達的軟體平台CUDA,英特爾想要從英偉達手中搶奪市場份額並非易事。除了推出用於人工智慧計算的新晶元之外,英特爾還表示一直在進行軟體開發。
「CUDA並不是英偉達能夠長期屹立不倒的護城河,」Habana實驗室首席商務官艾塔·麥地納(Eitan Medina)表示。他補充稱,英特爾開發的軟體平台採用開放標准,可以從軟體開發網站GitHub免費下載和使用。「現在的問題是,誰能更高效地完成這項工作?」
麥地納表示,Gaudi2的處理速度是Habana實驗室之前所開發人工智慧晶元的兩倍,由台積電的7納米製程代工製造。相比之下,Habana實驗室之前推出的人工智慧晶元採用的16納米製程工藝。
英特爾還推出一款用於人工智慧推理工作的晶元Greco,能夠利用人工智慧演算法預測或識別物體。
英特爾數據中心和人工智慧負責人桑德拉·里維拉(Sandra Rivera)表示,未來五年,人工智慧晶元市場預計將以每年25%的速度增長,規模會達到500億美元左右。她說:「我們打算通過投資和創新來引領市場發展。」她補充說,會向軟體領域進行更多投資,其中既有擴大英特爾的團隊,也有收購其他公司。
GPU、AI 晶元、通用化雲算力軟體,英特爾在創新峰會上告訴我們,它仍然是那家站在最前沿的科技公司。
本周二,英特爾推出了一款名為 Gaudi2 的 AI 晶元,這家公司正在大力進軍英偉達主導的人工智慧晶元市場。
Gaudi2 是以色列人工智慧晶元初創公司 Habana Labs 的第二代處理器,英特爾於 2019 年以約 20 億美元的價格收購了該公司。近年來,AI 研究人員和公司已經習慣使用英偉達軟體平台 CUDA,因此從後者手中搶奪市場份額一直是一個挑戰。除了用於人工智慧計算的新晶元外,英特爾一直專注於軟體研發。
相對於前代 AI 處理器 Greco 和 Goya,Gaudi2 的速度有了顯著提升,其採用台積電 7 納米製程,Tensor 處理器內核數量增加到 24 個,封裝內存容量從 32GB(HBM2)增加至 96GB(HBM2E),板載 SRAM 增加了一倍(從 24MB 到 48MB)。
「這是第一個也是唯一一個集成了如此大內存的 AI 加速器,」Habana Labs 的首席運營官 Eitan Medina 表示。該處理器的 TDP 為 600W,但仍然使用被動冷卻,不需要液冷。
英特爾展示了 Gaudi2 與競爭對手在熱門任務上的一些性能比較。在 ResNet-50 模型訓練中,Gaudi2 的'吞吐量是一代產品的 3.2 倍,英偉達 80GB A100 的 1.9 倍,V100 的 4.1 倍。在其他一些基準測試中,Gaudi 和 80GB A100 之間的差距更加明顯:對於 BERT Phase-2 訓練吞吐量,Gaudi-2 比 80GB A100 高出 2.8 倍。
不過,英特爾並沒有和英偉達最新的 H100 進行對比。
英特爾表示,基於與第一代 Gaudi 相同的體系架構,Habana Gaudi2 處理器大幅提高了訓練性能。用戶在雲端運行 Amazon EC2 DL1 實例以及本地運行 Supermicro Gaudi 訓練伺服器時,其性價比比現有 GPU 解決方案提升了 40%。
與此同時,英特爾還推出了一款名為 Greco 的推理晶元。Gaudi2 處理器目前已經開售,而 Greco 預計將在今年下半年開始為選定的客戶提供樣品。
昨天英特爾推出的 12 代酷睿 CPU HX55 系列不同於此前產品,可以實現接近桌面版的能力,其擁有最多 8 個性能 P 核、8 個能效 E 核,最多 16 個核心、24 個線程,還有 30MB 三級緩存,核顯最多包含 32 個執行單元。
除此之外,H55 系列內存支持雙通道 DDR5-4800 或者 DDR4-3200,最多安裝四條 128G 內存,以及四塊共計 16TB 的 SSD 固態硬碟,它也支持 PCIe 5.0。
HX55 系列一共有七款產品,覆蓋從 i5 到 i9,基礎功耗均為 33W,最高睿頻功耗達到 157W。
旗艦型號是 i9-12950HX,8P+8E 16 核心 24 線程,三級緩存 30MB,P 核頻率為 3.6-5.0GHz,E 核頻率達到 1.7-3.6GHz,集成核顯 32 單元,頻率為 1.55GHz。
性能方面,以最高端的 i9-12900HX 為例,對比上代頂級 CPU i9-11980HK,新晶元單核性能提升 17%,多核性能提升 64%,3D 渲染性能增加了 81%,AutoDesk 專業創作性能提升了 12-28%。
隨著新 CPU 的發布,一系列電腦廠商的游戲筆記本、移動工作站新品即將陸續上市。
除了新的硬體產品之外,英特爾昨天還首次進行了軟體基礎設施計劃「Project Endgame」的概念演示。應用程序可以利用該軟體基礎設施層,使設備能利用網路中其他設備的計算資源,從而提供始終可用、低時延、連續的計算服務。
英特爾首席架構師 Raja Kori 現場展示了 Endgame,在一台筆記本上運行虛幻引擎 5 Demo 時卡頓非常明顯,在開啟持續計算基礎設施後,軟體可以感知並利用來自附近更高性能計算設備上的額外圖形處理算力(一台外星人主機),幀率瞬間升級到了台式機水平。
這一能力也將在未來的元宇宙應用中發揮重要作用。英特爾表示,Endgame 項目正在開發中,預計今年開始 beta 測試。
『叄』 與其跟特斯拉講武德,不如找華為談合作
文|江小花
不是我們進入了汽車行業,而是汽車走到了我們的領域。不是我們要來顛覆汽車行業,是汽車行業自己需要進化。
不是軟體定義汽車,而是汽車智能化需要軟體,讓硬體變得更智能。智能硬體和軟體,好像就是華為的兩大主要優勢。
在你們眼裡,汽車產業可能在走下坡路,在華為眼裡,形勢比一片大好還要好。
華為並不著急,他們看的很清楚,不管是傳統車企,還是造車新勢力,但凡不能獨力成為一個特斯拉,那麼最終,一個能力強大,又隱忍友善的全棧解決方案合作夥伴,就是大多數整車企業進化到5G時代的必然選擇,華為顯然很有信心在全球范圍內成為最令人滿意的那一枚。
本文來源於汽車之家車家號作者,不代表汽車之家的觀點立場。
『肆』 華為不造車,卻造出汽車內核
本報記者陶震
就如同所有使用英特爾處理器的電腦都要貼上「IntelInside」標簽、所有應用徠卡攝像頭的手機都要打上「LEICA」標志、所有採用杜比音效的音響都印有「DolbyAudio」認證一樣,未來,所有基於華為全棧智能汽車解決方案開發的汽車都會打上「HI(HUAWEIIntelligence,即華為智能)」品牌標識。HI品牌的出現,標志著智能汽車將內置華為的核心技術和關鍵要素,華為也將用「HUAWEIInside」的方式,把數字世界帶入每一輛車。
華為智能汽車解決方案BU總裁王軍(右)
華為智能汽車解決方案BUADS智能駕駛產品線總裁和首席架構師蘇箐(左)
目前,特斯拉量產提供的L2級自動駕駛技術,是以美國日常高速公路通勤為基礎建構,並不能滿足我國上下班高頻使用場景中的復雜工況,而華為HIADS自動駕駛已完成L4級自動駕駛架構,實現了復雜城區、城市環路、高速、自動泊車等全場景覆蓋。作為首批試乘華為ADS自動駕駛汽車的媒體,《環球時報》記者在華為上海研究所周邊的綜合路況中,就能夠感受到ADS自動駕駛的連貫性,車輛可根據高階單車智能和高精地圖,在駕駛員不介入的情況下,實現自動變道、行人避讓、紅綠燈啟停等高階操作,完成全場景自動駕駛。據悉,ADS系統將於2022年第一季度量產。
與車企共創價值
華為一再強調,華為不造車,要幫助車企造好車。華為的入局,勢必將擴大汽車產業的發展格局,為汽車產業的轉型升級注入強大的技術儲備,並為汽車產業形態變遷輸入領先的專業能力。
受制於公司架構、人才結構、核心技術和盈利模式等影響,大型汽車企業轉型開發智能網聯電動車軟硬體能力相對欠缺。而華為入局後為車企開放的,不僅是製造智能網聯電動車所需的技術能力,更是背後幫助其攻關技術難題的研發團隊。
「華為目前在汽車產業的優勢和能力聚焦在軟體、演算法和生態中,其中核心能力的構建放在生態,也就是數據應用和操作系統上。」據王軍介紹,目前,華為擁有龐大的研發團隊和科學家支持智能汽車研究,其中,華為智能汽車解決方案BU團隊共有4千人,做基礎科學和理論研究的2012實驗室中也有500餘名負責AOS、VOS的研發人員,此外,還有大量負責HOS研發的軟體開發人員。
「軟體和演算法未來將會深入到智能網聯電動車中,但這方面能力的構建是需要長期積累的,這也是華為的優勢。我們希望和車企互通有無,車企更懂汽車和用戶,我們更懂ICT技術,結合起來共同給消費者帶來更好的價值。」王軍說。未來,華為這種優勢技術共融的共創品牌模式也將改變汽車主機廠與供應商傳統的「買賣法則」,成為汽車產業全新的商業模式。
曾憑一「企」之力,修改ICT行業准則,重構產業邊界,改變科技發展強弱之勢的華為,正在讓數字世界的惠及面更為寬廣。正如華為智能汽車解決方案BU的願景所言,華為要把數字世界帶入每一輛車,幫助車企解決產業轉型的技術難題,提供「從零到整」的解決方案。
本文圖片來自華為智能汽車解決方案BU官方
本文來源於汽車之家車家號作者,不代表汽車之家的觀點立場。
『伍』 pi幣基礎幣怎麼算
pi 幣基礎幣 = 每天 0.1pix24 小時 =2.4 。在 2020 年 12 月 8 日時,進行 PI 幣挖礦的礦工已經累計達到了 1000 萬人次,而 PI 幣平台所設定的規則是,挖礦的人數每翻十倍,系統算力就會衰減一次,在達到 1000 萬人次時, PI 幣的算力就衰減了四次。截至到 2021 年 8 月 4 日, PI 幣的挖礦礦工還沒有達到 1 億人次,因此基礎幣的計算還是以算力衰減了四次進行。
PI 幣又被稱為派幣,具體是指 PCHAIN Network 平台上的原生代幣。 PI 幣的英文名是 PCHAIN , 2018 年的兒童節當日, PI 幣正式上線,並且發行總量為 2100000000PI 。 PI 幣首的發團隊總共由四個創始人構成,其中團隊的領導人是 Dr.Feng Cao ,負責團隊內部的分工協調等工作, Kevin Zheng 是數據工程師,負責 PI 幣資料庫的建立以及演算法的修正, Frank Ma 主管區塊鏈,負責對區塊鏈項目進行優化, Steven Lv 是團隊的首席架構師,負責該幣整體的結構搭建。