① AI晶元基準battle,但終究不是一場三國殺
AI晶元領域的基準對決並非單一的三國爭霸,而是多元標准共存的挑戰。定義的統一性缺失讓評測方法的重要性凸顯,每家公司都在尋求成為標准制定者以占據產業頂端。地平線提出了MAPS評測法,聚焦速度與精度,試圖填補現有評測標準的局限。然而,AI晶元性能與演算法發展之間的脫節問題引起了業界關注。
傳統評測標准如峰值算力,僅反映理論性能,而MLPerf則由於模型更新滯後,無法全面反映晶元在實際應用中的能力。地平線認為,評測應關注晶元在AI任務中的速度和精度,而MAPS通過可視化和量化,直觀展示不同晶元的取捨。實戰中,谷歌Edge TPU和地平線新品在MAPS評估下,展現出不同的性能優勢和劣勢。
基準測試作為行業基礎和標尺,如MLPerf和AIIA DNN benchmark,各自有其局限性。MLPerf側重訓練,門檻較高,而AIIA DNN benchmark則更貼近國內廠商的使用場景。地平線的MAPS方法雖有創新,但需進一步規范應用場景和模型選擇,以期成為行業標准。
AI晶元評測的未來,需要更多方法的探索,以適應不斷變化的應用場景和演算法需求。基準測試需兼顧性能、精度和易用性,引導晶元設計與優化,以應對AI時代的挑戰。總結來說,這場基準之戰,是多元標準的碰撞,也是行業進步的催化劑。
② AI晶元基準battle,但終究不是一場三國殺
AI晶元性能測評領域,一直存在多種評測方法,而地平線最近提出的MAPS(Mean Accuracy-guaranteed Processing Speed)評測方法,旨在針對應用場景,提供速度與精度的直觀評估,旨在填補現有評測方法的不足。
地平線聯合創始人兼技術副總裁黃暢博士指出,深度學習神經網路模型發展迅速,AI晶元面臨的主要挑戰是演算法演進速度遠超硬體改進速度,使得評估AI性能的方法與演算法發展存在脫節。傳統評測標准如峰值算力和MLPerf等存在局限性,無法全面反映AI性能。
MAPS評測方法通過關注AI任務的速度和精度,提供速度與精度曲線,讓用戶在精度有保障的范圍內直觀選擇最合適的晶元性能。這一方法由地平線提出,旨在提供更開放、更易用的評估標准。
谷歌Edge TPU與地平線最新晶元在MAPS評測下,展現不同性能表現。基於EfficientNet模型測試,地圖形成面積最大時,即為晶元最強性能。結果顯示,即使標稱算力相同,晶元性能也存在顯著差異,地平線新晶元在高精度場景下具有優勢。
AI晶元評測標准作為行業基礎,是衡量成果的標尺。MLPerf和AIIA DNN benchmark等評測方法在推動行業發展方面發揮重要作用。然而,MLPerf偏重於訓練端,AIIA DNN benchmark則更接地氣,覆蓋更多工作場景。
地平線提出的MAPS評測方法,雖然創新性適用於整體AI解決方案的行業客戶,但仍存在局限性,如適用場景和行業規范等。實現行業標准,需要進一步細化模型和參數組合選擇,並與業界同行、標准化組織等緊密合作。
更多評測方法的出現,反映了AI晶元評測領域的持續創新。未來AI晶元發展關鍵在於適應AI演算法演進,平衡功耗、性能、精度與速度,實現與應用的更好結合。基準測試方法需要不斷優化,以抓住AI時代機遇。