① AI芯片基准battle,但终究不是一场三国杀
AI芯片领域的基准对决并非单一的三国争霸,而是多元标准共存的挑战。定义的统一性缺失让评测方法的重要性凸显,每家公司都在寻求成为标准制定者以占据产业顶端。地平线提出了MAPS评测法,聚焦速度与精度,试图填补现有评测标准的局限。然而,AI芯片性能与算法发展之间的脱节问题引起了业界关注。
传统评测标准如峰值算力,仅反映理论性能,而MLPerf则由于模型更新滞后,无法全面反映芯片在实际应用中的能力。地平线认为,评测应关注芯片在AI任务中的速度和精度,而MAPS通过可视化和量化,直观展示不同芯片的取舍。实战中,谷歌Edge TPU和地平线新品在MAPS评估下,展现出不同的性能优势和劣势。
基准测试作为行业基础和标尺,如MLPerf和AIIA DNN benchmark,各自有其局限性。MLPerf侧重训练,门槛较高,而AIIA DNN benchmark则更贴近国内厂商的使用场景。地平线的MAPS方法虽有创新,但需进一步规范应用场景和模型选择,以期成为行业标准。
AI芯片评测的未来,需要更多方法的探索,以适应不断变化的应用场景和算法需求。基准测试需兼顾性能、精度和易用性,引导芯片设计与优化,以应对AI时代的挑战。总结来说,这场基准之战,是多元标准的碰撞,也是行业进步的催化剂。
② AI芯片基准battle,但终究不是一场三国杀
AI芯片性能测评领域,一直存在多种评测方法,而地平线最近提出的MAPS(Mean Accuracy-guaranteed Processing Speed)评测方法,旨在针对应用场景,提供速度与精度的直观评估,旨在填补现有评测方法的不足。
地平线联合创始人兼技术副总裁黄畅博士指出,深度学习神经网络模型发展迅速,AI芯片面临的主要挑战是算法演进速度远超硬件改进速度,使得评估AI性能的方法与算法发展存在脱节。传统评测标准如峰值算力和MLPerf等存在局限性,无法全面反映AI性能。
MAPS评测方法通过关注AI任务的速度和精度,提供速度与精度曲线,让用户在精度有保障的范围内直观选择最合适的芯片性能。这一方法由地平线提出,旨在提供更开放、更易用的评估标准。
谷歌Edge TPU与地平线最新芯片在MAPS评测下,展现不同性能表现。基于EfficientNet模型测试,地图形成面积最大时,即为芯片最强性能。结果显示,即使标称算力相同,芯片性能也存在显著差异,地平线新芯片在高精度场景下具有优势。
AI芯片评测标准作为行业基础,是衡量成果的标尺。MLPerf和AIIA DNN benchmark等评测方法在推动行业发展方面发挥重要作用。然而,MLPerf偏重于训练端,AIIA DNN benchmark则更接地气,覆盖更多工作场景。
地平线提出的MAPS评测方法,虽然创新性适用于整体AI解决方案的行业客户,但仍存在局限性,如适用场景和行业规范等。实现行业标准,需要进一步细化模型和参数组合选择,并与业界同行、标准化组织等紧密合作。
更多评测方法的出现,反映了AI芯片评测领域的持续创新。未来AI芯片发展关键在于适应AI算法演进,平衡功耗、性能、精度与速度,实现与应用的更好结合。基准测试方法需要不断优化,以抓住AI时代机遇。