更新慢地平线提出的MAPS会更好吗 AI基准测试MLPerf模型少 (地平线更新)

AI算法的算力需求与AI芯片算力增长之间的差距有多大？从增长的速度看，AI算法的算力需求每年是指数级的增长，但AI芯片的算力只能以倍数增长，且难度越来越大。这是业界都非常关注的问题，本月的CCF-GAIR 2020峰会AI芯片专场上，六位大咖都提到了这一挑战。

因此，无论是从AI芯片长远的发展还是促进AI芯片更好落地的角度，业界都期待有一个公认的AI芯片Benchmark（基准测试）。2018年，MLPerf组织成立，为了让MLPerf能够像成熟的CPU、GPU的Benchmark一样，MLPerf囊括该行业中绝大部分知名企业和机构。推出两年的MLPerf还不够成熟，但包括英伟达、谷歌、阿里巴巴在内的大公司都乐于用最新版本的MLPerf基准测试成绩强调其产品实力。

不过，地平线联合创始人兼技术副总裁黄畅在中国计算机学会（CCF）主办，雷锋网、香港中文大学（深圳）联合承办，鹏城实验室、深圳市人工智能与机器人研究院协办的CCF-GAIR 2020 峰会AI芯片专场的演讲中指出， MLPerf有模型更新慢、模型少、模型选择受各种因素影响的挑战。他 也首次提出了新的方法用以评估芯片的AI真实性能——MAPS (Mean Accuracy-guaranteed Processing Speed，在精度有保障范围内的平均处理速度)。

MAPS是评估AI芯片真实性能更好的方法吗？

AI基准测试MLPerf模型少、慢，地平线提出的MAPS会更好吗？ | CCF-GAIR 2020

地平线联合创始人兼技术副总裁黄畅

每类极具代表性的处理器都有常用的性能评估指标，比如CPU用MIPS，GPU用Texture和Pixel评估性能，高性能计算用浮点运算速度TFLOPS（Floating-point operations per second，每秒浮点运算次数）。进入AI芯片时代，AI 芯片推理通常不需要浮点计算，而需要大量的整型运算，这样峰值算力TOPS（Tera operations per second，每秒万亿运算次数）成为了AI芯片性能指标最直观的参数。

但问题在于，峰值算力体现的是芯片性能的理论上限，实际使用过程中真正有效的算力与峰值算力差别很大。这是因为，芯片的计算架构、带宽、AI算法、数据重用性等问题都会导致芯片算力的有效利用率与峰值性能之间的巨大差距，有时差别可能高达几十倍。

但有一个业界公认的评价标准又意义重大。黄畅接受雷锋网采访时表示：“业界有一个AI芯片的评价标准最重要的意义在于让行业形成一种合力，让大家都有一个相对清晰的目标，容易形成共识、形成协力，健康地推动整个行业向前发展。”

MLPerf在2018年顺势推出了MLPerf Inference v0.5，获得全球芯片公司和知名机构的支持， MLPef最新成绩公布总能引发不少关注。作为还不够成熟的Benchmark，MLPerf当然也有很多挑战。

黄畅指出，MLPerf的思路是选定模型比谁快。选定的模型要求不管做量化或其他操作，它和原始浮点的精度差异不能超过1%。也就是说，MLPerf是在保证精度相同的条件下比谁的速度快，模型的选定是一个值得研究的课题。 不容忽视的是，提交者与组织博弈又带来了模型选择受各种因素影响的问题。

AI基准测试MLPerf模型少、慢，地平线提出的MAPS会更好吗？ | CCF-GAIR 2020

与此同时， MLPerf模型更新慢（图像分类模型在MLPerf Inference v0.5和MLPerf Inference v0.7没有更新）、模型少（仅有两个图像分类模型，只覆盖了70%和76%两个精度）。学术界图像分类，ImageNet的主流精度范围在[75%,80%]的问题，这让MLPerf无法及时反映算法效率提升、难以反映各种精度下的速度全貌。

“要达成一个所谓的标准是极其困难的，因为大家虽然目标大致相同，但出发点不一样。“黄畅同时指出，评估芯片的AI性能，应该换一个角度，可以从准、快、省这三个维度。”

AI基准测试MLPerf模型少、慢，地平线提出的MAPS会更好吗？ | CCF-GAIR 2020

“准”是反应实际任务上的算法精度，在不同的任务中，学术界已经有比较多共识。“快”通常有两个维度，延迟和吞吐率。“省”就是成本和功耗。黄畅认为，对于AI芯片的性能评估来讲，准和快是两个非常重要的因素。同一个芯片下，两个因素负相关，快了就会牺牲准确性，准了往往需要付出速度的代价，因此需要放在一起折中考量。

AI芯片性能的评估需要快、准、省，在这三个维度下地平线提出的新的AI芯片性能评估的方法称为MAPS（Mean Accuracy-guaranteed processing speed），意思是在精度有保障的范围评测芯片的平均效能，得到一个全面、完整、客观、真实的评估。

黄畅表示，MAPS对行业有六个创新之处：

MAPS的计算为公式为：MAPS = 所围面积 /（最高精度-最低精度） ，含义为在 ImageNet 的主流精度范围（75%~80%）下，速度最快的模型所代表的点（由精度和帧率确定）所围多边形面积大小即为芯片处理ImageNet AI任务的能力大小。

其代表的真实的AI效能也有对应的公式：MAPS/Watt &MAPS/＄=TOPS/ Watt &TOPS/＄ X Utilization X MAPS/TOPS

AI基准测试MLPerf模型少、慢，地平线提出的MAPS会更好吗？ | CCF-GAIR 2020

这三个要素中，第一个TOPS/Watt、TOPS/$是传统的方式。中间的要素有效利用率，是根据架构特点，利用编译器等去统化地解决极其复杂的带约束的离散优化问题，得到一个算法在芯片上运行的实际的利用率，实际是软硬件计算架构的优化目标。第三个要素是AI算法效率，指的是每消耗一个TOPS算力，带来的实际AI算法性能，体现的是AI算法效率的持续提升，过去几年AI算法效率提升非常快。如2014年提出的VGG19计算量是2019年提出的EfficientNet B0的100倍，同时EfficientNet B0精度更高，相对于算法效率每9个月提升一倍，大幅快于18个月翻倍的摩尔定律。

黄畅表示，“三个要素中，第一个反映的是旧摩尔定律，第三个反映的是新摩尔定律。前段时间Open AI lab以及其他的研究机构都发现，过去几年算法提升效率非常快，几个月的时间效率就会翻倍。如果我们关注这样的效率的提升，应该把握这三要素中最主要、变化最快的要素，并且根据这个要素去指导处理器架构的设计，进行关键的取舍决策。 ”

地平线为什么要提出MAPS这样的评价指标？黄畅在分享中也提到，“这个概念其实受到了EdgeTPU的启发。它在设计之初，并没有充分考虑高效算法的发展趋势。所以当EfficientNet算法出现的时候，并不能很好适配到EdgeTPU上。但谷歌将该算法针对EdgeTPU的特点进行了专门的优化，得到速度更快、精度损失非常少的一组模型EfficientNet-EdgeTPU。 这一点和我们自己的摸索和实践是一致的——算法的选择只是手段，真正的目的应该是其在具体芯片运行所表现出来速度和精度。 ”

AI基准测试MLPerf模型少、慢，地平线提出的MAPS会更好吗？ | CCF-GAIR 2020

以ImageNet图像分类任务为例，EdgeTPU运行不同模型的精度和帧率

如何理解？为以ImageNet图像分类任务为例 ，如上图所示，横轴表示芯片的处理速度，衡量方式是每秒帧率（FPS），纵轴表示芯片的处理精度，度量方法是Top1分类精度。 因为在边缘应用领域，过高（会过慢）或者过低（会不准）的处理精度都不具备实际的应用价值。不失一般性，MAPS评估方式选择75%~80.5%为精度保障范围。

针对某芯片，将某算法模型运行得到的处理速度和精度用一个点表示在该图上，尝试多种不同的选择，并将精度保障范围内位于最右侧（即速度最快）的若干点和上、下、左边界所围多边形面积大小，除以该多边形的高，即MAPS=所围多边形面积 /（最高精度-最低精度），得到该芯片的MAPS值单位仍是FPS，表示在此精度保障范围内的平均处理速度。

AI基准测试MLPerf模型少、慢，地平线提出的MAPS会更好吗？ | CCF-GAIR 2020

图为MAPS评估方式下主流芯片测试结果，右一折线为地平线最新一代芯片测试结果

黄畅说：“可以看出，同样标称4TOPS算力的芯片的表现差异还是很大的，在MAPS上甚至有将近2倍的差异，地平线即将推出的新一代芯片和11.4TOPS峰值算力的芯片相比，虽然在精度较高的区间上稍有劣势，但是在追求速度和延迟低的场景中会有明显的优势。”

他同时表示，“这只是一组基于EfficientNet模型评估的结果，相信随着算法不断演进，这些曲线会不断地发生变化。我们也希望有更多的软件、算法工作者，在MAPS评估方法的启发下，秉承开放包容的态度，在自己最擅长的能力上持续推动AI芯片能力的发挥。”

AI芯片当下最为关键正是满足应用的需求实现大规模落地，在这个过程中，如果能够有一个标准，既能降低AI芯片的选择难度，也能让业界达成共识朝着相同的目标努力。但正如黄畅接受采访时所说：“达成所谓的标准极其困难，要达成共识最根本的还是用商业化落地的结果，最终回归价值创造本身。”

为此， 地平线提出了MAPS评估方法，其重要核心在于放下成见，包容所有的选择。 MAPS能否获得业界的广泛认可仍有待观察。

最后，还有文章开头提到的AI芯片性能与AI算法需求之间的尖锐矛盾，有人提出了开放硬件的解决方法。对此，黄畅表示：“无论是我还是地平线，我们都相信开放是一个更好的选择，尤其是把时间轴拉长，把整个价值体系放得更宽，开放一定是更好的选择。因为没有什么比开放更能够汇聚力量。”

注：文中配图来自地平线

新基建浪潮下AI芯片的绝佳机遇 | CCF-GAIR 2020

评价一款AI芯片最关键的指标是什么？ | CCF-GAIR 2020

原创文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/4dab4f77add0fdbcdc5d.html

上一篇：AMD的AI策略与Intel和Nvidia有何不同AMD的a

下一篇：为什么平头哥和英伟达在MLPerf基准测试中都

网络科技网站

网络科技网站排名,根据网站的综合值按照不同的网络科技网站进行筛选排名结果,通过筛选网络科技网站可以看到每个网络科技网站里面的网站排名优质的网站是哪些

网络应用 2024-11-13 10:59:06

江苏富林医疗设备有限公司

江苏富林医疗设备有限公司致力于专业医疗设备和家庭保健产品的研究与开发。打造顶尖医疗器械制造中心，为客户创造最大的经济效益。公司现有员工200多人，拥有先进的研发中心、一流的生产线、完善的销售渠道以及贴心服务的售后团队。

编程开发 2024-11-13 11:00:37

拼音字典

根据你所输入的中文，输出相应的拼音。

站长资源 2024-01-10 21:41:29

折叠推拉门

广州瑞兆装饰材料有限公司是一家专业从事于：推拉折叠门,活动折叠门,移动折叠门,折叠推拉门,活动隔断厂家,酒店活动隔断,宴会厅活动隔断,活动屏风厂家,活动屏风隔断,电动活动隔断，欢迎联系我们！

餐饮酒店 2024-08-18 14:44:21

成都伊藤洋华堂电子商务有限公司

伊藤电商

电商供求 2024-08-18 17:25:28

东营吉祥号回收

东营手机靓号回收移动联通电信均可，您诚意卖我诚心收，潍坊手机靓号回收尾数3连以上如111/222/333/5555等，潍坊吉祥号回收四连以上如6666/7777/88888/99999等，东营手机号回收号码越好价格越高，东营吉祥号回收豹子号，连号，顺子号，对子号，个性号，循环号等。

手机软件 2024-11-17 19:11:07

茶馆儿

深圳市戴欧妮网络科技有限公司旗下一款社交APP，国内垂直于80-00后青年文化人群的文娱社交平台，强调社交破冰，摆脱普通交友模式，涉猎青年文化人群关注领域，用户参与文化传播、潜在消费意识、文化活动，分享展示自我、阅读等需求，打造青年文化人群在生活方式上的。基于“目的”的社交方式，通过分析用户画像、LBS、目的语言等信息，推荐出符合调性的同类用户进行匹配。

电影视频 2024-11-17 22:56:26

酷妙网络

www.niulinmen.com

网络应用 2024-11-28 14:52:39

宁波消防检测公司

宁波消防检测公司——鼎翔消防技术有限公司专注于消防维保,消防评估,消防改造,消防培训,消防排查和电气消防检测服务.我们拥有一支经验丰富的服务团队,提供可靠的消防安全解决方案.选择我们,选择安全与可靠!联系方式:0574-81877668

安全杀毒 2024-11-30 21:15:59

世界传统医学大健康交易平台

世界传统医药大健康技术交易平台

健康医疗 2024-12-02 21:09:52

福耀科技大学

福耀科技大学官网

学校大学 2024-12-06 17:21:52

上海众帆国际物流有限公司

我们上海众帆国际物流有限公司是无船承运人（NVOCC）之一、编号：NG190605-00011，也是国际货运代理协会（FIATA）成员之一，本公司专业经营国际运输业务，向海内外客户提供海、陆、空进出口货物运输服务，包括订舱、配载、报关、仓储、提运、保险以及多项物流服务。

商业服务 2025-01-15 18:05:37

帮帮盲发展好吗现在加盟要缴纳多少品牌使用费 (帮帮盲加盟)

国内保健行业正在快速的发展，在市场中随处可见各样的保健品牌，在市场中的随处可见各种各样的保健服务品牌，帮帮盲是一家来自于北京的保健服务品牌，所建立的保健服务项目多种多样，在市场中有着不错的口碑和影响力，成为了创业者们眼中的香饽饽，帮帮盲发展好吗，现在加盟要缴纳多少品牌使用费，帮帮盲自2015年诞生以来，只经过了短短七年的发展时间，已经...。

2025-01-16 01:02:19

神经网络压缩与加速竞赛双项冠军技术解读 2019 NeurIPS (神经网络压缩算法)

雷锋网AI开发者讯，日前，神经信息处理系统大会，NeurIPS2019，于12月8日至14日在加拿大温哥华举行，中国科学院自动化研究所及其南京人工智能芯片创新研究院联合团队在本次大会的神经网络压缩与加速竞赛，MicroNetChallenge，中获得双料冠军！以模型压缩和加速为代表的深度学习计算优化技术是近几年学术界和工业界最为关注的...。

2024-12-10 01:35:18

888联盟站内互动数据分析

代码说明，本页面的认证代码为888联盟专用评测代码，站长需懂简单html知识，直接复制代码粘贴到联盟网站相应页面即可使用，本代码不适用于其他广告联盟网站请勿获取！文字认证，文字链接代码认证适用所有类型的广告联盟，复制代码后放在888联盟网站首页底部或友情链接位置处，普通认证，普通联盟认证标志适用所有类型的广告联盟，能有效提升888联盟...。

2024-12-05 21:27:45

为什么互联网的未来是定制内容 (为什么互联网连接却无法访问互联网)

与其像网飞这样的平台只做内容推荐，不如说他们的算法也许有朝一日会成为内容创作者本身，2004年，有一群学者发表了一篇期刊文章，试图预测互联网的未来，因为他们观察到互联网集中化的趋势，互联网开始拥有对主流意识形态的绝对控制力，内容越来越多地集中在门户网站上，门户网站成为主导像旅游、科技和新闻等垂直领域的信息中心，这一预测被证明是非常有先...。

2024-11-30 18:11:23

索尼X80K电视通过U盘安装软件教程 (索尼x80k怎么样)

索尼X80K电视安装第三方软件教程当贝市场上找到设置，应用，安全和限制，，允许应用助手安装未知应用，上，打开，应用助手，，点击当贝市场安装包进行安装，推荐，使用当贝激光投影X5S，激光投影标杆，更小、更亮、更强；高端院线级ALPD激光技术，高清无散斑，2800CVIA超高亮度，画质通透；4，64GB的满血大存储，全新旗舰MT96...。

2024-11-25 17:14:14

欧盟对Meta开出7.98亿元反垄断罚单 (Meta)

在健康的舞台上，血糖就像是一个微妙的舞者，它的高低起伏直接影响着我们身体这座复杂而精妙的，大剧院，的运作，当血糖失去平衡，过高或过低都会给我们带来诸多困扰，尤其是对于糖尿病患者来说，控制血糖更是一场持久的战役，在这场跟健康或者身体管理的战斗中啊，食物这个角色可重要了，很多时候它都起着决定性的作用呢，有人说多吃白萝卜可以降血糖，这话到底...。

2024-11-17 00:43:36

看起来正当却难解面前基层称更怕奇葩诉求 12345公示 (看起来很正常)

近日，，包头发布，微信群众号晒出一批外地12345热线接纳到的不正当诉求，其中包含，想弃养孩子宿愿政府接纳，等，对此有网友示意，12345热线不是，许诺池，而在此之前，多地也曾发文对不正当诉求说，不，7月10日，包头市委宣传部上班人员通知红星资讯记者，关于不正当诉求的挑选及认定流程，会依照国务院办公厅的相关方法口头，12345接线...。

2024-07-12 00:27:19

4月6日是什么星座 (4月6日是什么日子?)

白羊座出世日期，3月21日，4月20日主要词，自己意味，公羊主管星，火星主持宫位，第一宫四象性，火阴阳性，阳性三方官，基本主持身材，头部色彩，白色珠宝，红宝石金属，铁幸运号码，5最大特征，管理金句，我最大！性情特征，激动、年轻、宿愿、无公家生乐事，开局新执行保持究竟人生痛苦，清查、分享、失去有缘分的星座，狮子座、射手座没缘分的星座，巨...。

2024-07-09 21:57:12

手机怎样设置灵活壁纸 (手机怎样设置开机密码锁)

若经常使用的vivo手机，设置灵活壁纸，可以参考以下方法，1、本地视频，进入设置，桌面、锁屏与壁纸，壁纸，右上角，选用视频，运行即可；或关上相册，选用视频，更多，设为壁纸，注，视频壁纸不允许开启声响，仅允许时长大于1s的MP4格局视频资源，视频壁纸时长为1s，10s.目前允许本地视频设为壁纸的机型有，iQOO11S、X...。

2024-07-05 14:41:30

凌渡是什么车 (凌渡是什么车品牌)

凌渡是上汽公众旗下的一款紧凑型车，以凌渡2021款改款280TSIDSG温馨版为例，其搭载1.4T直列四缸发起机，最大功率为150千瓦，最大扭矩为250牛米，装备7挡双离合变速箱，这款车型的车身结构为4门5座三厢车，最高车速可达每小时200千米，车身尺寸方面，长宽高区分为4615mm、1826mm、1425mm，轴距为2656mm，油...。

2024-07-02 14:06:34

一个QQ值多少钱 (一个qq号值多少钱一个)

一百元左右QQ号的价值会遭到多个起因的影响，包含QQ号的等级、位数、数字、注册期间、认证状况、绑定状况等等，因此，QQ号的价值因人而异，市场多少钱也会随着需求和供求相关而动摇，在一些买卖平台上，普通的QQ号能够卖100元钱左右，而假设QQ号是5，6位数字，或者会卖到1万元左右，假设是9位数的QQ号，能够卖100，1000元不等，另外，...。

2024-07-02 13:56:52

雕刻大师zbrush4R2下载v4.7.4.7简体中文版-游戏和影视制作软件

雕刻大师zbrush4R2,《ZBrush雕刻大师》是是游戏和影视制作的必备软件Zbrush4.0的R2版本。MacOSXLion测试成功,您可以免费下载。

2023-08-11 22:53:04

文章推荐

滴滴为什么越来越贵 Uber中国早期员工给出这样一个答案 (滴滴为什么越来越贵)

作为曾经的专车行业从业者，我认为造成现在这种状况的根本原因是滴滴的派单逻辑存在问题，导致其引导了司机的故意加价和接单速度慢，你也许注意到这个界面，打车的时候，界面默认在加价的选项上，而且加价还不少，，用户可以选择加不同的价格，而平台会告诉你加不同价格的接单可能性，如果加一次没被接单，可以调整加价再次叫车，刨去平台盈利压力的因素，这样...。

2025-01-31 00:27:56

网络百科

再Get一个互联网冷知识八秒定律 (get一个点上)

一，八秒定律是在互联网领域存在的一个定律，即指用户访问一个网站时，如果等待网页打开的时间超过8秒，会有超过70%的用户放弃等待，据资料显示，估计每年由于网络问题，缓慢甚至不通，导致的损失高达44亿美元，二，谷歌每天处理的搜索量超过30亿次，每秒回答3.4万个问题，但如果回答速度不够快，人们询问的次数也将减少，如果将搜索结果的提交时间放...。

2025-01-30 22:22:07

网络百科

数字化乡村振兴的新开局 (数字化乡村振兴试点项目正式招募)

春节假期刚结束，中央一号文件在2月21日被正式发布，这也是自2004年以来第18个指导，三农，工作的中央一号文件，以中国改革初期安徽凤阳县小岗村的，分田密约，为标志，包产到户、包干到户以其强劲的生命力在中国农村出现，并席卷中华大地，但彼时的国家体制下，农业生产责任制姓，资，还是姓，社，农业生产责任制是否为国家权宜之计，……在国内引发...。

2024-12-09 23:42:57

资讯动态

大模型联合研究中心人工智能度小满与哈工大共建 (模型联合训练)

6月1日，度小满与哈尔滨工业大学宣布共同成立，哈尔滨工业大学，度小满人工智能，大模型，联合研究中心，双方将围绕大模型基座研发、大模型技术原理及其应用技术等领域展开前沿研究，旨在提升大模型的技术创新能力和实际应用效果，双方还将共同培养生成式人工智能技术领域的领军人才，推动前沿技术的产业化应用加速，在签约仪式上，度小满CEO朱光表示，，...。

2024-12-09 14:26:09

资讯动态

自动驾驶的下一个战场矿区 (自动驾驶的下游任务有哪些)

过去一年，中国自动驾驶行业不断加速发展，相关政策的发布，使得开放场景中的自动驾驶商业化开始成为可能，譬如，百度Apollo和小马智行获准在北京开启自动驾驶商业化运营，值得注意的是，相比开放道路，园区、港口及矿区等封闭场景的商业化进展似乎更为稳定迅速，不少玩家将商业化触角伸向海外，正因如此，曾被人忽视的封闭场景开始吸引不少行业玩家的眼球...。

2024-12-04 00:17:44

资讯动态

更新慢 地平线提出的MAPS会更好吗 AI基准测试MLPerf模型少 (地平线 更新)

相关文章

文章推荐

更新慢地平线提出的MAPS会更好吗 AI基准测试MLPerf模型少 (地平线更新)