IPU首度公开MLPerf成绩 性价比收益胜过英伟达 (ip首部作用)

文章编号:41512 资讯动态 2024-12-03 GraphcoreNvidiaIPU

本周四,MLCommons发布了最新MLPerf Inference v1.0基准测试(Benchmark)结果,英伟达GPU一如既往地表现不俗,但值得英伟达注意的是,其超大规模数据中心的竞争对手,Graphcore公司专为机器智能设计的 IPU也参加了此次基准测试。

MLPerf基准测试发布至今已有三年之久,此前英伟达、谷歌、阿里巴巴等大公司一直通过MLPerf跑分成绩强调其产品实力,能够挑战英伟达GPU的IPU为何今年才加入MLPerf基准测试?首次参加MLPerf测试的IPU,究竟表现如何?

IPU首度公开MLPerf成绩,性价比收益胜过英伟达

首次提交两个模型,性价比收益胜过英伟达

在今年提交的MLPerf训练1.0版本任务中,Graphcore提交了两个模型:计算机视觉模型ResNet-50和自然语言处理模型BERT。

IPU首度公开MLPerf成绩,性价比收益胜过英伟达

新一轮MLPerf基准测试结果(部分)

Graphcore高级副总裁兼中国区总经理卢涛称,之所以提交这两个模型,是因为这两个模型在相应领域里颇具代表意义且被广泛使用。

“许多骨干网络还是基于ResNet,BERT虽然有很多变种版本。但标准的BERT就还是大家比较认可的Benchmark基准。”

基于IPU-M2000,Graphcore用了两种配置的硬件进行基准测试,由4个1U IPU-M2000和1个双路服务器组成的IPU-POD16,可以提供4 PetaFLOPS的AI算力,由16个IPU-M2000和4台双路服务器组成的IPU-POD64 ,可提供16 PetaFLOPS的AI算力。

IPU首度公开MLPerf成绩,性价比收益胜过英伟达

测试结果显示,在BERT模型训练中,IPU-POD16在开放分区(Open Division)的训练时间在半小时以内,约为27分钟,封闭分区(Closed Division)的训练时间为34分钟。两个分区的区别在于,在封闭分区中,需要完全按照规定的网络架构优化方式和硬件配置完成提交,而在开放分区拥有更多的自主灵活性。

同样的模型训练在IPU-POD64上,训练时间缩短3.5倍,且在开放分区的训练时间10分钟以内,这意味着相关科研工作者在模型训练过程中能够更快地得到研究结果。

在ResNet-50模型训练中,IPU-POD16的封闭分区训练时间为37分钟,IPU-POD64能在这一基础上能将时间缩短3倍。

一直以来将英伟达视为竞争对手的Graphcore这次也同英伟达基于DGX A100 640G提交的训练结果进行比较。基于DGX A100,其ResNet-50的MLPerf训练时间28分钟,BERT的MLPerf训练时间为21分钟,均高于IPU-POD16。

不过IPU训练时间更久并不意味着其AI能力就落后于GPU。

IPU首度公开MLPerf成绩,性价比收益胜过英伟达

IPU首度公开MLPerf成绩,性价比收益胜过英伟达

卢涛表示,一方面,ResNet、BERT等应用都是在过往基于GPU架构选择出来并深度优化的应用,对IPU可能并不是很友好,另一方面,对于最终用户非常关注“每花费一美金所能获得的训练收益”,如果将训练收益和目录折算成性价比,ResNet训练任务下,IPU-POD16相对DGX A100 640G版本的性价比收益有1.6倍,BERT训练任务下,IPU-POD16相对DGX A100 640G版本的性价比收益有1.3倍。

也就是说,如果单纯从性价比收益来看,IPU可能是更好的选择。

参加MLPerf基准测试,源于Graphcore 资源更加充足

事实上,Graphcore IPU与英伟达GPU跑分对比并不是第一次,不过当时并未选择在业内认可度和接受度更高的MLPerf。

去年8月,Graphcore通过参加谷歌发布的EfficicentNet模型、ReSearchNEt模型以及NLP模型等基准测试且与英伟达A100 GPU对比。测试数据表明,多维度比较后,IPU的推理性能与训练性能均优于GPU。

为何当时未提交MLPerf的结果?“因为当时资源有限,更多地聚焦在对SDK的打磨、优化、功能开发,和头部客户及合作伙伴联合探索应用场景落地。”卢涛如此回答。

卢涛解释到,参加MLPerf Benchmark需要较大的投入,Graphcore十几个团队成员分别间接或直接参加了这一项目,且至少耗费半年以上的时间。“今天Graphcore整体软硬件,尤其是软件和生态,更加成熟完善,公司整体实力和之前相比更加雄厚。在几个因素叠加的影响下,我们参加了MLPerf训练1.0的Benchmark,后续也有持续投入的计划。”

选择在资源充足后参加MLPerf基准测试,同时也表明Graphcore对这一基准测试的认可。

“AI芯片产业的整体出发点是DSA(Domain Specific ARChitecture),与不论是在整体架构上还是计算机体系结构上相对比较类似的CPU相比,各个AI处理器的架构之间会有较大的差异。对于最终用户来说,就很难体现所选择的架构对于业务受益产生的影响。”

“我并不能说MLPerf代表了整个AI产业所有的任务,但是它代表了今天工业界比较主流部署的应用场景。我认为MLPerf是有一定指导意义的。”卢涛说道。

虽然基于GPU架构选择出来的应用模型对IPU而言并不友好,但Graphcore认为,需要积极参与产业标准的探讨,逐渐成为产业中有力的声音,才能影响产业标准的走向。

“之后我们会积极参与MLPerf的提交,提供一些不同的任务,让MLPerf的工作负载更具代表性。”卢涛说道。

不是GPU的IPU,为什么更值得英伟达警惕?

超越全球最大7nm芯片A100!Graphcore第二代IPU晶体管数量高达594亿个

原创文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
享购车

中国最可信的汽车以租代购交易市场,在线提供以租代购市场信息,二手车估价、二手车出售、二手车以租代购、转让、求购等服务。

OPPO

OPPO商城是以潮流数码、生态产品销售为主营业务的电商平台,提供OPPO、一加等多品牌产品和服务

Java

该站点未添加描述description...

精品酒店预订网酒店预订

精品酒店预订网是国内领先的在线酒店客房搜订平台,凭借现代化的通信系统、在线电子商务技术和完善的客户管理系统,通过一体化的专业呼叫中心,向广大的商旅人士提供集酒店定位搜索、实时房态、在线订房、出行资讯等在内的商旅服务。

欧意

欧意交易所app是一款非常值得信任的安全虚拟货币交易区块链平台,该软件具有强大的功能,包括比特币等加密数字货币的买卖、及时的价格走势和数字货币走势等实用功能,欧意交易所app官方下载安装最新版手机。

房车房舱锁

斯科企业成立于2009年,匠心经营十四载,是一家集自主研发、生产、销售和服务于一体的高新技术企业,是国内领先的五金智能集成系统解决方案提供商。拥有30多个牌号的合金新材料,同时也可以根据客户的需求来定制相关产品,满足客户多样需求。

电动搬运车平板车,AGV小车,电动平车报价,轨道平车厂家

河南省新乡市帕菲特搬运设备有限公司,工厂是一家集智能研发、设计、制造、销售、无轨电动平车,RGV轨道电动平车,蓄电池电动平车,AGV小车等。厂家报价电话19337383013!

万联网

万联网供应链金融智慧服务平台,专注于物流、供应链及其与互联网、金融跨界创新领域,为供应链金融生态圈内的企业提供包括资讯、营销、活动、培训、咨询、报告、对接等供应链智慧服务产品

广州丧葬服务

广州福寿万年长【24小时全国服务热线:400-000-1116】全天免费咨询、快速上门服务、管家式服务、殡葬服务【殡仪馆服务|丧葬服务|骨灰盒|寿衣花圈|殡葬用品|墓地陵园】白事服务、灵堂布置、花圈鲜花、24小时上门服务,了解各地风俗习惯。

超级图片

超级图片:让图片连接世界。在图片中嵌入版权、文字、链接、声音、视频、广告等信息。图片被裁剪、截屏、PS或被打印出来,隐藏信息仍然存在图片中,永不丢失。

全局底部横幅