DPU 英特尔买下了的魔力何在 Nervana 然而 (英特尔dpg)

导读：在过去的一个月中，Intel收购了深度学习芯片公司 c++om/article/82846998f8f2dfc60b10.html" target="_blank">Nervana Systems ，以及移动和嵌入式机器学习公司 Movidius，给未来的深度学习下了重注。而Intel所做的这一切，正是在为未来适应深度学习的数据流（DPU）架构升级布局。

这些新公司将一起解决英特尔仍在形成的难题：捕捉未来深度学习领域——这块预估达到数万亿美元的蛋糕。而这个艰巨的任务，都将通过 Intel 自己的 Knights Mill 在机器学习代码和工具方面的成果，加上软件优化的工作来实现。而与此同时，NVIDIA正在加强其自产的GPU训练和推理芯片市场，以及配备了最新 Pascal GPU 和所需深度学习书库的自产硬件市场。

Intel 最近令人惊讶的收购行为，也成为了重磅头条，而此举使得 NVIDIA更难说明 GPU 该如何加速（目前在模型训练占主导地位的计算引擎），想要在这个新兴市场上占有一席之地，他们还要更加努力。然而在过去的两年中，有很多新成员加入了该领域，这无疑是雪上加霜。

深度学习芯片新贵宣扬的理念是：通用体系架构（包括GPU）无法在低精度、固定点及专业性上与之比拟。事实上，我们可能进入到计算机体系结构的“寒武纪爆炸”时代，它由深度学习方面的新需求形成。不过，我们可以设想在短时间内，应用程序和用户的数量足够多，实际上就能确保芯片初创公司在等待大爆发时不会玩完。

Wave Computing

这些新贵中，其中一家专注深度学习的初创公司名为 Wave Computing ，它在 Nervana 系统方面有很多优点，这些都可以使它成为 Intel（或者其它公司）的最佳收购对象。

虽然Wave Computing 的技术和执行方法不同于 Nervana，但公认的是：在有着低级随机舍入和其他相同技术的超低精度硬件上，进行大规模深度学习训练时，它在实用性上略胜一筹。同时该公司的 Jin Kim 告诉 The Next Platform，他们看到了自身技术对于如英特尔这类公司的价值所在。Nervana 的采购行为对大局来说是有益的，因为它表明了该类型的市场需要非通用硬件。

有一个可能性是：Intel 对于芯片的兴趣就如同对于 Nervana 的 Neon 软件框架一样，但 Wave Computing 的 Kim 说：“还有另一个会遭公司哄抢的需求未被满足：开发板和加速器板。可当我们与该领域的人交谈时发现，他们都希望有一个针对深度学习具体需求的单体系统。”

当然，在 NVIDIA 的 DGX-1 applIance 中这种东西已经存在，它配备了 Pascal generation GPUs ，且具备了进行训练和推理的所有软件。然而，Kim 说，他们已经掌握了硬件和软件技术，且可以凭借更低的功耗和更短的训练时间（理论上无需 DGX-1 appliance）击败 Pascal。关键点是除了 DGX-1 外，它是深度学习采取的第一个系统，毫无疑问，它肯定是基于一种新架构。

Wave Computing 方法基于通过其DPU处理单元的数据流架构。和 Nervana 一样，Wave 的核心部位也有一个高度可扩展的共享内存架构（有着混合内存立方体或 HMC）。

Wave 的业务并不在销售加速板，它专注的是提供一个完整的排序和推理系统。这也正是 Kim 说的：数据中心网络中的即插即用节点，它可以本地支持 TensorFlow ，Hadoop，Spark，和 kafka 。系统会在 2017 年从 Q2 开始进入到 1U 和 3U 配置。他们有一个 28 nm 的测试芯片，虽然在两年前就交付验证了，但即将到来的 16 nm FinFET芯片现在正在流片，今年年底交付时将提供大幅提升。

Kim说：“第一个 28 nm 芯片可以将 16000 个处理单元置于一块硅上，但 16 nm 的 FinFEt 芯片即将问世，它可以将 64000 个处理单元置于一块硅上。”它首先将通过一个私有云，培养那些想要在系统变得可用之前就先行体验的早期用户。“我们的商业模式，并不是使用我们的云端来供服务，但是，需求非常高，而且私有云可以更快的选择出那些是想要早期访问的人。”

那么，数据流架构（DPU）芯片和系统的内部到底长什么样？

英特尔买下了，然而 DPU 的魔力何在？

获取这里所有内存的负载和最重要的内存带宽能力。实际上，它与数据流处理单元自身一样重要，毕竟，如果无法移动数据的话，即使是最聪明的处理器也没什么用。当然，这只是绝大部分的移动指令，另一个主要特征是，用于深度学习工作负载的法案，在其数据重用的地方可以显著提高效率。

每个 8 位 RISC 型处理器都有 RAM 指令和局部寄存器，以保存大量局部操作的内存数据。这样使得话，就无需移动数据，只要移动指令。基本的指令序列包括：乘法、添加、转移等。每个处理单元组都集合到有着16 元素的集群中，共享算术单元（每个有2个）。这些集群组成了核心计算引擎，且可以聚集在一起单独完成 8 位的工作，或者一起做 64 位的工作（可变长度的算法）。

英特尔买下了，然而 DPU 的魔力何在？

它的主要原理很简单。将每一个 DPUs 组合到一起，并完成多个任务。这是一个 NIMD 框架（有两种控制流），可以支持很高的内存带宽。第一代芯片在 6.7-8 GHz 之间跑来跑去，且在 150-200 瓦的范围内，但 Kim 没有评论冬季将出来下一代的芯片。每个数据流处理单元（DPUs）都成为了群集的一部分。它通过团队开发的战术调度工具包进行静态调度，且不会遇到内存一致问题，因为它明确了：在DPU的特定部分运行那些算法。

每个 DPU 有 24 个“计算机器”，且从上面你可以看出，建筑能支持高度的随机访问存储器，该存储器有着 4 个 HMC 和DDR4存储器（由将这些铺在一起的核心组成元素组成）。在 Wave 的 3U 配置下，他们可以把 16 台这样的机器结合在一起。

当然，它与通用处理器之间的关键区别是：低精度与固定点的数学能力。 Kim说：“我们专注于在多个线程中，处理单元级别上的高度并行操作。我们还专注于高内存带宽的能力。由于它是实时可重构的，所以有可能得到支持随机四舍五入的硬件，进行混合精度的数学问题。这是深度学习向低精度发展的正确趋势，这样可以节省内存带宽。只要你可以在更高的精度下积累结果，就可以保证准确性，”

“整体的想法是，成为一个企业数据中心的 tensorflow 计算服务器节点，所有的 tensorflow 模型都以最小的修改运行，且分区也在一个可扩展的数据流架构高效运行，这样的话，整个系统都可以利用共享内存，我们就可以更好的测量 GPU ，且不消耗 CPU 。”

Wave 方法的核心是：通过随机四舍五入技术使用固定点，和许多小的高并行计算元素。 Kim指着IBM和斯坦福的研究说：“使用固定点和低精度算法，你只要小心转动浮点基本相同的收敛，”如下图所示。

英特尔买下了，然而 DPU 的魔力何在？

模型上进行推测的成本不能太高，这也是深度压缩工作为何如此重要的原因（就像来自斯坦福的 Song Han一样利用 EIE 成果）。顶部绿色线采用的是低精度、无智能四舍五入的固定点。这项研究是在几年前进行的，那时人们认为浮点数是必需的。

Kim 说：“事实上，如果你进行随机或对数为基础的四舍五入，且使用固定点训练的话，其浮点几乎都是一样的。”底部的黑色线表示是固定状态下红色和蓝色的浮点。

在系统水平的性能方面，所有厂商依然可以一起竞争，因为 NVIDIA 的 DGX-1 appliances 并没有对很多框架进行太大冲击。然而，根据 NVIDIA 深度学习盒中现有的 P100 性能数据，以及Xeon 的实际基准，Wave 分享了以下指标。

英特尔买下了，然而 DPU 的魔力何在？

我们能想象出一些 Wave Computing 的可能结果，其中最有可能的是“ 一部分大公司以收购的方式，寻找可以在价格和性能击败 NVIDIA，且与深度学习挂钩的系统。” 当然，在恰当的位置，它也要有必需的软件堆栈。这一领域，NVIDIA已经让自己的 CUDA 库与最知名的深度学习框架进行对接。

Wave Computing 系统是个容器，它可以支持微服务方向结构，该结构有着基于tensorflow的SDk 以运行和执行模型（有着用于tensorflow的Python和C++API ），和一个用于大型数据中心（想要支持不同的语言）的低水平 SDK。Kin 说：“目标是为了使 tensorflow 模型在没有匣子的情况下运行更快，尽可能的远离用户。”这听起来很像 DGX-1 Appliance，然而，Kim 说“这将是有竞争力的价格。”没有人知道这是否意味着少几千元，还是相同的价格。

需要注意的是，我们应该指出：Kim 并没有说这是 CPU 或 GPU 的所有用户的替代物。“在某些情况下，这样的 tensorflow 分区方式，图表的某些部分将在 DPU 上运行，有一些在 CPU 上运行、还有一些在 GPU 上运行。我们的目标是用最好的混合和匹配加快速度。”它在人购买的系统中是如何形成的，以及它是怎么实施的还有待观察，但我们希望随着重点转移到新的结构，有人可以在明年结束之前抢到 Wave，且深度学习开始将其应用于有真实用户的实际系统中。

Via： The Next Plat Form

推荐阅读：

一路“买买买”，英特尔怎样铺平了它在人工智能上的道路？

英特尔3.5亿美元收购深度学习公司Nervana

原创文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/7ffbf468f540ed174034.html

上一篇：Disrupt大会直击TCdisruption

下一篇：移动人工智能时代已来临甲骨文产品开发高级

上网导航

导航，上网导航，QQ上网导航，QQ浏览器导航，腾讯上网导航，网址导航，网站导航，网址大全，好的网站，上网主页

网站模板 2024-08-17 00:48:04

不锈钢钢瓶秤

上海凯鸿诚称重设备有限公司(www.shkhc.com)主营不锈钢钢瓶秤,防爆叉车秤,不锈钢叉车秤,打印无线吊秤,无线电子吊钩秤,带打印电子秤,打印磅秤等产品,公司坚持以诚信为本,信誉至上,注重推陈出新,注重提高技术含量,注重满足用户的不同需求,采用的设计和制作工艺,不懈地致力于提高产品质量与产品品质,努力以优质的产品和优良的服赢得广大用户的认可

设计美化 2024-07-11 13:33:24

金企（北京）科技集团有限公司

金企（北京）科技集团有限公司是国内专注于残疾人发展事业的企业服务平台，公司自成立以来，积极响应国家号召、细心研读国家政策，认真学习领会习近平总书记的一系列重要指示精神，坚持把扶贫助残作为公司的历史使命公司。

商业服务 2024-07-11 13:41:42

沈阳家教网

沈阳慧博家教网,16年品牌经验，成功为上万个家庭及教育机构提供教师人才解决方案,用心服务,真诚你我！

商业服务 2024-08-18 13:06:23

端子盘

苏州毅豪兴模具是一家专业生产销售端子盘、塑料胶盘、塑胶端子盘、端子圆盘、收料盘、圆盘、塑胶圆盘、冲压端子盘、端子收料盘和牛皮纸带、黄牛皮纸带,白牛皮纸带,淋膜牛皮纸带等等。

电影视频 2024-07-16 20:30:20

上海煊誉实业有限公司

上海煊誉实业有限公司-电缆接头、金属软管、尼龙软管、软管接头、扎带、铆钉、固定座

电影视频 2024-11-24 19:19:21

广东竭能环保科技有限公司

游戏策略实验室，为玩家提供独特的游戏攻略和创新战术。

游戏网游 2024-11-29 17:46:03

呱呱爆品

呱呱爆品是免费专业的私域爆品选品平台，提供私域爆品榜单（含快团团）、快团团团长榜单、选品对接等服务，找爆品找团长就上呱呱爆品，帮助你成为下一个大团长！

商业服务 2024-12-05 00:21:10

昆明服装厂

昆明美泰来服装公司企业通过ISO9001质量体系认证，昆明服装定做电话13086669683，专业昆明西服，衬衫，昆明职业装，工作服定做，大衣，标志服装，酒店服装订制，校服定做，工装制服定制，男女士西装定制，标志服，棉衣棉服，冲锋衣订做，羽绒服订制，文化衫T恤定制，昆明防静电工作服，防酸碱耐阻燃制服，加油站工作服等服装设计定制的昆明服装制衣厂家。

设计美化 2024-12-06 17:54:40

广东天宸

广东天宸官网

电影视频 2025-01-28 23:01:58

氧含量分析系统

南京艾伊科技有限公司(www.aiyigf.com)是专业的氧含量分析系统，防爆氧分析仪，纯度氧分析仪，常量氧分析仪，反应釜氧分析仪，在线氧气分析仪供应商，公司采用先进的光电化技术，致力于为石化、医药、电力、冶金、食品、院校等行业的安全生产、在线监测、自动化过程控制提供整体解决方案和技术服务，欢迎来电洽谈

安全杀毒 2025-01-30 01:36:54

长春建筑加固,加固公司,植筋加固,混凝土加固,加固工程

吉林省盛桉建筑加固工程公司是一家专门从事结构补强加固设计的长春建筑固公司,主要施工项目为：建筑加固,长春植筋加固,长春房屋加固,长春混凝土加固粘钢、包钢加固，结构增大截面、CGM灌浆、长春碳纤维加固，植筋、化学锚栓，拥有建设部核准的特种专业工程施工资质。

设计美化 2025-02-22 17:59:58

邀请用户参与网站重新设计维基百科十年内首次改版 (邀请用户参与交修)

自2001年启动以来，在线百科全书已发表了超过5000万篇文章，并以近300种语言提供，这些条目由志愿者创建，编辑和更新，该网站由非营利组织WikimediaFoundation托管，该网站指出，其，主要目的是创建，学习和策划内容，，并牢记简化导航的宗旨，旨在，为所有参与我们项目的人创造更热情的体验，十年来，互联网上使用最广泛的资源...。

2025-01-31 03:34:58

睡觉睡偏了要扣钱家住两省边界奇葩漫游费 (睡偏了头还能自己长好吗)

国内三大电信运营商近日集体宣布提速降费，N大举措，，但流量费降低之外，不少网友纷纷吐槽手机漫游费仍然居高不下，甚至还存在乱收费现象，近日，居住在海口王先生的海南联通，风行卡，被莫名扣除，漫游，费39.86元，海南联通解释，王先生可能近期到过海边，接收到了广东联通的信号，王先生的经历不是个案，，天价漫游，离奇漫游，边界漫游，不断被网...。

2025-01-30 20:56:27

2021年智慧医院大会在沪召开你能看到哪些智慧医院的未来 (2021年智能车大赛)

3月28日，2021全国智慧医院建设大会正式迎来了第二天的进程，在前一日，各位嘉宾分享了互联网医院与区域医疗、5G，AI下的智慧医院、县域医院智慧能力建设、医院智慧物流等多个热点话题，引起了参会者的激烈讨论，第二天的分享中，10位嘉宾从，医院社区健康联动，、，DRG背景下的成本绩效管理，、，医保信息化，、，智慧医院的临床数据保护，等议...。

2024-11-30 21:21:05

一文了解坚果P5参数配置坚果P5投影仪怎么样 (坚果百度百科)

发表在坚果投影仪2024，4，1509，07坚果P5是坚果P系列的最新产品，外观方面变化不大，但是画质和性能配置方面得到全面升级，具体坚果P5投影仪怎么样呢，下面就来详细了解一下，看看坚果P5投影仪参数配置如何，各方面有什么优缺点，是否值得用户入手，坚果P5投影仪怎么样，1.光学参数在亮度方面，坚果P5的实际亮度达到450CVIA流明...。

2024-11-28 13:58:19

高知校园风拉满卢昱晓念旧圆框眼镜

拜登要访华，美对华做严重退让，澳媒，绝大局部主要技术中国上游美国已看法到在与中方竞争方面的力所能及，据观察者网报道，澳洲智库日前颁布一份报告称，中国在绝大少数先进技术的钻研畛域上位居环球首位，该报告在剖析包含国防、太空、动力、环境、人工智能、机器人和动物技术在内的64项主要畛域先进技术后发现，中国在其中57项技术上处于环球上游位置，占...。

2024-09-07 19:37:34

不可退费北京华尔街英语培训核心有限公司国贸店 (不能退费是霸王条款吗)

申明，1.以上内容仅代表揭发者自己，不代表黑猫揭发立场，2.未经授权，本平台案例制止任何转载，违者将被清查法律责任，3.黑猫揭发处置揭发不收取任何费用，凡以黑猫揭发名义不要钱的均为混充、诈骗行为，请及时报警并与黑猫官网反应，揭发邮箱heimaotousu@vip.sina.com，4.请大家选用官网渠道处置生产纠纷，不要轻信第三方机构...。

2024-07-17 17:10:42

拼多多床边材质质疑及质检报告索求无果 (拼多多床铺)

这个床买来8个月了散滋味1个月实践经常使用7个月，其中7个月期间还包含之前断过一次性卖家换边等这条边的20天时间，，两边不到半年床的一个边断过一次性起初卖家给换了条新边，而后反经常常使用，当天发现还是那条换过的边又有了断裂的迹象，反经常常使用的状况下又能断裂，不知道这个边用的什么木头资料，反经常常使用不到3个月又能断裂，这算不算是品质...。

2024-07-17 14:33:06

败诉后返岗宿愿渺茫反而指控同僚违宪美97岁法官被美媒劝退 (败诉后反诉)

[全球时报综合报道]就在美国总统拜登因，犯懵懂，而被，劝退，之时，美国最年长的法官保利娜·纽曼也堕入难堪境地，，从新上岗，宿愿渺茫，综合路透社、美国，华盛顿邮报，等媒体11日的报道，当初曾经97岁高龄的纽曼在2021年的一场心脏病之后产生了，清楚的心智消退，状况，不只断案效率大幅降落，就连自己电脑上的文件都找不到，即使如此她仍坚称身材...。

2024-07-13 04:52:09

吉利帝豪有几款车 (吉利帝豪有几款车型)

11种系列，区分是，帝豪EP9、帝豪EX7、帝豪EX8、帝豪GT、出色、帝豪EC7、帝豪EV7、帝豪EX9、帝豪ET9、帝豪EC8、帝豪EV8吉利帝豪有哪些型号吉利帝豪在EC718和EC718，RV之后，还有帝豪EC825，以及GT、EC8、EX7、EX8、ET，9、EX9等跑车、SUV、MPV、皮卡车型等，车型尺寸是长度是4631m...。

2024-07-07 08:08:52

qq空间的地址是多少? (qq空间的地址链接)

QQ空间的地址是，用户可以在电脑或手机的阅读器中输入这个网址，而后经过登录自己的QQ账号来访问QQ空间，QQ空间是腾讯公司推出的一个社交网络平台，相似于国外的Facebook或Twitter，用户可以在QQ空间里颁布说说、上行照片、写日志、分享音乐或视频等，与朋友互动交换，它是中国互联网上十分受欢迎的一个社交运行，领有宏大的用户个体...。

2024-07-05 20:45:51

中菲谈判后外媒菲武装部队总顾问长称总统已下令紧张南海紧张形势 (中菲谈判后外交官是谁)

全球网报道记者索炎琦，据路透社报道，菲律宾武装部队总顾问长罗密欧·布劳纳周四，7月4日，示意，菲律宾总统马科斯已下令该国武装部队紧张南海紧张形势，报道称，马科斯的命令是在中菲双方周二，7月2日，举办谈判后作出的，2024年5月31日，菲律宾总统马科斯在新加坡香格里拉对话会上宣布主题演讲，图源，外媒据中国外交部网站信息，7月2日，外交...。

2024-07-05 01:50:42

2023年：苦难行军的结束，大踏步前进的开始_高球说之出口成张

2023年：苦难行军的结束，大踏步前进的开始_高球说之出口成张_新浪博客,高球说之出口成张,

2024-02-02 01:53:05

文章推荐

28nm增产竞赛缺芯只是表面原因 (28nm扩产)

近几个月，晶圆代工厂相继宣布扩充产能，华虹半导体宣布建设一条工艺等级为90，65，55nm的生产线，台积电、联华电子及中芯国际也纷纷指向了28nm产能扩充，最早是今年3月18日，中芯国际发布公告称公司与深圳市签订合作框架协议，中芯深圳将重点生产28nm及以上的集成电路和提供技术服务，最终实现每月约4万片12吋晶圆产能，预计项目投资金额...。

2024-12-09 14:07:43

资讯动态

啊哔哩哔哩公布2023年度弹幕 (哔哩哔哩公会中心)

12月15日，哔哩哔哩，以下简称，B站，与中国文物交流中心、中国文字博物馆联合发布2023年度弹幕，啊，2023年度弹幕，啊，，是指当所见所闻刷新自身认知，当代年轻人往往会用，啊，来抒发惊叹，比如看到UP主展示绝活时、发现宝藏内容时、见证重大科技突破时，今年，B站用户一共发送，啊，超1320万次，UP主，墨欣，的，一笔写...。

2024-12-04 01:09:42

资讯动态

大疆发布首款单反相机单手手持云台 2018 CES (大疆发布首款运载无人机)

与其他企业喜欢在CES上发布重磅新品不同，大疆在CES上的表现总是很低调，2016年只是发布了，悟，Inspire1Pro黑色版和Phantom34K版本，2017年发布灵眸Osmo手机云台，银色、禅思M1云台、地面站专业版及精灵Phantom4中国新年特别版，雷锋网报道，今年的CES在拉斯维加斯已拉开序幕，这次大疆共带来两款新品，全...。

2024-12-03 23:53:24

资讯动态

2019 走下神坛 iPhone (2019走向2020年图片)

美东时间12月27日，苹果公司股价了上涨1.6%，刷新收盘历史高位，有望创下十年来的最佳年度表现，同时苹果市值一度突破13000亿美元，而这离不开其核心业务——iPhone，12年前，第一款iPhone问世，重新定义了智能手机，之后人们总是把iPhone和，创新，、，改变世界，联系在一起；而12年后头顶正笼罩着销量不稳的乌云，但也在积...。

2024-12-03 21:59:08

资讯动态

独家丨快手电商调整丁雨晴担任商城运营与活动营销部负责人 (快手电铺在哪里)

独家获悉，原快手电商、商业化基建平台负责人丁雨晴已于近期转岗至业务部门，担任商城运营与活动营销部负责人，向电商事业部负责人王剑伟汇报，丁雨晴是中国互联网公司极其少有的90后女性高管，她是一名正八经的，清北，高材生——本科就读于北京大学，硕士求学于清华大学，专业均为经济金融类，公开信息显示，2020年，丁雨晴开始在快手担任战略分析...。

2024-12-03 17:13:32

资讯动态

DPU 英特尔买下了 的魔力何在 Nervana 然而 (英特尔dpg)

Wave Computing

那么，数据流架构（DPU）芯片和系统的内部到底长什么样？

相关文章

文章推荐

DPU 英特尔买下了的魔力何在 Nervana 然而 (英特尔dpg)