学术界重在工业界追求 how why MXNet作者李沐 (学术界工作)

文章编号：46366 资讯动态 2024-12-10 李沐 MXNet 亚马逊 TensorFlow 谷歌

雷锋网AI科技评论按：在旧金山参加 AAAI 期间，经余凯老师的引荐，AI 君来到了位于 Palo Alto 的亚马逊AWS 办公室与李沐见了一面。从百度少帅到 CMU 博士再到 MXNet，李沐的履历俨然自带距离感。但当穿着耐克灰色套头衫和牛仔裤的李沐坐在我们面前侃侃而谈时，AI 君在会面前的担心一扫而光。

严格来说这并不是一次采访，更像是朋友间的闲聊。经李沐老师的同意，我们整理出了下面这篇文章，其中涉及的内容仅代表他的个人观点，特此声明。

MXNet作者李沐：工业界追求“how”，学术界重在“why” | 2017 见闻

MXNet作者李沐

2015 年的最后一天，李沐在朋友圈自嘲：

在这一年里，他为社区做出了 1580 个贡献，最长连续参与了 39 天。

在接下来的几个小时，他和小伙伴在 CMU 的机房跨了年。

当时的他说，2016 年有更多更多需要完成的重要的事情。

的确，李沐在刚刚过去的 2016 年完成了学业爱情事业的三丰收：准备 CMU 博士毕业答辩、步入婚姻殿堂、迎接儿子的诞生……而 MXNet 在 2016 年 11 月被亚马逊选为官方开源平台，无疑是其作者李沐在过去一年无法忽视的、浓墨重彩的一笔。

MXNet：“多谈技术，少做对比”

在知乎问答「如何评价 MXNet 被 Amazon AWS 选为官方深度学习平台？」中，李沐个人觉得，不管是亚马逊还是其它公司，第一点首先还是要听从用户的声音（listen to the customer），基于社区驱动导向的 MXNet 实际上需要带给用户的不是别的，而是「爽」。

当用户只需要关心数据量和运算量、写好数学公式、把数据交给云并用花钱租算力；而不需要关心如何有效实现利用硬件、不需要关心自动求导是如何训练、云端如何优化的时候，用户才能够真正把精力放在自己想做的事情上。「AWS 最关心的是用户体验，然后是买资源赚钱。这里最保险的是支持所有流行的 DL 框架。」李沐曾经在一个知乎问答中这样总结道。

在提及这一点的时候，李沐也向雷锋网AI科技评论表达了他自己的看法，他认为亚马逊看重的是「有与无」的问题，而不是「谁」的问题。

「亚马逊靠的是机器时间（machine hour）赚钱，而不是靠软件与平台。因此，做社区的目的主要是为了把用户量积累起来，而上面用的是什么开源平台，其实并不重要。」

当然，亚马逊不会傻到为谷歌做嫁衣裳而选择 Tensorflow，因此它亟需的是找寻一个能够属于自己的开源平台。实际上这桩合作的促成，背后的「二传手」Alex Smola 功不可没。

Smola 是李沐在 CMU 的两位博士导师之一，于 15 年从 CMU 重返工业界，加入亚马逊 AWS 担任机器学习总监。此前在雷锋网AI科技评论报道过的 AAAI 2017 大会上，Smola 也以 MXNet 做了主题分享，而在演讲开始的感谢环节，李沐的名字赫然在目。

在 AAAI 的演讲中，Smola 拿 MXNet 的运行速度与其它开源平台做对比，而在谈话中李沐表示，自己并不愿意这样简单粗暴地做对比，他也告诉员工们，如果其它公司邀请你们做分享，一般不要做对比，只谈技术就好。

「我很理解大家爱看对比类的文章，但这是一个有偏见（biased）的做法。我们比别人快一两倍，不是我们想表达的东西，而为什么快，做了哪些优化，离我们的理想状态还有哪些差距，这样的总结可能对我来说更有价值一些。」

但不论李沐如何避免对比，MXNet 还是经常会被拿来与 TensorFlow 相提并论，他在谈话过程中也时常提及后者。在知乎上，他索性将机器学习的发展历史写成了一篇武侠小传，将修真世界里的 MXNet 比喻为「散修小团体」，而 TensorFlow 则是「最大流派平台」。

诚然，不论是开始时间还是平台特性，MXNet 都是与 Tensorflow 最为接近的一个：完整的多语言前端、全系统模块化、编译依赖小、适合快速开发的特性。虽然吃瓜群众们津津乐道的无非是哪家更强、优缺点是什么、两家如何自处竞争这样的问题，甚至还会八卦两家之间的关系。但李沐表示，其实他们与 TensorFlow 并不是想象中那种剑拔弩张的状态，相反，几个朋友每个星期都会碰头交流，讨论技术问题。

而更重要的一点在于，李沐认为所谓的「不同」纯粹是设计理念（design choice）的差异所导致的。

「谷歌想做的是一个完完整整的语言，跟 python 无关，自己就能成为一门语言 TF。」这样的策略能让谷歌从底层到上层拥有绝对控制权，像安卓一样，用户只要在上层做东西，底层全交给谷歌。虽然大体量势必会带来优化的困难，但这是谷歌的生态圈和战略所决定的。而 MXNet 选择的是轻量化的设计路线，毕竟这个平台一开始也只是 DMLC 抱着纯粹的热情做起来的兴趣项目，希望能降低深度学习的门槛。

「算法是科学。框架不是。它涉及的是设计者自己的审美观、哲学等主观理念，如果要用基于不同设计理念的表现性能来评论这个平台的好坏，我觉得意义不大。」

是的，基因——李沐用这个词来形容再恰当不过了。不论是亚马逊选择了 MXNet，抑或是谷歌做出了大而全的 TensorFlow，都是公司骨子里的基因在起着决定性的作用。

李沐觉得，框架的融合（merge）会是未来的趋势，系统各自为政的时代会被更多的兼容与支持取代。但不论 AI 潮流会是惊涛骇浪或是风平浪静，李沐坚信前端的用户驱动导向总是不会改变的。

学术界的“why”与工业界的“how”

初为人父的李沐在 2017 年初又实现了一个小目标。在 2 月初，他顺利完成了 CMU 的博士论文答辩。

在旁人看起来难如登天的答辩环节，对于李沐而言却只是「走走流程」般的轻松及「了却一件事」般的易如反掌。更何况，这场答辩汇集了全球顶尖科技公司的大牛们：谷歌、苹果、亚马逊深度学习项目的 Jeff Dean，Ruslan Salakhutdinov，Alex Smola，还有 CMU 机器学习助理教授 Barnabas Poczos。

虽然毫无悬念地被问到了「比较下 MXNet 和 TensorFlow」，但李沐在微博中调侃称，「最后大家并没有打起来」。

记得有位朋友这样评价李沐，「他是少有的在工业界和学术界都有着深厚积累的人。」微软亚洲研究院、百度少帅、谷歌实习生再到亚马逊，任何一份工作放在别人身上都是闪闪发光的经历，然而李沐一人占全了。即使有着令人艳羡的工作，李沐还是选择了到 CMU 读博。

在美国深造五年的李沐也目睹了深度学习火得一塌糊涂的全过程，不少企业也开始涉足这一领域。在他看来，普通民众更多的关注点是在强 AI，而学术界甚至都不会用「AI」这个词。在美国的 Top 学校里，做纯 ML 的其实不多，就连 MIT 这样的学校也是新近才招募了专门教授机器学习的老师。

而李沐认为深度学习突然火起来的原因，其实是门槛太低的结果。「你不需要懂数学。它就是一种语言，神经网络的层是不同的句子，每个人都可以通过这个语言描述你对问题的理解，链接不同层构造一个程序。框架可以帮你完成计算，更何况计算量和数据都不缺，必然导致大家会慢慢进来。」

鉴于学术界与工业界的交互越来越频繁，也有不少企业也会与大学研究院进行合作发表应用性强的论文，但这些论文往往拿不到 Best 或 Oral Paper，也是因为评审标准的出发点不同所致。作为在工业界与学术界都待过的大牛，李沐虽然现在对于两个领域的研究侧重颇有心得，但在四年前，他在投递论文时也吃过不少亏，NIPS、IJCAI、JMLR、UAI、KDD连续被拒绝的他，心情非常郁闷。2013 年 8 月，他在微博上无奈地写道：

后来回顾这段历程时，李沐感慨道：

「做产品和做学术研究是完全不同的东西。产品的导向是解决问题的 how，效果好、简单好用、通用性强、资源消耗低、便于实践，也就是东西要 work（应用）。不同公司的侧重点可能有些差异，比如百度对广告的精准性要求高一些，腾讯可能需要产品简单一些。而做学术研究时要写清楚的是 why，最重要的是想法（idea），第二点是洞察（insight）, 也就是你能把这个事情做出深层的解释，再接下来才是结果好不好。」

但李沐在实践的时候，还是会把应用放在第一位。他在带实习生的时候，就要求对方首先要做一个至少能跑得起来（work）的东西，然后再在其中提炼想法。在他的理解中，没有实践基础的理论就是空中楼阁。

在 CMU 博士论文答辩之后，李沐从匹兹堡回加州的飞机上写就了一篇随想录。他笑着对雷锋网AI科技评论说，这篇文章本来设想了两种写法，一种是说自己有多牛多牛（李沐说，文中列举的只有一半）。「但后来想了一下，第一种写法虽然看上去很厉害，但对别人没有意义。反过来，我写自己做过了什么，哪些失败了，原因是什么。其实这五年做的大部分事情是失败的，如果不总结一下，错误总是一直在犯。」

文章写就之后，李沐感悟最深的一点在于每个人都应该走自己的路。「每个人在文章中都看到了不同的东西，很多人看到工业界有钱，有的人看到技术方面的一些思考，也有的人看到我最后一段的情怀，但并不代表着你一定要跟着我走的路去走。如果只是因为这篇文章觉得鸡血满满，转头去读了个博士，可能也会后悔。我的背景决定了自己能做什么，每个人也都是如此。」

CMU的答辩结束之后，家庭暂时成为了李沐生活的重心，但这并不会持续很久。原来只有 Smola 和李沐两个人的办公室，现在已经满满当当。李沐说，他们很快就要搬进不远处的新办公室，并计划再招 300 个人，准备让 MXNet 变得更好用一些。

雷锋网AI科技评论后记：AI君一开始的文章标题其实并非长这样，但李沐老师在看完文章之后，却希望能换个低调一些的标题，他说自己并不希望靠上“亚马逊”、“CMU”这样的标签。细想也是，以李沐老师的存在感，似乎也不需要吧。

封面与正文图片由李沐本人提供，特此感谢。

原创文章，未经授权禁止转载。详情见转载须知。

MXNet作者李沐：工业界追求“how”，学术界重在“why” | 2017 见闻

谷普下载提醒您

本文链接：http://www.gpxz.com/article/47c635e43bc648643245.html

上一篇：荐会海南推荐会

下一篇：和人工智能的那些事儿分享清华大学朱小燕教

首页

首都医科大学附属北京友谊医院始建于1952年，原名为北京苏联红十字医院，是新中国成立后，在苏联政府和苏联红十字会援助下，由党和政府建立的第一所大型医院。1954年新院址落成，毛泽东、周恩来、刘少奇、朱德等老一辈革命家为医院亲笔题词。毛泽东主席特别题词“减少人民的疾病，提高人民的健康水平”。1957年3月，苏联政府将医院正式移交我国政府，周恩来总理亲自来院参加了移交仪式。1970年，周总理亲自为医院命名为“北京友谊医院”。

健康医疗 2024-11-13 10:56:55

档案整理服务公司

中博奥技术有限公司专业致力于档案整理服务，档案数字化加工，档案管理系统，档案扫描，具有档案专业加工资质，智慧档案库房建设，数字化档案馆，档案软件开发和档案咨询等项目。

手机软件 2024-08-17 00:11:33

魔兽地图社论坛

电影视频 2024-07-12 01:08:17

成都冷库设计,四川冻库设计,13881933303,成都保鲜库建造,四川冷藏库造价,成都冷库,成都冻库公司

四川蓉众恒制冷设备有限公司,13881933303专注冷库安装10余年,冷库产品免费保修1年,2年内免费提供电器零配件,厂家直销无任何中间环节，调拨价批发零售冷库全套设备,工程商们的最佳合作伙伴,冷库造价更低,服务上千客户,欢迎来电咨询：400-028-8787.

设计美化 2024-07-07 16:15:18

声乐速成网

中国声乐速成网-刘书铭老师的《声乐速成训练法》是对传统教学法的一种反叛，其宗旨是使歌唱方法简单化易学化。让学习者在最短的时间内取得最大的进步。

音乐歌曲 2024-08-17 22:36:15

西安透水砖厂家

陕西齐禾天地建材是透水砖的生产厂家，也叫渗水砖,属于绿色环保新型建材，使用寿命长；外表光滑，边角清晰，线条整齐；抗冻性能和抗盐碱性高；我公司产品有透水砖厂家、西安吸水渗水砖、植草砖厂家、PC彩砖、草坪砖、道沿石、盲道砖、渗水砖、护坡砖等。定制各种规格的PC透水砖，品种多规格全，质量高，售后无忧，其产品质量得到了用户的高度认可，工厂交通运输及其便利。

贸易批发 2024-07-13 16:05:34

深圳市兴大毅电子有限公司

深圳市兴大毅电子有限公司是专业贴片电子元器件供应商

电影视频 2024-08-18 13:34:24

四川省教育信息化与大数据中心

四川省教育信息化与大数据中心（四川省电化教育馆）于2021年4月经省委编办批复成立。中心主要职能职责为：建设管理省教育大数据平台和“互联网+教育”大平台；研制全省教育信息化相关标准规范；负责数字教育资源生产、汇聚、监制、评价和推荐指导；承担“四川云教”、在线教育等的开发、应用和管理服务；开展信息技术教学应用研究、培训和教学实践、推广等；承担教育电子政务和数据管理服务相关工作。

网络应用 2024-07-15 22:19:17

武汉高力热喷涂工程有限责任公司

电影视频 2024-07-17 09:32:56

新侨集团

电影视频 2024-07-17 15:30:57

青岛方大包装

青岛方大包装股份有限公司，是塑料印刷、复合软包装产品的专业生产厂家，本公司秉承“绿色、安全、精美”的生产管理理念，靠品质产品、个性化服务不断拓展国内外市场。0532-85399088

安全杀毒 2024-11-27 15:42:06

4K数字超高清内窥镜摄像系统

4K、3D超高清内窥镜摄像系统、数字全高清内窥镜摄像系统、内窥镜远程控制服务系统、医用LED冷光源、医用4K监视器、智能数字化内窥镜吸烟系统、加热除雾系统、高清便携式内窥镜摄像系统一体机、全高清手术录像系统，工作站台车以及附属配套手术器械等微创医疗设备，系列产品搭载芯智融互联网远程服务系统。充分满足客户在临床各科室需求。

互联资讯 2024-12-21 19:06:40

网盘禁传盗版对用户内容进行全方位监测 (网盘禁传盗版怎么解决)

20日，国家版权局今天印发了，关于规范网盘服务版权秩序的通知，，指出网盘服务商应当采取有效措施，制止用户违法上传、分享未经授权的作品，具体包括，正在热播、热卖的作品，出版、影视、音乐等专业机构出版或者制止的作品，其他明显感知属于未经授权提供的作品，对此，国内几家大型网盘服务商也给予了明确的表态和整改措施，例如对用户公开分享的内容进行机...。

2025-02-02 03:00:10

如何在一周内快速摸清一个行业 (如何在一周内快速减10斤)

不管是创业，亦或是进入一个新的行业工作，我们都需要对这个行业有一个清晰的了解，一周时间很短，想完全摸清一个行业是不可能的，不过大致了解，还是完全可以做到的，那么一周时间你需要了解哪些知识呢?一、行业框架1.基本术语∶大致了解行业术语、专业名词有哪些，2.行业规模∶行业整体规模和数据，行业年度经济收入多少，3.生命周期∶处在行业生命周期...。

2025-01-30 23:42:27

当百度度秘该度秘说了什么的时候抓周 (百度度秘在哪)

总结这个月初李彦宏在百度世界大会上的表达——李彦宏说，人工智能是百度核心中的核心，怎么理解这个核心中的核心呢，李彦宏和吴恩达一起用相当长的篇幅描述了今天百度3个重要的业务单元，百度大脑、百度深度学习平台以及度秘，很多普通读者未必听懂了这3者的关系，因为这是一个面向开发者的语境，简单来说，百度深度学习平台是一些经过训练的算法模型，百度大...。

2024-12-04 01:07:41

全球圆满落幕智能制造峰会观点碰撞！ AIoT 产业· 大咖云集

AIoT融合落地方兴未艾，工业制造智能转型迫在眉睫，为了构建行业对AIoT产业的全新认知，解析AIoT泛产业的，云、管、边、端，及智能制造产业的发展，探讨当下AIoT行业落地困境及工业互联网发展思路，2019年11月22日，全球AIoT产业·智能制造峰会在深圳隆重举行，本次会议由雷锋网主办，由深圳市软件行业协会、深圳市大数据产业协会、...。

2024-12-03 22:51:01

上海警察一个月拿多少啊 (上海警察一个月多少钱)

要看是上海哪个区的警察，各个区县的差距很大的，各个区县内部的机关和基层的差距也是有的.而且算上职称系数的话这个差距还应该拉开.总的来说收入最低的闸北的基层民警一个月奖金加工资2000至3000，高的是浦东及闵行的个别派出所，基层民警能够拿到五位数.上海普通派出所民警工资上海民警的工作一年有12万左右，根据律临资料显示，上海正式编制警察...。

2024-11-29 15:14:15

西安两初中生失联一天被找回这两位初中生究竟去哪里了 (西安一中学生被抓)

一，西安两初中生失联在西安市鄠邑区一中学发生了一起事故，有两名学生在放学后失联了，这两名女生分别为13岁、14岁，事情的经过是当天本来应该是放学回家的时间但是其中一位孩子的父亲迟迟没有见到自己家的孩子回来，后来他联系了自己家的亲戚朋友都没有看到孩子，这个时候孩子的父亲意识到了危险，开始着急了起来于是选择了报警，因为没有给孩子配备手机所...。

2024-11-29 14:58:07

长沙嘻哈帮街舞怎么样 (长沙嘻哈帮街舞培训地址)

每个家长，在自己有限的能力内都希望给孩子美好的未来，因此在孩子发展的少儿时期，会帮忙报名各种培训机构，街舞是时下很流行的少儿培训项目之一，可以锻炼孩子的身体部位，可以参赛锻炼孩子的胆量并开阔眼界，总之优点多多，当然这一系列的前提是选择的街舞机构靠谱，那么，长沙嘻哈帮街舞怎么样，快随小编一起来了解一下这个品牌吧，关于长沙嘻哈帮街舞的介绍...。

2024-11-22 19:43:56

2022年仅剩387万 5年中国网站数量下降30%

CNNIC发布了最新的中国互联网发展统计报告，报告称，2018年中国有523万个网站，2022年下降到了387万个，5年间下降了近30%，而且还在持续下降中，A5图王说到，中国的网站从500w到300w，但全球网站还是有近两亿的网站，差距非常大，是什么原因导致网站数量减少呢?A5图王分析了5点，另外，A5图王还说到，其实网站包括h5比...。

2024-11-16 00:03:14

一人一机飞机空中熄灭14秒俄传奇航行员有多传奇曾遇到风险抵珠海 (一人拉飞机)

据新华社报道，第十五届中国国际航空航天博览会将于11月12日在广东珠海揭幕，参与航展的中外战机以及航展物资正陆续达到珠海，其中一架俄罗斯第五代隐形战役机苏，57备受注目，让中国军迷兴奋的不光是苏，57战役机初次在珠海为中国观众展现飞机功能，更由于驾驶这架编号054的苏，57战役机航行员是俄罗斯传奇试飞员谢尔盖·博格丹，现年62岁的博格...。

2024-11-13 15:01:57

SKG公司卖二手货 (skg这家公司怎么样)

我于6.22把烈焰红筋膜枪寄到SKG公司去培修，并支付75元的培修费来改换电池，但该公司告知没有电池，可以改换一台全新的海外版服务器，问及需要有外壳塑封包装以及服务器质保两年，均给我回答是可以的，在此状况下，我改换了服务器，然而运上来以后发现，1.外壳无塑封包装；2.该公司说机器是海外版，但零件与标识标签及盒子上并无海外版或标注海外版...。

2024-07-17 20:24:41

杭州君虹科技有限公司诱导在校生放开教育存款 (杭州君虹科技有限公司兼职)

申明，1.以上内容仅代表揭发者自己，不代表黑猫揭发立场，2.未经授权，本平台案例制止任何转载，违者将被清查法律责任，3.黑猫揭发处置揭发不收取任何费用，凡以黑猫揭发名义不要钱的均为混充、诈骗行为，请及时报警并与黑猫官网反应，揭发邮箱heimaotousu@vip.sina.com，4.请大家选用官网渠道处置生产纠纷，不要轻信第三方机构...。

2024-07-17 08:48:44

精美,精美专题内容文章-点家

精美专题,提供精美的相关文章和相关资讯,在本栏目你可以看到精美这个内容的相关各类文章很多篇,如有不足请提供给我们更多精美的文章供大家查阅.

2023-10-11 01:41:52

文章推荐

pubg官网如何下载 pubg官网下载教程 (pubg官网下载地铁逃生)

有很多喜欢吃鸡类型游戏的玩家，想要去官网下载一下吃鸡游戏pubg，所以这次小编带来pubg官网下载教程，希望能够让所有热爱吃鸡游戏的朋友们能够顺利的下载好这款吃鸡鼻祖游戏，毕竟有不少新手朋友不知道具体的下载方式，普通的方式并不适用，下面就给大家进行详细的介绍，biubiu加速器，最新版下载下载由于pubg，也就是绝地求生目前还没有国...。

2025-02-12 01:05:59

资讯动态

小米智能猫眼1s将开售搭载5英寸屏 (小米智能猫眼怎么重新连接wifi)

导读，据了解，小米智能猫眼1s采用了1080P高清摄像头，内置了8000mAh电池，门内屏幕支持显示天气、限号信息，3月28日，小米正式发布了智能猫眼1s，售价699元，首发649元，3月31日开卖，据介绍，小米智能猫眼1s的门内部分采用5英寸的IPS液晶屏，钢化玻璃全贴合工艺，可视角度更大，图像更清晰，有人按门铃，屏幕自动显示门外画...。

2025-02-02 19:12:32

资讯动态

百度云首次披露业绩数据BAT稳坐国内公有云前三 (百度网盘首次18元后续是多少)

互联网巨头BAT霸榜国内公有云前三，这是否说明公有云市场趋于集中，雷锋网消息，2月22日百度公布了2018财年第四季度未经审计的财务报告，本季度百度营收272亿元人民币，同比增长22%，净利润21亿元人民币，值得关注的是，在财报公布之后的财报电话会议上，百度云首次公布了其业绩数据，百度云季度营收破十亿百度方面宣布，百度云业务在2018...。

2024-12-10 01:32:31

资讯动态

高通万卫星拥抱AI赋能终端创新的未来 (高通卫星电话)

6月27日，高通公司AI产品技术中国区负责人万卫星出席上海MWC世界移动通信大会期间举办的中国移动终端合作峰会，并发表主题演讲，拥抱AI赋能终端创新的未来，，分享高通公司正在如何通过领先产品和解决方案赋能终端侧生成式AI发展，通过强大的NPU性能和高通AI引擎的异构计算设计，高通公司在支持终端侧生成式AI用例处理方面独具优势，其最新的...。

2024-12-09 16:11:50

资讯动态

维基百科和谷歌联合开发机器学习算法如何揪出论坛里的骂街党 (维基百科和谷歌)

最近，来自维基百科和谷歌的IT专家，公布了把AI用于，节制，维基百科用户评论的成果——找出哪些用户在搞人身攻击，还有他们为什么要在网上骂街，针对该问题，研究人员开发机器学习算法，分析维基百科在2015年收到的的海量评论，这一年，维基百科讨论页面共收到6300万条评论，这些评论存在的本意，是讨论如何改进维基百科收录的各条文章，这些算法使...。

2024-11-30 18:34:47

资讯动态

学术界重在 工业界追求 how why MXNet作者李沐 (学术界工作)

MXNet：“多谈技术，少做对比”

学术界的“why”与工业界的“how”

相关文章

文章推荐

学术界重在工业界追求 how why MXNet作者李沐 (学术界工作)