谷歌大脑撰文解析 神经网络如何自行设计神经架构 AutoML (谷歌大脑项目)

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经? | Google I/O 2017

在 Google I/O 大会上,谷歌公布了最新的机器学习算法——AutoML,随即,Quoc Le 与 Barret Aoph 大神在 Google ReseARCh Blog 上发布了一篇名为《采用机器学习探索神经网络架构》的文章。雷锋网进行了编译,并做了不改动原意的编辑和修改。

「在谷歌团队,我们成功地将深度学习模型应用于非常多的领域,从图像识别、语音识别到机器翻译等等。自然,这些工作离不开一整支工程师与科学家团队的努力。人工设计机器学习模型的过程实际上绝非坦途,因为所有可能组合模型背后的搜索空间非常庞大——一个典型的十层神经网络可能有~10种可能的神经网络组合。问题也接踵而至,为了应对这样庞大的数量级,神经网络的设计不仅耗时,而且需要机器学习专家们累积大量的经验。」

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经? | Google I/O 2017

如图是 GoogleNet 的架构。神经网络的设计需要从最初的卷积架构开始,进行多年的细心调试

为了让机器学习模型的设计变得更加简单,谷歌团队一直希望能让这一过程自动化。此前谷歌也有做不少尝试,包括 evolutionary algorithms 与 reinforcement learning algorithms 等算法已经呈现了比较好的结果。而 Quoc Le 与 Barret Zoph 在此文中所展现的,是谷歌大脑团队目前在强化学习上得到的一些尝试与早期结果。

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经? | Google I/O 2017

在团队一个名为「AutoML」的项目中(如图所示),左边有一个名为「控制器」(the controller)的 RNN,它设计出一个「child」的模型架构(雷锋网觉得可以称之为「雏形/子架构」),而后者能够通过某些特定任务进行训练与评估。随后,反馈的结果(feedback)得以返回到控制器中,并在下一次循环中提升它的训练设定。这一过程重复上千次——生成新的架构、测试、再把反馈输送给控制器再次学习。最终,控制器会倾向于设计那些在数据集中能获得更高准确性的架构,而反之亦然。

谷歌团队将这一方法应用于深度学习的两大数据集中,专注图像识别的 CIFAR-10 与语言建模的 Penn Treebank。在两个数据集上,系统自行设计的模型性能表现与目前机器学习专家所设计的领先模型不相上下(有些模型甚至还是谷歌成员自己设计的!)。

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经? | Google I/O 2017

猜猜哪个是人类设计的神经网络架构,哪个是机器设计的?

让机器自行选择架构(machine-chosen architecture),与人类在设计神经网络的时候有一些共通之处,比如都采用了合并输入,并借鉴了此前的隐藏层。但其中也有一些亮点,比如机器选择的架构包含乘法组合 ( multiplicative combination),如右图最左边(机器设计)的蓝色标签为「elem_mult」。对于循环神经网络而言,出现组合的情况并不多见,可能因为人类研究者并没有发现明显的优势。有意思的地方在于,此前人类设计者也提议过机器采用的乘法组合,认为这种方法能够有效缓解梯度消失/爆炸问题。这也就意味着,机器选择的架构能够对发现新的神经架构大有裨益。

此外,机器还能教会人类为何某些神经网络的运行效果比较好。上图右边的架构有非常多的渠道,梯度可以向后流动,这也解释了为何 LSTM RNNs 的表现比标准 RNN 的性能要好。

「从长远看来,我们对于机器所设计的架构进行深入的分析和测试,这能够帮助我们重新定义原本自身对架构的看法。如果我们成功,这意味着将会启发新的神经网络的诞生,也能让一些非专家研究人员根据自己的需要创造神经网络,让机器学习造福每一个人。」

参考文献:

[1] Large-SCAle Evolution of Image Classifiers ,Esteban Real, Sherry Moore, Andrew Selle, Saurabh Saxena, Yutaka Leon Suematsu, Quoc Le, Alex Kurakin. International Conference on Machine Learning, 2017.

[2] Neural Architecture Search with Reinforcement Learning ,Barret Zoph, Quoc V. Le. International Conference on Learning Representations, 2017.

via research.googleblog ,雷锋网编译

版权文章,未经授权禁止转载。详情见 转载须知 。

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经? | Google I/O 2017

全局中部横幅
XPOWER高端轨道插座

相舆科技(上海)有限公司耗时6年研发了艾宝沃XPOWER智能电力系统,为居家和商业空间提供智能插座,移动插座,电力轨道插座等一站式智能用电解决方案,并成为了苹果、迪士尼、万科、绿地集团等多家全球500强企业商业空间智能电力标配服务商。全国招商热线:400-820-6930

食品微波烘干杀菌

湖北岱骏机械设备有限公司主营食品微波烘干杀菌,化工微波加热烘干,乳胶微波烘干杀菌,陶瓷微波烘干定型,盒饭微波加热灭菌,茶叶花卉杀青烘干,五谷杂粮微波熟化,医药行业微波设备,宠物食品烘干杀菌,昆虫微波干燥杀菌,农副菌类烘干杀虫,纸制品微波烘干机,竹木微波烘干杀菌等

南京卓越考研

卓越考研是一家全日制考研集训辅导机构,唯一拥有自建集训校园的辅导班,按照基础分班定制教学,核心师资都是名校副教授以上名师,学习2个月内不满意无条件退费。

苏银信用管理中心

苏银信用管理中心|苏银企服|不良记录下架|解除限高|法律案件删除|征信修复|行政处罚解除|行政处罚下架|司法案件删除|裁判文书下架

深圳市雅韩视科技有限公司/Airhans

雅韩视|Airhans|电动牙刷|吸奶器|无线充电|医疗设备|MCU开发|单片机开发|蓝牙2.4G|加热设备|加湿器|PLCC控制器|成人用品电路设计|消费类电子PCBA|

感应加热设备

广东力华感应设备有限公司21年专注感应加热设备生产和研发的高新技术生产厂家,21年致力于感应加热设备,高频焊机,淬火机床,熔炼炉,锻造加热炉,高频钎焊机,热处理退火设备,钎焊设备,自动化钎焊设备,高频焊接设备,高频钎焊设备等设备,人工操作1小时,机器只要2分钟,污染,节能环保,生产效率高!

仿盛趣123

仿盛趣123,最专业的仿盛趣传奇版本发布网,每日多达上百条仿盛趣热血传奇信息查询,玩传奇就玩仿盛趣版本

超声波清洗机

春霖是一家享誉国内外的超声波清洗机厂家,定位中高端,种类齐全,包括小型、单槽、双槽、多槽、全自动超声波清洗机、碳氢超声波清洗设备等,热线:13825295010

上海公关活动公司

ZEAO展奥公关(021-56208016)专注于“高端公关活动策划上海年会策划,直播年会,上海活动公司,庆典活动,上海发布会策划,上海线上年会活动,上海答谢会策划,直播年会策划,直播发布会和品牌推广活动策划”的沪上知名公关公司,深入研究“高端公关活动策划、创意、执行、推广多年,有丰富的经验、运营方略与各种体验营销渠道相结合。我们致力于为您打造精准的品牌及产品推广及活动策划方略。

免费试用房产中介软件【房产中介管理系统】

易房大师是免费试用的房产中介管理软件,为您提供功能强大的房产中介管理系统,易房大师为您提供的管理软件涵盖PC电脑、网站、手机、平板和微信服务,是业内第一家基于云服务的房产中介管理软件,是功能最全面、服务最及时、性价比最高的房产中介软件服务商。

全局底部横幅