谷歌大脑撰文解析 神经网络如何自行设计神经架构 AutoML (谷歌大脑项目)

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经架构? | <a href=google I/O 2017" href="//static.leiphone.com/uploads/new/article/740_740/201705/591d70f2b256b.png" src="http://www.gpxz.com/zdmsl_image/article/20241209162234_11319.jpg" loading="lazy">

在 Google I/O 大会上,谷歌公布了最新的机器学习算法——AutoML,随即,Quoc Le 与 Barret Aoph 大神在 Google Research Blog 上发布了一篇名为《采用机器学习探索神经网络架构》的文章。雷锋网进行了编译,并做了不改动原意的编辑和修改

「在谷歌团队,我们成功地将深度学习模型应用于非常多的领域,从图像识别、语音识别到机器翻译等等。自然,这些工作离不开一整支工程师与科学家团队的努力。人工设计机器学习模型的过程实际上绝非坦途,因为所有可能组合模型背后的搜索空间非常庞大——一个典型的十层神经网络可能有~10种可能的神经网络组合。问题也接踵而至,为了应对这样庞大的数量级,神经网络的设计不仅耗时,而且需要机器学习专家们累积大量的经验。」

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经架构? | Google I/O 2017

如图是 GoogleNet 的架构。神经网络的设计需要从最初的卷积架构开始,进行多年的细心调试

为了让机器学习模型的设计变得更加简单,谷歌团队一直希望能让这一过程自动化。此前谷歌也有做不少尝试,包括 evolutionary algorithms 与 reinforcement learning algorithms 等算法已经呈现了比较好的结果。而 Quoc Le 与 Barret Zoph 在此文中所展现的,是谷歌大脑团队目前在强化学习上得到的一些尝试与早期结果。

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经架构? | Google I/O 2017

在团队一个名为「AutoML」的项目中(如图所示),左边有一个名为「控制器」(the controller)的 RNN,它设计出一个「child」的模型架构(雷锋网觉得可以称之为「雏形/子架构」),而后者能够通过某些特定任务进行训练与评估。随后,反馈的结果(feedback)得以返回到控制器中,并在下一次循环中提升它的训练设定。这一过程重复上千次——生成新的架构、测试、再把反馈输送给控制器再次学习。最终,控制器会倾向于设计那些在数据集中能获得更高准确性的架构,而反之亦然。

谷歌团队将这一方法应用于深度学习的两大数据集中,专注图像识别的 CIFAR-10 与语言建模的 Penn Treebank。在两个数据集上,系统自行设计的模型性能表现与目前机器学习专家所设计的领先模型不相上下(有些模型甚至还是谷歌成员自己设计的!)。

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经架构? | Google I/O 2017

猜猜哪个是人类设计的神经网络架构,哪个是机器设计的?

让机器自行选择架构(machine-chosen architecture),与人类在设计神经网络的时候有一些共通之处,比如都采用了合并输入,并借鉴了此前的隐藏层。但其中也有一些亮点,比如机器选择的架构包含乘法组合 ( multiplicative combination),如右图最左边(机器设计)的蓝色标签为「elem_mult」。对于循环神经网络而言,出现组合的情况并不多见,可能因为人类研究者并没有发现明显的优势。有意思的地方在于,此前人类设计者也提议过机器采用的乘法组合,认为这种方法能够有效缓解梯度消失/爆炸问题。这也就意味着,机器选择的架构能够对发现新的神经架构大有裨益。

此外,机器还能教会人类为何某些神经网络的运行效果比较好。上图右边的架构有非常多的渠道,梯度可以向后流动,这也解释了为何 LSTM RNNs 的表现比标准 RNN 的性能要好。

「从长远看来,我们对于机器所设计的架构进行深入的分析和测试,这能够帮助我们重新定义原本自身对架构的看法。如果我们成功,这意味着将会启发新的神经网络的诞生,也能让一些非专家研究人员根据自己的需要创造神经网络,让机器学习造福每一个人。」

参考文献:

[1] Large-Scale Evolution of Image Classifiers ,Esteban Real, Sherry Moore, Andrew Selle, Saurabh Saxena, Yutaka Leon Suematsu, Quoc Le, Alex Kurakin. International Conference on Machine Learning, 2017.

[2] Neural Architecture Search with Reinforcement Learning ,Barret Zoph, Quoc V. Le. International Conference on Learning Representations, 2017.

via research.googleblog ,雷锋网编译

版权文章,未经授权禁止转载。详情见 转载须知 。

谷歌大脑撰文解析 AutoML:神经网络如何自行设计神经架构? | Google I/O 2017

全局中部横幅
GQ男士网

【GQ男士网】是中国第一个视野开阔的时尚男人网站,聚焦时尚资讯,解读每季国际男装发布会及时尚趋势,引导男士时尚品味生活和潮流消费,最全最快呈现《智族GQ》杂志内容。

火车头私有云采集

火车头私有云为客户提供一整套的数据采集解决方案,解决大数据量采集及存储、突破网站防采集反爬、多端分布式采集、跨平台支持主流操作系统部署、时事舆情监控、品牌舆情监控等功能。

475手操器

北京樽祥科技有限责任公司是一家专业从事仪器仪表销售公司,作为艾默生罗斯蒙特手操器国内区域总代理,减少中间环节直接面对客户。475手操器、TREX手操器德国工厂原装进口,货源品质保证。

蚌埠天球电子科技有限公司

蚌埠天球电子科技有限公司是国内专业生产孵化机的定点厂家,位于安徽省蚌埠市蚌埠工业园,占地30亩,注册资金588万元,职工80人,技术力量雄厚

乐行网

乐行网提供城市公交地铁线路查询,火车高铁时刻表,票务查询等出行交通信息。

彗星网络科技

不要钱建站,企业网站建设,推广上百度首页,广告位赚钱,宣传公司形象,做网站不收费,财会业务,会赚钱网站,代理报税,网站优化,百度排名靠前,链接赚钱,会计记账,广告展示,彗星免费建站www.68lc.cn

石英管厂家

东海县硅宝石英制品有限公司是石英制品生产专业单位,主要产品有石英管、石英玻璃管.厚壁石英管.大口径石英管.石英锅炉管.石英棒、双孔石英管、石英套管、石英水套、石英片、石英环、石英坩埚、石英仪器、各种石英弯管、球型石英管、无臭氧紫外线石英管.乳白石英管以及各种异色石英管等石英制品。

快快网络

快快网络作为新一代云安全引领者,为全球客户提供DDOS防护,CC防护,WAF安全,BGP高防服务器等专业智能服务,为政企等各行业提供云安全解决方案。

四川天象人力资源

四川天象人力,致力打造成为客户最具信赖的人力资源品牌服务商,公司主要从事代理招聘、劳务派遣、人事代理、生产线外包、灵活用工、校企合作等业务,一对一专属客服,为您服务~

爱开大学生网

爱开大学生网提供大学生新闻网上投稿平台,支持大学生社会实践网上投稿,包括大学生新闻、大学生社会实践、大学生活等栏目信息,大学生自己的网上投稿平台。

有好健康

有好健康_是国内以奇异搞怪为主的网站

-东莞市恒宇仪器有限公司官网

恒宇仪器专业开发生产:拉力机,万能材料试验机,拉力试验机等系列产品,用途广泛,与奥康鞋业、361、Nike、阿迪达斯等国内外企业均有合作,深受客户好评.欢迎至电全国免费热线:400-8300-665

全局底部横幅