回顾Google神经网络机器翻译上线历程 (回顾工作历程经典句子)

文章编号：46086 资讯动态 2024-12-09 Google Google Translate 机器翻译深度学习神经网络

雷锋网按：本文作者陈村，剑桥大学自然语言处理（NLP）组，现为机器学习语义分析工程师。

回顾神经网络机器翻译上线历程 | 深度

Google Translate作为久负盛名的机器翻译产品，推出10年以来，支持103种语言，一直作为业界的标杆。

而在前不久，Google官方对翻译进行一次脱胎换骨的升级——将全产品线的翻译算法换成了基于神经网络的机器翻译系统（Nueural Machine Translation， )。从Google官方发表的博文[1]和技术报告[2]中，我们有机会一窥究竟，这个全新的系统到底有什么神奇的地方？笔者借这篇文章，帮大家梳理一下机器翻译的发展历程，以及Google这次新系统的一些亮点。

机器翻译，即把某一种源语言（比如英文）翻译到最恰当的目标语言（比如中文）。

还在几年前，机器翻译界的主流方法都是Phrased-Based Machine Translation (PBMT)，Google翻译使用的也是基于这个框架的算法。所谓Phrased-based，即翻译的最小单位由任意连续的词（Word）组合成为的词组（Phrase），比如下图中的“北风呼啸”。

PBMT是怎么把一句英文翻译成中文的呢？

回顾神经网络机器翻译上线历程 | 深度

Statistical machine translation. ACM Computing Surveys, 40(3), 1–49.

传统的PBMT的方法，一直被称为NLP（Natural Language PROcessing，自然语言处理）领域的终极任务之一。 因为整个翻译过程中，需要依次调用其他各种更底层的NLP算法，比如中文分词、词性标注、句法结构等等，最终才能生成正确的翻译。这样像流水线一样的翻译方法，一环套一环，中间任意一个环节有了错误，这样的错误会一直传播下去（error propagation），导致最终的结果出错。

因此，即使单个系统准确率可以高达95%，但是整个翻译流程走下来，最终累积的错误可能就不可接受了。

深度学习这几年火了之后，机器翻译一直是深度学习在NLP领域里成果最为卓越的方向之一。 深度神经网络提倡的是end-to-end learning ，即跳过中间各种子NLP步骤，用深层的网络结构去直接学习拟合源语言到目标语言的概率。

2014年，Cho et. al [3]和Sutskever et al. [4] 提出了Encoder-Decoder架构的神经网络机器翻译系统。如下图所示：

回顾神经网络机器翻译上线历程 | 深度

NMT这样的过程直接学习源语言到目标语言，省去了训练一大堆复杂NLP子系统的依赖，依靠大量的训练数据（平行语聊库，比如同一本书的中文和英文版本），直接让深度神经网络去学习拟合。熟悉深度学习的朋友可能会意识到，这样的方法一个极大的优势就是 省去了很多人工特征选择和调参的步骤 。听说前两年，有个做神经网络图像处理的教授，在不太了解NLP的基础上，硬生生地搭建了一套可以匹敌传统PBMT的机器翻译系统，后者可是十几年来多少奋战在第一线的NLP同志一砖一瓦垒起来的啊。而且，相比于传统PBMT一个词组一个词组的独立翻译，NMT这样end-to-end翻译出来的语言更加自然流畅。

2015年，Yoshua Bengio团队进一步，加入了Attention的概念。稍微区别于上面描述的Encoder-Decoder方法，基于Attention的Decoder逻辑在从隐层h中读取信息输出的时候，会根据现在正在翻译的是哪个词，自动调整对隐层的读入权重。即翻译每个词的时候，会更加有侧重点，这样也模拟了传统翻译中词组对词组的对应翻译的过程。Attention模块其实也就是一个小型神经网络，嵌入在Encoder-decoder之间的，跟着整个神经网络训练的时候一起优化训练出来的。

Bengio团队的这个工作也奠定了后序很多NMT商业系统的基础，也包括Google这次发布的GNMT。

Google这次在算法上、尤其是工程上对学术界的NMT方法提出了多项改进，才促成了这次Google NMT系统的上线。

学术上的NMT虽然取得了丰硕的成果，但在实际的产品中NMT的效果却比不上PBMT。究其原因Google在技术报告[2]中总结了三点：

1、训练和预测的速度太慢。

要获得更好的模拟效果，就要用更深层的神经网络来拟合参数（下面会提到，GNMT用了8层的Stack LSTM来做Encoder）。这么复杂的神经网络在预测的时候就要耗费大量的资源，远远慢于PBMT的系统。并且在训练的时候拟合这么大规模的预料，可能要很久很久才能训练一次，这样不利于快速迭代改进调整模型参数。

2、NMT在处理不常见的词语的时候比较薄弱。

比如一些数字、或者专有名词。在传统PBMT系统中，可以简单地把这些词原封不动的copy到翻译句子中；但是在NMT中，这样的操作就无法有效的进行。

3、有时候NMT无法对输入源句子的所有部分进行翻译，这样会造成很奇怪的结果。

Google NMT的主要神经网络架构图如下：

回顾神经网络机器翻译上线历程 | 深度

仔细看，其实还是带Attenion的Encoder-Decoder逻辑。Encoder是由8层LSTM组成，最下面两层是一个 双向LSTM ，可以从前到后以及从后往前理解一遍输入的源语言输入。中间的蓝色模块就是 Attention模块 ，负责对Encoder的逻辑进行加权平均输出到Decoder层。 Decoder模块 也是一个8层的LSTM，最终连接到Softmax层，一个词一个词输出最终的目标语言词语的概率分布。

算法上，论文中还提到了一些创新点。包括引入Wordpiece来对单词进行更细粒度的建模，来解决上面提到的不常见词语的问题；以及在Decoding结束之后，搜索最佳输出序列的时候，引入coverage penalty的概念，来鼓励Decoder输出更加完整的翻译句子，以解决有时候NMT有时候无法完整的翻译整句的情况。

工程上，报告里面着重谈到了几个 性能优化 的重点：

8层的LSTM堆叠起来，大大增加了神经网络的表达能力，在海量的数据下可以获得更好的模型效果。不过这样的堆叠会直接导致模型太庞大不可训练，在梯度反向传播的时候，很容易出现梯度弥散或梯度爆炸的问题。过去的研究证明[5]，Residual Connection的方式，直接去学习残差可能会带来更好的效果，避免了深度网络中反向传播中出现的梯度反向传播可能会发生的问题。在上面的Google NMT架构图中，从倒数第三层开始都会引入Residual Connection。

与此同时，在工程上Google也进行了非常多的优化，来减少训练和实时翻译时候的延迟问题。比如训练数据的时候，数据会分成n等份，交给不同的GPU去异步训练，然后再汇总到统一的参数服务器；同时，Encoder和Decoder的不同层的LSTM会在不同的GPU上运行，因为更上一层的LSTM不必等到下一层的神经网络完全计算完毕再开始工作；即使对于最后的Softmax输出层，如果最后输出词的维度太大，也会划分到不同的GPU上并行处理。可谓不放过丝毫并行的机会。

底层基础计算平台的支持。 Google NMT采用了自家的Tensorflow深度学习框架，并运行在Google专门为深度学习打造的TPU（Tensor Processing Unit）上，当年的AlphaGo也是由TPU提供支持。在对于模型参数的计算上，也大量应用了Quantized计算的技术：

从软件框架到定制硬件，相互配合，追求最极致的性能。在这篇报告里，有着长长的作者列表，最后赫然列着Google工程架构大神Jeffrey Dean的名字，他是当年一手创造了Map Reduce、Big Table等产品的Google奠基者之一。

Google这次的论文，基本框架仍然是带Attention模块的Encoder-Decoder。而且国内厂商，比如百度和搜狗，也发布了类似的神经网络机器翻译系统。百度早在去年，就发布“工业界第一款NMT系统”。不过，Google毕竟是机器翻译界的标杆，这次披露的论文也揭示了很多他们为了大规模商业化做出的努力，因此在业界引起了不小的震动。

注： [1] A Neural Network for Machine Translation, at Production Scale

[2]Wu, Y., Schuster, M., Chen, Z., Le, Q. V., Norouzi, M., Macherey, W., et al. (2016, September 26). Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation.

[3]Cho, K., van Merrienboer, B., Gulcehre, C., Bougares, F., Schwenk, H., and Bengio, Y. (2014a). Learning phrase representations using RNN encoder-decoder for statistical machine translation. In Proceedings of the Empiricial Methods in Natural Language Processing (EMNLP 2014).

[4]Sutskever, I., Vinyals, O., and Le, Q. (2014). Sequence to sequence learning with neural networks. In Advances in Neural Information Processing Systems (NIPS 2014).

[5]He, K., Zhang, X., Ren, S., & Sun, J. (1512). Deep residual learning for image recognition. arXiv preprint (2015).

原创文章，未经授权禁止转载。详情见转载须知。

回顾神经网络机器翻译上线历程 | 深度

谷普下载提醒您

本文链接：http://www.gpxz.com/article/8fe8e737ae4aba12d3f5.html

上一篇：事故疑致谷歌搜索Gmail多项服务全球性宕机

下一篇：美国数字财富管理从业者都在关注哪些领域智

二维码生成/解码器

二维码生成器是站长工具新推出的一款好用便捷实用工具，可以制作各种用户需求的各种二维码，欢迎经常使用。

站长资源 2024-11-13 11:07:41

火车头私有云采集

火车头私有云为客户提供一整套的数据采集解决方案，解决大数据量采集及存储、突破网站防采集反爬、多端分布式采集、跨平台支持主流操作系统部署、时事舆情监控、品牌舆情监控等功能。

新闻资讯 2024-07-11 13:26:19

重庆市九龙坡区人民政府

重庆市九龙坡区人民政府公众信息网

行业信息 2024-07-11 13:38:23

泰久信息

深圳市泰久信息系统股份有限公司拥有丰富的智慧旅游与智慧影院实战建设经验,专注于各地旅游景区以及影院提供整体建设解决方案,帮助景区和影院实现线上线下移动O2O技术服务。

商业服务 2024-08-18 00:07:16

船舶五金机电网

此处为网站描述内容

网站模板 2024-08-18 17:32:10

88ICON

88ICON是免费设计素材网站，88ICON提供png图片、psd图片、矢量图片、背景图片、banner、ppt模板、图标icon、艺术字、海报展板、摄影照片、卡通插画、电商主图、文案字库、音效配乐等内容的免费下载。

卡通动漫 2024-08-12 18:35:56

上海问涂信息技术有限公司

上海问涂信息技术有限公司(wentu.info)专业的微信小程序开发定制制作公司，最全、最热门、最实用的微信小程序，适合餐饮，商城，商家打折促销各类小程序开发应用。

网络应用 2024-11-13 12:25:06

广州华兴康复医院【官方网站】

广州华兴康复医院是一家集医、教、研、预防、康复、保健为一体的现代化综合性医院，为不同层次的人群提供优雅舒适的就医院环境和温馨的医疗服务。

网站模板 2024-11-21 19:37:04

个人隐私

华江生物亲子鉴定中心，是一家专门提供广州、珠海、江门亲子鉴定咨询服务的机构，可以提供个人隐私亲子鉴定、入学亲子鉴定、上户口亲子鉴定、无创胎儿亲子鉴定、亲缘关系鉴定等咨询服务。鉴定结果3-5个工作日发放，鉴定报告全国有效

商业服务 2024-11-25 19:39:43

上海睿浚电子科技有限公司

上海群安电子有限公司是以双绞线传输器、HD系列视频传输以及专业电涌保护技术为导向，集技术研究、产品开发、生产及营销为一体的高新技术公司。

电影视频 2024-11-26 18:59:06

东莞破碎机

东莞捷斯雅是一家专业研发机械设备的生产厂家,主营:除湿干燥机,模具控温机,塑料干燥机,东莞干燥机,高温模温机,工业冷水机,水式恒温机等业务,【咨询热线】13925743109

管理咨询 2024-11-27 23:39:32

IC交易网

IC交易网(www.ic.net.cn)是IC电子元器件的专业交易平台。IC网站,IC型号,IC供求,IC库存,IC查询,ICGOO

网站模板 2024-12-06 13:11:35

致矿机论斤卖英伟达和比特大陆担心吗矿难比特币 (矿机贱卖)

比特币出现暴涨暴跌的行情并不少见，最近一周比特币又开启了狂跌模式，根据Coinbase数据，北京时间21日凌晨比特币价格跌破4100美元，本周累计跌幅达30%，并创去年9月份以来的价格新低，这一轮比特币的暴跌让部分中小型矿场无奈转卖矿机清盘，甚至被人按照废铁的价格论斤卖，这对矿机芯片的重要提供商英伟达和比特大陆自然不是一个好消息，那他...。

2024-12-09 21:07:00

HTT加州轨道建设将推迟完工 One 笑了 Hyperloop (轨道加州是几号线)

作为超级高铁领域的领头者，虽然HyperloopOne似乎更受众人关注，但是不得不承认，美国超回路列车运输技术公司，HyperloopTransportationTechnologies，简称HTT，是其最重要的竞争对手，今年1月，HTT公司对外宣布，他们即将打造出世界上第一个能够运载乘客的超级高铁Hyperloop系统，该项目已经...。

2024-12-03 16:09:57

世界人工智能大会探索下一代大模型的基础研究论坛超越边界 (世界人工智能大会)

当谈及未来世界时，我们已经站在一个令人兴奋的路口，这是一个融合科学、技术和创新的时代，而人工智能正是这个时代的核心驱动力，曾经我们根本无法想象，人类探索广袤宇宙、模拟真实世界的梦想已近在咫尺，从微观到宏观，从原子到星辰，探索未知，人工智能引领我们进入一个全新的境界，然而，新的挑战也随之而来，依托世界人工智能大会，由上海算法创新研究院、...。

2024-11-30 21:50:18

直播行业新红利！淘宝推出全托管服务 (直播行业新红线是什么)

都2024年了，现在入局淘宝直播还晚么，不晚！近日，淘宝再放大招，成立直播电商公司，为有意入淘开播的明星、KOL、MCN机构提供，保姆式，全托管运营服务，记者获悉，这项服务主要面向初入淘的，新手玩家，，为其提供精细化的托管运营服务，帮助其快速上手，适应淘系生态玩法，作为电商直播的开创者和主阵地，淘宝依托业内最丰富的货品池和最专业的电商...。

2024-11-30 19:06:22

看这一篇就够了关于深度学习与计算机视觉真的 (就看这个作文)

今年夏天，雷锋网将在深圳举办，全球人工智能与机器人创新大会，GAIR，，在本次大会上，我们将发布，人工智能与机器人Top25创新企业榜，，慧眼科技是我们重点关注的公司之一，今天，我们邀请到慧眼科技研发总监李汉曦，为我们带来深度学习与计算机视觉方面的内容分享，嘉宾介绍，李汉曦，慧眼科技研发总监，澳大利亚国立大学博士；曾任澳大利亚国家信...。

2024-11-30 18:03:41

虾皮Z8投影仪怎么样详细配置分析虾皮Z8优缺点有哪些 (虾皮z8投影仪怎么样)

发表在其它家用投影仪品牌2023，12，513，04虾皮Z8是一款造型如同扫地机器人一般的投影仪，具体虾皮Z8投影仪的参数配置如何呢，下面就来了解虾皮Z8投影仪的详细参数配置，看看虾皮Z8投影仪怎么样，有什么优缺点，实际使用需求是否可以满足用户的日常需求，一、虾皮Z8投影仪怎么样，1.亮度方面虾皮Z8采用的是LCD显示技术，因此亮度上...。

2024-11-28 16:55:22

带你全面了解极米H5硬件极米H5投影仪拆机 (带你全面了解国足新帅)

发表在投影仪拆机2023，6，2710，23又到了拆机环节，这次为大家展示的设备为极米H5，下面带大家一起为极米H5投影仪拆机，来看看极米H5内部结构究竟如何，目的是为了让更多的投影小伙伴了解自己正在使用的机器有什么硬件，以便后续机子出故障，自己心中也能有个谱，一、极米H5投影仪拆机步骤，投影仪的顶盖是由卡扣固定，并没有固定螺丝，我们...。

2024-11-28 14:43:11

3115广告联盟站内互动数据分析 (3158广告)

代码说明，本页面的认证代码为3115广告联盟专用评测代码，站长需懂简单html知识，直接复制代码粘贴到联盟网站相应页面即可使用，本代码不适用于其他广告联盟网站请勿获取！文字认证，文字链接代码认证适用所有类型的广告联盟，复制代码后放在3115广告联盟网站首页底部或友情链接位置处，普通认证，普通联盟认证标志适用所有类型的广告联盟，能有效提...。

2024-11-19 16:40:59

涂歌迟迟不退我押金 (涂歌里抃猜生肖)

申明，1.以上内容仅代表揭发者自己，不代表黑猫揭发立场，2.未经授权，本平台案例制止任何转载，违者将被清查法律责任，3.黑猫揭发处置揭发不收取任何费用，凡以黑猫揭发名义不要钱的均为混充、诈骗行为，请及时报警并与黑猫官网反应，揭发邮箱heimaotousu@vip.sina.com，4.请大家选用官网渠道处置生产纠纷，不要轻信第三方机构...。

2024-07-17 06:50:36

北约休想甩给中国锅国内锐评丨制作乌克兰危机的 (北约退出国家)

外地期间10日，北约华盛顿峰会颁布宣言，在北约配合美国遏华策略的背景下，这份宣言对中国启动了恶意攻打，它宣称中国对北约利益、安保和价值形成应战，诬称中国是俄乌抵触的，选择性允许者，，对跨大东洋安保形成系统性应战，作为俄乌抵触的始作俑者，北约非但不反躬自省，反而对不时劝和促谈的中国，甩锅，栽赃，让环球再次见识了这个，热战遗孽，的本性，时...。

2024-07-13 05:52:13

普法入人心宪法进社区 (普法宣传深入人心)

派出所民警向居民发放宣传手册，本报实习记者杨红霞摄，今日是国度宪法日，大家可以经过普法小册子了解一下国度赋予我们了哪些权益，这个防电信坑骗手册大家可得好难看一下，哪些狗不能养，我们也得了解一下，包全自己也包全他人，……12月4日，在我国第十个国度宪法日、第六个，宪法宣传周，之际，西宁市城西区彭家寨镇富兴路社区联结彭家寨司法所、...。

2024-07-03 23:22:42

王者荣耀赛事战令系统王者荣耀赛事战令解析

王者荣耀赛事战令系统解析是2265小编为你带来的王者荣耀战令系统分析。更好的帮助你了解王者荣耀中的这个功能，更好的根据自己的需求进行选择，相信你已经迫不及待了，赶快来2265安卓网下载试试吧！系统规则赛事战令开启后，所有召唤师登录游戏就可以免费解

2023-10-11 01:49:17

文章推荐

传统行业=产业互联网新华三如何挖掘产业价值互联网 (传统行业产品经理)

雷锋网消息，紫光旗下新华三集团，第十届互联网夏季论坛，近日正式召开，随着消费互联网向产业互联网升级，新华三这样的企业级市场大玩家也面临全新的机遇和变革，在新华三看来，产业互联网相比消费互联网是百倍甚至千倍的市场空间，新华三认为，产业互联网具备以下商业特点，设备联网、数据通过联网汇聚在一个平台上、利用平台数据形成智能，创造价值、在平台上...。

2024-12-09 20:49:04

资讯动态

Watson之眼协助影像医生读片走出实验室 (watsons什么牌子)

认知健康的时代已经来临了，未来的领导者将是那些有能力驾驭认知计算的人，这是IBM官网上的一段话，为了成为未来的领导者，IBM在路上，据雷锋网消息，2016年11月29日，在北美放射学年会上，IBMWatson健康和北美放射学会组成，Watson之眼，队亮相，向放射学家展示了Watson从头到尾分析X片的过程，很快，12月16日，，...。

2024-12-09 16:39:25

资讯动态

2024青少年弱视矫正加盟品牌 (2024青少年身高体重标准表图片)

在探讨2024年青少年弱视矫正加盟品牌时，易视界确实是一个值得深入了解和考虑的品牌，以下是对易视界的详细分析，一、品牌影响力与认可度易视界作为青少年视力矫正的全国连锁品牌，拥有多年的行业经验和成熟技术，其在市场上具有较高的认可度和美誉度，为加盟商提供了稳定的客流和信任基础，降低了市场推广的难度和成本，这种品牌实力是易视界加盟的一大优势...。

2024-12-02 22:03:35

创业加盟

单玻璃纯平背盖红魔9 Pro系列发布 6500mAh电池真全面屏 4399元起 (单面玻璃系列)

11月23日，红魔9Pro系列正式发布，米粉心中最酷的MIX5，单块玻璃的纯平后盖，6.8英寸2480x1116屏下前摄全面屏，6500mAh电池，定价4399元起，红魔9Pro和红魔9Pro，主要是电池容量、快充功率、容量版本的差别，其余一致，红魔9Pro有暗夜骑士、氘锋透明暗夜、氘锋透明银翼3款配色，163.98×76.35×8....。

2024-12-02 17:59:02

手机评测

C1投影仪评测更有活力的品牌更具年轻的设计 emotn (2021投影仪测评)

发表在投影仪评测2021，11，2916，16千元级投影仪里就真的没有好产品吗，饭可以乱吃，话可不能乱说，眼下不少采用LED光源的LCD投影技术的产品都各放异彩，这其中就有一家主打年轻且充满活力的新晋品牌—emotn投影仪，emotn投影仪在产品画质和设计上集聚了创新与美感；旗下emotnC1就是一款千元价位的巨幕影院，下面就一起...。

2024-11-29 01:24:41

网络百科

回顾Google神经网络机器翻译上线历程 (回顾工作历程经典句子)

相关文章

文章推荐