不会说人话?Google又被专业翻译diss (不会说人话的人是畜牲不如的人)

春节假期已经过去几天了,不知道大家有没有吃好玩好?朋友圈这几天几乎被美食、萌娃视频和景点照片刷屏了,让人好生羡慕。

不会说人话?Google又被翻译diss IT业界 第1张

朋友圈(为保护隐私,一些信息打了码)

不知道大家注意到没有,上面四条朋友圈消息,有一条是在俄罗斯发出来的。实际上,在这个传统上要回乡团聚的日子里,也有相当一部分人选择全家出国旅游。

根据中国旅行研究院与携程旅行统计,今年春节预计中国出境游人数将达到650万人次,中国人在春节假日出境旅游几乎可以“席卷全球”。

但出国旅游就有个问题:如何在当地交流?这可不是光学会几句英语就能解决的问题,如果你要去不以英语为母语的国家,可能就麻烦了,不是每个当地人都会讲英语。

这时候, 手机 上的翻译 软件 就有用处。

目前出国旅游比较流行的是Google翻译。对于中国大陆用户来说,近期比较重要的更新是在去年的3月29日,Google更新后的翻译App可以在中国大陆地区无障碍使用,经过一波宣传,用的人越来越多。

在 知乎 上“出国旅游有什么好的便携式翻译机或App可用?”这一问题中,得赞最多的回答首推Google翻译App。

不会说人话?Google又被翻译diss IT业界 第2张

知乎上“出国旅游有什么好的便携式翻译机或App可用?”这一问题中,得赞最多的回答

但机器翻译一向被专业译员鄙视,即使Google为翻译加持神经 网络 技术也没有改变很多人类译员的看法。

最近美国《大西洋月刊》上的一篇文章中,作者道格拉斯·霍夫施塔特(Douglas Hofstadter)对Google翻译diss(侮辱)了一把。他通过英语、法语、德语和中文四种语言翻译比对,论证出一个结果:Google翻译即使应用 人工智能 技术,也没有真正理解语言。

他在文章中举了中文翻译英文的例子,文本是杨绛的《我们仨》中的一段。

原文:

Google翻译版本:

作者翻译版本:

作者在这里指出了Google版本不少问题:

翻译中一次也没提到过人名“锺书”,而是分别翻译成了“he”、“the book”和“the book of fear in the book”。很明显,Google翻译没有理解出这是个人名;

原文是“他仍兼管研究生”,但翻译变成了“He is still a graduate student”(他仍是个研究生);

Google译文中的“Mao Tse Translation Committee”这一短语,漏掉了毛泽东主席(Chairman Mao Tse Tung)名字的最后一个字,而且“毛选翻译委员会”明显也不是这么翻译;

原文的“徐永煐”(Xu Yongying)被翻译成了“Xu Yongjian”。

“客去后”被翻译成了“guest to go”(客人要走)。

“南书房行走”中的“行走“被翻译成“walking”,这也是Google没有理解原词含义。

不光是这一段,作者从他当下看的书中选择了好多个段落进行测试,几乎每一段都会出现形式不一、大小各异的翻译错误,其中也包括上文所述的无法理解的句子。

为什么Google翻译在上面的例子中还是不尽如人意?在作者看来,Google翻译只是类似于处理密码一样处理语句,而没有像人类一样“阅读“语句,它处理的符号和现实世界是分开的,没有现实体验,也就谈不上理解。

Google翻译不尽如人意,但它真的完全没有用吗?

既然Google翻译在前面的例子中如此糟糕,那对于出国的游客来说,Google翻译还有用吗?

前面dissGoogle翻译的作者霍夫施塔特指出,Google翻译目前还不能做到准确理解语句,但霍夫施塔特只分析了一类文本,那就是文学作品类。

Google翻译面对的可绝不仅仅是想了解文学作品的人,对于不同的需求,它的表现会不会有所变化?换句话说,对于出国游客来说,Google翻译的表现会不会更好一点?做一个简单测试也许能看出来。

新浪 科技以 百度 上各类“出国英语XXX句”中随机挑选的10个出国常见语句为样本,输入到iOS版Google翻译App中测试(这里的测试语句除了常见的问路类型,还有相对比较复杂的),然后将这10句原文和翻译分成三类,分别是“有歧义”、“不常用”和“正确”类型,结果如下:

不会说人话?Google又被翻译diss IT业界 第3张

分类结果

这里要注意的是,这里分类的依据是可理解的程度,而不是语法。这就意味着只要能够被理解且不出现歧义,即使是有明显语法错误的,也可以被分到“不常用”类别,比如“How to get to the subway station”这种有语法错误的句子,但还能通过单词理解,就分到“不常用”类别中。

但即使按照这样不太严格的标准来分类, 可理解与有误解的比例还是6:4,以下就来说说四个“有歧义”句子可能出现的误解:

“我要退这张票”翻译成“I want to withdraw this ticket”,可能会被误解成“我要拿走这张票”,因为“withdraw”有“拿走”的意思,而没有“退票”的含义;

“我想把这张50美元换开”中的“换开”不能翻译成“swap”,因为这个英语单词不能用于“换零钱”这个含义中;

“能给我张退税表吗?”的Google翻译“Can you give me a tax return?”,把“表格”(form)这个含义在翻译中丢失了,而且“tax return”是“报税”的意思,而不是“退税”的意思;

“这有免税店吗?”被Google翻译错译了“Is this duty-free shop?”(这家店是免税店吗?),这是一个只要稍微学过英语的人都会看出来的错误。

从随机的测试结果看来,Google翻译的准确度离满足游客的需要还是差了一些距离。

为什么有了人工智能加持,Google翻译还是不够好?

前文中说过,Google近期比较重要的更新是可以在中国大陆地区无障碍使用。但实际上, Google在前年有一次更重要的更新,那就是将翻译 系统 从原来的“基于词组的机器翻译”(PBMT)转变为“神经机器翻译”(NMT),也就是将神经网络技术引入到机器翻译中。

Google宣称,经过此次更新,翻译结果更加通顺,可用性更强。

按照百度百科的说法,神经网络“是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型”。这个定义非专业人士不太好理解,没关系,只要知道神经网络是实现人工智能的基础性技术就好了。

人工智能是这几年的大热新闻关键词和最流行的技术,连今年的春节晚会上都展示了人工智能技术加持的自动驾驶汽车。但新闻中常常被讲的神乎其神的人工智能怎么在语言翻译这方面都做不好?前文中那个dissGoogle翻译的作者霍夫施塔特给了我们一个解释。

霍夫施塔特认为, 很多人其实对人工智能的期待过高,从而“脑补过度”,这在心理学上被称为“Eliza效应”,大概意思是说人会过度解读机器的结果。

这里的“Eliza”是上个世纪60年代的早期人工智能 项目 ,能通过脚本理解简单的自然语言,并能进行类似于人类的互动,与它互动过的许多人都认为Eliza确实了解他们内心的感觉。在霍夫施塔特看来,即使是一些人工智能领域的研究者,也难免落入“Eliza”效应的陷阱中。

霍夫施塔特认为,人类的翻译是一个“阅读-内化-表达”的过程,人类读到文本之后,会联想到相关的现实场景,然后基于场景给出另一种语言对于这种场景的表达。

但Google翻译只是一个“解码”过程,即使是人工智能加持,Google翻译也没有真正理解文本,它只是将原文看成被加密的译文,只要解码即可翻译。这样的过程缺乏现实体验,谈不上理解,当然就难免出现错误。

有人也许会问,神经网络技术就不能模仿人类 思维 来翻译吗?霍夫施塔特也给出了自己的答案,他认为这类机器翻译目前还没有超越单词和短语层面,这样的人工智能在“读”到文本之后,只是联想到对应语言的单词,而不是联想到现实场景,尽管用了复杂的统计词语聚类算法,但这和人类的翻译思维还是不一样。

这种技术加持下的Google翻译,虽然能将原文和译文的词语对应起来,还有一定能力组织成句子,但还是难以理解。

霍夫施塔特的说法在新浪科技的测试中也得到验证。此前的出国常用语句翻译测试,从“退票”翻译成“withdraw ticket”和“换开”翻译成“swap”这两个例子中,就能看出Google翻译目前还停留在词对词或者短语对短语的层面,而不是联想到实际场景,即使按照正确的语法组织起来,也难以让人理解。

借用一位翻译学教授的话: “你每一个字看得懂,但连起来就不是人说的话。”

由此看出,Google翻译距离完全无障碍的应用还有一定距离。在这种情况下,出国的游客除了在手机装上几个翻译App之外,最好还是多学点常用英语,再不济也练一练画图技能,以备不时之需。

当然,人工智能的研究者还是要更深入的探究人类思维,并且开发出一款更好的翻译App;如果真有这么一天,专业译员也会对机器肃然起敬了。

最后,新浪科技祝大家春节假期快乐,不管你是在国外还是国内。

不会说人话?Google又被翻译diss IT业界 第4张

来源: 松松科技 QQ/微信:lusongsong7

免费推广咨询提供免费推广咨询服务 电话: 185-1032-1726少走弯路立即咨询……
全局中部横幅
九九信息网

九九信息网为您提供房产、车辆、宠物、生活服务、商务服务、教育培训、招商加盟等分类信息,您可以发布和查看分类信息。

关注森林

林草平台:关注林业和草原,传播生态文化,打造林草行业品牌,保护生物多样性,应对气候变化。关注森林isenlin.cn:我们致力于联接森林、林业和公众。

南通万户

南通万户是南通地区用友软件销售服务中心(Tel:18862981058),主要销售服务用友T6/用友T3,15年专业从事用友软件的研发、销售、服务以及运营维护。

论文哥

论文哥免费论文查重检测,首款免费论文检测软件,为毕业生提供专业的论文查重,查重入口,查重软件,查重网站等一站式服务

NRKXO益品居照明品牌官网

NRKXO益品居照明,国家注册商标,高端家用灯具品牌,拥有多个国家外观设计专利。行业首家明确整灯质保,行业独家五年内质量问题配件、运费、光源全免!

重庆货运公司,重庆物流公司

洲胜物流是一家从事重庆到全国的陆运、空运、海运物流服务的重庆物流公司。洲胜物流公司以快捷、准时、安全、优惠的服务宗旨为广大客户服务!

贵阳金刚砂

贵州鹏程新材料是专业的金刚砂材料生产厂家,主要生产:金刚砂、石英砂、金刚砂骨料、彩砂材料、不发火地坪材料、艺术压花地坪材料、聚合物防滑坡道材料、金刚砂耐磨地坪材料,地面快速修补材料、混凝土密封固化剂,彩色艺术压花地坪材料、海绵城市彩色透水地坪等材料厂家,买金刚砂请到贵州鹏程新材料厂

下水道疏通

立刻通(liketong.cn)专业提供全国各城市下水道疏通,管道疏通,马桶疏通,地漏疏通,化粪池清理,北京疏通,天津疏通,上海疏通,广州深圳疏通等各类管道堵塞疏通服务,咨询热线:400-8899-592.

夜店网

夜店网是一个关注中国电子音乐产业以及夜店Club发展的社区平台,用新视角解读现代夜店Club的价值和酒吧文化,夜店网致力于维护和推广中国电子音乐的发展,挖掘国内潜在的DJ电子音乐创作人。

广东瑞东勘察基础工程有限公司

广东瑞东勘察基础工程有限公司成立于2010年4月,注册资金1020万元,公司现有高级工程师、工程师、测绘技术员、注册人员等专业技术人员,公司现有计算机40余台,拥有单、双频全球卫星定位系统(GPS)2台、全站仪15台、JX-4A全数字摄影测量工作站、高精度电子水准仪、地下管线探测仪以及地理信息系统软件、地面移动测量系统软件、各种数据采集、图形编绘软件等,公司致力于制度化、正规化建设,已建立了符合国内工程管理模式的管理制度和工作程序,在质量控制上以项目为单位进行质量管理,避免和预防在项目实施中出现质量问题,将质量责任层层落实到个人。

零峡知识网

零峡知识网专业的门户信息网站,涵盖了|生活|科技|房产|互联网|汽车信息与一站的综合性专门户网站。

全局底部横幅