微软又向前走了一步 为了赶翻译下岗

文章编号:41594 资讯动态 2024-12-03 唯物微软翻译okweiwu

一名新入职场的翻译员,担心越来越厉害的机器翻译抢了自己饭碗,于是在知乎上发问,“这个行业还有没有前途?”老司机们纷纷上前安慰,其中一位说,年轻人你兔样兔森破,让机器翻译一下上面这个对话,看能不能搞定,再来担心吧。

不知道“年轻人”有没有去试。雷锋网去试了试,发现行业公认最厉害的 Google 翻译和微软翻译(Microsoft Translator),确实都搞不定这个极具中国特色的语音对话。但两者的表现,又是不一样的。

同一段语音,这是 Google 的结果:

为了赶下岗,微软又向前走了一步

这是微软的结果:

为了赶下岗,微软又向前走了一步

具体来说。使用语音翻译,Google 会完整保留所有字;微软则会把第一句中的语气词“啊”字省略掉,把第二句中的“意思”省略掉一个(可判定为误伤)。为什么?

TrueText:去掉“哼哼哈嘿”

为了赶下岗,微软又向前走了一步

微软告诉雷锋网,之所以省略掉“啊”以及误伤一个“意思”,是因为他们在语音翻译中运用了一项独门绝技——TrueText(智能文本校正)。在一份官方文档中,微软这么解释 TureText 的作用:

这就是微软的语音翻译技术,为“口头语”所做的优化之一。Olivier Fontana 是微软研究院 Microsoft Translator 产品战略总监,在八月中旬的一次沟通中, 他告诉雷锋网,我们平时说话,说出来的和写下来的表达方式是不一样的 (口头语和书面语),TrueText 可以把语音识别出的文字,变成机器更容易理解的、有意义的内容,这一技术微软在全球范围内是独一无二的。

因为工作关系,本文作者日常要处理不少采访速记,尽管文本经过速录员的“人工优化”——去掉了不少语气词,但通篇文档中找到几个连续的完整句子,几乎是不可能的。除了准备好的演讲稿,很少有人平时说话的时候可以用连贯的语句,表达自己的意思。人在说话时,本来就是磕磕绊绊的,是“话中有话”的,是“不言而喻”的,机器理解人的本意,再转换成另一种语言,更是难上加难。TrueText 技术相当于用机器做了口语文本内容的整理。

语音翻译:为对话而优化

为了赶下岗,微软又向前走了一步

很多人认为,语音翻译就是先把语音识别为文本,再把文本翻译为另一种语言的过程。其实不是这样。

Olivier Fontana 告诉雷锋网,微软尝试过这种简单拼接的方式,但翻译质量无法令人满意。最终微软的方案是,在语音识别阶段就为口语的识别做了特殊的输入优化,识别之后的文本经过 TrueText 技术的处理,再进入文本翻译阶段,文本翻译的输出结果也要为口语做优化,最终通过成熟的 TTS 技术让机器“读出来”翻译结果。

Olivier Fontana 说,在“实时对话场景”的翻译模型研发过程中,微软面临着三项关键的挑战:

微软介绍,针对口语的翻译优化,尤其是针对聊天对话内容的优化,以及 TrueText 技术,微软在业界都是唯一的。

Olivier Fontana 表示,传统机器翻译都是基于比较正式的文本翻译,微软则加入了大量基于口语对话的语料库。他透露,微软甚至还花钱请了很多人到 Skype Translator 上聊天,谈他们的假期,日常生活,作为口语数据进行搜集。

“对话即平台”

为了赶下岗,微软又向前走了一步

Skype Translator 的实时语音翻译技术,一经问世,就引发了行业关注。这是一项让两个不同语言的人,可以实时通过自己的母语进行语音进行沟通的“黑科技”(见 视频 )。微软最早在 2012 年天津的一次学术活动上展示了这项技术。2014年12月,这项技术在 Skype Translator 应用上实现商用,之后陆续运用到桌面版 Skype Translator 和Microsoft Translator 手机App中。今年上半年,这项技术迎来新的里程碑,微软将 API 开放给所有人,方便开发者将其集成到自己的应用中。

微软翻译针对语音“对话”进行的种种优化,很容易让人联想到,这家公司在年初 Build 大会上公布的战略“对话即平台”。他们还透露,在今年年底前,将为Office 365企业用户提供 Skype Meeting Broadcast 服务。通过该服务,可以自动为网络会议添加字幕,并将会议实时地翻译成不同语言展现出来。

注:本文曾用标题《微软翻译:别人还在为“书面语”奋斗,我们已经为“口头语”优化》

原创文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
秒收录网

秒收录网(msl.wang)是一个综合行业网站自动免费收录平台,信息推广、友链发布,为收录各行业优秀正规网站,每天都拥有几万的蜘蛛来访。并提供用户可以免费发布友链。

加载中

欢迎来到鼎誉瓶盖发卡网,支持微信、支付宝、QQ钱包支付,支持7X24无人值守自动发货

浩方智能

浩方智能小桔网络

远程智能

浙江科洪电器有限公司位于温州乐清市柳市镇,主要经营配电开关控制设备、高低压电器及成套设备等产业,始终为客户提供高质量的产品、专业的技术支持以及健全的售后服务。

小泽网络

小泽网络团队专注于前后端开发和UI定制,专为客户提供定制化的web,软件端解决方案和优质的用户界面设计。

江西标识牌制作价格

衢州市顺风广告标识标牌制造有限公司是一家标识标牌生产厂家,主营雕塑、金属标牌、制作标牌、标识标牌制作、标牌标识制作、标识牌制作、LED发光字制作、迷你发光字等,产品价格优惠,广受客户好评,业务覆盖全国,主要覆盖浙江衢州、杭州、金华、丽水、上海、安徽、江西等地。

回转轴承

徐州丰禾智能科技有限公司是制造回转支承,回转驱动,转盘轴承的生产厂家,致力于为客户创造更多价值,采购热线:0516-80278855。

青县电子机箱

海达电子机箱厂座落在河北青县农场四分场,是专业生产电子机箱,机柜的厂家,欢迎来电咨询,质量过硬,价格低廉,在广大用户中享有盛誉。

Ghawar加维

Ghawar加维是全新的消费者视角移动端洞察平台,凭借颠覆性洞察能力和创新性数据技术,掌握跨触点、端到端的消费者全链路数据,重塑消费者历程。目前Ghawar已推出七大成熟解决方案,分别是创意大全书、媒介情报站、种草加速器、战役评估师、日常投放跟踪、人群画像馆与链路透视镜,打通营销链路各个堵点:从媒介情报、媒介策略与优化、投放效果跟踪、人群链路与洞察四大维度切入,涵盖软硬广投放模式和声量情报、全方位TA特征偏好解析、消费者行为及心智的品类链路剖析、移动端全域行业沟通素材、高效种草引流的媒体和内容策略、Campaign人群触达和长短期效果评估、以及持续监测本品投放触达和种草效果等服务,全面重塑消费者链路。助力品牌完成“全域媒体扫描、后链路效果评估、策略优化与迭代”的闭环,重塑消费者链路,击破“数据孤岛”。

帝源教育

帝源教育为你提供小学语数英教材同步视频课程,小学名师讲解,让孩子在家也能学习。

全局底部横幅