Compose 神经网络可以帮你写 Gmail 谷歌 Smart 邮件了 (composition)

文章编号:46614 资讯动态 2024-12-10 谷歌SmartComposegmail邮箱

雷锋网 AI 科技评论按 :在 Google I/O 2018 上,除了 Google 助手给餐馆打电话的场景赢得现场观众的喝彩外,在用户写邮件时可预测下一句的 Smart Compose 技术同样也引得众人欢呼。近期,谷歌大脑团队首席软件工程师 Yonghui Wu 在 Google AI Po 出了这篇详细介绍 Smart Compose 原理的博文,雷锋网 AI 科技评论将其内容编译如下。

Google I/O 2018 上,谷歌介绍了 Gmail 中的一项新特性,智能预测拼写功能:Smart Compose,该新特性利用机器学习,交互式地为正在写邮件的用户提供补全句子的预测建议,从而让用户更快地撰写邮件。Smart Compose 基于此前智能回复(Smart Reply)技术开发而来,Smart Compose 提供了全新的方式来帮助用户撰写邮件,无论用户是在回一封来件还是从草稿箱起草一封新邮件。

谷歌 Smart Compose:神经网络可以帮你写 Gmail 邮件了

谷歌在开发 Smart Compose 的过程中,遭遇到了以下这些关键挑战:

找到对的模型

比如 ngram,neural bag-of-words(BoW)和 RNN language 这种典型的语言生成模型,它们是基于前缀词序列来预测下一个词的。然而,在一封邮件中,用户在当前邮件撰写会话中打下的单词会给模型一个信号,模型会利用该信号来预测下一个单词。为了结合更多用户想表达的上下文,谷歌的模型还会利用邮件主题和此前的邮件正文(假设用户正在回复一封刚刚收到的邮件)。

谷歌的方法是包含利用额外语境的一个方法,该方法是将问题转换成一个序列到序列(seq2seq)的机器翻译任务,其中源序列是邮件主题和上封邮件正文(假设存在上封邮件)的串联,用户正在写的邮件是目标序列。尽管该方法在预测质量上表现良好,但它的延迟要比谷歌严苛的延迟标准超出了好几个量级

为了提高预测质量,谷歌将一个 RNN-LM 神经网络与一个 BoW 模型结合起来,结合后的模型在速度上比 seq2seq 模型要快,且只轻微牺牲了预测质量。在该混合算法中,谷歌通过把词嵌套们平均分配在每个区域内,来对邮件主题和此前的邮件内容进行编码。随后谷歌将这些平均分配后的嵌套连接在一起,并在每次执行解码步骤时将它们提供给目标序列 RNN-LM,过程如下面的模型图解。

谷歌 Smart Compose:神经网络可以帮你写 Gmail 邮件了

Smart Compose RNN-LM 模型架构。将邮件主题和此前邮件信息进行编码,采用的方法是将它们的词嵌套平均分配在每一个区域内。随后,平均后的嵌套会在每次执行解码步骤时提供给目标序列 RNN-LM。

加速模型训练和服务

当然,一旦选定了这种建模方法,谷歌就必须调整各种模型超参数使用超过数十亿的样本来训练这些模型,所有的这些操作都相当费时。为了实现加速,谷歌使用了一个完整 TPUv2 Pod 来执行实验。在这情况下,谷歌能够在一天之内将一个模型训练至收敛状态

在谷歌训练出速度上更快的混合模型之后,初始版本的 Smart Compose 在一个标准 CPU 上运行时,依旧存在几百毫秒的平均服务延迟,这与 Smart Compose 努力预测语句来帮用户节省时间的特点是不相符的。幸运的是,谷歌可在推断期间使用 TPU 来大大地加速用户体验,通过分流 TPU 之上的大部分计算,谷歌可以将平均延迟改良至几十毫秒,同时也能大大增加单一机器可处理的服务请求数量。

公平性和隐私

由于语言理解模型会反映人类的认知偏倚,这样会导致得到多余的词汇联想和句子完成建议,所以在机器学习内实现公平至关重要。Caliskan et al. 在他们近期的「Semantics derived automatically from language corpora contain human-like biases」论文中指出,模型的词联想深陷于自然语言数据的偏倚数据中,这为打造任何一个语言模型都带来了相当的挑战。在模型训练过程中,谷歌积极地寻找方法来持续降低潜在的偏倚。另外,由于 Smart Compose 是基于数十亿的短语和句子进行训练,这与废品邮件机器学习模型的训练方法一致,谷歌已经进行了广泛的测试来确保,模型只记忆多种用户都使用的常识语句,关于常识语句的调查结果源自这篇论文 The Secret Sharer: Measuring Unintended Neural Network Memorization & Extracting Secrets()。

未来研究

谷歌将持续地研究改良语言生成模型的预测质量,为此谷歌会通过使用最先进的构架(如 Transformer,RNMT+等)和试用最新、最先进的训练技术来实现这一目标。一旦模型的实验结果满足了谷歌的严格延迟约束条件,谷歌就会把这些更加的先进模型部署到自家产品上去。另外,谷歌还在进行结合个人语言模型的研究,该模型的目的是给系统增加一个新特性,让它能够更加准确地模拟每个用户自己的写作风格。

via Google AI Blog,雷锋网 AI 科技评论编译。

原创文章,未经授权禁止转载。详情见 转载须知 。

谷歌 Smart Compose:神经网络可以帮你写 Gmail 邮件了

全局中部横幅
“detail.zol.com.cn”的百度权重查询结果

查询百度权重和百度的关键字排名,查询360权重和360的关键字排名

北京电信•中国电信官方网站

中国电信官方网站•北京(原北京中国电信网上营业厅)-在线销售数码通讯、套餐/靓号等产品、正品低价、品质保障。同时为用户提供充值缴费、宽带办理、费用查询、在线客服、及品牌专区等全方位的网上自助服务;中国电信——世界触手可及。

普通型冷冻干燥机

宁波市双嘉仪器有限公司(www.nbsjialab.com)是优质的中试冷冻干燥机,生物制品冻干机,冬虫夏草冻干机,普通型冷冻干燥机,大型食品冻干机,立式/台式冷冻干燥机,压盖型冷冻式干燥机生产厂家,宁波市双嘉仪器有限公司不仅具有精湛的技术水平,更有良好的售后服务和优质的解决方案,欢迎来电洽谈

地热天气网

地热天气网_提供24小时、今天、明天、未来一周7天、10天、15天、30天及40天天气预报查询服务。

重庆皮肤科医院排名「迪邦皮肤病」重庆皮肤科最有名的医院

重庆哪家皮肤科医院看白癜风/牛皮癣好一点「重庆迪邦皮肤病医院」是重庆皮肤科最有名的医院,位列重庆皮肤科医院排名第一,是重庆市医保定点医院,专注治疗白癜风、牛皮癣等皮肤疾病,咨询电话:400-698-8568。

南平市建阳区福达竹木机械制造有限公司

南平市建阳区福达竹木机械制造有限公司

手机游戏

CF蘑菇资源网站专注于推广绿色软件,官方软件,免费为大家提供最新最全的官方软件和绿色软件下载,打造国内最好绿色软件下载站,官方软件,绿色软件免费下载站!

永磁调速器

南京艾凌节能技术有限公司简称艾凌节能,是因永磁调速技术而成立,专做产品:永磁调速器,永磁耦合器,永磁联轴器,永磁调速器系统,套筒式永磁调速器。永磁调速节能方案提供者和实践者。从此开启了完全自主知识产权的研究和产业化。

郑州永信工业搪瓷机械有限公司

郑州永信工业搪瓷机械有限公司生产工艺先进、技术领先,瓷面光洁无污染;产品传热效率高,耐腐能力强,使用效果好。服务热线:13213082890

管道疏通

邻家快修提供附近管道疏通、防水补漏、墙面翻新、家具维修、水电维修、开锁换锁、门窗维保、瓷砖地板修复、厨卫改造等服务,专业师傅24小时在线服务,覆盖全国城市,同时有专业的家修类知识和问答,是专业的家庭维修服务平台

真空泵厂家

重庆派若特科技作为真空泵厂家,专注于莱宝/爱德华/科威尔/英帕/鲍斯真空泵机组,重庆油泵的销售及服务.根据多年的实战经验,在选型设计方面有丰富的积累与创新,可以为客户提供优质的服务.欢迎新老客户来电咨询!

全局底部横幅