如何让AI像人类一样学习自然语言 CMU博士生杨植麟 (ai怎么让图片变成想要的形状)

文章编号:44947 资讯动态 2024-12-09 自然语言处理人工智能

雷锋网AI科技评论按 :近几年,由于深度神经网络的快速发展,自然语言处理借此取得了重大突破,但同时也达到了它的发展瓶颈期。因此,研究如何让 AI 像人类一样去学习自然语言成为了现在研究者们最关心的问题。

近期,在雷锋网 GAIR 大讲堂上,来自卡内基 · 梅隆大学三年级博士生杨植麟同学分享了无监督学习和情景化学习的一些最新进展,其中包括一篇 ICLR Oral 论文的解读。视频回放地址:

杨植麟,卡内基梅隆大学博士三年级,师从苹果人工智能主任 Ruslan S.,主要研究无监督深度学习及其在自然语言理解的应用;过去两年在 ICLR/NIPS/ICML 等人工智能顶会发表 11 篇文章 (9 篇一作);曾在 Facebook 人工智能实验室从事研究工作,本科以年级第一毕业于清华计算机系。

分享主题 :让人工智能像人类一样学习自然语言:无监督学习和情景化学习的最新进展

分享提纲

分享内容:

近几年,深度神经网络在自然语言学习任务上取得众多突破,但是仍然依赖于大规模静态标注数据。与此相反,人类学习语言的时候并不需要大规模监督信号,并且可通过与环境的交互理解语言。

先来回顾一下近些年 NLP 发展的状况。NLP 发展的黄金时期出现在 2013 年末和 2014 年这段时间。这段时间出现三个非常重要的技术:Word embeddings;Seq2seq;Attention,这三项技术基本奠定了 2014 年之后的 NLP 发展基础。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

从2015年到现在,大家做的主要事情就是把三个技术都用上,做各种各样的变种,用在不同的任务上来检验模型效果。单从效果上来看,还是有到很多突破的。但有两点需要注意,依赖监督学习可能已经做到了极限;监督学习有两个问题,一是依赖大规模标注数据集,二是依赖静态数据集。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

反观人类是如何学习语言的?人类只需要非常少的监督信号,通过动态与环境交互,在环境中执行一些行为,得到一些反馈,进行学习语言。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

如果让机器像人类一样学习,就需要突破监督学习的瓶颈。接下来讲的就是在这一方面的探索,怎样让机器像人类一样学习自然语言。

先看一下这个,Mastering the Dungeon : Grounded Language Learning by Mechanical Turker Descent。其中的

Mastering the Dungeon 是我们创造的一个游戏环境,Mechanical Turker Descent 是我们发明的算法名字。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

图中的两个人(Turker1 和 Turker2)相当于平台上的两个用户。他们每个人负责训练一个 dragon,如果 dragon 赢了,对应的人会获得奖励。这样 Turker 就会受到激励,会给 dragon 更好的样本学习,让它在比赛中击败其他 dragon。

下图反应了 dragon 在游戏环境中具体是如何交互学习的,以及具体的游戏环境是怎么样的。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

这个交互学习算法的名字叫 Mechanical Turker Descent。第一步,每一个 Turker 会给 dragon 一些训练数据,第二步,用数据集训练出一个模型。第三步,这些模型会放在其他数据集上交互验证,每个模型会得到分数,获得高分的 Turker 会获得奖励。第四步,所有的数据将合并起来,进入下一轮,直到训练出比较好的 agent。

这个算法其实既有比赛,又有合作。Turker 为了赢得奖励,所以他们之间相互比赛,促使他们提供更好的数据给 dragon。同时他们又是合作的,在每一轮结束后都会把数据合并起来进入下一轮,这些数据在下一轮都会共享。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

这样的算法有四个优点:

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

实验结果

通过实验得出几点结论,实验中的交互学习算法确实比传统通过标记数据的静态学习效果要好。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

limit 是指限制 Turker 每一轮给的训练数据数量。在给同样奖励的情况下,发现如果不限制 Turker,他会多给 dragon 30% 的数据,最终的模型表现效果也较好。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

在模型有反馈和没有反馈的两种不同情况下,其性能表现也有很大的差别。如果把模型反馈去掉,所有的指标都会下降,说明动态调整训练数据的动态分布是非常重要的。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

接下来为大家介绍一篇 ICLR Oral 论文。论文题目为:Breaking the Softmax Bottleneck A High-Rank RNN Language Model。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

我们首先证明了softmax存在表达能力上的根本缺陷,继而提出了混合softmax (mixture of softmaxes)的方法,先算K softmaxes,然后用weighted sum得到最后的概率。这个方法在大家常用的语言模型数据集中,取得了当前最好的结果。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

由于篇幅限制,这里就不做文字解读了,大家如果感兴趣可以直接去看这篇论文或者观看视频回放:

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

未来最重要的两个研究方向,一个是无监督学习,另一个是 language grounding。

无监督学习可以学习有价值的和可传递的特征表示,可以改善低资源和高资源任务; 可以用于监督或无监督任务的元学习。language grounding 可以提供足够复杂的环境,是一种非常有效的学习算法。

以上就是本期嘉宾的全部分享内容。更多公开课视频请到雷锋网 AI 慕课学院观看。

关注微信公众号:AI 科技评论,可获取最新公开课直播时间预告。

原创文章,未经授权禁止转载。详情见 转载须知 。

CMU博士生杨植麟:如何让AI像一样学习自然语言?| 分享总结

全局中部横幅
中国台湾网

中国台湾网是中央台办和国台办管理的国家重点新闻网站,拥有庞大的涉台资源。全面报道台湾事务和两岸关系的重要新闻资讯,致力于传播两岸亲情,沟通两岸民意,服务两岸交流,是两岸网络信息枢纽和同胞交流互动平台。

内蒙古添邦智富商贸有限责任公司

内蒙古添邦智富商贸有限责任公司是从事电子产品销售;计算机软硬件及辅助设备零售;办公设备耗材销售;日用百货销售;家具销售;照明器材销售;五金产品零售;门窗销售;建筑装饰材料销售;电线、电缆经营;网络技术服务;企业。经过数年的经营与积累,公司集聚了一批高素质的技术人才。公司在“诚信、自强、创新、共赢”的集团核心价值观引导下,致力于为每一位客户提供高质量、高性价比的系统解决方案、工程设计实施和专业售后服务。

钛扁方

联系电话:0917-3370620宝鸡市锦盛达钛业有限公司位于中国钛谷—陕西宝鸡。依托“中国钛谷”的强大综合实力进行高效的资源共享。具备得天独厚的地域、材料、科研优势,为用户提供优质的产品。公司主营钛及钛合金棒、钛方棒及钛扁方、钛管等有色金属材料钛材。是一家集生产、加工、销售为一体的综合性企业。

贵州五星酒业集团官网

贵州五星酒业集团茅台镇五星酒厂,酒都十强酒企,贵州省民营企业100强

黑龙江盛京皮肤病医院【预约挂号】

哈尔滨白癜风医院哪家好?黑龙江盛京皮肤病医院【咨询电话:400-678-8596】是哈尔滨治疗白癜风专业的医院,黑龙江盛京皮肤病医院规模大,成立时间久,是便民利民的医院,医院开通网上预约挂号服务,服务信息公开且透明。

安丘

安丘、一个小县城、一个生我养我的地方、一个神秘有古老的地方、爱我安丘、天南地北安丘人

优学培训网

优学培训网是全国好的技能培训,职业培训学校教育门户网站,汇聚全国各地优秀的电脑IT,语言培训,职业资格,技能培训,财经培训,补习辅导,管理培训,出国留学,文体才艺专业培训院校。

河池游戏网

河池游戏网是一个集海量游戏攻略、资深玩家社区、安全下载服务、个性化推荐和优质服务于一体的游戏平台。我们专注于为游戏爱好者提供全面、详细的游戏指南,以及安全、便捷的游戏下载服务,让您的游戏体验更加丰富多彩。快来与我们一起探索游戏的无限可能吧!

爱尔兰鲜花

1、爱尔兰鲜花的品种齐全,IrelandFlowerShop可以满足各种用花需求;IrelandFlowerDelivery,IrelandFlorist,IrelandOnlineFlorist,爱尔兰订花途径方便快捷;2、爱尔兰订花送花网站提供个性化服务;3、爱尔兰货到付款,免去后顾之忧;4、爱尔兰鲜花店有其他诸如活动策划、贺词编写等派生服务。5、独特的花束设计和良好的顾客服务赢得了众多顾客的青睐

北京本全天元贸易有限公司

北京本全天元贸易有限公司-北京本全天元贸易有限公司

嘻哈猴子

个人模版的个人主页

股掌柜资讯网发展有限公司

股掌柜资讯网发展有限公司成立于2002年,是经中国证券监督管理委员会批准,取得经营证券期货业务许可证的证券经营机构,是中国证券业协会会员单位。公司提供专业的证券咨询服务,致力于成为投资者值得信赖的投资服务平台。

全局底部横幅