如何让AI像人类一样学习自然语言 CMU博士生杨植麟 (ai怎么让图片变成想要的形状)

文章编号:44947 资讯动态 2024-12-09 自然语言处理人工智能

雷锋网AI科技评论按 :近几年,由于深度神经网络的快速发展,自然语言处理借此取得了重大突破,但同时也达到了它的发展瓶颈期。因此,研究如何让 AI 像人类一样去学习自然语言成为了现在研究者们最关心的问题。

近期,在雷锋网 GAIR 大讲堂上,来自卡内基 · 梅隆大学三年级博士生杨植麟同学分享了无监督学习和情景化学习的一些最新进展,其中包括一篇 ICLR Oral 论文的解读。视频回放地址:

杨植麟,卡内基梅隆大学博士三年级,师从苹果人工智能主任 Ruslan S.,主要研究无监督深度学习及其在自然语言理解的应用;过去两年在 ICLR/NIPS/ICML 等人工智能顶会发表 11 篇文章 (9 篇一作);曾在 Facebook 人工智能实验室从事研究工作,本科以年级第一毕业于清华计算机系。

分享主题 :让人工智能像人类一样学习自然语言:无监督学习和情景化学习的最新进展

分享提纲

分享内容:

近几年,深度神经网络在自然语言学习任务上取得众多突破,但是仍然依赖于大规模静态标注数据。与此相反,人类学习语言的时候并不需要大规模监督信号,并且可通过与环境的交互理解语言。

先来回顾一下近些年 NLP 发展的状况。NLP 发展的黄金时期出现在 2013 年末和 2014 年这段时间。这段时间出现三个非常重要的技术:word embeddings;Seq2seq;Attention,这三项技术基本奠定了 2014 年之后的 NLP 发展基础。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

从2015年到现在,大家做的主要事情就是把三个技术都用上,做各种各样的变种,用在不同的任务上来检验模型效果。单从效果上来看,还是有到很多突破的。但有两点需要注意,依赖监督学习可能已经做到了极限;监督学习有两个问题,一是依赖大规模标注数据集,二是依赖静态数据集。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

反观人类是如何学习语言的?人类只需要非常少的监督信号,通过动态与环境交互,在环境中执行一些行为,得到一些反馈,进行学习语言。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

如果让机器像人类一样学习,就需要突破监督学习的瓶颈。接下来讲的就是在这一方面的探索,怎样让机器像人类一样学习自然语言。

先看一下这个,Mastering the Dungeon : Grounded Language Learning by Mechanical Turker Descent。其中的

Mastering the Dungeon 是我们创造的一个游戏环境,Mechanical Turker Descent 是我们发明的算法名字。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

图中的两个人(Turker1 和 Turker2)相当于平台上的两个用户。他们每个人负责训练一个 dragon,如果 dragon 赢了,对应的人会获得奖励。这样 Turker 就会受到激励,会给 dragon 更好的样本学习,让它在比赛中击败其他 dragon。

下图反应了 dragon 在游戏环境中具体是如何交互学习的,以及具体的游戏环境是怎么样的。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

这个交互学习算法的名字叫 Mechanical Turker Descent。第一步,每一个 Turker 会给 dragon 一些训练数据,第二步,用数据集训练出一个模型。第三步,这些模型会放在其他数据集上交互验证,每个模型会得到分数,获得高分的 Turker 会获得奖励。第四步,所有的数据将合并起来,进入下一轮,直到训练出比较好的 agent。

这个算法其实既有比赛,又有合作。Turker 为了赢得奖励,所以他们之间相互比赛,促使他们提供更好的数据给 dragon。同时他们又是合作的,在每一轮结束后都会把数据合并起来进入下一轮,这些数据在下一轮都会共享。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

这样的算法有四个优点:

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

实验结果

通过实验得出几点结论,实验中的交互学习算法确实比传统通过标记数据的静态学习效果要好。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

limit 是指限制 Turker 每一轮给的训练数据数量。在给同样奖励的情况下,发现如果不限制 Turker,他会多给 dragon 30% 的数据,最终的模型表现效果也较好。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

在模型有反馈和没有反馈的两种不同情况下,其性能表现也有很大的差别。如果把模型反馈去掉,所有的指标都会下降,说明动态调整训练数据的动态分布是非常重要的。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

接下来为大家介绍一篇 ICLR Oral 论文。论文题目为:Breaking the Softmax Bottleneck A High-Rank RNN Language Model。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

我们首先证明了softmax存在表达能力上的根本缺陷,继而提出了混合softmax (mixture of softmaxes)的方法,先算K softmaxes,然后用weighted sum得到最后的概率。这个方法在大家常用的语言模型数据集中,取得了当前最好的结果。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

由于篇幅限制,这里就不做文字解读了,大家如果感兴趣可以直接去看这篇论文或者观看视频回放:

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

未来最重要的两个研究方向,一个是无监督学习,另一个是 language grounding。

无监督学习可以学习有价值的和可传递的特征表示,可以改善低资源和高资源任务; 可以用于监督或无监督任务的元学习。language grounding 可以提供足够复杂的环境,是一种非常有效的学习算法。

以上就是本期嘉宾的全部分享内容。更多公开课视频请到雷锋网 AI 慕课学院观看。

关注微信公众号:AI 科技评论,可获取最新公开课直播时间预告。

原创文章,未经授权禁止转载。详情见 转载须知 。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

全局中部横幅
CCTV

提供CCTV5+在线直播及电视节目表预告等服务,是中央电视台的第二个体育频道,频道每天24小时以全高清的方式进行开路播出。频道内容主要包括:赛事直播、录像和集锦。

江苏履信新材料科技有限公司

江苏履信新材料科技有限公司系江苏省民营创新型科技企业,主要研发、生产、销售各种路面融雪、抗凝冰系列产品。公司注册资本1000万元,拥有占地100亩厂房和成套生产线,拥有各种配套的研发、检测设备。

浙江飞宇智能科技有限公司

浙江飞宇智能科技有限公司主要研发生产电动车充电桩和停车场智能车牌识别,产品已遍布全国三十多个省市,拥有大批优秀的加盟代理商,年产值超于五千万,公司拥有大量优秀人才,核心技术,行业解决方案和成功案例,在智能化领域树立了良好的品牌形象.

游戏窝

游戏窝游戏是专业的游戏平台,免费为你提供手游,小游戏,网页游戏,手机游戏下载,网络游戏下载,网页游戏大全,玩游戏就上游戏窝

轴流泵

盐城市海洋水泵有限公司主营轴流泵,混流泵,立式轴流泵,成立于2001年,现拥有员工40余人,包括管理人员10人,技术人员5人。

全自动大米生产设备厂家

河南粮院专业研发生产大米加工成套设备,大米加工机械,大米加工设备价格,大米精加工设备,小型大米加工设备,大型大米深加工设备厂家。购粮院大米加工设备享受**农机补贴,咨询电话:400-966-9225

安徽大家网络科技有限公司

大家网络是目前全球最为领先的互联网应用适老化及无障碍技术服务公司,是中国政务信息无障碍服务体系的核心技术单位,技术先进、改造高效、价格最低、安全可靠、服务最好。

武汉熠盛汽车技术有限公司

武汉熠盛汽车技术有限公司成立于2014年,是一家集研发设计、生产、销售、服务于一体的高新技术企业。公司当前主营产品为电动助力转向总成(EPS)、电动助力转向控制器(ECU)、电子水泵、房车风扇控制器总成、5G基站电调天线。公司致力于为客户提供高品质有竞争优势的汽车、通信类电机驱动相关产品以及解决方案,并积极为节约能源和保护环境做出贡献。

TechWeb.com.cn

TechWeb专注于互联网消费领域,每日专业提供互联网产品、智能设备及互联网服务等方面的新资讯,呈现为网站、微博、微信、APP等全媒体新形态的互联网消费互动媒体。

山西货架厂,仓储货架生产厂家

太原鼎诺是一家专业生产销售仓储货架、托盘、钢平台、自动化立体库的山西货架厂。位于。咨询热线:15535357096。我们为不同厂家提供不同的仓储方案,来满足不同仓库的需求。在仓储货架生产销售安装等方面,我们有丰富的经验。希望与您建立长久的合作。

永康市丽孜网络科技有限公司

提供免费的足球比赛、足球本分、世界杯等体育资讯,欢迎大家的观看谢谢。

夺目

夺目,企业视频在线制作工具,仅需上传照片和视频,即可一键制作各类风格的视频广告,淘宝主图视频,企业宣传片、产品视频、微信小视频,高效且低成本的满足您的视频营销需求

全局底部横幅