和 XLNet! ERNIE 百度开源自然语言理解模型 NLP 个 BERT 2.0 任务中碾压 16

7 月 30 日,百度发布了 ERNIE(Enhanced Representation through kNowledge IntEgration)的优化版本——ERNIE 2.0 自然语言理解框架。这个中英文对话的 AI 框架不仅获得了最优的(SOTA)结果,并且在 16 个 NLP 任务中表现出优于 BERT 和最近的 XLNet 的高水准。目前,ERNIE 2.0 代码和英文预训练模型已开源。

百度开源自然语言理解模型 ERNIE 2.0,16 个 NLP 任务中碾压 BERT 和 XLNet!| CNCC 2019

近年来,类似于 BERT,XLNet 的无监督预训练自然语言表达模型在各种自然语言理解任务中取得了重大突破,包括语言推断、语义相似度、命名实体识别、情感分析等。这也表明了基于大规模数据的无监督预训练技术能够在自然语言处理中发挥至关重要的作用。

SOTA 预训练模型(如 BERT,XLNet 和 ERNIE 1.0)的预训练系统核心是基于几个简单的任务来模拟单词或句子的共现。例如,BERT 构建了掩码模型和下一个句子预测任务,从而捕获单词和句子的共现信息;XLNet 则构造了一种全排列的语言模型,并采用了自回归的方式来捕获单词的共现信息。

然而除了共现之外,训练语料库中还包含语法、语义信息等更多有价值的信息。例如:命名实体(名称、位置和组织),则可以包含概念信息、句子之间的顺序和距离关系等结构知识;而文档层面的语义相似性或句子之间的话语关系,则能够训练模型学习语义感知表示。假设模型能够经过训练从而不断学习更多类型的任务,是否这样可以进一步提高模型的效果呢?

百度开源自然语言理解模型 ERNIE 2.0,16 个 NLP 任务中碾压 BERT 和 XLNet!| CNCC 2019

ERNIE 2.0 ——可持续学习语义理解框架

基于这一理念,百度提出了一种持续学习的语义理解预训练框架 ERNIE 2.0,它可以通过持续的多任务学习,逐步学习和建立预训练任务。

该框架支持增量引入词汇 (lexical)、语法 (syntactic) 、语义 (semantic) 等 3 个层次的自定义预训练任务,并通过多任务学习对其进行训练,实现全面捕捉训练语料中的词法、语法、语义等潜在信息。而且每当引入新任务时,该框架在递增地训练分布式表示的同时,还会记住先前任务的信息。 百度开源自然语言理解模型 ERNIE 2.0,16 个 NLP 任务中碾压 BERT 和 XLNet!| CNCC 2019

ERNIE 2.0 与 BERT 或 XLNet 等经典预训练方法的不同之处在于,它并不是在少量的预训练任务上完成的,而是通过不断引入大量预训练任务,从而帮助模型高效地学习词汇、句法和语义表征。作为一种全新的语言理解持续预训练框架,ERNIE 2.0 不仅实现了 SOTA 效果,而且为开发人员构建自己的 NLP 模型提供了可行的方案。

百度将 ERNIE 2.0 模型的性能与英文数据集 GLUE 和 9 个流行的中文数据集的现有 SOTA 预训练模型进行了比较。结果表明,ERNIE 2.0 在 7 种 GLUE 语言理解任务上优于 BERT 和 XLNet,并在所有 9 种中文 NLP 任务上击败 BERT,例如:基于 DuReader 数据集的阅读理解,情感分析和问答。

百度开源自然语言理解模型 ERNIE 2.0,16 个 NLP 任务中碾压 BERT 和 XLNet!| CNCC 2019

模型在 9 项常规中文 NLP 任务中的结果;模型结果均为五次实验结果的中位数,粗体字表示 SOTA 结果

实际上根据 GLUE 数据集的测试结果,无论是基本模型还是大型模型,我们能够观察到 ERNIE 2.0 在英语任务上优于 BERT 和 XLNET。此外,ERNIE 2.0 大型模型还实现了最佳性能,并为中文 NLP 任务创造了新的最优性能的结果。 百度开源自然语言理解模型 ERNIE 2.0,16 个 NLP 任务中碾压 BERT 和 XLNet!| CNCC 2019

模型在 GLUE 上的结果,其中开发集上的结果是五次实验结果的中位数,测试集结果根据 GLUE 评估服务完成

雷锋网 AI 科技评论

【CNCC 2019来了!】

10月17-19日,CNCC 2019 将在苏州金鸡湖国际会议中心举办,本次会议由中国计算机学会 (CCF) 主办,苏州工业园区管委会承办。

CNCC 全称为中国计算机大会,是我国计算领域规模最大、规格最高的学术、技术、产业交融互动的盛会。该会议创建于 2003 年,每年于不同城市举办,至今已成功举办十五届。会议形式包括大会特邀报告、大会论坛、技术论坛、特色活动及展览展示等。大会也特别设立了“自然语言理解的挑战与机遇”技术论坛,敬请关注。

如果你是个人参会,可以:

•通过官网cncc.ccf.org.cn参会报名

•申请论坛,作为论坛主席或讲者参会

•申请资助参会,申请者限边远地区高校青年教师或学生

原创文章,未经授权禁止转载。详情见 转载须知 。

百度开源自然语言理解模型 ERNIE 2.0,16 个 NLP 任务中碾压 BERT 和 XLNet!| CNCC 2019

全局中部横幅
联轴器

罗文LONNWENN联轴器工厂是一家有着十几年历史的高端联轴器生产厂家,本公司技术精湛,设备优良,检测设备齐全,我公司生产的联轴器畅销全国,深受用户的好评,欢迎国内外新老客户莅临指导。

搜狗输入法

搜狗拼音输入法官网下载,荣获多个国内软件大奖的搜狗拼音输入法是一款打字更准、词库更大、速度更快、外观漂亮、用了让您爱不释手的输入法,是您装机输入的好选择。享受输入,从搜狗开始!

麟美生物丨实验代做

代做实验公司有哪些?麟美生物,专业为各大学、科研机构提供植物、动物类、生物实验、微生物检测等各种代做实验。慢病毒包装服务,病理学研究,生物学检测等服务,欢迎咨询。

四川鲲之跃建筑工程机械有限公司

四川鲲之跃建筑工程机械有限公司四川鲲之跃建筑工程机械有限公司四川鲲之跃建筑工程机械有限公司

防伪标签

通程防伪】领先的物联网解决方案服务商,专业防伪标签、二维码防伪标签、二维码防伪标识、防伪标制作,溯源系统、防伪防窜货系统开发,防窜货解决方案,为客户提供产品一站式防伪定制解决方案,以专业的产品标识技术和丰富的系统实施经验,维护客户产品的收益、品牌形象和经销商利润。

淘悠优严选

专注品牌网站建设和创意网站设计,提供案例化网站建设服务,是网站建设公司的翘楚。

咖啡机租赁

上海咖啡机租赁公司的办公室咖啡服务覆盖上海黄浦区,徐汇区,长宁区,静安区,普陀区,虹口区,杨浦区,闵行区,宝山区,嘉定区,浦东新区,金山区,松江区,青浦区,奉贤区,崇明区及全国,提供庆典咖啡机租赁,雀巢咖啡机租赁,手冲咖啡机租赁,半自动咖啡机租赁,全自动咖啡机租赁,现磨咖啡机租赁,商务咖啡机租赁,展会咖啡机租赁,自助咖啡机租赁,速溶咖啡机租赁,便携式咖啡机租赁,浓缩咖啡机租赁,办公室咖啡机服务。

天龙八部SF网

天龙八部私服发布网是国内最大的新开天龙八部发布网,每天为怀旧天龙八部SF玩家发布最新变态天龙私服,还有各类版本最新天龙SF大全信息方便查找!

东莞市宏莞技术检测有限公司

宏莞自2007年成立以来,积极研发和引进高科技含量的信息技术与设备,始终专注于服务质量的提升,励志成为客户最值得信赖的服务伙伴。本公司由前台湾UL灯具组工程部经理(十年工作经验)所创办,负责所有灯饰相关产品之把关。同时也为亚洲地区灯饰类产品UL标准之总工程师。

消费最前线

消费最前线(原锦鲤财经)是一家专注于商业消费领域的新媒体。专注于推动行业发展,为用户提供最前沿、最时尚、最实用的资讯和报道,打造最专业的消费产业动态交流原创平台,展现个体创业与品牌的融合之美。

供应奶茶,冷饮专用植脂末,山东亚麻籽油粉厂家

山东天美生物技术有限公司是一家专业供应奶茶、咖啡、冷饮、专用植脂末,低聚果糖生产,亚麻籽油粉厂家,价格合理,欢迎来电咨询。

商丘网

商丘网——商丘网络第一媒体

全局底部横幅