IJCAI 2018 清华对话式人工智能课题组六篇长文被ACL (ijcai2025截稿日期)

文章编号:43575 资讯动态 2024-12-09 人工智能ECAIACLIJCAI20182018

清华大学计算机系对话式人工智能课题组多篇论文被 ACL 2018 和 IJCAI-ECAI 2018 会议录用,涉及对话系统、语言生成、强化学习等领域。下面是论文列表及介绍:

• Generating Informative Responses with Controlled Sentence function

作者:柯沛、关健、黄民烈、朱小燕

会议:ACL 2018 长文

本文着眼于闲聊对话生成领域,研究如何控制生成回复的全局功能特征,并解决功能控制和内容丰富性的兼容问题。句子功能(Sentence Function)是一种重要的语言学特征,按句子功能可将语言划分为疑问句、陈述句、祈使句等多个类别,该特征在对话中能够体现说话者的目的。本文引入条件变分自编码器,利用隐变量来建模和控制生成回复的功能特征;同时,我们在模型中设计了类别控制器,解码回复中的每个词之前会先根据隐变量和当前解码状态预测待生成词所属的类别(即功能控制词、话题词或普通词),再根据类别信息解码出相应的词,使得功能特征和内容信息能够在生成的回复中有机结合。自动评测和人工评测的结果表明,我们的模型生成的回复不仅在结构上符合设定的功能类别,而且在内容上具备丰富的信息量。

作者:王延森,刘辰屹,黄民烈,聂礼强

会议:ACL 2018 长文

(本篇文章与山东大学聂老师合作)

本文研究如何赋予开放领域对话系统提问的能力,从而增强闲聊系统的交互性与持续性。如何提一个好问题,也较大程度体现了机器理解的能力。我们发现,一个好的提问由三种类型的词构成:疑问词、主题词与普通词,为此我们提出了"类型化解码器"(Soft/Hard Typed Decoder)。在每个解码的位置上,解码器会先决定生成词的类型分布,并利用概率偏置提高生成对应类型词的可能性。对于 Soft 类型化解码器而言,每个解码位置上词的类别分布与词的生成概率分布进行混合;对于 Hard 类型化解码器,我们采用了 Gumbel-Softmax 的概率操作技巧(近似 argmax 功能),使得解码器具有选择动态词表的能力。自动评测和人工评测的结果说明了我们的模型所生成的提问相对基线模型具有明显的优势,更容易驱动对话继续下去。

• Commonsense Knowledge Aware Conversation Generation with Graph Attention

作者:周昊,杨天吉,黄民烈,赵海舟,许静芳,朱小燕

会议:IJCAI-ECAI 2018 长文

(本篇文章与搜狗公司许静芳团队合作)

本文研究如何通过常识知识的引入提升对话模型在开放领域对话生成任务上的语言理解和生成能力。给定用户输入的语句,对话模型首先从常识知识库中检索出相关的知识图谱,然后使用一种静态的图注意力机制,将这些知识图谱编码成向量输入到编码器中,通过丰富语义知识从而提升模型对语言的理解能力。在语言生成的过程中,模型通过动态的图注意力机制根据当前解码器状态注意到合适的知识图谱以及其内的知识三元组,之后选择合适的常识知识或普通单词去生成,从而加强了模型的语言生成的信息量和知识方面的连贯性。自动评测和人工评测结果说明了我们提出的引入常识知识的对话模型可以生成语义合适且富有信息量的回复。

• A Weakly Supervised Method for Topic Segmentation and Labeling in Goal-oriented Dialogues via Reinforcement Learning

作者:高信龙一,黄民烈,陈海青,赵中州,李凤麟,朱小燕,聂礼强

会议:IJCAI-ECAI 2018 长文

(本篇文章与阿里巴巴陈海青团队合作)

本文研究话题结构分析在理解任务导向性对话上的作用,我们基于弱监督学习对大规模无标签的对话语料进行话题分割与标注,采用深度强化学习方法来建模对聊天对话中意图识别的未来奖励。模型由一个基于层次化 LSTM 的表示学习网络,和一个在对话主题的局部连续性与全局结构性的奖励序列上实现最优的强化学习网络两部分组成。首先用简单的先验知识自动对数据进行粗标注,然后通过两个网络的迭代训练来进一步提炼数据。大量实验的评价与分析证明了我们新提出的训练模式在该任务上有显著的提升。

• Assigning Personality to a Chatting Machine for Coherent Conversation Generation

作者:钱桥 黄民烈 赵海舟 许静芳 朱小燕

会议:IJCAI-ECAI 2018 长文

(本篇文章与搜狗公司许静芳团队合作)

为聊天机器人赋予固定的人物设定是对话领域的重大挑战之一,本文着眼于聊天机器人在提及自身属性时是否可以给出与人设相符的答案,同时保证了前后回答的一致性。我们提出了一种方法,使用从社交媒体上抓取的通用对话数据训练生成模型,使用有监督的属性检测器 (Profile Detector) 判断用户的问题是否提及聊天机器人的属性设定,以及具体哪一条预设的属性值。随后使用训练好的双向解码器 (Bidirectional Decoder) 生成包含属性值的回复。此外,为了消除训练数据与预设属性值不一致的问题,我们使用无监督的属性值定位器 (Position Detector) 来帮助模型更好地训练。我们同时使用了自动评价和人工评价,实验结果表明我们生成的回复通顺、逻辑正确并且语言多样化。

• Densely Connected CNN with Multi-scale Feature Attention for Text Classification

作者:王诗瑶 黄民烈 邓志东

会议:IJCAI-ECAI 2018 长文

(注:王诗瑶是邓志东教授的博士生,黄民烈老师合作指导该论文工作)

用于文本分类的卷积神经网络大多数采用固定窗口大小的卷积核,因此无法灵活地学习可变 n-gram 特征。在本文中,我们提出了一种密集连接的卷积神经网络,其包含基于多尺度特征的注意力模型。密集的连接建立了底层特征和高层特征之间的跨层连接,从而产生丰富的多尺度特征,即可变的 n-gram 特征。此外,我们提出了多尺度特征的注意力模型,使其可以自适应地选择合适的特征尺度用于文本分类。实验表明,我们的模型在六个公开数据集上达到了超过基线的效果。注意力模型的可视化进一步揭示了该模型具有为文本分类选择合适的 n-gram 特征的能力。

版权文章,未经授权禁止转载。详情见 转载须知 。

清华对话式人工智能课题组六篇长文被ACL 2018、IJCAI-ECAI 2018录用

全局中部横幅
赚钱

圣微灯塔乐源网整合全网优选赚钱创业好项目,网赚项目管理视频教程,包含小红书怎么赚钱,抖音怎么赚钱等最新创业项目资源网赚论坛。

首页

大连洪荒之力电子科技有限公司,前身为深圳市思模创科技有限公司,成立于2015年,是一家致力于奔驰和保时捷全系车型配件设计、研发、生产为一体的,拥有ISO9001认证的现代化电子科技公司,我司拥有20余种专利技术,是国家认证的高新技术企业。

嘉岩供应链

嘉岩自主开发的一站式MRO工业品精品采购商城,品类齐全/正品低价/多仓直发/货期保障!主营传动,电气、工具、劳保、办公清洁、仪器仪表、机械部件等多条产线的MRO产品,嘉岩工业精品商城还为您提供更专业的mro采购服务。

男人袜

国内首家男袜包年订购服务商,创办11年,品质如一。男人们应该省下买袜子的时间,去做更有挑战的事业!

生活中的知识one

生活知识大全网-生活小常识大全,生活小窍门大全,健康小常识等频道,为您提供日常生活小常识,生活知识,生活知识大全,生活小窍门,生活小妙招,运动保健等生活相关知识.健康生活,家有妙招,尽在生活知识大全网

六一网

展示一些个人性的,对于通过各种途径收集而来的理论、概念定义、创意、理念、原理、思维方式、思路、模式、方法、构造、现象、问题、科技发展前景、发明创造应用方向、技术改进方案、知识产权保护、案例、人物经历、能力、喜好、情感、故事与传说、心得体会、体育运动、景观介绍、新功能介绍、生活情趣、天文气象、地质地理、动植物生态、民族文化和风情、食物烹饪、综艺与游戏、文艺节目、影视音乐、艺术、建筑风格、地标建筑、交通设施、不同类型的旅游形式、工具的使用拓展等等方面进行创新的分类,多角度观察、思考、解析、组织重构所产生的创造性想法,以及与之有联系的对象。个人性的想法都是公开的、无偿的、共享性的。

LEDinside

LEDinside|LED在线是LED市场调研机构,提供LED资讯、LED市场分析报告以及LED价格行情。

北京汽车牌照出租

蚂蚁车务(13051916777)北京汽车牌照出租、北京租车牌多少钱、北京车牌过户、京牌出租、京牌租赁价格、京牌回收等业务,为用户提供北京租车牌流程、北京租车牌价格、北京车牌租赁价格等相关信息,是您身边专业的车牌租赁代办平台。

免费空间

免费资源网是一个免费资源分享发布网站,包括免费空间、免费域名、网站建设、SEO优化教程等。免费空间发布.免费空间教程免及最新免费云空间知识。

重庆茂田机械有限公司

重庆茂田机械有限公司是一家集研发生产于一体的高新技术企业、专精特新小巨人企业,提供的产品包括各类农用机械、自走式履带旋耕机、有刷减速电机、无刷减速电机、电磁刹车、蜗轮蜗杆、齿轮等以及售后服务。

全局底部横幅