多语种语言理解再上新台阶！ 2022三项冠军科大讯飞拿下SemEval (多语种研究)

近日，第十六届国际语义评测（The 16thInternational Workshop on Semantic Evaluation, SemEval 2022）大赛落下帷幕，科大讯飞在三项主要赛道中拿下冠军，标志着科大讯飞在多语种语言理解领域持续进阶。

科大讯飞拿下SemEval 2022三项冠军，多语种语言理解再上新台阶！

SemEval 2022评测由国际计算语言学协会（AsSoCiation for Computational Linguistics, ACL）旗下SIGLEX主办，迄今已举办16届，参赛者覆盖国内、外一流高校及知名企业，包括达特茅斯学院、谢菲尔德大学、华为、阿里达摩院等，代表着最前沿国际技术和水平。

经过角逐，科大讯飞分别在“多语种新闻相似度评测任务”（Task8）、“多语种惯用语识别任务” 子赛道（Task2: Subtask A one-shot）、“多语种复杂命名实体识别任务”（Task11）三个子赛道中拿下冠军。

新闻相似度评价：目光如炬

本次SemEval2022评测聚焦的Task 8是多语种新闻相似度评价任务。科大讯飞与哈尔滨工业大学联合组建的“哈工大讯飞联合实验室”（Joint Laboratory of HIT and iFLYTEK ReseARCh，简称HFL）以显著优势摘得冠军。

简单来说，参赛队伍需要在每组新闻中判断是否描述了同一个事件，并以1-4分为两篇新闻的相似度打分，其中包含了多达10种语言，分别为阿拉伯语、德语、英语、西班牙语、法语、意大利语、波兰语、俄语、土耳其语和中文。但新闻相似度究竟是什么？让我们用一则示例为大家解读。

科大讯飞拿下SemEval 2022三项冠军，多语种语言理解再上新台阶！

图中列举了两篇相似度极高的新闻稿件，参赛队伍必须将文中相似的主要元素剥离出来并逐一分析，比如地理信息、叙事技巧、实体、语气、时间及风格，最终得出两篇文章的相似度与差异化。

与普通的文章相比，该项比赛更强调跨语言理解能力，除了写作风格和叙述方式外，还需要把握文章中描述的具体事件。通俗来说，该项技术可以甄别外网的一些新闻报道是否存在偏差与曲解，从而有效预防虚假信息、不良信息的传播。

科大讯飞在这样的赛道上拔得头筹，充分展示了在跨语言理解能力上的强硬实力。

惯用语检测：熟能生巧

哈工大讯飞联合实验室拿下的第二项任务冠军，便是Task2SubtaskA的惯用语检测。通俗来说，无论你是哪国人，在日常表达中都有一类短语的固定用法，并且该固定用法通常与短语的字面语义不同，我们会将这些短语称为“惯用语”。想要理解包含惯用语的句子，首先需要判断句子中的多字短语是否为惯用语，比如“说曹操，曹操到。”句中的曹操是否真实存在。

该任务的形式便是给定一个目标语句，包括其上下文和多字短语，继而判断该语句中的多字短语用法究竟是惯用语还是字面意思。该任务为多语言任务，包含英语、葡萄牙语、加利西亚语三种语言。其中加利西亚语没有在训练集中出现过，因此科大讯飞代表队需要在不同语言之间进行迁移学习。

还是不懂？别担心，让我们来看一则示例。

科大讯飞拿下SemEval 2022三项冠军，多语种语言理解再上新台阶！

如例所示，Literal表示字面意思，第一句话可翻译为：当你从网中抓一条大鱼时，最好撑住它的腰。Idiomatic表示惯用语，所以第二句话中再次出现了大鱼一词，但却不是简单的字面意思，而是“大人物”。

所以该任务要求参赛队伍区分不同句子中同一个词的不同语义，这需要强大的分析及跨语言理解能力。有了该项技术，在日常写作和翻译工作中，即可有效鉴别惯用语的表达用意，极大提高内容准确率。

科大讯飞不负众望，再摘桂冠。

复杂命名实体识别：披荆斩棘

这第三冠有多难？光听名字就觉得复杂：多语种复杂命名实体识别任务（MutiCoNER）。科大讯飞联合中国科学技术大学语音及语言信息处理国家工程研究中心迎难而上，在该项任务中一举拿下三个子赛道冠军。

我们先拆解一下MuticoNER这个词，Muti是multilingual(多语言)的简称，Co即是complex (复杂),而NER则是Named Entity Recognition，又称作“命名实体识别”，是指识别文本中具有特定意义的实体，主要包括人名、地名、机构名、专有名词等。

该任务是一个多语言赛道数据集，包含11项单独语言命名实体评测任务，以及2项多语言统一建模的评测任务。该榜单数据来源于Wikidata（维基数据），数据量庞大且极具应用价值。参赛团队需要在单个语言以及多个语言混合的文本数据中，精准预测不同语言实体的类别标签。该任务采用国际通用的槽位F1评价指标,我们在多语言混合、中文、孟加拉语赛道上，分别以92.9%、81.6%、84.2%的F1成绩登顶。

这项任务究竟有多难？举个例子：NER是指从用户文本中按照业务需求识别出实体的类别，之前任务基本上一句话中仅会出现一到两个实体，本次任务需要抽出多实体增加实体抽取难度，同时需要具备多语种能力，例如【(皇马)[organization]除了首轮负于[克星拉科](organization)以外，现在已是四连胜。(Rafael van der Vaart)[PER]、(Gonzalo Higuaín)[PER]和(Arjen Robben)[PER]的表现出色。】既要识别出多个相关实体，同时是各语种夹杂的文本。

此前针对中文和英文需要单独进行模型建模，此次有关赛道的挑战是仅使用一个模型来可以完成不同语种任务，能够快速识别复杂、专有词汇，提高准确率。

科大讯飞拿下SemEval 2022三项冠军，多语种语言理解再上新台阶！

拒绝纸上谈兵，技术应用要落地

当前，人类已进入“人、机、物”智能互联时代，智能语音是这个时代最为关键的入口之一，有助于实现语言大互通，建设人类命运共同体。科大讯飞始终保持初心、坚持源头核心技术创新，在语音、语义等国际赛事中为国争光。

在去年11月举办的国际低资源多种语音识别竞赛OpenASR中，科大讯飞参加了所有15个语种受限赛道和7个语种非受限赛道，并全部取得了第一名，而在SemEval 2022多语种NLP领域中取得佳绩也标志着科大讯飞在多语言理解与跨语言迁移能力再上新台阶，从多语种语音到多语种语言都有着顶尖技术实力。

而在今年的北京冬奥会和冬残奥会上，科大讯飞作为“官方自动语音转换与翻译独家供应商”，为所有观众展现了一场“无障碍沟通”的体育盛会。

基于强大的多语种语音语言技术，我们可以做到语种足够全、翻译足够准、反应足够快，支持包括冬奥体育在内的16大行业领域翻译，在冬奥应用场景下，中文与英/俄/法/西/日等重点语种的翻译准确率超过90%，平均每句语音翻译响应时间不超过1.5秒，一方面帮助各国观众、游客快速掌握赛事信息，另一方面我们特别希望帮助听障人士运用科技的手段听得见奥运文字，看得见奥运声音。

科大讯飞拿下SemEval 2022三项冠军，多语种语言理解再上新台阶！

值得一提的是，科大讯飞AI虚拟人 “爱加（i+）”也成为了冬奥会的一名“虚拟志愿者”。在北京冬奥小屋中，爱加可以用多种语言与各国运动员进行面对面的交流，助力冬奥的无障碍沟通。科大讯飞运用语音识别、语音合成、口唇驱动、面部驱动、肢体动作驱动等多项核心技术，打造出虚拟形象自动化内容生产方案，让虚拟人不仅会说普通话，同时支持31种语言及方言，是不折不扣的“语言通”，不仅能进行面对面的冬奥赛事、赛程实时互动交流，还能陪你玩一把冬奥知识游戏大PK，周边交通、文化、旅游等咨询问答也不在话下。

除此之外，在教育、医疗、司法等场景中的各类行业人工智能应用中，多语种语音交互系统都将发挥重要作用。经过多年的技术积累，除了中英以外，当前科大讯飞已经具备其他69种语言的语音识别能力，其中已经有35个语种准确率已经超过90%，并已在新加坡、俄罗斯、印度、日本等国家部署了海外站点，将持续为海内外开发者提供语音识别、语音合成、机器翻译、图文识别等语音语言服务。

如何更好地研发包括中文在内的多语种语音及语言技术的AI能力并实现大规模应用落地，如何更好地用人工智能技术服务社会、建设美好世界，是我们不断奋斗努力的方向。

未来，科大讯飞将不断开展人工智能源头技术创新，助力中国人工智能在全球赢得话语权，实现更多人工智能创新应用真正解决社会刚需，蓬勃向上，生生不息。

版权文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/3385657b511ebd25eeb7.html

上一篇：人工智能不仅是炫技要着眼实际痛点对话平安

下一篇：数智创新助力低资源地区健康普惠宁夏启动新

新闻媒体发稿

公司目前业务范围包括：新闻媒体发稿,软文发布平台,软文营销,软文推广,新闻营销推广,报纸软文等效果广告等一站式网络整合营销服务,天识广告专注于为中小企业提供一站式网络推广解决方案的互联网公司。

新闻资讯 2023-10-02 18:50:53

爱剪辑官网

爱剪辑是全民流行的视频剪辑软件，支持AI自动加字幕、调色、去水印、横屏转竖屏等齐全的剪辑功能，且其诸多创新功能和影院级特效，也使它成为迄今超易用、强大的视频剪辑软件。

电影视频 2024-01-10 22:11:31

淮北军事拓展训练公司

【亚马逊企业军校】淮北军事拓展训练行业领跑者，拥有大型的淮北军训基地和拓展训练基地，为客户提供军事拓展训练、企业员工军训、魔鬼训练、企业团建、户外拓展等项目，承诺淮北拓展训练公司「不满意退款」企业员工户外团建活动策划。

军事政治 2024-07-05 18:49:58

昆山渝楷五金弹簧有限公司

昆山市渝楷五金弹簧有限公司于2001年在昆山正式设立，公司位于江苏省昆山市巴城镇京阪路1399号，投资总额1000万美元，专业从事集精密五金弹簧、弹片的开发、设计及制造。

编程开发 2024-11-13 06:01:36

自动码垛机

东莞市亿思特机械自动化设备有限公司专注于气动助力臂,工业桁架机械手,搬运助力机械手,全自动码垛机,装箱机器人,上下料机器人,三轴四轴机械臂等设计制造,提供自动化整体解决方案,如果需要码垛机械手，桁架机器人，单立柱双立柱码垛机信息，欢迎来电咨询详谈。

设计美化 2024-11-13 16:49:52

大型步入式试验箱,步入式恒温恒湿试验箱厂家

上海巨夷仪器设备有限公司是专业的大型步入式试验箱,步入式恒温恒湿试验箱厂家供应商，主营产品有：大型步入式试验箱,步入式恒温恒湿试验箱厂家等,上海巨夷仪器设备有限公司不仅具有专业的技术水平，更有良好的售后服务和优质的解决方案,欢迎来电洽谈

商业服务 2024-11-22 23:35:57

蒸汽锅炉清洗

华海环保科技有限公司主营业务包括锅炉清洗、化工设备清洗以及蒸汽锅炉清洗等服务，涵盖了多个领域和行业的需求。我们拥有经验丰富的技术团队和先进的清洗设备，可以针对不同类型的设备和污染情况，提供定制化的清洗方案。无论是在工业生产中需要清洗锅炉设备，还是需要对化工设备进行彻底清洗，我们都能够为您提供专业的技术支持和优质的服务。

商业服务 2024-11-26 15:54:53

九江瑞升耐磨件制造有限公司

公司成立于2007年6月6日,占地:23310平方米,拥有专业人才120名。公司配备了专业的检测及生产设备。采用熔模铸造,覆膜砂及自动铸蜡杋等工艺,生产挖掘机耐磨斗齿、齿座、边齿、铲齿、斗铀、斗齿销等年生产产品近1.5万吨。为客户提供一流的产品及服务

商业服务 2024-11-29 10:51:16

360文秘网

360文秘网（www.360wenmi.com），提供大量优秀范文，包括工作总结、教学资源、论文范文、述职报告、心得体会、讲话稿、公文等文秘指导与写作范例。博览文秘材料，启迪写作思维，就上360文秘网！

下载资源 2024-12-02 00:00:39

恒信OL

电影视频 2025-02-07 16:03:02

Sangco

PHPASPMYSQLMSSQL专家Sangco

电影视频 2025-02-20 22:44:35

贵州交警总队科研所

科研机构 2025-03-04 23:06:00

煲仔饭加盟品牌有哪些 (煲仔饭加盟品牌)

人永远都对吃抵抗不了，在我们的生活中有十分之一的时间是用来吃饭的，可见吃对我我们是多么的重要，人们看到了商机，想要在销售食物上进行突破，销售一种大家都喜欢的快餐，但是多数人虽看到商机，却没有能力创造品牌，让大家熟知，所以加盟一家品牌可以说是一个不错的品牌，那么煲仔饭的加盟品牌有哪些呢，煲仔饭美味可口，价格平民，是一种很受欢迎的美食，煲...。

2025-01-31 21:27:14

头条的作战半径 (头条任务)

头条的作战半径张一鸣在14年融资时提过个概念，今日头条单位面积内的算法工程师数量，全球最高，到2017年他们又有个新提法，今日头条现在部署的服务器台数，非上市公司里面最高，张一鸣说今日头条做的都是一类产品，是沿着自己的产品理念和产品主线，以推荐为基础，以智能匹配为基础，在别人做的基础上做出创新，不是模仿抄袭某一家，不是具体针对某一家，...。

2025-01-30 17:54:37

成立三周年瀚博半导体宣布完成16亿人民币B (成立三周年的文案)

消息，瀚博半导体在公司成立三周年之际，宣布完成16亿人民币B，1和B，2轮融资，由阿里巴巴集团、人保资本、经纬创投和五源资本联合领投，国寿科创基金、MiraeAsset，未来资产，、基石资本、慕华科创基金，清华产业背景，，以及老股东红点中国、耀途资本和元木资本跟投，值得关注的是，此次融资意味着瀚博半导体在继快手之后，引入了第二家...。

2024-12-09 18:28:00

紫光展锐如何冲上手机处理器市场的全球第四 (紫光展锐如何锁频)

曾经稳固的4G手机芯片市场格局，在5G时代已经开始发生变化，联发科凭借高性价比的中高端5G芯片表现比手机芯片一哥高通更加亮眼，紫光展锐也在内部大刀阔斧改革以及新的战略之下，今年第二季度在手机芯片市场占有率排名第四，公开市场第三，方向正确是赢多赢少的事，方向错误是输多输少的事，这是紫光展锐CEO楚庆反复强调的观点，这就引出了两个问题...。

2024-12-09 18:09:47

3954标箱！这个班列5次刷新单月发运量历史纪录 (标箱的规格)

记者从中国铁路南宁局集团有限公司获悉，11月份，广西始发中越班列发运集装箱货物3954标箱，环比增幅51%，保持高速增长态势，再创单月发运量历史新高，今年前11个月，广西始发中越班列已累计发运货物16952标箱，同比增长1274%，实现5次刷新单月发运量最高纪录，编辑，张晓璇...。

2024-12-04 12:56:23

因阿迪新疆棉事件泡泡玛特推迟联名被判违约；俞敏洪谈东方甄选店铺被关停与抖音不存在互掐；推特在苹果商店更名为X丨雷峰早报 (阿迪新疆棉道歉了吗)

今日头条因阿迪新疆棉事件泡泡玛特推迟联名被判违约，网友不买账半月前，泡泡玛特成为被强制执行人，执行标的超1710万元，泡泡玛特回应称，该案件属于正常商业纠纷，已支付全部款项，但当时并未公布判决法院、案号等相关信息，一时间也引发社会各界不少猜测，如今谜底揭晓，近日，北京泡泡玛特文化创意有限公司与阿迪达斯体育，中国，有限公司申请撤销仲裁...。

2024-12-03 17:31:52

Pro2系统怎么修复?刷机可修复系统极米RS 提供刷机固件 (pro2.0)

发表在投影固件2022，4，1615，24极米RSPro2是极米相对较为高端的智能家用投影仪，所搭载的系统同样也是极米INUI，如果系统出现故障就需要进行修复，修复的方法可以是恢复出厂设置，也可以是刷机，如果能够正常开机使用，系统故障并不影响开机和遥控，可以选择恢复出厂设置，如果已无法开机，那就需要进行刷机修复了，下面一起看看极米RS...。

2024-11-28 14:02:01

我在ToB公司做产品运营的血泪教训

之前我做ToB运营的时候把ToB的产品当做ToC的产品来做，也走了很多的弯路，产品始终没有走到正向运转的路径，没有赚钱，这也导致我在ToB的运营工作中遇到了很多的麻烦，经过最近的一段时间的思考和新业务模式的拓展，我才认识到ToB的运营不仅仅是掌握一些技巧那么简单，在这两年的工作中，我踩过很多ToB产品运营的坑，简单的可以归结于思想有问...。

2024-11-21 23:29:18

电商杀不死的十大行业

电商杀不死的十大行业，想开实体店的，最好要了解一下，都说实体店大量，关门倒闭，，但满大街店铺却也没有减少多少，只不过是从事的行业换了，如果是十几二十年前，街上什么行业最火?一定是服装店，鞋店，当年各大城市的步行街，主要是靠这些店铺支撑的，但是你现在去街上逛逛，会发现服装店和鞋店已经微不足道了，那么哪些行业是现在实体店的主力呢?有网友对...。

2024-11-15 23:26:07

国际最大的汽车开售网站 (国际最大的汽车玻璃公司)

第一名，汽车之家汽车之家成立于2005年6月，是环球访问量最大的汽车网站，依据iUserTracker数据统计，汽车之家月度笼罩人数凑近8000万，中国互联网汽车用户60%的期间破费在汽车之家，汽车之家是中国最值得信任的汽车互联网服务平台——为汽车消费者提供贯通选车、买车、用车、置换一切环节的片面、准确、快捷的一站式服务，努力于以传媒...。

2024-07-07 20:39:04

没思考向美国求援菲律宾是不想吗

直资讯，近日中菲南海抵触更新，而菲律宾方面6月21日示意，没有思考过征引，美菲独特进攻条约，，您如何解读菲方这一表态，特约评论员张思南，关于你这个疑问，我的下看法反响是，不然呢，难道真有人轻薄以为美国会为了菲律宾的利益，而在实质意义上军事介入南海抵触吗，菲律宾的这个表态就很鸡贼，一句，没有思考过征引，美菲独特进攻条约，说的如同菲律宾...。

2024-07-04 20:29:24

默认,默认专题内容文章-理联盟

默认专题,提供默认的相关文章和相关资讯,在本栏目你可以看到默认这个内容的相关各类文章很多篇,如有不足请提供给我们更多默认的文章供大家查阅.

2023-10-25 17:32:12

文章推荐

五等分的新娘手游下载2022 五等分的新娘手游下载链接 (五等分的新娘新婚旅行篇)

五等分的新娘这款游戏同国内的二次元美少女卡牌类手游都不同，采用了以消除为主要玩法的剧情向题材，那么五等分的新娘手游下载2022年可以在哪个平台完成，这款游戏的下载链接是什么，下面大家一起来看一下吧，五等分的新娘2022最新下载地址游戏介绍这款游戏最吸引各位宅男玩家的就是配音演员全员到位，而且动漫男主角的五个新娘在游戏内都有着超级逼真的...。

2025-02-10 01:15:13

资讯动态

格莱佳厨房废品处理加盟好不好 (格莱美厨具)

不知道大家还记得吗，前段时间上海火热进行的废品分类行动，可以说这是一个轰动的事件，我们再也不能像以往一样，把废品放在一个袋子丢出门去，甚至吃个鸡翅，都要把骨头和肉分开处理，这真是难为了千万的家庭，格莱佳厨房废品处理可以很轻松的解决这个问题，让厨房废品不再成为难事，消费者可以轻松快速的处理厨余废品，不再为厨房废品难分类、难清理而发愁，那...。

2024-12-21 15:33:29

创业加盟

不考虑加个双Wi 你的手机处理器那么快 (不考虑加个双引号吗)

今天，我们通过几位大家的老朋友了解一个手机的，黑科技，作为一名游戏发烧友，韩梅梅总会购买最新款旗舰手机，业余时间大都在游戏中度过，最近，她喜欢上了对走位有高要求的，王牌战士，手游，赵海龙作为游戏中的游击型选手，有着出色的机动性和伤害能力，也是韩梅梅喜欢的角色，在网络状况好的情况下，赵海龙开启大招期间，敌人一旦被瞄准就会遭到双枪攻击，...。

2024-12-10 01:04:30

资讯动态

学霸们的精华分享一次看个够大讲堂 GAIR 大牛 (学霸们的精华有哪些)

雷锋网AI科技评论按，2017年，在GAIR2017大会成功举办后，雷锋网旗下宣布成立了一个全新的高端学术分享品牌，GAIR大讲堂，在过去的一年里，GAIR大讲堂通过举办高频次的学术分享活动，包括线上和线下，，实现了学术专家、AI业者与高校学术青年之间的深度交流，以下是我们的年度盘点，国际顶会论文解读，线下，AAAI2018预讲会哈...。

2024-12-03 21:51:31

资讯动态

投影画面太大怎么调整 (投影画面太大了怎么无损调整)

发表在专业问答2021，1，1410，02展示机型信息，品牌型号，爱普生tw5700、当贝F3系统版本，nunaiOS、当贝OS2.0投影画面太大可以通过调焦镜头、画面缩放或移动投影仪位置进行调整，调焦镜头主要分为以下的三步进行操作，投影画面太大怎么调整一、调焦镜头1.开机投影仪先将投影仪开机，并将画面投射到白墙上；2.转动调焦轮然后...。

2024-11-29 00:18:42

网络百科

多语种语言理解再上新台阶！ 2022三项冠军 科大讯飞拿下SemEval (多语种研究)

新闻相似度评价：目光如炬

惯用语检测：熟能生巧

复杂命名实体识别：披荆斩棘

拒绝纸上谈兵，技术应用要落地

相关文章

文章推荐

多语种语言理解再上新台阶！ 2022三项冠军科大讯飞拿下SemEval (多语种研究)