2016 认知计算需要解决这些问题思必驰首席科学家俞凯大数据和深度学习不是万能的 CAIIC (认知策略百科)

文章编号：43967 资讯动态 2024-12-09 俞凯思必驰认知计算语音交互语音识别

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

如果横向对比语音和视觉两种技术，大多数人可能会直观地认为视觉是比语音更复杂的一种技术，但事实真是如此吗？

在17日举办的中国人工智能产业大会上，思必驰首席科学家、“思必驰-上海交大智能人机交互联合实验室”主任、上海交通大学计算机教授俞凯博士在接受雷锋网采访时表示，“语音和视觉是两种不同的模态，前者是一维信号，后者是二维信号，视觉的帧率比语音低很多，因为视觉可能是一张图片或者是视频，视频一秒24帧，而语音1秒钟100帧就能听出来差别，所以从实时性来看，语音的难度要高于视觉，但是从本身处理的信息量来讲，视觉则会难于语音。”

当然语音交互涉及到的问题不仅如此，它所做的不仅仅是

语音识别属于感知层，而感知只是语音交互的一部分

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

从上图来看，一个端到端的语音交互方案包括了感知、认知和知识处理三个部分。俞凯表示， “识别和合成都属于感知范畴，这部分的目的是把语音信号转为编码文字，在后端需要对转成的编码文字进行相应的理解决策以及相关的表述，这是认知。”如何把感知和认知连接起来是一个问题，也是目前思必驰正在做的一件事情

如果只看感知和认知部分，大数据和深度学习无疑是最核心的两个因素。

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

不久前，微软研究院发布的最新的语音识别测试结果显示，电话语音在语音识别的测试当中已经达到了人类的水平（上图左上角），人类的水平是在5.9，而这次测试的数据达到了5.8。俞凯指出，语音识别能够达到这一水平的关键就是大幅度的计算。

第二个例子是上图左下角展示的结果，这是思必驰利用极深的神经网络在一组抗噪的语音识别上做的测试，测试结果是7.1，这是一个什么样的概念？

俞凯解释，在深度学习产生之前，全世界最好的结果是13.4，深度学习产生之后这一数值降到了12，而7.1是目前最好的结果，如果做到5以下，就达到了人类水平，事实上，在一些特定场景下，结合深度学习以及大数据的技术已经可以达到人的水平。因此，大数据和深度学习对人工智能的意义是显而易见的。

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

但俞凯强调，站在学术界和产业界的角度看，感知层并不是最高深的问题，远场和外噪声环境下的语音识别、非配合式的语音交互这些问题学术界和从业者进一步深入研究就可以解决。 认知问题，是深度学习和大数据组合之外，业界需要探索的方向。

如果在网上查阅资料，你会发现认知计算算不上高频词，至少相比深度学习，认知计算在业界的热度还没那么高，俞凯坦言，关于认知计算业界目前还没有一个统一的定义。

那么它和深度学习相比有什么特点？

俞凯向雷锋网解释道，“深度学习是一种方法，我们可以把它用在人工智能和控制上，它解决的是输入和输出之间的映射（算法），例如输入语音，输出的是文字；而认知计算解决的是理解、反馈和学习问题，它对应于人脑当中比较抽象的推理部分，认知的输入和输出都不明确。”

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

它用坐标描述了语音交互在认知计算上的分类。按照对话的应用场景来看，以轮回的次数作为横坐标，结构的引进程度作为纵轴，我们就可以在坐标的象限里分成四个部分（如上图）：命令式、问答式、闲聊式和任务式四种场景。可以看出，命令式的交互和闲聊式的交互本质上都没有引进绝对的结构化信息，命令相对简单，闲聊会更复杂，而问答和任务这两种交互场景是目前应用得比较多的类型。

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

再来看看认知计算涉及到的技术，它包括深度（序列）学习、知识与数据双轮驱动以及强化学习。

认知计算需要解决大数据和深度学习之外的问题

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

俞凯认为，深度学习和大数据是基础，但它们并不是万能的，认知计算需要解决的就是深度学习和大数据不能解决的问题。方言识别器准确率即便达到了95%以上也不代表就有了好的交互体验，这涉及到的是深度学习和大数据之外的问题。

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

首先，在深度学习之外，有两个需要解决的问题：交互时机和异常处理。交互时机是指在对的时间切入交互，这里面包含了信号增强、对话状态追踪、失真及重叠语音的识别等任务；异常处理就是要知道如何去纠正，这其中的问题有异常检测及置信度衡量、异常类型划分等等。

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

除此之外，俞凯还介绍，大数据之外也涉及到了两个问题，即语义理解范畴延伸、知识库和应用规划的结合，这些都不是通过收集到的原始大数据就能解决的，它们都需要加入很多算法。

一言以蔽之，认知计算需要解决上述问题才能够在用户层面有好的交互体验。

思必驰首席科学家俞凯：大数据和深度学习不是的，认知计算需要解决这些问题｜2016 CAIIC

“我们会看到大数据和深度学习对普适模型以及大一统方案上将有很大的进步，但是真正实际使用过程中，要一些新型技术结合进去才有可能解决，科学上的进步往往是从产业上的问题作为入手点，而提出的解决方案可能会超越大家现在的想象。”俞凯如此表示。言下之意，至少在语音交互上，产业界还存在很多问题亟待解决。

但我们对未来还是要保持乐观的心态，随着技术问题的进一步解决，语音交互领域未来会产生一些新的商业模式。俞凯告诉雷锋网，预计明年将会有很多专业领域提供语音识别服务的公司会涌现出来，如医疗、金融和教育等领域，这些都需要专业的人来做数据模型，他们只需要用一套标准化的方案就可以实现应用。换言之，虽然未来可能很难再有类似思必驰这些向第三方提供lisense的平台型的公司出现，但创业企业可以从这些平台公司获取基础技术，再根据细分行业的具体需求来形成应用，这是语音交互产业的未来一个发展方向。

原创文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/611302644668a3dcebd5.html

上一篇：2016未来企业赢在第四范式戴文渊CAIIC维度

下一篇：20张PPT谈四大领域产业布局CAIIC2016商汤研

126网易免费邮

网易126免费邮箱–你的专业电子邮局，超过20年的邮箱运营经验，系统快速稳定安全，支持超大附件和网盘服务。网易邮箱官方App“邮箱大师”帮您高效处理邮件，支持所有邮箱，并可在手机、Windows和Mac上多端协同使用。

手机软件 2024-01-14 20:38:52

HIWIN

天津龙创恒盛实业有限公司专业为您提供直线导轨,HIWIN,直线模组,直线电机的相关信息，想要了解更多直驱转台,晶圆机械手,力矩转台,线性滑轨,滚珠丝杠,联轴器,滚珠螺杆的详情，请联系我们。

行业信息 2024-08-17 00:46:13

应势科技

应势科技专注于研发适用于工业大数据数的动态预测性分析智能技术及解决方案。

手机软件 2024-07-11 13:27:03

云主机笔记

云主机笔记，致力于便宜云服务器优惠活动分享和服务器运维教程笔记。每日精选便宜VPS、云服务器商家推荐和常用建站和应用云服务器运维教程。

网络应用 2024-08-17 22:43:27

巨光微视

巨光微视科技（苏州）有限公司，主要致力于电子元器件供应链整合，为客户提供全方位的电路保护器件及功率半导体器件，产品线包括：瞬态电压抑制器、气体放电管、压敏电阻、静电保护器件、半导体放电管、自恢复保险丝、二极管、整流桥、MOS管等器件；主要代理经销品牌包括：捷捷微电子股份有限公司、无锡新洁能股份有限公司，君耀电子、晶导微电子、乔光电子等；公司团队有十多年电子行业服务经验，为客户全方位的提供售前售后服务包括技术培训、电路保护解决方案、样品支持、产品测试、库存管理等服务；公司一直坚持以客户为中心，合作共赢的理念，致力于成为客户最值得信赖的电子元器件供应链整合供应商。

商业服务 2024-07-10 20:34:26

二手随车吊买卖

机械之源二手随车吊设备信息交易平台,专业提供二手随车吊买卖交易,免费发布随车吊信息,随车吊配件,保险,维修,租赁,随车吊司机招聘求职,随车吊新闻咨询

新闻资讯 2024-11-29 00:04:16

东莞市望宇自动化设备有限公司

东莞市望宇自动化设备有限公司是一家专业从事自动化设备的设计,生产,销售的企业.,有着十多年的设计,生产经验.主营产品有:点胶机,点胶阀,真空贴合机,覆膜机,热线0769-82625288，15920020738

设计美化 2024-11-29 11:40:16

家庭教育健康管理心理咨询师服务中心

心理空间专注家庭教育、健康管理、心理咨询和亲子关系，提供专业的心理咨询信息服务，同时为广大需要报考健康管理师、心理咨询师、营养师等证书的朋友提供帮助与支持。

商业服务 2024-12-01 21:56:28

长沙源永商贸有限公司

长沙源永商贸有限公司提供建筑材料、装饰材料、五金产品的销售服务，同时专注于机械设备的销售、租赁和研发。我们依法持有营业执照，在法律法规允许范围内自主开展经营活动。欢迎联系我们了解更多详情。

商业服务 2024-12-02 22:06:35

鼓风干燥箱

苏州三清仪器有限公司主营鼓风干燥箱,真空干燥箱,电子防潮箱,智能节氮氮气保护柜,防爆防火安全柜,酸碱试剂PP柜等环境试验和安全防护领域的产品的研发、方案设计及销售。

设计美化 2025-02-02 19:38:57

040wan游戏

040wan游戏平台专注最新好玩的网页游戏运营，超低折扣页游，高返利品牌网页游戏等热门BT页游，让你更省心玩游戏！

游戏网游 2025-02-07 02:05:06

嘟嘟牛在线生活圈

嘟嘟牛收银，餐饮收银服务商，最好的餐饮收银系统！嘟嘟牛提供网络收银机，餐饮收款机，餐饮管理系统软件，餐饮收银系统，外卖订餐系统，网上订餐系统等。

网络应用 2025-02-14 01:43:01

百度轻应用试用体验感悟 (百度轻应用app下载)

第一次听说，轻应用，这个词是在去年的8月某天，那时候观看一个百度在2013年百度世界大会视频记住了两样东西，皇太吉说未来移动互联网是服务经济时代，其次是百度宣布推出，轻应用，，可实现无需下载，即搜即用和通过移动搜索智能分发，当听到这样的消息时候不难发现这其中的商机，那就是移动互联网应用开发者经历了微博开放、微信时代的崛起等机会，几乎每...。

2025-01-30 17:33:54

3D 后者专注传感芯片投资灵明光子 OPPO (福彩3d专业)

据企查查显示，9月4日深圳市灵明光子科技有限公司发生一则工商变更，原股东JamesHarris退出，新增OPPO广东移动通信有限公司，持股3%，其中，JamesHarris是灵明光子创始团队人员之一，为美国工程院院士、斯坦福大学电子教授，该公司的其他三名创始人贾捷阳、臧凯、李爽均为JamesHarris的学生，共同创业之前曾在斯坦福大...。

2024-12-09 22:53:13

拥抱你的AI新同事虽然最后你可能被抛弃 (拥抱你的爱)

雷锋网按，我们已经站在人工智能时代的前沿，大部分人对此趋之若鹜，少数人高喊着警惕的口号，被视为杞人忧天的傻子，人工智能的浪潮正不可避免的袭来，它到底是怪兽还是福音，恐怕事实上，它两者都是，日前发布文章，深刻的揭露了人工智能从提高人类生产力到淘汰人类生产力的过程，可以说是一篇警世恒言，雷锋网在不改变原意的情况下为您做如下编译，去年秋天，...。

2024-12-09 18:12:19

坚果j7镜头进灰怎么清理 (坚果j7镜头上怎么没有j7标志)

发表在坚果投影仪2019，12，313，28前些天，有用户反馈家里的投影仪坚果j7，没有用多少时间镜头就进灰了，由于镜头对于投影仪来说非常重要，也不敢轻举妄动所以就反馈到了投影网，希望能给出一个较好的解决方法，其实关于坚果j7镜头进灰，可以分为两种情况，一种是镜头表面吸灰尘，那么这种就比较好清理，另一种是镜头内部进灰，这个就有点难度了...。

2024-11-28 18:10:54

陈欧的神话被你破灭了

@厦门校花，昨晚聚美上市，仅仅四年的时间，陈欧把自己奋斗到接近百亿身价，80后的榜样，真正的高富帅，而且是纽交所上市最年轻CEO，这简直就是开挂的人生模式，长得帅，有钱，有才有能力都在他身上实现了，女生们，如果遇到这样的男人就嫁了吧，@大学生游乐网，从16岁就在国外留学，对了顺便提一句他老爸叫，陈新有，是四川省德阳市委副书记和市...。

2024-11-16 00:06:56

要关上PDF文件应该下载哪个软件 (冰箱关电源后冰箱门是否要关上)

关上pdf文件的话下载轻快pdf阅读器就可以了，假设是想要关上编辑的话须要下载pdf编辑器才行，用编辑器也能关上pdf文件并对文件启动编辑，PDF阅读器收费版如何下载，PDF阅读器有很多种，就比如，轻快pdf阅读器，，这个阅读器的下载方法就有两种！方法一，经过电脑上的阅读器搜查，轻快pdf阅读器，进入官方，经常使用手机扫描官方上的二维...。

2024-07-08 20:35:04

蔚来es8和es7区别 (蔚来es8和es6区别)

蔚来ES8与ES7之对比蔚来ES8和ES7是电动汽车市场中的两颗绚烂明珠，各自仰仗其共同之处赢得了广阔生产者的关注，本文将从外观、性能、内饰和多少钱等多个维度对这两款车型启动深度剖析，协助生产者更明晰地了解它们的不同之处，一、外观设计蔚来ES8的外观充溢了力气感和现代感，家族式的前脸设计配合流线型车身，犹如一头蓄势待发的猛兽，凸显出剧...。

2024-07-07 10:23:52

雷克萨斯rx450hl和450h区别 (雷克萨斯rx300)

车身长度不同、外观不等同，1、车身长度不同，RX450hL车身比RX450h延长110mm，2、外观不同，RX450hL车顶部位的线条启动了向上延长，车尾后备箱处显得愈加垂直，尾灯外部由多个L组成，雷克萨斯rx450h发起机从新启动和封锁时其全体晃动十分显著雷克萨斯RX450h是雷克萨斯旗下的一款SUV，并推出了多种车型发起机从新启动...。

2024-07-07 06:55:57

二手吊车可以分期吗 (二手吊车可以去银行做分期吗)

二手吊车可以分期，依据查问关系地下消息，二手汽车吊功能稳固允许分期，二手车分期付款的运行比过去愈加方便，买二手吊车须要留意些什么须要留意以下几个疑问，1.审核车子能否为意外车，特意是车门位置能否有修复过的痕迹；2.判别吊车经常使用年限，可以从轮胎上反映，吊车车胎的磨损水平可以反映一辆车的经常使用频繁水平，特意是前轮；3.审核发起机外观...。

2024-07-07 03:33:22

迈巴赫跑车有哪几款 (迈巴赫跑车有风噪)

迈巴赫跑车有哪几款，迈巴赫跑车只要一款，那就是迈巴赫，Exelero，不过截止到2019年10月，迈巴赫，Exelero属于概念车的存在，并没有启动出售，迈巴赫，Exelero是飞驰旗下的超奢侈低档跑车，驳回了两门两座的方式，车身所有由碳纤维材质打造，重量为2660克，迈巴赫，Exelero的外型念旧并且前卫，它只消费了一辆，然后被南...。

2024-07-06 18:45:05

bandzip官方下载-bandzip中文版下载v7.25最新版

bandzip就是“bandizip”，没有繁琐的设置界面，上手非常容易，可以快速解压缩文件，支持的格式以及编码有很多，基本满足日常生活中的解压缩需求。还可以进行多卷压缩，遇到大型的文件的时候可以进行分卷。还能设置非常多格式的密码哦，欢迎有需要的朋友下载使用！

2023-11-16 14:05:47

文章推荐

微软正在尝试干掉Win10的传统密码 (windows正在尝试识别问题怎么回事)

在推行微软账户与Windows10紧密联动之后，干掉账户密码似乎成为了微软心中的一道坎，从Windows10预览版的更改可以看出，系统下一步更新将启用微软账户无密码登陆机制，这意味着Windows10多年以来推行的WindowsHello、指纹和PIN码登陆将成为主流，在刚发布没多久的Windows10预览版18936，20H1，中，...。

2025-01-30 23:05:45

网络百科

突发 (突发性耳朵聋最佳治疗方法)

刚刚，欧洲遭到新一轮的未知病毒的冲击，英国、乌克兰、俄罗斯等都受到了不同程度的影响，据悉，该病毒和勒索软件很类似，都是远程锁定设备，然后索要赎金，据DailyMail报导，总部位于伦敦的全球最大广告公司WPP，是英国第一家被爆受到波及的公司，员工们已经被告知关闭电脑，并且不要使用公司WiFi，此外，俄罗斯石油公司Rosneft、丹麦航...。

2024-12-09 23:17:30

资讯动态

宽凳科技连续完成新融资商业逆势破局率先规模落地 (宽凳科技值得去吗)

国内领先的高精地图及智能应用综合解决方案服务商宽凳科技对外披露，最新连续完成了由合肥产投、隐领创投等领投的近亿元A轮追加融资，同时，随着自动驾驶行业逐渐稳固及新基建持续利好，公司商业实现创新突破，2020年收入显著增长，商业变现能力大幅提升，率先完成行业内规模化落地，随着商业的逆势破局，公司即将迎来爆发性成长期，越来越多的资本方与产业...。

2024-12-04 00:09:31

资讯动态

结果被电棍击伤！他们的伤势如何三名男大学生在校约架 (被电棍击对身体危害)

伤者正在医院接受治疗，目前仍有头痛耳鸣的症状，警方通报目前已受理案件将会严格依法处理，仨大学生与同学约架被电棍击伤，2022年11月4日在陕西汉中航空职业技术学院内发生了一起校园斗殴事件，被打的同学表示在临床时一寝室门还在开着，里面的人在玩闹嬉戏，这名同学认为对方声音过大，于是对其进行劝诫，没有想到的是双方产生了激烈的争吵，继而约架，...。

2024-11-24 18:38:03

资讯动态

肾功能不全有哪些表现 (肾功能不全有哪些症状)

肾功能不全又称肾衰竭，它是由多种原因引起的，肾小球严重破坏，使身体在排泄代谢废物和调节水电解质、酸碱平衡等方面出现紊乱的临床综合征候群，肾病整体来说分为5个发展阶段，其中肾功能不全阶段处于中期也就是第3个发展阶段，是整个病情发展的关键转折点，处于前两期的肾友，基本上肾功能损伤问题不大，及时纠正可以完全恢复，已经进展到后两期的患者，不仅...。

2024-11-19 01:02:12

资讯动态

2016 认知计算需要解决这些问题 思必驰首席科学家俞凯 大数据和深度学习不是万能的 CAIIC (认知策略百科)

语音识别属于感知层，而感知只是语音交互的一部分

认知计算需要解决大数据和深度学习之外的问题

相关文章

文章推荐

2016 认知计算需要解决这些问题思必驰首席科学家俞凯大数据和深度学习不是万能的 CAIIC (认知策略百科)