索尼 脖颈贴合传感器 大法 AI 无声语音识别 转换皮肤震动信息 (索尼脖颈贴合怎么样)

文章编号:42458 资讯动态 2024-12-04 无声语音交互机器学习

如今,对于听力有障碍的群体来说,听不到的声音,可以触摸到了。

“触摸”听不到的语言,是由东京大学和索尼计算机科学研究所(CSL)共同研发的 AI 系统「Derma」实现的。有了 Derma 系统,只要在喉咙周围的皮肤上贴上传感器,利用喉咙和下颚的皮肤震动,就能将口形转化为语音。

索尼「无声语音识别」大法:脖颈贴合传感器,AI 转换皮肤震动信息

可“触摸”的语言

根据病症的严重程度,现阶段治疗听力障碍的主流手段包括:

其中,人工耳蜗植入是当前让重度、极重度耳聋患者恢复听力的唯一有效办法。

雷锋网了解到,早在 1957 年,法国科学家首次将电极植入一位全聋病人的耳蜗内,使该患者感知到周围的环境音。直到上世纪 90 年代,人工耳蜗进入临床应用阶段,给极重度耳聋患者带来了“新生”。

实际上,人工耳蜗的发展离不开电子技术、计算机技术、语音学、电生理学、材料学、耳显微外科学的发展。在这些学科兴起、发展之前,针对听力障碍患者,科学家给出的应对措施是一种叫做 Tadoma 的触诊唇读法。顾名思义,这种疗法是指——听力障碍患者通过用手指触摸说话者的嘴唇、下巴、脖颈处,读取说话者想表达的内容。

而上述日本团队研发 AI 系统 Derma 的灵感,最初正是源于Tadoma。

通过机器学习将自动化

该团队的设计其实就是将Tadoma 疗法的过程通过机器学习自动化了。

就其 原理 而言,如下图所示, 在喉咙周边的皮肤上贴上一个加速度/角速度传感器,获取无声发声时下颚、舌肌运动引起的从下颚到喉咙的皮肤颤动信息,采用深度学习进行分析识别,最终实现将无声语音转换为语音输入的 无声语音交互 (Silent Speech Interaction,SSI)。

索尼「无声语音识别」大法:脖颈贴合传感器,AI 转换皮肤震动信息

雷锋网注意到,该传感器可获取 12 维的皮肤运动信息,深度学习可以分析、识别 35 种发声类型。实验表明,识别皮肤颤动信息的精准度超过 94%。

就其 外形 而言,与现有的一些无声语音交互设备相比,这一设备体积小、重量轻、并不显眼。此外,这一系统耗电量低,不易受到环境亮度等因素的影响,不会影响到佩戴者的正常生活,可以说是非常实用了。

另外研究团队表示,经转换后的语音合成不仅可以输入到具有语音识别功能的数字设备(语音助手),同时也能帮助有语言障碍的患者进行交流。

将来,该团队的研究方向则是可穿戴电子设备和体内嵌入式计算集成。

基于 AI 的无声语音交互

近年来,无声语音交互领域方兴未艾,当前产业和学界在该领域的思路主要有 2 条——通过感知气流识别话语(气流采集)和通过感知肌肉运动的方式识别话语(EMG 信号采集)。以下是该领域发展的大致时间线:

实际上,无声语音识别不仅可以帮助有听力、语言障碍的人群,也适用于包括灾害现场、舱外探索、水下作业、工厂车间在内的场景。

不过,无声语音交互设备要想真正成为消费级产品,还需打磨。正如微软全球资深技术院士、微软云与人工智能事业部负责人黄学东博士曾表示:

关于索尼 CSL

正如上文所述,Derma 由东京大学和索尼 CSL 共同研发。

索尼「无声语音识别」大法:脖颈贴合传感器,AI 转换皮肤震动信息

在中国人民大学出版社 2011 年出版的一本名为《索尼研究所的经营哲学》的书中,索尼CSL董事长所真理雄便讲述了索尼CSL的经营管理理念。所真理雄写道,索尼CSL 遵循“小即是美”的经营理念,坚持不扩大规模,因此诞生了众多的“异类和天才”,同时也支持人才的“流通”。

雷锋网了解到,索尼CSL 成立于 1988 年,作为索尼公司的“创新工厂”,广泛关注计算机科学、生命科学、脑科学和经济学等多个领域。当前索尼CSL 的研究方向包括「全球议程」(涵盖从能源到食品和医疗保健的问题)、「人类增强」(包括探索人类创造力和人机交互/集成的研究)与「网络智能」(AI)。

2019 年 11 月,索尼宣布成立索尼 AI 部门,以“利用 AI 激发人类的想象力和创造力” 为使命,旨在推进 AI 技术的基础研发,而索尼CSL总裁兼 CEO Hiroaki Kitano 便是索尼 AI 的全球负责人。

[3]

原创文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
申通快递官网

申通快递官网,申通快递,快递,发快递,快递员,业务员查询,上门取件,在线下单(寄件),申通营业网点查询,快递加盟,单号追踪跟踪查询,投诉电话查询,车辆信息,申通新闻,招聘等服务,全国统一客服热线:95543.

奇码星球

奇码科技为教育机构一键接入少儿编程,旗下奇码星球品牌专注于设计、研发、推广普及一系列针对中小学生的人工智能教学课程体系,致力为国内大小教育培训机构及学校赋能,提供少儿编程课程和少儿编程培训、编程竞赛等加盟业务,成为中国人工智能人才培养的引导者和推动者.

顾彼思(上海)企业管理咨询有限公司

顾彼思勇于挑战引领变革,帮助中国企业走向世界,帮助海外企业立足中国。提供企业管理咨询、经营能力测评、经营战略管理、人力资源管理等企业培训服务。

深圳市居善园林工程有限公司

深圳市居善园林工程有限公司是一家集产品开发、生产、制作、销售、安装服务于一体的专业性木结构厂家,公司拥有专业的场外庞大施工团队,专业从事:木结构、承建各种木屋、高档木别墅、木会所、木平台等各类户外工程。

义乌市启派拉链有限公司

义乌市启派拉链有限公司是一家专业从事拉链、织带、生产、销售及开发的企业,公司引进国际先进自动化生产设备,生产的产品有尼龙拉链、金属拉链、树脂拉链、钻石拉链、丙纶织带、涤纶织带、提花带等。,联系人:周振亲

9422教程网

9422教程网为广大网友提供专业的wps教程,让电脑小白也能轻松学会wps。

览众科技

科技类官网,数字化智能运营,览众,览众科技,数字化转型,数据图谱,数据中台,数据治理,数据管理,数据集成,数字化,数字化智能运营,数据资产变现,资产运营,数据服务,元数据管理,数据血缘,数据目录,ETL,RPA,企业级智能流程自动化平台,企业数字效能引擎,流程自动化专家,可视化编程,财务自动化,一键申报,智能报销,财务转型,RPA财税机器人,RPA金融机器人,RPA辅助机器人,RPA管理机器人,数字劳动力,一键报税,跨系统协同,一站式业务流程自动化解决方案,RPA助力金融数字化转型

无纺布面粉袋封口机/无线封口机,面粉袋超声波封口机

凯华机械多年来一直专注于:无纺布面粉袋封口机,面粉袋超声波封口机,面粉袋封口机、缝边机等设备的生产研发和销售以及完善的售后系统。热线:13655875103

北京嘉创信安科技有限公司

北京嘉创信安科技有限公司为客户提供军工资质“四证”认证(国军标认证、保密认证、许可证认证、名录认证)、涉密信息系统集成(甲、乙)级认证、军工涉密业务咨询服务单位安全保密条件备案、信息安全等级保护测评等咨询服务,同时销售自主研发的安全保密产品及行业内各大厂商的主流产品,所售产品均通过国家保密局认证或军队安全产品认证。

太原市人民政府门户网站

负责市政府会议的会务组织工作.协助市政府领导同志组织会议决定事项的实施.协助市政府领导组织起草或审核以市政府,市政府办公室名义发布的公文,办理中央,国务院,省委,省政府及其他部门发送市政府的公文,负责公文机要交换工作...

佛山柏意门窗专注高品质系统门窗极简系统窗系列

广东佛山柏意门窗是一家集研发、设计、生产、销售、服务为一体的新兴品牌,拥有完善的铝材产业链、经验丰富的制作团队、健全的服务网络及销售体系;十多年来公司一直秉持客户至上、服务第一、以诚会友、以质保源的宗旨。并严抓产品质量,从源头抓起,不断更新产品优势,夯实企业产品质检,真诚的为客户服务。公司先后于荆门、武汉、贵阳、安徽、河南等地陆续建...

一站式汇率换算网

汇率网为您提供最新、最准确的货币汇率查询服务。我们24小时不间断更新,让您随时掌握市场脉搏,轻松进行汇率换算和追踪。无论是个人旅行还是企业金融决策,全球实时汇率网都是...

全局底部横幅