声纹识别在安防行业也有春天人脸识别大趋势下 (声纹识别在安卓哪里看)

文章编号：39956 资讯动态 2024-12-03 AI 人脸识别声纹识别 speakin 安防

人脸识别大趋势下，声纹识别在安防行业也有春天？

每逢年末，各类融资消息多不胜数，百万起步，上不封顶。在这其中，一条并不起眼的数千万人民币的融资消息引人注意。

这几年，在市场、技术、政策等多重影响下，曾经浮浮沉沉的AI正在各个行业普及开来。从应用层面来看，AI初创公司大多以人脸识别落地；而SpeakIn（势必可赢科技）却另辟蹊径以声纹识别为刃攻克各个行业的城池壁垒，为传统行业赋能，并于近期获得新一轮千万融资。

欲用声纹识别攻破安防圈

SpeakIn 于2015在硅谷创立，聚焦声纹生物信息ID，商业化落地主要包含四大块：1、安防领域；2、民生领域；3、金融领域；4、智能硬件。针对这些场景，目前已推出多套产品及解决方案。

SpeakIn COO易鹏宇坦称道，在这其中，公司战略优先级最高的当属安防领域，落地方式主要有两种：

而就此，今年6月，SpeakIn还与公安部门合作建立“智能声纹系统联合实验室”，共同投入研发公安业务与安防领域的先进产品与系统，用声纹识别技术为社会安定和国家安全提供服务和保障。

声纹识别的“前世今生”

雷锋网了解到，该技术最早诞生于上世纪四十年代的贝尔实验室。它是通过对一种或多种语音信号的特征分析来达到对未知声音辨别的目的，简单来说就是辨别某一句话是否是某一个人说的技术。

它常常应用于刑侦破案、罪犯跟踪、国防监听、个性化应用等等，主要抽取说话人声音的基音频谱及包络、基音帧的能量、基音共振峰的出现频率及其轨迹等参数表征，然后再与模式识别等传统匹配方法结合进行声纹识别。

易鹏宇告诉雷锋网， 一宗案件中，同时具有指纹、人脸、声音的案件少之又少。互联网时代下，很多犯罪行为都是通过微信、电话等网络设备，声音成为最明显的突破口。

对此，公安部门也早已意识到。雷锋网了解到，多年之前，我国就有设立声纹识别中心，一些工作经验丰富的专家用一些很传统的软件通过识别声音频谱图，花上五个小时、甚至十个小时去听辨一条声音。方言口音、轻重音、韵律特征、发音习惯、语流中的吞音现象、鼻韵味的发音特征、声音基频等等都是在声纹专家辅助系统之前，人力需要判断的声纹特征，一个案子可能一周都听不完，办案效率非常低下。

即便如此，这种作业模式目前还在各个公安部门中广泛使用。

其实， 从理论上来说，声纹就像指纹一样，是具有唯一性的生物信息特征，该技术在美国也一直被广泛使用。 据悉，美国联邦调查局对2000例与声纹相关的案件进行统计，利用声纹作为证据只有0.31%的错误率。截至目前，已经为美国警方破获了几千起案件，为办案人员提供了有效的线索和证据。

显然，相比美国，该技术在我国的推广、使用略为缓慢。究其原因，主要因此前国内相关公司技术上的不成熟让声纹识别在公安那里吃了‘闭门羹’。 “声音是人类最自然的交互方式之一，但相比于人脸识别技术，声纹技术在超大规模识别能力上前些年一直没有太大的突破。” 易鹏宇说道。

在他看来，如今是时候全面应用了。

从技术角度来看，目前在十万的声纹库中寻单一声音，SpeakIn可以做到 Top10（相似值），命中率可达99%点几。而据雷锋网了解，目前全国最大的声纹库大概是五到六万，如此可观的识别率，帮助警方成功破案是一件非常大概率的事情。

声纹识别如何切入安防行业

在与公安部门多次交流中，易鹏宇发现公安的需求非常明确，主要围绕能“破案”展开，并且是能快速、方便、智能地破案。

他介绍说，公安部门引入声纹识别技术之后，把案件声音录入系统（智能声纹鉴定专家辅助系统），随之与库中语音相比对，之后该声音通过机器学习拆分成多个音素的频谱图，五分钟后就可以判别声音归属，并给出很好的排名结果（TOP值），提升办案效率。

而这其中主要得益于两大“功臣”：

总体而言，最终SpeakIn为公安客户提供的是一套完整的解决方案及服务。

声纹识别可用性如何？

声智科技CEO陈孝良博士此前接受雷锋网专访时曾表示，现在大部分研究都是有关动态声纹实时检测，动态检测的方法自然要利用静态检测的各种原理方法，同时也需要增加其他很多算法，比如VAD、降噪、去混响等。VAD的目的是检测是不是人的声音，降噪和去混响是排除环境干扰，这不仅对于声纹检测很中重要，对于语音识别更加重要。

VAD常用两个方法，基于能量检测和LTSD（Long-Term Spectral Divergence)，当前用的较多是LTSD，另外特征提取方面还需要：动态时间规整 (DTW)、矢量量化 (VQ)、支持向量机 (SVM)，模型方面则需要隐马尔可夫模型 (HMM)和高斯混合模型 (GMM)。

虽然声纹识别的唯一性很好，但实际上现有的设备和技术仍然很难做出准确分辨，特别是人的声音还具有易变性，易受身体状况、年龄、情绪等的影响 ，主要包括：

就此，易鹏宇也坦承，声纹识别技术的应用对于环境的要求的确比较苛刻，噪音干扰等问题仍是声音领域的难点。（因为不仅对声纹，语音语义识别也面临着噪声等问题）

他同时也强调说，声纹识别在智能硬件等领域应用充当娱乐功能；用作公安、金融等领域，认证手段也并非独立或者优先使用，它与其他生物识别方式是并存的。不同类型的生物识别各有优势，很多时候都是配合使用，多了一道屏障，绝非当且仅当。

值得一提的是，随着技术的不断成熟，公安部为采购这些设备还正式颁布了《安防声纹识别应用系统技术要求》的行业标准。换言之，声音也是可以作为证据进行鉴定的。

小结

“不同于人脸识别的大规模数据库，声纹识别的难点在于目前声纹库的规模还有待扩充；另外，在声音领域还有类似鸡尾酒会这样的技术难关需要攻克，想要做好这件事，必须保持耐心。” 易鹏宇说道。

的确，都是深度学习基于数据驱动的模型，与人脸识别一样，声纹识别的训练也需要庞大的数据积累及对数据的精确标注。

而相比人脸识别，声纹识别难上加难。

声纹识别训练库的建立，至少要保证性别比例分布为50%±5%，包含有不同年龄段、不同地域、不同口音、不同职业。同时，测试样本应该涵盖文本内容是否相关、采集设备、传输信道、环境噪音、录音回放、声音模仿、时间跨度、采样时长、健康状况和情感因素等影响声纹识别性能的主要因素。

也就是说，声纹识别对数据的要求其实比语音识别还要高很多，这条路会很难。但庆幸的是，我国目前也有像SpeakIn这样的AI初创公司在坚持做拓荒者。用易鹏宇的话说，“这不正是创业者需要做的事吗？”

原创文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/e87d7cfc8fd15dbfc882.html

上一篇：宇视灰姑娘的逆袭之旅宇视灰姑娘的作者是谁

下一篇：的需求边界在哪儿十年求索之路AI医疗对雅森

生活服务网站排行榜单

生活服务网站排行榜单，是综合网站各数据指标综合计算得出的。

网站模板 2023-10-02 19:37:12

车行无忧

车行无忧,提供专业的车辆信息服务。公众号【车行无忧服务号】、APP【车行无忧】、电话【0851-96699】在线咨询等众多服务途径，助您行车无忧！

商业服务 2024-08-16 23:15:29

个人主页

安康个人主页

博客日志 2024-07-03 18:16:53

深圳电通纬创微电子股份有限公司

电影视频 2024-07-11 13:46:05

制药网

制药网是国内外制药机械设备仪器在线用户云集的网络宣传推广媒体网站，服务于FLUKE、NASH、赛默飞、赛多利斯、安捷伦等众多国际大企业，汇集了制药设备机械仪器行业新闻、技术文章、展会信息、企业名录、报价价格、药机视频和订单采购等信息，同时也是众多药厂的采购平台！

电影视频 2024-08-18 14:16:27

山东远明智光电力科技有限公司

山东远明智光电力科技有限公司，是以高低压成套电气设备生产为基础，以电力工程安装为主导，致力于电力工程﹑高低压成套设备﹑无线输（充电）设备﹑智能家居﹑智能机器人的研发销售为主的公司。业务涉及电力﹑石化﹑煤炭﹑钢铁﹑市政﹑有色金属﹑民生家居等行业和领域。

行业信息 2024-08-18 16:50:18

上海穆茨传动设备有限公司

上海穆茨传动设备有限公司坐落于上海，专业从事进口换热器产品的推广和销售，在厂家大力支持下，获得TTP中国区代理资格，重点推广并销售美国TTP，API（艾普尔）公司产品。

电影视频 2024-07-16 22:24:57

进店发

电影视频 2024-11-13 04:42:22

开云电竞(中国)官方网站

专业加工高品质、高精度、高速度的高频微波电路板|肇庆市…电子科技有限公司

网站模板 2024-12-05 01:21:27

度度看开发平台

编程开发 2024-12-05 20:37:17

致高无尚精神财富继续传承

家之有谱如国之有史追溯百家姓氏之根源，i家谱网寻求国内外流传之古谱还是百家姓氏有谱可循有史可查，是每一个人都能谱写家族的史，也是经历者，给您子子孙孙留下致高无尚精神财富。

历史文化 2024-12-09 23:21:36

爱加速

爱加速App是一款专业的网络加速软件，提供高质量的静态网络接入服务，全平台支持。爱加速让网络安全与速度尽在掌握。

网络应用 2025-01-29 21:48:27

可以找茬的手机游戏合集 2023耐玩的找茬手游推荐 (可以找茬的手机游戏)

找茬类型的手游很有意思，是让玩家们在图片中寻找不同地方的游戏，小编今天为大家介绍2023耐玩的找茬手游合集，以下几个可以找茬的手机游戏是相当有趣的，能让玩家锻炼一下自身的观察力，这样的可以找茬的手机游戏简直是休闲时候必备的游戏神器，1、，欢乐找找茬，欢乐找找茬，这个游戏就是很正常的那种找茬类型手游，游戏中前期的一些关卡难度比较小，只...。

2025-02-11 17:47:30

很多宝子们不知道制作vlog视频的软件有哪些，小编为大家带来热门的视频剪辑制作软件大全推荐，想要制作出令人惊叹的视频吗，不需要昂贵的设备或专业的技能，只需要一款优秀的视频剪辑制作软件！我们向您推荐一款功能全面、易于使用且价格实惠的软件，它能够帮助您轻松地将素材剪辑、编辑和制作成您想要的视频，让我们一起来了解这款软件的特点和优势吧！1、...。

2025-02-10 00:45:39

功能争议微信上线 (微信的争议)

无论是真的恶意抹黑还是被，碰瓷，，关于自媒体文章侵害名誉权的争论从未停止，利用抹黑对手的，黑稿，进行商业诋毁，是近年来新出现的互联网乱象之一，为了维护公众自身以及公司在微信当中的形象，微信在日前为公众平台推出了，争议，功能，如果权利人认为自己的名誉在其他自媒体发布的文章当中受到了影响，可以将文章引入，争议，流程，以后在微信当中再也不担...。

2025-01-30 20:35:01

阿里YunOS在汽车行业还有更大野心 117亿轨迹点并不是终点 (阿里云oss收费标准)

*阿里巴巴集团资深副总裁、阿里云总裁胡晓明在云栖大会深圳峰会3月29日，搭载YunOSAuto的荣威RX5已经上市7个月，在这个时间节点上，阿里云总裁胡晓明在云栖大会深圳峰会上公布了YunOSAuto的战绩，雷锋网新智驾获悉，发布至今，YunOSAuto已经产生117亿个轨迹点定位，其前装高精度定位技术的应用大幅提升了传统的地图数据获...。

2024-12-09 23:51:37

平安银行AI全布局 (平安银行车抵贷)

近日，平安银行再次在同业中，一骑绝尘，，率先发布2020年年报，在2020年年报中，平安银行董事长谢永林表示，科技发展潮流不可逆，主动拥抱、积极参与才能借势顺势，把握趋势......我们会继续坚定不移地在科技、互联网等领域继续投入，提前布局更多赛道，2016年，谢永林以董事长的身份执掌平安银行，五年来他持续推动平安银行向科技发展的道路...。

2024-11-30 20:06:39

米家激光投影评测你值得拥有的投影仪！ (米家激光投影仪)

发表在米家投影仪2018，12，616，38原装米家激光投影5000ANSI流明激光投影仪几年前，智能电视占据了市场，但它们有一些缺点，例如由于屏幕较大而难以在小型低天花板房间移动，如今，投影仪是您的最佳选择，它们很轻巧，您可以将它们放在任何地方，它们为您提供与智能电视相同甚至更好的质量，在这个机会中，小米推出了新设备，米家激光投影超...。

2024-11-28 22:01:24

埃及总统对巴勒斯坦和黎巴嫩领土的侵犯无法接受 (埃及总统对巴西的态度)

外地期间11日，埃及总统塞西在沙特首都利雅得加入阿拉伯，伊斯兰特意峰会时示意，环球和中东地域的未来正处于十字路口，巴勒斯坦和黎巴嫩领土被入侵是对整个国内体系的应战，无法接受，塞西谴责对加沙地带平民的屠戮，他示意埃及剧烈推戴任何破坏巴勒斯坦事业的方案，无论是经过驱逐外地居民、强制他们转移，还是使加沙地带无法寓居的任何行径，他强调，要成功...。

2024-11-12 15:41:36

扣子扣恶人生第一粒！在校生走进法院学宪法 (扣子是什么人)

北京日报客户端，记者高健往年12月4日，是我国第十个，国度宪法日，，海淀法院与海淀学区联结举行，弘扬宪法精气争做新时代好少年，宪法日主题优惠，约请来自中国人民大学隶属中学、北京八一学校、北京市第十九中学百余名在校生走进海淀法院法庭，学习宪法，海淀法院院长邵明艳向在校生们解说我国宪法，宪法是国度的基本大法，既是治国安邦的总章程，也是公...。

2024-07-03 22:21:41

华为云会议PC端下载-华为云会议电脑版v9.7.8官方最新版

华为云会议电脑版是华为官方出品的华为云视频会议软件，通过它用户能够进行跨平台的会议和聊天，软件基于华为自身的云会议接口制作，支持发起会议、预约会议

2023-11-05 05:43:23

TCP/IP寻址_视频讲解_用法示例-tcpip编程词典

TCP/IP寻址是什么意思？怎么用？本专题通过翻译、语法解释、视频讲解、实例代码运行方式详细介绍了TCP/IP寻址的定义和使用方法

2023-11-11 14:15:07

java追剧达人原生安卓影视APP源码对接苹果CMS

java追剧达人原生安卓影视APP源码对接苹果CMS修改版java原生苹果cms追剧达人!修复了之前网上流传的只能播放m3u8的毛病!本源码可以**解析的**!**选集!响应快!支持投屏，选集，秒播，缓存下载等等，开发环境java安卓:And...

2023-09-17 17:45:49

腾讯qq下载官方手机QQ最新版-腾讯QQ安卓版v8.8.88

腾讯qq下载官方手机QQ最新版-腾讯QQ是8亿人在用的即时通讯软件，你不仅可以在各类通讯终端上通过腾讯QQ聊天交友，利用腾讯QQ还能进行免费的视频、语音通话，或者随时随地收发重要文件，您可以免费下载安卓手机腾讯QQ。

2023-08-11 12:49:59

文章推荐

揭秘我每天被动引流50 学会了年入6位数不是问题精准粉丝的秘密 (揭秘我每天被骗了)

大家好，我是遥远哥，今天教大家怎么引流，一天可以引流50，的精准粉，我今天不仅会分享引流的思维和方法，还会告诉你怎么引导到微信的客户，提高客户的终生价值，这篇文章集结了我过去引流的精髓，千万一定要认真阅读，不能跳读，否则你还是不会引流，还是赚不到钱，我相信这篇文章一定能帮你提升引流的能力，让你少走很多的引流弯路，我给大家分享的方法，都...。

2025-01-28 23:32:56

好文分享

园内人多吗嘻哈乐儿童主题乐园有多少分园 (人数多的游园活动)

儿童乐园品牌现在有不少，能够满足孩子玩乐需求，在这里可以享受主题乐园，有众多玩乐项目在孩子成长中起着重要作用，嘻哈乐儿童主题乐园拥有成熟的运营经验以及丰富的主题乐园，可以做好主题乐园的建设，嘻哈乐儿童主题乐园有多少分园，园内人多吗，大多数创业者都很关注儿童乐园的经营状况，嘻哈乐儿童主题乐园主要以定制化的儿童乐园经营为主，公司运营有很多...。

2025-01-16 01:30:24

创业加盟

智能家居崛起之路讯飞的思考与开放 (智能家居崛起的原因)

近两年，随着越来越多智能设备逐渐落地普及，整个智能家居行业扶摇直上，在今年世界物联网博览会上，中国经济信息社发布的，2017，2018年中国物联网发展年度报告，中指出，作为万亿级物联网市场的四大主流细分领域之一，我国智能家居市场总体规模已达900亿元，相较2016年增长50%，科大讯飞作为智能家居领域关键厂商，继AIUI语音系统、MO...。

2024-12-10 01:38:29

资讯动态

为了AI大模型数据中心服务器要成潮流泡澡 (为了模特梦陷入深渊是什么电影)

当AI写论文，做旅行攻略，作画，写诗能够媲美甚至超越普通人水平时，有人兴奋不已，也有人忧心忡忡，普通人对于生成式AI可能带来的变化态度各有不同，但推动这一技术发展的研究人员和企业都有一个共同关注的问题——大模型所需的大算力需求带来的能耗问题如何解决，以火爆全球的OpenAI公司的ChatGPT为例，两年前，微软为了满足OpenAI的G...。

2024-12-09 19:17:20

资讯动态

我们都知道些什么关于那些被热议的手术机器人 (我们都知道些什么)

近年来，机器人不仅用于工业领域，在医疗系统也已得到推广应用，如大名鼎鼎的手术机器人，SurgicalRobot，的问世不过短短10年，但同样取得重大进展，目前，关于机器人在医疗界中的应用的研究主要集中在外科手术机器人、康复机器人、护理机器人和服务机器人方面，其中，外科手术机器人是目前应用范围最广且最具前景，其提供的强大功能克服了传统外...。

2024-11-30 20:51:24

资讯动态

声纹识别在安防行业也有春天 人脸识别大趋势下 (声纹识别在安卓哪里看)

欲用声纹识别攻破安防圈

声纹识别的“前世今生”

声纹识别如何切入安防行业

声纹识别可用性如何？

小结

相关文章

文章推荐

声纹识别在安防行业也有春天人脸识别大趋势下 (声纹识别在安卓哪里看)