声纹识别逐渐升温，缝隙处叩开蓝海市场-电子工程世界

说一声“启动汽车”，引擎马上开启；下班回家对着智能门锁喊一声“开门”，门锁应声而开；对着智能电视喊个话，它就能为你播放专属的视频内容……阿里巴巴用“芝麻开门”打开了宝藏，我们能用声纹识别做什么？

近日，从人工智能产业发展联盟 - 得意音通声纹技术联合实验室获悉，声纹识别在过去一年，从场景侧不断下沉，更加落地。作为语音赛道一个重度垂直的领域，声纹识别终于从“等风来”，成为站在“风口”上的技术。

根据清华大学人工智能研究院听觉智能研究中心、人工智能产业发展联盟 - 得意音通声纹技术联合实验室、中国电信股份有限公司研究院联合发布的《中国声纹识别产业发展白皮书 2.0》，2020 年，声纹技术厂商融资事件达到过去 4 年最多，投资总额仅次于 2018 年。虽融资热度和频次无法与最热门的应用领域相比，但在疫情当下以及贯穿 2019-2020 始末的资本寒冬中，已经算是例外了。

从白皮书对百度、京东、微信等搜索词分析来看，声纹识别与支付、反欺诈、门禁、门锁、考勤等具体应用场景紧密联系在一起，这也从一定程度上反映出了声纹技术当前主要的落地方向。

国内声纹厂商主要有哪些？

<与非网>对国内 20 多家声纹识别企业进行了汇总分析，这些企业也从一定程度上反映了语音技术的三个发展阶段：

早期以 2000 年~2007 年成立的专注于声纹技术的厂商为代表，如得意音通、中科信利、远鉴科技、厦门天聪等，主要背靠清华大学、厦门大学、中科院声学所、自动化研究所等高校和科研机构，这些老牌企业掌握了深厚的技术积累和核心专利。

2007-2015 年间，思必驰、云知声等算法厂商入局，凭借对场景的理解和核心技术的布局，抓住了语音发展的先机。

2016 年开始，人工智能的发展带动了一批初创企业，声扬、声智、中科昊音等都是在这波 AI 红利中成长和诞生的公司，这些企业融资节奏通常比较快，正加紧在专利布局、落地上发力。

2020 年声纹识别三大落地应用

疫情下声纹考勤兴起

今年声纹技术主要的落地场景之一就是声纹考勤。在疫情的非接触需求下，今年 2 月，国务院印发《企事业单位复工复产疫情防控措施指南》，明确要求暂时停用指纹考勤机，改用其他方式对进出人员进行登记。

同时，人脸支付也被“降温”。2 月，中国人民银行营业管理部就制定的《北京市非银行支付机构复工复产防疫工作指引》中提出，要优化和丰富“非接触式服务”渠道和场景，强调疫情防控期间，暂缓人脸识别支付商户拓展。

语音具有天然的“非接触”特性，具体到声纹这个细分领域，它可以根据每个人的语音特征和发音习惯进行动态识别，非常适用于进行身份认证的场景应用中。

在与清华大学人工智能研究院听觉智能研究中心主任、得意音通创始人郑方博士的交流中，笔者曾获悉，“无接触”将沉淀为今后遴选生物识别技术的核心要素之一，特别是在 B 端场景（例如考勤）。声纹天然具有“无接触”的特点，并且不怕被口罩遮挡，应用成本低，声纹产品将成为考勤市场中强有力的竞争者。

他认为考勤产品未来主要有两大方向：一是从集中转向分布、线下转为线上线下结合，也就是说，不再需要单一的考勤机设备，而是直接由员工在各自手机上完成打卡，既提高效率，又保障卫生；二是单纯的考勤功能可能会与门禁功能结合，可以是集中，也可以是分布。得意音通在声纹考勤迭代上主要有三个方向：一是更“轻”，如增加小程序等入口；二是更“重”，注重与门禁等设备结合；三是更安全，还可与人脸技术结合，具体会根据市场反馈来规划。

金融 / 政务服务依旧是大市场

除了疫情下酝酿的新应用，声纹识别最早实现规模化商用的是在金融领域。金融领域因其丰富的场景、海量的数据、对可靠性的高要求和广泛的用户反馈等，一直是前沿技术在民用领域（相较于公共安全领域）的理想试金石。声纹识别也不例外，4G 时代，金融行业催生了手机银行这一形态并迅速普及，使得金融级远程身份认证的需求激增，而声纹识别刚好可以满足这个需求。

根据白皮书显示，到 2020 年下半年，约有 30 家银行机构采购了声纹识别技术产品，其中“动态声纹密码”的声纹登录成为第一大应用场景，可用于账户登录、大额转账、无卡取款、密码找回等业务场景。微信和支付宝也上线了基于声纹动态口令的登录方式。此外，在信贷业务中引入声纹识别技术作为反欺诈手段，还可有效降低冒用他人身份进行骗贷以及多头贷款等事件的发生率。

在政务服务市场，声纹识别也发掘到一个极具潜力的应用——城乡养老保险是社会保障体系的重要组成部分，然而冒领养老金的事件时有发生，每年冒领总金额以亿元计，但若要求高龄老人亲临现场验明身份又非常不便。社保局通过预装声纹身份认证系统，通过 1:1 声纹确认技术，就可以进行远程身份认证。

另据白皮书显示，随着电信诈骗案件频发，声纹特征在公共安全领域的应用价值越来越凸显出来。公安部将声纹识别技术已经纳入防治方案，建库规范提上日程。

智能生活成为蓝海

除了上述应用，声纹识别的下一个蓝海市场有望在智能生活场景中产生，目前已经开始落地的有智能家居、智能车载等应用。

按任务分类的话，声纹识别有 1：1 和 1：N 两大类应用，前者主要进行声纹确认，上面提到的金融、社保等都属于 1：1 确认，通过给定一个说话人的声纹模型和一段只含一名说话人的语音，判断该语音是否是该说话人所说。而在 1：N 应用中则属于声纹辨认，是根据一组候选说话人的声纹模型和一段语音，来判断该语音是哪个说话人所说，适用于公安、安防、智能生活等场景。

随着语音交互场景的成熟，各种个性化的服务需求渐渐浮现出来。通过 1：N 的声纹辨认技术，可支持智能音箱、智能语音助手等提供个性化服务，如针对家庭用户中的老年人、儿童等不同年龄段用户，按照兴趣推荐不同的歌曲、新闻，以及开放特定的功能权限等；利用声纹检出和追踪技术，可在会议纪要中标注每段话所对应的说话人，即可轻松完成多人会议记录，这一功能在市面上一些录音笔中已包括。此外，声纹识别还可完成个人日常生活中各种事物访问控制的授权，比如智能手机锁屏、各类网络账号的声控密码锁、电脑声控锁、声控安全门、汽车声控锁等。

思必驰目前在其全链路对话式 AI 中，特别针对车载场景下通过声纹识别进行优化升级，提供更多个性化的服务方式。

云知声也将声纹识别技术引入到深度学习领域，联手平安好医生打造客户端“声纹登录系统”，并与国家电网合作了会议系统声纹识别项目。

以计算机视觉起家的依图科技，近两年也开始在智能语音发力，2019 年宣称在全球声纹识别竞赛中夺得第一，虽然后续并无太多声纹方面的成果更新，但也反映出依图对声纹的重视，多模态应该是其未来的布局方向。

智能家居是民用场景中最早拥抱声纹技术的，例如长虹已经在电视、空调中先后加入声纹识别功能，使得家电也能够智能识别用户身份，开启私人订制模式。

互联网厂商也在积极布局。

百度前几年在国际上发布过声纹识别方面的论文，今年在小度智能屏中，声纹识别功能已经成为卖点之一。

阿里约在 3 年前开始推广声纹识别，主要运用于平台用户的身份核验，比如在线身份校验服务，用户可通过声纹识别在手机淘宝进行密码修改等。

腾讯云也与微信智能团队共同推进声纹识别，借助云端大数据的优势，根据个人属性提供更多差异化服务内容，并进一步提升安全性，运用在安保、金融、智能硬件等领域。

写在最后

在 AIoT 的推动下，声纹识别技术有望推动一些场景的升级迭代，在未来的人机交互中，带动从硬件到软件在更多商用场景中的发展。多模态的技术应用可能会率先兴起，比如在身份识别场景中，通过声纹+人脸融合验证，在精度要求、安全保障以及不同场景下的体验提升都能得到满足。

这从当前的国际技术趋势上也可以看到一些发展轨迹，例如通过多模态建模，将人脸和声纹中的信息和参数融合在一个架构和模型中，实现语音内容和说话人身份同时识别、语种和说话人身份同时识别等。

关键字：声纹识别人工智能听觉引用地址：声纹识别逐渐升温，缝隙处叩开蓝海市场

上一篇：2020年全球LCD电视面板产能呈下降趋势
下一篇：讯飞智能出元旦惊喜礼盒，助力孩子成绩“牛”气冲天！

推荐阅读最新更新时间：2024-11-10 12:58

“心机”马斯克：表面抵制AI，暗地重金偷跑

过去几个月，ChatGPT火爆全球，强大的AI聊天机器人深刻影响了诸多行业，也让人们再一次认识到了AI的作用和威胁。于是不久前，在人类可能会被AI裹挟的担忧下，包括马斯克在内的上千名颇具影响力的科学家、企业家、投资人联合发布了一封联名信，呼吁全行业暂停开发训练更先进强大的AI技术，至少要先暂停6个月，如今这份公开信联合签署者已经超过2.6万人。有趣的是，明面上呼吁按下AI研发暂停键的马斯克，暗地里却在推进自己的AI项目，据报道，马斯克已经在美国内华达州成立了一家名为X.AI的人工智能（AI）公司，并被曝出，这家公司成立于3月9日，而这个时间甚至要比马斯克公开发布联名信的时间还要早。据了解，马斯克的X.AI公司，将与聊天机

[机器人]

寒武纪AI芯片采用台积电16纳米

大陆首家人工智能(AI)处理器“独角兽”寒武纪于6日宣布，未来将会推出通用型云端的智能芯片∕处理器机器学习处理器(MLU)，并与台积电16纳米携手合作，未来下一步锁定7纳米甚至5纳米，将开创深度学习处理器一个全新的方向。陈天石：打败苹果A11 “四两拨千斤” 大陆中科寒武纪6日于北京举行发布会，会中创办人陈天石首先回顾了寒武纪过去十年发展。寒武纪于2016年，面向产业界，支持发布了全球首款商用深度学习处理器IP产品寒武纪1A处理器，及全球首个AI专用指令集Cambricon ISA。 2017年，华为发布了全球首款AI手机芯片麒麟970，发布了首款智能手机Mate10。陈天石说寒武纪“就是背后那个原创的低调的技术

[嵌入式]

诊断准确率达100%，你会选择“机器人医生”看病吗？

　　大大的脑袋，圆圆的眼睛，“他”是一个机器人，“他”也是一个全科医生，“他”的大脑是“天河超算”。下面就随网络通信小编一起来了解一下相关内容吧。　　把100份病历输入“他”脑中，得出批量临床诊断仅需要4.8秒，单个病例需要的时间为0.04秒，而这个诊断和专业医生作出的诊断结论一致度达到100%。　　“他”是由天河团队研发的CDSS(Clinical Decision Support System)临床决策支持系统，被形象地称为“大超人”。衡阳南华大学8月19日举办的第20届全国高等医学院校诊断学教学改革研讨会上，记者见识了这个“大超人”的威力。　　诊断结果的准确率达到100% 　　这次研讨会上，来自全国20多

[网络通信]

机器人也能拥有公民身份？爱分享懂幽默有眼神交流

随着人工智能的发展，人形机器人的技术也变得成熟了，近日，史上首个获人类公民身份的人形机器人索菲亚亮相在多伦多举行的“Discovery”创新成就展，在大展上，可见到人形机器人索菲亚除了能模仿人类跟周围人有除了有眼神交流，眨眼之外，还能跟随谈话并模仿人类说话时的手势。据介绍，人形机器人索菲亚在“Discovery”创新成就展上，她跟人们讲笑话，分享她的旅游，还跟人们分享关于人工智能的看法，此外，索菲亚幽默地教粉丝如何摆造型拍照，据悉，“索菲亚”公民身份是于2017年10月于沙特阿拉伯授予，有兴趣的朋友可以关注一下。

[嵌入式]

执人工智能牛耳，这13家科技公司：舍我其谁

《麻省理工科技评论》每年都会评出50家“最智能”科技公司榜单，据外媒统计，今年，这份名单中首次有13家公司依靠 AI （人工智能）支撑自己的业务，在榜单比例超过20%。　　依靠AI的这13家公司具体如下：英伟达（NVIDIA）：芯片厂商英伟达于今年初收购了爱尔兰创企Movidius，并在“AI in a box”研发上取得长足进展。“AI in a box”适用广泛，可为VR、自动驾驶和无人机应用提供支持。　　 Facebook：Facebook能入围MIT这份榜单，Oculus功不可没。Facebook社交网络上AI的运用也很不错。　　百度：百度市值高达550亿美元，目前正在开发语音识别项目Deep Spee

[嵌入式]

三星移动芯片跟进人工智能：应对高通华为苹果

　　上周，华为年度旗舰Mate 10终于降临国内，对于这款重磅新机来说，其中一个重要卖点就是，强大的AI能力，背后是麒麟970功劳。下面就随手机便携小编一起来了解一下相关内容吧。　　麒麟970着重突出了手机的AI能力，而这也是手机移动处理器下一个发展的大趋势，苹果在A11上也提前进行了布局，高通骁龙处理器也宣布跟进。三星移动芯片跟进人工智能：应对高通华为苹果　　至于在移动处理器领域占据着重要地位的三星，自然不会放过这个趋势，而现在据《韩国先驱报》报道称，今年8月份三星低调的对中国人工智能创业公司深鉴科技进行了投资。　　其实在这之前，三星就已经对英国人工智能技术公司Graphcore投资3000万美元，

[手机便携]

机器人骚扰电话曝光伪AI无处不在

人工智能自1956年首次提出后，到如今经过几轮起伏，在2016年因谷歌举行了一场备受全球关注的人机大战，使得人工智能在全球迅速走红，引发巨头们豪赌，纷纷加大投入，并伴随以深度学习为核心的AI技术日益成熟，且在物联网部署后有能力获得足够的数据，再加上计算能力的提升，引发全球科技变革。尽管人工智能被视为未来二三十年发展方向，但应用落地缓慢，尤其商业变现困难，包括目前火热的无人驾驶汽车等领域，商业落地还遥遥无期，面向消费科技的智能语音，以及公共场所的人脸识别等AI技术得到广泛应用，同时也积极对金融业产生重大变革，利用数据洞察经济等。但总体来看，人工智能还处在应用爆发前夕，而企业生存则是第一要素，除频繁高额融资支撑企业运营外，同时也

[机器人]

聚焦AI云计算千亿市场 BAT各有谋算

人工智能已经成为2018年的重要技术趋势，它的使用将会变得更加广泛，云计算也会赋能人工智能，有云计算才有大数据，云计算与AI似乎是一个完美的组合。面对如此的千亿市场，BAT又有什么谋算。与2016年相比，许多创新技术开始融入到云计算中，其中以人工智能尤为明显。从智能机器人、智能家居到无人驾驶，再到智慧城市，人工智能与云的融合发展已布局到多行业以及多个应用场景。 2017年1月至10月，国内多个云厂商先后发布了各自的深度学习平台发布情况。其中，3月28日，腾讯云宣布推出DI-X深度学习平台;3月29日，阿里云发布升级版的机器学习平台PAI2.0;4月12日，百度云发布BDL深度学习平台;4月28日，金山云推出KDL深度学习

[网络通信]

热门资源推荐
热门放大器推荐

小广播