“声纹”独一无二是身份识别的利器-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

每个人声音的独一无二的气质形成了“声纹”，而在某种程度上，这可以代替指纹。指纹必须要和人有直接的肢体接触，但是声纹直接发来一段声音就可以，将来可以应用于识别或侦查领域。那么声纹的工作原理是什么呢？

　　声纹识别神秘面纱

在这个移动互联网大行其道的年代，人们不用互相见面就可以完成很多事情，比如社交、购物、网上开店、金融交易等等，但是如何验证身份变成了人和人在不见面的情况下最难的事情。传统的解决方案就是密码或者秘钥，它需要你记住或者存起来，容易忘又容易丢，还容易被黑客利用各种手段攻击。有多少人使用“123456“这种简单密码在网络上行走，他们就是黑客们最喜欢的目标；你家的路由器是不是还在用”admin”这种默认密码，这就是物联网领域中安全最薄弱的环节。不过，好在我们每个人身上都长满了“活密码”，指纹、脸、声音、眼睛等等，都是人和人之间相互区分的独一无二的标识，我们称之为“生物特征”。声音就是这种一种可以反映人身份的生物特征，参考“指纹”的命名方式，我们可以叫它“声纹”。

　　各种生物特征比较

声纹是指人类语音中携带言语信息的声波频谱，它同指纹一样，具备独特的生物学特征，具有身份识别的作用，不仅具有特定性，而且具有相对的稳定性。声音信号是一维连续信号，将它进行离散化后，就可以得到我们现在常见的计算机可以处理的声音信号。

计算机可以处理的离散声音信号

声纹识别(也称说话人识别)技术也如同现在在智能手机上应用十分广泛的指纹识别技术一样，从说话人发出的语音信号中提取语音特征，并据此对说话人进行身份验证的生物识别技术。每个人都具有独一无二的声纹，这是由我们的发声器官在成长过程中逐渐形成的特征。无论别人对我们的说话模仿的多么相似，声纹其实都是具有显著区别的。

现实生活中的“未见其人，先闻其声”就是人类通过声音去识别另一个人身份的真实描述，你妈甚至通过你电话里的一个“喂”字就知道是你，而不是隔壁老王家的儿子打的电话，这是我们人类经过长期进化所获得到的超常的能力。虽然目前计算机还做不到通过一个字就判断出人的身份，但是利用大量的训练语音数据，可以学出一个“智商”还不错的“声纹”大脑，它在你说出8-10个字的情况下可以判断出是不是你在说话，或者在你说1分钟以上的话后，就可以准确地判断出你是否是给定的1000人中的一员。这里面其实包含了大部分生物识别系统都适用的重要概念：1:1和1:N，同时也包含了只有在声纹识别技术中存在的独特的概念：内容相关和内容无关。

工作原理

对于一个生物识别系统而言，如果它的工作模式是需要你提供自己的身份(账号)以及生物特征，然后跟之前保存好的你本人的生物特征进行比对，确认两者是否一致(即你是不是你)，那么它是一个1:1的识别系统(也可以叫说话人确认，SpeakerVerification)；如果它只需要你提供生物特征，然后从后台多条生物特征记录中搜寻出哪个是你(即你是谁)，或者哪个都不是你，那么它是一个1:N的识别系统(也可以叫辨认，SpeakerIdentification)，见图1。技术上，简单的声纹识别的系统工作流程图来见图2。

　图1说话人确认和说话人辨认

　图2声纹识别工作流程图

对于声纹识别系统而言，如果从用户所说语音内容的角度出发，则可以分为内容相关和内容无关两大类技术。顾名思义，“内容相关”就是指系统假定用户只说系统提示内容或者小范围内允许的内容，而“内容无关”则并不限定用户所说内容。前者只需要识别系统能够在较小的范围内处理不同用户之间的声音特性的差异就可以，由于内容大致类似，只需要考虑声音本身的差异，难度相对较小；而后者由于不限定内容，识别系统不仅需要考虑用户声音之间的特定差异，还需要处理内容不同而引起的语音差异，难度较大。

目前有一种介于两者之间的技术，可以称之为“有限内容相关”，系统会随机搭配一些数字或符号，用户需正确念出对应的内容才可识别声纹，这种随机性的引入使得文本相关识别中每一次采集到的声纹都有内容时序上的差异，这种特性正好与互联网上广泛存在的短随机数字串(如数字验证码)相契合，可以用来校验身份，或者和其他人脸等生物特征结合起来组成多因子认证手段。

具体到声纹识别算法的技术细节，在特征层面，经典的梅尔倒谱系数MFCC，感知线性预测系数PLP、深度特征DeepFeature、以及能量规整谱系数PNCC等，都可以作为优秀的声学特征用于模型学习的输入，但使用最多的还是MFCC特征，也可以将多种特征在特征层面或者模型层面进行组合使用。在机器学习模型层面，目前还是N.Dehak在2009年提出的iVector框架一统天下，虽然在深度学习大红大紫的今天，声纹领域也难免被影响，在传统的UBM-iVector框架下衍化出了DNN-iVector，也仅仅是使用DNN(或者BN)提取特征代替MFCC或者作为MFCC的补充，后端学习框架依然是iVector。

图3示出了一个完整的声纹识别系统的训练和测试流程，可以看到在其中iVector模型的训练以及随后的信道补偿模型训练是最重要的环节。在特征阶段，可以使用BottleNeck特征取代或者补充MFCC特征，输入到iVector框架中训练模型，如图4所示。

　图3声纹识别算法的完整训练和识别框架

　图4使用BottleNeck特征训练iVector模型

在系统层面，不同的特征及模型，可以从不同的维度刻画说话人的声音特征，加上有效的分数规整，将各子系统融合能有效的提高系统的整体性能。

关键字：声纹身份识别引用地址：“声纹”独一无二是身份识别的利器

上一篇：通过步态发现怪异行为或可应用于安防系统
下一篇：住宅安防系统这样设计才科学合理

推荐阅读最新更新时间：2024-03-16 11:23

上海高校研发身份认证生物识别新技术

上海交大研发的“人脸识别身份认证系统”已应用于江苏、广东等地监狱门禁。人脸识别系统的智能化体现于软件：通过“去配饰算法”，即使被识别对象突然戴起了眼镜，系统也能还原其本来面目。　　人脸识别有没有失灵的状况？比如双胞胎、加戴眼镜、长大变老、黑灯瞎火？在10月17日举行的国际减灾应急与安全博览会上，沪上13所高校携58个项目开辟展区，基于人体生物特征的识别认证新技术集中亮相，不仅人脸识别的这些难点迎刃而解，更牛的虹膜识别也展现了超凡“眼力”。　　除了银行、别墅等应用场景，上海交大研发的“人脸识别身份认证系统”已应用于江苏、广东等地监狱门禁。人脸识别系统的智能化体现于软件：通过“去配饰算法”，即使被识别对象突然戴起了

[安防电子]

HID Global展望2016年安全身份识别主流趋势

安全身份识别解决方案的全球领导者HID Global通过从不同行业市场的重要客户那里所获得的深刻洞察，以及公司最新解决方案在前瞻性合作伙伴和全球各地的终端用户中进行的试点项目与正式部署情况，确定了2016年最值得业界关注的安全趋势。HID Global 广阔的行业视角，使得公司有能力精准指出其认为将会在今年对身份信息与门禁管理，公民身份识别以及物联网（IoT）产生最重大影响的五个主要发展方向。 “我们正在关注新的一年中将会出现的几大发展趋势，包括对于以移动性为核心，可以更好满足用户体验的安全技术的需求在不断增加。HID Global相信这些将是2016年行业创新的主要驱动力，” HID Global总裁兼CEO Stefan

[嵌入式]

LabVIEW嵌入式心音身份识别系统方案

心音身份识别是指一种利用人体心音信号进行身份识别的技术，心音是心脏及心血管系统机械运动状况的反映，包含了心脏各个部分本身及相互之间作用的生理和病理信息。因此，心音信号在不同的人身上有着完全不同的特征并且具有极高的稳定性，可以用作生物识别技术的识别特征。心音信号除了很难伪装，伪造及篡改外还具有容易获取的优势，因此人体心音信号可以为一种新型生物识别方法。本文开发了一种基于LabVIEW的嵌入式心音身份识别系统，该系统使用方便灵活，能够实现对用户身份的注册、辨识和确认。 1、心音信号身份识别原理心音信号用于个人身份识别主要包括两步:特征提取和模式匹配，特征提取是从心音信号中提取到唯一的表现被测者身份的有效且稳定可靠的特征，模

[工业控制]

ZigBee身份识别技术在智能家居系统的应用

　　随着电子技术特别是无线通信技术的快速发展，人们对通信技术的功耗、可靠性及灵活性的要求越来越高。作为一种具有低功耗、低成本、数据传输可靠及组网灵活等特点的ZigBee技术，越来越引起人们的关注，非常适合家庭这种短距离无线组网的使用。而作为现有成熟的GSM(Global System for Mobile Communication)技术，因其在网络资源，传输特性及数据可靠性等方面的优势，为人们提供了一个机动、灵活、可靠的远距离传输方式。　　本文介绍了一种基于这两种技术相结合的控制方案，并安装于笔者的家庭中，经过一年多的实际应用，收到了令人满意的效果。为倡导的技术走出实验室的发展思路，起到很好的推动和示范作用。特别是本系

[单片机]

ZigBee<font color='red'>身份</font><font color='red'>识别</font>技术在智能家居系统的应用

安全引擎手掌静脉身份识别技术成热门应用

　　发达国际的昨天，预示着中国的今天和明天。随着手掌静脉技术为越来越为中国企业所认知，一股安全应用热潮将风生水起。　　令人耳目一新的安全利器　　手掌静脉技术为何赢得世界和中国的一致推崇?据了解，在国内应用的这款能够识别手掌静脉的计算机鼠标——富士通手掌静脉识别装备之一，内部有配备近红外线探测装置的摄像设备，使用者手掌一接触鼠标，近红外线就可以通过窗口照射到人的手掌静脉。由于静脉中血流状态因人而异，因此，只有当从近红外线摄像画面中得到的静脉类型与预先登录的静脉类型完全吻合的用户才能得到确认，否则便不能进入信息系统.。这不仅使安全保密程度大大提高，而且让使用者的登录更加便捷。　　富士通手掌静脉识别技术

[安防电子]

2014年安全身份识别认证技术发展趋势

全球安全身份识别解决方案商，发布对2014年安全身份行业产生重要影响的发展趋势预测。预测涵盖多种解决方案及技术，包括在门禁和桌面登录、安全发行、身份验证、访客管理、电子ID(eID)和安全资产跟踪等方面的未来发展。HID Global高级副总裁兼首席技术官Selva Selvaratnam博士还在分析中谈到：各机构在其IT基础架构和周边架构中越来越多地采用高级鉴权机制，预计会减少使用密码。同时加速门禁和桌面登录功能的融合，从而能在门户、数据、以及云安防领域为用户提供无缝的体验。在去年进行预测的基础上，我们在此继续分享2014年以及此后的主要市场趋势。目前的市场令人充满期待，因为整个行业都在不断进步，更易于各个

[安防电子]

膝关节唯一性凸显，或用作身份识别

据国外媒体报道，人们对数字指纹、虹膜识别以及声音认证等身份确认的方式并不陌生，但研究人员近日称，人类的膝关节也可用来进行身份认证，并且准确率高达93%。据美国一行研究团队称，人类的膝盖也具有唯一性，可为机场临检以及其他的安全检验点提供简单的身份识别手段。在核磁共振成像（以下简称“MRI”）系统首次试验后，其准确率高达93%。　　来自美国密歇根州南菲尔德的劳伦斯理工大学（Lawrence Technological University）的计算机科学家利奥尔-沙米尔（Lior Shamir）称，人群在机场验护照或是通过一件办公室入口时，在移动的队列中，该系统应当是快速登记和进行身份识别的完美工具。　　研究团队认为，除非有大的

[模拟电子]