说话人识别的研究始于20世纪30年代。随着研究手段和工具的不断改进,说话人识别的研究逐渐摆脱了早期单纯的人耳听辨模式。Bell实验室的L•G•Kesta用目视观察语谱图的方法进行识别,并提出了“声纹”的概念。我国的声纹鉴定技术起步较晚,上世纪80年代末,公安部二所(现为公安部物证鉴定中心)引进了美国的DSP5500声谱仪,开展声纹鉴定的科研和检案实践。1992年公安部物证鉴定中心完成了部级重点课题《5500语图仪在声纹鉴定中应用的研究》,2001年,该中心承担的国家九五科技攻关项目《声纹鉴定关键技术及话者识别系统研究》通过验收,研制出具有自主知识产权的VS99语音工作站,标志着我国声纹鉴定技术日趋成熟。
“声纹鉴定与自动识别技术研究”项目由公安部物证鉴定中心等单位完成,其主要研究成果是将声纹自动识别功能植入VS99语音工作站,该系统能对说话人特征进行自动分析、判断和语图显示及测量,并可结合专家鉴定以确定说话人身份,适合于法庭科学实际应用。本项目研制出当前声纹鉴定工作中非常实用的集声谱仪和说话人自动识别系统为一体的语音工作站,大大提高了结论的准确率,为声纹鉴定提供了一个实用系统。
◆创新技术:
1.抗噪声处理
噪声对检验结果的影响是一个不可忽视的问题。在本系统中对于非平稳噪声,研究人员提出了利用偶数帧段主分量特征输入隐马尔可夫模型(HMM)结合时间方向平滑处理的SS方法来提高噪声环境下汉语连续语音识别系统鲁棒性的方法,取得较好的识别结果。
2.语音端点检测
端点检测可以避免由噪音引起的误动作以及由噪音引起的误识别,对于准确检测语音信号的起始、提高识别系统精度等有重要意义。采用传统的语音端点检测器SAD很容易造成语音激活的漏检。另外,较大的干扰信号,又有可能被当成是语音的激活,造成语音激活的虚检。为克服这一缺点,研究人员采用一种基于相关性的语音激活检测器,定义了一种有效的相关函数,找到了判别门限设定方法以及防止漏检和虚检的方法。
3.识别算法
本系统采用的是基于GMM模型的优化算法。
(1)改进的GMM的模型训练方法
实验中发现EM算法存在出现奇异阵的重大缺陷,而最大似然估计(ML),虽然识别率比较低,但不会出现奇异阵。因此研究人员采用最大似然估计(ML)所得模型为初始模型,然后用EM算法中的每步的模型通过α值控制修正比例对其进行修正,称为改进EM算法。
(2)基于遗传算法的GMM的模型优化算法
研究人员对传统的遗传算法进行了改进,用于GMM的参数优化中,大大提高了模型的优化程度。
(3)GMM的说话人识别方法的优化
研究人员提出了一种新的优化的基于GMM的说话人识别方案,该方案通过先对一次发音对应一个模型的各帧似然度做一种特定变化然后再计算该音节总的似然度,也就是该音节对应该模型的总的评分,记作Sc,与最大Sc所属模型相对应的说话人即为目标说话人。
◆社会效益:
目前,公安部物证鉴定中心完成的国家“九五”攻关成果VS99语音工作站已经在国内普及,在实际办案中发挥了重要作用。该项目是在VS99的基础上增加自动判别功能,从而进一步提高办案效率和鉴定的准确率。
该项目研制的声纹鉴定自动识别系统具有完全自主知识产权,实用性强,非常适合公安工作的实际需要,可在侦查中对大量嫌疑人进行排查,可以有效地提供侦查方向,缩小侦查范围,提高工作效率。同时该系统具有语图实时显示功能,适用于行动技术中语音信号的采集。自2002年以来,实际检验鉴定案件200起,案件类型包括刑事、经济、民事、治安案件。从结案反馈及法庭审判结果看,正判率为100%。
关键字:声纹鉴定 自动识别 说话 特征
引用地址:
声纹鉴定新技术自动识别判断说话人特征
推荐阅读最新更新时间:2024-03-16 10:53
贴锁骨下的可穿戴监测设备,Cicer为医生实时汇报病人生命特征
你察觉到一些动静醒了过来——是妈妈因为呼吸困难在半夜睡醒。她用手摁着胸口,挣扎着坐起来。你带着她冲向了医院。你握着她的手,感觉到她的脉搏越跳越快,所有的症状都显示了令人难以置信的心跳速度。但当你们俩都到了医院,她却又好了,能四处走动还能跟你说话。所有的指标读数显示正常。同样的事在这个月已经是第三次了。 你准备回家了,同时也感到害怕,因为你知道这样的事还会发生。 但这次不一样。医生交给你一个三角形的设备,设备背面带着小型的有粘性的杯子。他说,如果又出现这种病情,你们回医院,不过要在来医院前就把这个设备粘在你母亲的锁骨下面。 两周后,你和妈妈又一次赶到了医院。这次当你到医院时,医生已经拿着打印好的单
[医疗电子]
会说话的指南针电路
会说话的罗盘是由霍尔效应的方向传感器(MOD1)和模拟音频存储设备ISD1016制成的。会说话的罗盘包含了一个数字罗盘(MOD1),一个ISD1016模拟存储设备(U2),一个74S188可编程只读存储器(U3)和一个简易的额外配件。
[模拟电子]
还得靠实力说话
国产智能手机市场仿佛是在一夜之间变得纷繁复杂,如果说小米打开了智能手机这个“潘多拉之盒”,那么后来的360、盛大、百度等等,都是纷纷加入这场混战的军队。但这场所谓的战争,逐渐演变成为一场营销噱头的网络纷争。 因为从背景上讲,现在国产智能手机纷争的主角们都有一个相似的背景:无论是小米、360还是后来加入的盛大,他们无一都是互联网公司。 而在这个骂战满天飞的年代,他们迎来了一个在专业领域上有着雄厚实力和“纯正血统”的强力竞争对手七喜手机。 国产智能手机市场,变成了战火纷飞的互联网市场争夺。 从其核心人物的性格来看,小米的雷军依然不改其技术流风格,从小米手机入市开始不断讲述小米手机要做国产智能手机老大的愿景,还不厌
[手机便携]
基于DTW的编码域说话人识别研究
说话人识别又被称为话者识别,是指通过对说话人语音信号的分析处理,自动确认说话人是否在所记录的话者集合中,以及进一步确认说话人的身份。说话人识别的基本原理如图1所示。 按照语音的内容,说话人识别可以分为文本无关的(Text-Independent)和文本相关的(Text-Dependent)两种。文本无关的识别系统不规定说话人的发音内容,模型建立相对困难,但用户使用方便。与文本有关的说话人识别系统要求用户按照规定的内容发音,而识别时也必须按规定的内容发音,因此可以达到较好的识别效果。 随着网络技术的发展,通过Internet网络传递语音的网络电话VoIP(Voice over IP)技术发展迅速,已经成为人们日常交流
[嵌入式]
云计算的三大特征与十大障碍
报告对云计算的发展进行了精辟的展望,明确了一些重要的发展趋势,以及云计算使用所需要解决的重要障碍。同时报告还对云计算经济进行了精辟的论述。在我看来,这份报告还忽视了一些云计算的前景。不过总体来说,这份报告非常值得一读。
RAD认为云计算具有以下三个特征:
1、可使用的无限的计算资源,从而消除了云计算用户预防不测的需要。
2、消除了云计算用户的前期投资,从而使得公司以小规模启动,仅在需要增加时增加硬件资源。
3、可支付短期内所使用的计算资源(如处理器的使用小时数和存储使用的天数)以及可以根据需要停止使用,从而通过在不需要时不再使用机器和存储来节省资金。
RAD认为,这些能力被视为云还
[网络通信]
雾化测试仪的应用及特征
雾化测试仪适用于汽车、飞行器等内饰材料,如汽车内饰塑料件、聚氨酯、纺织品、皮革、胶粘剂、非织造布、热可塑性弹性体等材料在高温下其挥发性成分蒸发情况的评价,亦可用于车前氙气灯高温雾化现象的测定。 技术特征: 宽范围、高精度控温装置轻松实现非标测试 6个试验位设计,可同时进行试样试验和空白试验 设备运行稳定,为用户提供准确可靠的检测数据 执行标准: ISO 6452-2007 橡胶或塑料涂覆织物 汽车内装饰物的雾气凝结性能的测定 DIN 75201-1992 汽车-内部设备所用材料雾化性能的确定(中文版) SAE J1756-1994 汽车内饰材料确定成雾特性的试验 QB/T 2728-2005 皮革物理和机械试验 雾化性能的测定
[测试测量]
中国公共云计算市场呈现三大特征
根据IDC最新发布的中国云计算市场的研究报告显示,2010年中国云计算服务市场规模已经达到3.2亿美元。其中超过60%的市场是来自应用软件即服务(AaaS)市场的贡献,主要包括各软件供应商通过云计算方式在线为中小企业提供的财务、企业管理以及协作等应用软件。
在用户需求的推动下,2010年公共云计算服务提供商有了大幅度的发展。IDC中国负责云计算相关领域的研究经理周震刚认为,中国公共云计算市场呈现出以下几个显著特征:
第一,中国公共云计算的运营方式在2010年变得更加多样化。
更多的企业开始进军公共云计算的运营领域。其中,互联网企业具备广泛的客户基础;电信增值服务商和互联网数据中心有着基础架构方面的优势
[网络通信]
医疗电子市场前景看好 巨头方案迭出
由深圳创意时代主办,中国电子学会生物医学电子学分会协办的2008中国国际医疗电子技术大会(CMET2008)本周在深圳隆重召开,来自深圳迈瑞、金科威、东莞金众电子、南京神州英诺华、日电电子等100多家国内医疗电子企业的代表出席了这一技术盛会。作为国内首个关注医疗电子技术方案与发展的专业技术性论坛,本次大会还吸引了包括Actel、TI、NI、ADI、Xilinx、Altera在内国际医疗电子元器件供应巨头以及从事医疗电子研究的科研机构参会并发表了最新医疗电子解决方案及研究成果。 2008中国国际医疗电子技术大会在深圳召开 随着人们对健康与身体保健的重视程度越来越高,以及医疗产业电子化信息化的加速,医疗电子作为一种新
[医疗电子]