随着研究手段和工具的不断改进,说话人识别的研究逐渐摆脱了早期单纯的人耳听辨模式。
Bell实验室的 L•G•Kesta用目视观察语谱图的方法进行识别,并提出了“声纹”的概念。
“声纹鉴定与自动识别技术研究”项目由公安部物证鉴定中心等单位完成,其主要研究成果是将声纹自动识别功能植入VS99语音工作站,该系统能对说话人特征进行自动分析、判断和语图显示及测量,并可结合专家鉴定以确定说话人身份,适合于法庭科学实际应用。本项目研制出当前声纹鉴定工作中非常实用的集声谱仪和说话人自动识别系统为一体的语音工作站,大大提高了结论的准确率,为声纹鉴定提供了一个实用系统。
◆创新技术:
1.抗噪声处理
噪声对检验结果的影响是一个不可忽视的问题。在本系统中对于非平稳噪声,研究人员提出了利用偶数帧段主分量特征输入隐马尔可夫模型(HMM)结合时间方向平滑处理的SS方法来提高噪声环境下汉语连续语音识别系统鲁棒性的方法,取得较好的识别结果。
2.语音端点检测
端点检测可以避免由噪音引起的误动作以及由噪音引起的误识别,对于准确检测语音信号的起始、提高识别系统精度等有重要意义。采用传统的语音端点检测器SAD很容易造成语音激活的漏检。另外,较大的干扰信号,又有可能被当成是语音的激活,造成语音激活的虚检。为克服这一缺点,研究人员采用一种基于相关性的语音激活检测器,定义了一种有效的相关函数,找到了判别门限设定方法以及防止漏检和虚检的方法。
3.识别算法
本系统采用的是基于GMM模型的优化算法。
(1)改进的GMM的模型训练方法
实验中发现EM算法存在出现奇异阵的重大缺陷,而最大似然估计(ML),虽然识别率比较低,但不会出现奇异阵。因此研究人员采用最大似然估计(ML)所得模型为初始模型,然后用EM算法中的每步的模型通过α值控制修正比例对其进行修正,称为改进EM算法。
(2)基于遗传算法的GMM的模型优化算法
研究人员对传统的遗传算法进行了改进,用于GMM的参数优化中,大大提高了模型的优化程度。
(3)GMM的说话人识别方法的优化
研究人员提出了一种新的优化的基于GMM的说话人识别方案,该方案通过先对一次发音对应一个模型的各帧似然度做一种特定变化然后再计算该音节总的似然度,也就是该音节对应该模型的总的评分,记作Sc,与最大Sc所属模型相对应的说话人即为目标说话人。
◆社会效益:
目前,公安部物证鉴定中心完成的国家“九五”攻关成果VS99语音工作站已经在国内普及,在实际办案中发挥了重要作用。该项目是在VS99的基础上增加自动判别功能,从而进一步提高办案效率和鉴定的准确率。
该项目研制的声纹鉴定自动识别系统具有完全自主知识产权,实用性强,非常适合公安工作的实际需要,可在侦查中对大量嫌疑人进行排查,可以有效地提供侦查方向,缩小侦查范围,提高工作效率。同时该系统具有语图实时显示功能,适用于行动技术中语音信号的采集。自2002年以来,实际检验鉴定案件 200起,案件类型包括刑事、经济、民事、治安案件。从结案反馈及法庭审判结果看,正判率为100%。
上一篇:非接触式温度传感器的选择和使用
下一篇:一种高精度、宽动态范围的APD偏压控制/光功率监测电路设计
推荐阅读最新更新时间:2023-10-12 20:53
- 英飞凌推出OptiMOS™ Linear FET 2 MOSFET, 赋能先进的热插拔技术和电池保护功能
- USB Type-C® 和 USB Power Delivery:专为扩展功率范围和电池供电型系统而设计
- ROHM开发出适合高分辨率音源播放的MUS-IC™系列第2代音频DAC芯片
- ADALM2000实验:变压器耦合放大器
- 高信噪比MEMS麦克风驱动人工智能交互
- 在发送信号链设计中使用差分转单端射频放大器的优势
- 安森美CEO亮相慕尼黑Electronica展,推出Treo平台
- 安森美推出业界领先的模拟和混合信号平台
- 贸泽开售用于快速开发精密数据采集系统的 Analog Devices ADAQ7767-1 μModule DAQ解决方案