超高信噪对于MEMS麦克风的重要性

发布者:虚拟现实迷最新更新时间:2021-10-18 来源: eefocus关键字:麦克风  噪声  ASR 手机看文章 扫描二维码
随时随地手机看文章

自动语音识别系统的普及和视频内容共享信息和经验的使用正在急剧增加。用于捕捉声音的麦克风的性能和质量必须高,以确保良好的用户体验。关键因素包括噪声、畸变、频率响应和元件匹配。

 

在之前的文章中,已经简单说明了,麦克风性能的特点通常是自噪声和动态范围。动态范围的上限由声学过载点(AOP Acoustic Overload Point)定义。下限由信噪比(SNR Signal-to-noise Ratio)定义。信噪比描述了麦克风的自噪声。麦克风只能在其自噪声层以上的声压级(SPL)下接收信号。因此,高信噪比的麦克风可以在比低信噪比的麦克风更低的声压下工作。本文,则集中于信噪比(SNR)和声学过载点(AOP),并解释了在语音识别和音频/视频捕获系统中具有高麦克风性能的好处。

 

麦克风输出中的噪声可以定义为任何不是预期输入源的信号,通常被认为是输出信号中不希望出现的元素。噪声水平越高,越会降低音频信号的质量。噪声可以来自麦克风外部,也可以来自麦克风本身。人们通常听到麦克风的自噪音作为一种嘶嘶声,影响感知的声音质量。对于算法来说,噪声会恶化信号的保真度,从而降低系统性能。

 

麦克风的噪声可以用不同的方式表达:

  • 自噪声(Vrms、dBV、dBFS)是麦克风本身在不受外界声音激励时产生的rms噪声电压。

  • 信噪比(SNR (dB))描述了麦克风相对于预期输入信号的自噪声。信噪比的测量通常使用一个标准的声学输入信号来表示想要的声音,一个94 dBSPL (1 Pa)正弦波。

 

等效输入噪声EIN (dBSPL)是进入麦克风的(假想的)声学噪声水平,它相当于麦克风输出时的电子噪声水平。

 

所有现实生活中的音频传感器都是非线性系统,因为它们向通过它们的信号添加内容。在失真的情况下,增加的内容位于原始信号中出现的频率的谐波。失真通常以总谐波失真THD(如果包含自噪声则为THD+N)来测量。它是当麦克风被正弦波激发时,信号谐波中的能量(通常是第二到第五次谐波)与基频中的能量之比。测试信号通常是一个1 kHz的正弦信号,处于相对较高的声压级(SPL),通常为94 dBSPL或更高。THD以百分比(%)表示。声学过载点,AOP通常定义为THD超过10%的声压级。AOP的单元是dBSPL。

 

在大多数情况下,保持传入麦克风的声音的原始形式和内容是有益和重要的。在原始信号中加入内容,比如失真,可能会让听声音的人听起来不舒服。增加的能量越多(即THD值越高),感知到的音频质量就越差。失真还可能使语音识别系统等算法产生混淆,特别是对输入信号的内容进行非常详细分析的语音识别系统,失真造成的影响会更大。

 

图1 Acoustical SNR 信噪比示意

 

音频/视频录制的目的是捕捉来自受试者的传入声音,并将其复制到麦克风系统的输出中。当录音是为人类的耳朵,它是可取的电子输出信号匹配的声音信号尽可能接近,提供一个“自然”的声音记录。麦克风及其信噪比是声捕获信号链的关键部分,影响录音质量。下表给出了一些典型的用例。

 


在自然情况下,每增加一倍距离,声压减半(降低6分贝)。捕获的声源越远,到达麦克风的声音信号就越安静。由于麦克风的自噪声实际上是恒定的,输入信号电平的降低会导致麦克风输出信号的信噪比降低。通常,弱信号必须被放大,使其达到设备信号路径的适当水平。放大信号也会放大输出信号中的噪声。放大倍数越大,噪声上升到显著降低捕获信号质量的水平的风险就越大。

 

高麦克风信噪比有助于保持本底噪声是几乎听不见的,即使信号被放大。捕获距离越长,麦克风的自噪声越小,以避免出现问题。当距离很长且声源本身很安静时,这一点尤其重要。当每增加一倍的距离,声压会衰减6分贝时,使用高信噪比6分贝的麦克风,可以使捕捉距离加倍而不会降低信号质量。

 

POLQA (Objective Listening Quality Assessment)是一种ITU-T标准模型,它使用数字语音分析来客观地确定录制语音信号的质量和可理解性。高信噪比的麦克风在POLQA测试中表现明显更好,并具有更好的语音清晰度。当用高信噪比麦克风记录信号时,同一水平的信号更容易理解。

 

和SNR一样,AOP也是一个重要的音频/视频质量因素。失真很容易使视频记录变得无用。网上有很多在流行音乐/摇滚音乐会上拍摄的智能手机视频,由于音频失真严重,无法观看。如果预期声音(或干扰声音)的传入声压水平高或非常高,则高AOP可以改善声音质量。高AOP帮助麦克风系统处理传入声音信号中可能出现的非常高的信号峰值,即使平均声压水平不是非常高。参见下表中的一些典型用例。

 


直到几年前,消费电子设备麦克风AOP的标准水平还在110到120 dBSPL之间。在最近的过去,AOP的需求已经上升了。为了确保音质和语音识别性能满足客户的要求,设备设计者应该选择AOPs接近或高于130 dBSPL的麦克风。在较低的声压水平下,观察比为AOP指定的10%更低的THD水平更有意义。除了拥有高的AOP之外,THD保持在低水平(低于2%)也很重要,对于预期的应用程序(例如,高达120 dBSPL), THD应该达到足够高的声压级。

 

在系统中,所捕获的声音用于算法时,声音质量目标可能与信号用于人耳时不同。信号并不一定要听起来很自然,只要它是为算法优化的。不管用例是什么,保持信号不受干扰、工件、失真和噪声的影响总是很重要的。

 

自然语音识别(ASR)是将语音信号自动转录成文字的任务。转录正确率越来越接近人类水平,大约为95%。然而,到目前为止,只有在环境条件良好的实验室里才有可能达到这个水平。在现实生活环境和远距离语音识别涉及一些重要的声学挑战,如背景噪声、混响、回声消除和麦克风定位。仅仅有一个好的语音识别引擎是不够的。系统中的每个元素都应该以高标准执行,以防止出现质量瓶颈。麦克风的工作是提供语音识别系统最好的输入信号。 高输入信号质量有助于ASR系统分析传入的声音,并找到其中的特征,从而识别语音内容。关键参数包括噪声、畸变、频率响应和相位。

 

高AOP可以帮助在嘈杂环境中的语音识别系统。有时,语音信号本身并不强,同时存在其他干扰。例如,在语音控制的家庭娱乐系统和数字助理中,有靠近麦克风的扬声器,可以输出响度大的音乐或语音信息。高AOP有助于保持低失真,改善噪声和回声的消除。

 

距离语音源越远,输入到ASR算法的信号的信噪比越低。因此,当目标捕捉距离越长,麦克风信噪比越高。

 

语音识别系统的一个关键功能是能够忽略非待转录语音的声音和噪声。音频/视频捕捉和人与人之间的沟通质量也可以通过从信号中排除不需要的声音来提高。目标是增加信噪比,在这种情况下,信噪比是想要的声音(信号)与不想要的环境声音(噪音)的比率。

 

将多麦克风与算法相结合,可以实现噪声消除和方向性。定向传声器系统,如波束形成,可以集中麦克风对所需方向的灵敏度和突出所需的声源。不需要的声音也可以根据参数取消,如两个麦克风之间的水平差异。盲源分离是一种更为复杂的降噪系统。它可以消除与方向、距离和位置无关的噪声。所有这些噪声消除方法都得益于其接收信号的准确性和高质量。麦克风应具有高信噪比,低失真,平坦频响(也改善了相位响应)和低群延迟。

 

为了优化噪声消除算法的功能,系统中使用的麦克风应该具有相同的特性。麦克风与麦克风匹配的作用至关重要。麦克风之间的灵敏度、相位特性和延迟的差异越小越好。

 

从2005年到2015年,最先进的麦克风在大众市场消费电子设备的信噪比从低于60分贝提高到约65分贝。随着新的高性能语音识别系统和其他捕获用例的需求,即使65 dB也不再足够了。目前高端麦克风的信噪比接近70分贝。


高麦克风性能是实现高语音识别和音频捕获质量的关键。自动语音识别算法和相机等技术的性能正在迅速提高,设备购买者对用户体验的期望也在提高。避免麦克风成为改进瓶颈是很重要的。幸运的是,现在有高性能的麦克风。噪声性能在过去的几年中有了显著的提高。随着AOP达到130 dBSPL的标志,SNR已经超过了70 dB的水平,而质量下降的失真正在成为过去。这种水平的麦克风性能有助于充分提升设备整体表现。

关键字:麦克风  噪声  ASR 引用地址:超高信噪对于MEMS麦克风的重要性

上一篇:优派4K电竞显示器XG320U 惊艳来袭,带你披荆斩棘!
下一篇:TWS耳机通话降噪中的技术

推荐阅读最新更新时间:2024-11-16 22:13

6种经典实用的相位噪声测量方法(图文解析)
相位噪声的含义 相位噪声是对信号时序变化的另一种测量方式,其结果在频率域内显示。用一个振荡器信号来解释相位噪声。如果没有相位噪声,那么振荡器的整个功率都应集中在频率f=fo处。但相位噪声的出现将振荡器的一部分功率扩展到相邻的频率中去,产生了边带(sideband)。从下图中可以看出,在离中心频率一定合理距离的偏移频率处,边带功率滚降到1/fm,fm是该频率偏离中心频率的差值。 相位噪声通常定义为在某一给定偏移频率处的dBc/Hz值,其中,dBc是以dB为单位的该频率处功率与总功率的比值。一个振荡器在某一偏移频率处的相位噪声定义为在该频率处1Hz带宽内的信号功率与信号的总功率比值。 图1 相位噪声的含义 主要的相位噪声
[测试测量]
6种经典实用的相位<font color='red'>噪声</font>测量方法(图文解析)
大联大诠鼎集团推出基于Qualcomm产品的三麦克风通话降噪耳机方案
2022年11月10日,致力于亚太地区市场的领先半导体元器件分销商---大联大控股宣布,其旗下诠鼎推出 基于高通(Qualcomm)QCC3071芯片的三麦克风通话降噪耳机方案 。 图示1-大联大诠鼎基于Qualcomm产品的三麦克风通话降噪耳机方案的展示板图 随着TWS(True wireless stereo)耳机市场的不断成长,用户对于产品的需求也从简单的快速连接,升级到更高的要求标准上。其中通话质量成为当今大多数人购买蓝牙耳机时的一项重要考量。在日常生活中,影响语音通话质量的重要因素之一是噪声。因此语音降噪技术就成了提高语音质量的关键所在。为了能够在非常嘈杂的环境中进行清晰的语音通信,大联大诠鼎基于Qualco
[手机便携]
大联大诠鼎集团推出基于Qualcomm产品的三<font color='red'>麦克风</font>通话降噪耳机方案
麦克风和服务器在英飞凌的推动下熠熠生辉
翻译自——EEtimes 硅传声器尽管营收下降了7%,但预计将在今年将实现50%的增长。 英飞凌本周公布了季度业绩,称硅麦克风及其服务器业务是该季度的亮点,否则该季度营收将连续下降7%,至19.16亿欧元(21亿美元)。该公司还预计将在本季度末或下月初完成对Cypress的收购交易。 英飞凌首席执行官Reinhard Ploss表示:“市场对最新一代硅麦克风的需求正在动态增长,此外,服务器业务等个别领域也有所改善。不过,总体而言,我们预计在本财年下半年之前,需求不会全面复苏。但英飞凌的长期增长动力保持不变,我们正在为塑造未来的流动性和能源效率做出重要贡献。” 英飞凌预计当前财年的收入增长将与预期一致,约为5%,这是
[物联网]
<font color='red'>麦克风</font>和服务器在英飞凌的推动下熠熠生辉
如何使用示波器测量电源纹波噪声及注意事项
在大学时代里,很多电子发烧友都喜欢做一些小的电子制作,至于电路板上的供电方法,7805、7812是当之无愧的性价比之王,多快好省!而当我们做的小制作出现故障时候,几乎没有人会把电源带来的影响列入考虑范围,因为大学时候制作的东西,大多数电路拓扑结构简单,信号频率也不高,所以即使电源端有波动,对后面的电路影响也不大。 今天的电子电路(比如电子测量仪器、多媒体产品)的电平切换速度、信号复杂度比以前更高,同时芯片的封装和信号幅值却越来越小,对电源波动更加敏感。因此,电路设计者们比以前会更关心电源端带来的影响。 以我们ZDS2024示波器本身为例,内部的主电源为一个开关电源,主板上的电源分配网络要把这个直流电源变成各种电压的直流电源
[测试测量]
如何使用示波器测量电源纹波<font color='red'>噪声</font>及注意事项
基于DSP及车辆噪声信号的车辆碰撞声检测装置
本文采用小波分析和模式识别方法分析车辆噪声信号,设计了一种基于DSP的车辆碰撞声检测装置,该装置能有效检测车辆碰撞事件,实现交通事故的自动识别。相对于已有交通事故检测装置具有识别率高、实时性强的优点,而且价格较低。 1 硬件设计 我们设计的碰撞检测装置的原理框图如图1所示,首先采用声音传感器采集各种声音信号,传感器输出的电信号经放大电路放大后,传入声音采集芯片的模拟信号输入端。声音采集芯片将模拟信号进行A/D转换后,送到DSP模块做进一步处理。DSP模块实时地处理所采集到的声音信息,判断是否有车辆碰撞事故发生。存储器模块和DSP模块相连,用于储存需要处理的数据和固化的代码数据,并为DSP模块运算时提供临时存储空间。报警模块和
[嵌入式]
2018年MEMS麦克风不再缺货!国产化替代还需“生态圈”形成
     MEMS麦克风长期以来一直备受关注,是近五年来所有MEMS产品中复合年增长率最高的器件之一。2008年,MEMS麦克风的市场规模约为1.05亿美元,2012年增长至4.02亿美元,2016年更是达到了10亿美元里程碑。目前,MEMS麦克风的年出货量已经达到了45亿颗。 终端需求放缓 MEMS麦克风缺货得到缓解 2017年,电子元器件爆发了缺货潮,MEMS麦克风产品也未能幸免。亚马逊(Amazon)、谷歌(Google)、苹果(Apple)、阿里巴巴陆续推出智能音箱,以及国内二三线厂商逐步加入智能音箱战局,成为推升MEMS麦克风需求暴增的关键因素之一。 数据显示,2017年智能音箱销售量达到了1500万~2000万台,
[手机便携]
音频系统应用中的“POP”噪声以其常用解决方法
  “POP”噪声是指音频器件在上电、断电瞬间以及上电稳定后,各种操作带来的瞬态冲击所产生的爆破声。本文将讨论几种常用的解决方法及其工作原理,这些方法针对具体的集成电路具有各自特点,应用时需要根据实际情况综合考虑。 图1:单端模式与桥式模式输出电路示意图。   本文提到的音频系统是指音频半导体器件,包括音频数模转换器、模数转换器、音频放大器等的应用系统。产生“POP”噪声的瞬态冲击通常是一种很窄的尖脉冲,用傅立叶分析展开后,其频谱分量很丰富,且在频域内的能量分布相对平均。本文下面讨论的几种“POP”噪声解决方法的目的,就是要降低20Hz~20kHz范围内的谐波分量。对绝大多数人而言,如果信号的峰
[电源管理]
音频系统应用中的“POP”<font color='red'>噪声</font>以其常用解决方法
1GHz 和2GHz 全差分放大器实现了高速ADC 性能
2007 年 5 月 29 日 - 北京 - 凌力尔特公司(Linear Technology Corporation)推出 ADC 驱动器 LTC6400-20 和 LTC6401-20,这两款器件用单 3V 电源实现了前所未有的性能。这些全差分放大器含有增益设置电阻,减轻了驱动最高性能高速 ADC 的难度。LTC6400-20 具有 20dB 的固定增益,在输入频率为 140MHz 时,具有 -93dBc 的 3 阶互调失真(IMD3)性能,噪声指数为 6.5dB。在 240MHz 时,IMD3 好于 -70dBc。这个系列固定增益为 8dB 至 26dB 的其它器件将陆续推出。 LTC6400-20 采用 3V 电源电压工作
[新品]

推荐帖子

在SYS(驱动\内核模式程序\服务)中怎样通知EXE(主程序)程序,或向它发送消息,SYS不能使用SendMessage啊?
???在SYS(驱动\\内核模式程序\\服务)中怎样通知EXE(主程序)程序,或向它发送消息,SYS不能使用SendMessage啊?
byahui 嵌入式系统
【极海APM32F407 Tiny Board】2、开发环境搭建&串口printf打印
开发板支持KEILMDK开发环境,从官网下载DFP安装包即可:安装好后,就可以打开keil工程进行仿真调试了:但是板载cmsis-dap调试器串口无法使用,只好使用外置的调试器了,在GPIO例子基础上增加串口打印功能:/*!*@Filemain.c**@briefMainprogrambody**@versionV1.0.2**@date2023-03-01**@attention**Copyright(C)2021-2023
dql2016 国产芯片交流
关于RS编码的伯利坎普表示
请教各位大神,在RS编码中,将码元从对偶基表示转换到伯利坎普表示,是在RS编码之前、之后还是都可以?能否详细解释一下关于RS编码的伯利坎普表示
JinxLeader RF/无线
铁粉心滤波电感器的设计
铁粉心滤波电感器的设计铁粉心滤波电感器的设计thanks回复:铁粉心滤波电感器的设计非常的感谢谢回复:铁粉心滤波电感器的设计很想看看,现在正需要呢!!!Re:铁粉心滤波电感器的设计硬件工程师面试试题IC设计基础虽不要还是要谢
zbz0529 PCB设计
怎么用最简单的方法测出支路上有没有小电流通过 ?
2MA-5MA左右有专用芯片吗?不需要精确测量电流只要测出有没有电流就行了怎么用最简单的方法测出支路上有没有小电流通过?像你这样一般都是用电压来检测,,不知道你说的支路是什么意思。串个小点的电阻,然后比较器或者ADC串个小电阻,然后万用表LZ是要维修分析啊,还是要电路自己显示分析功耗啊?1.维修分析:万用表里的电流档,或者:串个小电阻,然后万用表测电压。2.电路自己显示分析功耗:在合适电平的地方串个小电阻送AD楼主的“2MA-5MA左右有专用芯片吗?”是不是想用芯
ggggihss 微控制器 MCU
WorldFIP现场总线的特点
1引言2000年1月4日,历时12年IEC(国际电工委员会)发布了最终获得通过的IEC61158标准。新标准包括8种类型的现场总线标准,容纳了8种互不兼容的协议。WorldFIP工厂仪表总线是其中Type7现场总线(法国Alstom公司支持)。WorldFIP是欧洲标准EN50170的3个组成部分之一(Volume3),WorldFIP是在法国标准FIC46601-C46607的基础上采纳了IEC物理层国际标准(1158-2)发展起来的。WorldFIP的显著特点是为
songbo 工控电子
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

更多开源项目推荐
换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved