语音信号的数字化噪声抑制技术-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

　　语音信号的噪声抑制技术是基于人耳的声音屏蔽效应的，即当有较强的声音信号时，较小的噪声信号将被屏蔽而不易被听到。

　　在具有噪声抑制功能的语音通信设备中，没有语音信号时噪声抑制电路将信道关闭，使噪声信号不能到达语音终端，避免了噪声出现；语音信号来到时，噪声抑制电路自动打开信道，这时虽然噪声语音一起送到语音终端，但由于声音屏蔽效应，噪声的存在可以忽略。

模式式的噪声抑制电路直接对语音模拟信号进行处理，通常主要由取样放大器、模拟比较器、模拟开关、阻容延时器件等组成。因其集成度低、参数调整困难、设定的噪声抑制参数易受环境因素影响而漂移，使得噪声抑制性能难以得到保证。

　　在为某国孙工程研制新一代语音指挥通信设备时，为了避免模拟式噪声抑制技术的缺点，采用了数字化的噪声抑制技术。这一技术，是在对模拟语音信号进行PCM编码后，再用CPLD（复杂可编程逻辑器件）对PCM码流进行数字化噪声抑制处理，然后将PCM信号解码还原为模拟语音信号。结果，不仅获得了优良的噪声抑制效果，而且能够用软件调节噪声抑制参数，设备的集成主和稳定性都有显著提高。

1 噪声抑制电路的主要技术参数

噪声抑制电路的主要技术参数为：噪声抑制阈值、前道时时间、后延时时间。

噪声抑制阀值是指打开语音信道的门限电平值。在阈值之下的信号认为是噪声，关闭语音信道；在阈值之上的信号则认为是语音，打开语音信道。这一阈值可根据环境噪声的大小、外来干扰的严重程度及语音信号的幅度而进行设置。例如，当语音信噪比为30dB时，噪声抑制阈值可设为32mV左右。

由于语音和噪声两种信号并不总是能够完全区分开的，因此在信号幅度超过噪声抑制阈值或回落到阈值之下时，需要分别进行延时和后延时。

前延时时间是指语音信号在超过阈值后到语音信道打开的延时时间。这一时间太长将造成语音的起始音素被切除（称为“头切”），是不能允许的。但这一时间又不能太短，太短的话任何幅度超过噪声抑制阈值的突发的短暂干扰都会立刻打开语音通道并将这干扰送到语音终端，破坏静音效果。为尽可能地吸收这类干扰又不至于造成“头切”，根据语音声学特征的有关统计资料与经验数值，前延时时间可在0.5～4ms之间选择。

　　后延时时间是指在噪声抑制门限被打开并自己传送语音时，从语音信号幅度回落至噪声抑制阈值之下到语音信道关闭的延时时间。由于语音信号波形的动态范围很大，讲话时又随着语气的变化而起伏停顿，因此后延时时间太短会造成语音的断续，影响语音传送质量。后延时时间太长，则造成语音停顿时噪声拖尾，同样影响语音质量。为兼顾这两方面，后延时时间的量值范围约为0.05～0.5s左右。

　　由于语音特点因人而异，环境噪声和外界干扰情况又常有不同，所以上述的噪声抑制三参数经常需要在语音通信的过程中进行调节。在使用模拟噪声抑制电路时，这些参数是用电位器或开关来调节的。在使用模拟噪声抑制电路时，这些参数是用电位器或开关来调节的。采用数字化噪声抑制技术后，通过软件就可以设定和调节这些参数了。

2 语音信号的数字化

采用数字化噪声抑制技术，必须先将语音信号数字化。模拟语音信号的数字化有多种方法，最通用的是按照G.711标准进行PCM编码[1]。对于频带为300～3400Hz的语音信号，采用2.048MHz的取样时钟，以8kHz的速率进行8位取样，取样数据按A律编码，偶数位交替反转。多路语音信号可以分配不同的取样时隙，32个时隙（125μs）组成一帧。

PCM编解码芯片选用National Semiconductor公司的TP3094[2]。该芯片为44引脚PLCC封装，单一5V供电，集成了四路PCM编解码电路，压扩方式为A/μ律可选，片内自带电压基准、低通接收滤波器和带通发送滤波器，通过外接电阻可以调节输入信号的增益。

TP3094可采用长帧和短帧两种同步方式，外接帧信号和2.048MHz的时钟即可工作。TP3094在进行PCM编解码时的工作方式有8bit和32bit两种，以8bit方式工作时需为每路语音的PCM码提供单独的帧同步信号，而以32bit方式工作时只要为第一个时隙提供短帧同步信号即可自动完成对其后连续的另三路PCM语音编码同步。在以32bit方式作时，还可以采用多片TP3094芯片级联工作。

图1所示为两片TP30094级联成为八路PCM语音编解码电路。图中TP3094的VCI0～VXI3为四种语音输入端，GXO0～GXO3为各路的增益调节端，在VXI和GXO之间接一电阻，此电阻与VXI端至信号源间的电阻比值可决定该路语音信号的输入增益。VRO0～VRO3为解码后的四路模拟语音信号输出端。电容C1、C2用于滤波。外接的2.048MHz主时钟脉冲冲送到两片TP3094的MCLK端，8kHz的帧信号F0（由CPLD产生）送到第一片TP3094的FSX0和FSR0端，再将第一片TP3094的FSX和FSR1分别连到第二片TP3094的FSX0和FSR0端，就完成了两片芯片的级联。两片以上的级联亦可由此类推。为避免数字信号对模拟信号的干扰，电路中数字部分和模拟部分的供电分别布线后再接到单一5伏电源。

　　两片TP3094的PCM信号输出端DX并联后送到数字噪声抑制电路，经数字噪声抑制电路处理后的PCM信号再送回两片TP3094的输入端DR进行解码。TSX0、TSX1是开路沟道输出端，R1、R2为上拉电阻。在所分配的时隙输出PCM信号时，TSX0、TSX1为低电平，可提供给CPLD作为控制信号。

　　TP3094工作于32bit短帧方式时的时序图如图2所示。

输入和输出的PCM信号DR、DX包含了从CH0至CH3的四路数字语音信号，每路为一个时隙，8个bit。每路语音的PCM编码中D7为符号位。D6～D0为数值位。FSX1和FSR1可用于级联下一个芯片。

3 数字化噪声抑制电路的原理框图

数字化噪声抑制电路的原理框图如图3所示。由于采用的是“自顶向下”的CPLD设计方法，这一电原理框图本身就是最顶层的图形设计文件（.gdf文件）。图中的各个组成部分，根据需要分别采用了基本逻辑门电路、参数化模块、以缺省符合（Default Symbol）表示的文本输入（Text Entry）和宏功能逻辑单元（Mega Function）组合。

图3的原理简述如下：

从PCM解码输出端DX输出表示八路语音信号的64bit串行信号，进入64位的参数化移位寄存器模块进行串/并变挛，变换后的输出经64位参数化锁存器模块锁存，每帧刷新一次。锁存信号以八位为一路，依次送到八个噪声抑制控制器（Symboll）。每个噪声抑制控制器独自控制一路语音信道，将PCM信号的偶数位取反后，再将除符合位（最高位）以外的七位数字与由S[6..0]设定的噪声抑制门限值进行比较，比较结果输出给延时器（Symbol2），延时器输出则作为控制信号送到噪声抑制控制器。各噪声抑制控制器输出的PCM信号经64位参数化称位寄存器模块完成并/串行变换后恢复成串行PCM码流送往两片TP3094解码成为具有噪声抑制效果的语音信号。噪声抑制控制器还输出八路指示信号LED[7..0]至八只发光二极管作为各语音信道的噪声抑制门限指示。

Symbol3用来产生TP3094要求的帧脉冲F0，提供移闰寄存器、锁存器、噪声抑制控制器所需的时序信号，并为延时器提供不同的时钟信号；P0、P1用来选择PCM帧32个时隙中的哪八个时隙用于本片作语音噪声抑制处理；TSET[3..0]用来选择CLK1、CLK2的分频系数以调整噪声抑制延时时间。这些输入都可以通过外部数字信号进行设置和调节。

按以上方法对PCM信号进行的数字化噪声抑制处理使语音信号产生一帧（125μs）的固定时延，但人耳的听觉对这一时延是完全不能觉察的。

4 CPLD设计要点

CPLD器件选用Altera公司的EPF6016ATC100集成电路[3]，内含16000个等效门，1320个逻辑单元，采用100-Pin TQFP封装。设计软件使用MAX+PLUS II 10.0版本[4]，下面介绍设计要点。

4.1 Symbol1的设计

Symbol1实施噪声抑制控制功能，首先通过偶数位取反将PCM码转换成便于作大小比较的码型，再将D[6..0]与S[6..0]输入的设定值进行噪声抑制门限比较。比较结果从D端输出到延时器，并从B端收延时信号。根据比较结果和延时状态决定是将输入的PCM信号原样送往输出，还是将代表无语音信号的“55H”码送往输出。

　　Symbol1的逻辑功能由AHDL语言编写，具体如下：

Subdesign symbol1

（A[7..0],S[6..0],B:input；

Y[7..0],D,L:output；）

variable

E[6..0]：node；

begin

E6=！A6；E5=A5；E4=!A4；

E3=A3;E2=!A2;E1=A1;

E0=!A0;

L=!B;

if(E[6..0]>S[6..0]) then

(D) = B "1";

end if;

if (B) then

(Y[7..0])=H"55";

else(Y[7..0]) = A[7..0];

end if;

end;

以上文本通过编译后即可建为缺省图形符号Symbol1。

4.2 Symbol2的设计

Symbol2实现前后延时功能，采用图形输入，电路图见图4。

图4中CLK1、CLK2为前、后延时的计时脉冲，由2.048MHz的MCLK主时钟经分频后得到，分别用于前延时计数器Countr1和后延时计数器Counter2计时。当无语音信号时，噪声抑制控制器Symbol1的输出D为“0”，Counter2计至Q2端为“1”后停止计数，并通过反相器将CLK2的输入封住。Q2端的高电平同时对Counter1清零，使B输出为“1”，噪声抑制控制器输出PCM码“55H”，即无语音信号。

当接收到的PCM信号幅度超过设定的噪声抑制阈值时，D变为“1”，Counter2被清零，此时Counter1脱离清零状态开始计数器。Counter1计至Q1为“1”后B端输出电平从“1”转为“0”，前延时结束，Symbol1的输出从“55H”变为转发输入的PCM码。与此同时，B端的低电平将CLK1时钟封住，只要Counter1不被清零，B始终为低。

如果接收到的PCM信号不是连续的语音而是突发噪声，幅度只是短暂地超过设定的噪声抑制阈值，那么D变为“1”后在Counter1未来得及将B变为“0”时D又回到了“0”，B的电平就一直是“1”，PCM输出码也始终是“55H”，突发的噪声就不会传到输出端。

在话音信号持续期间，信号幅度在短暂时间内低于噪声抑制阈值虽然使得D端电平有时为“0”，从而使Counter2有时脱离清零状态开始计数，但只要信号幅度低于噪声抑制阈值的时间不超过设定的后延时时间，Counter2就总是在计数未满时就被再次清零，其输出一直保持为“0”，使B也一直为“0”，输出与输入的PCM信号始终保持一致，语音不会发生继续。只有当输入信号幅度低于噪声抑制阈值的时间超过设定的后延时时间后，Q2输出“1”，才使Counter1被清零，使B为“1”，输出PCM码“55H”。再有信号来时，仍按上述流程工作。

4.3 时序的设计

数字化噪声抑制电路必须严格按照标准的PCM时序工作，电路由外部提供2.048MHz的主时钟信号MCLK和帧同步信号Fi。Fi用于本部分电路PCM信号与其它电路的PCM信号组帧时进行同步，在不需要该功能时可将Fi输入端接高电平。

Symbol3在MCLK的作用下产生PCM编解码电路TP3094所需的帧同步信号F0，又从TP3094接收TSX0和TSX1信号以产生数字噪声抑制处理所需的时序信号TSX、TT。为了保证PCM信号的正确读入、锁存、处理和移位输出，这些信号间的时序关系必须如图5所示。

　　TSX由TSX0、TSX1经“与非”后得到，在每帧中所选定的八个时隙传输PCM信号时为高电平。TSX为串/并行移位寄存器提供赋能信号，在主时钟MCLK的下降沿将来自DX端的PCM信号读入寄存器并移位寄存。TSX同时是PCM信号从DR端输出的三态门控制信号。

TT是CPLD噪声抑制时序中的一个重要控制信号，由TSX延时半个主时钟周期（244ns）后取反得到。由于TT的延时作用，使得图3中的参数化锁存器模块能在输入的PCM信号完成串/并行变换后随即于TT的升沿将数据锁存住。在通过并/串行移位寄存器输出PCM信号时，TT为高电平时把并行数据装载进移位寄存器；TT为低电平时MCLK的上升沿将寄存器内的数据逐位地串行移出至DR端。

CPLD产生的时序信号只能满足图2和图5的要求，实现起来并不复杂，可用简单的图形输入或文本输入实现。值得注意的是，正确使用MAX+PLUS II软件中的“Assign-Clique”[4]功能，为时序相关的功能模块指定相同的“Clique”，能够使波形仿真的结果明显得到优化。

5 应用成果

按照以上设计，用两片TP3094和一片CPLD芯片再加上少量外围器件组成的数字化噪声抑制电路，改造了某语音指挥通信设备中采用模拟电路噪声抑制技术的八路语音指挥通信电路板，得到了优良的语音噪声抑制效果。新的电路板继而成功地应用到新一代语音指挥通信设备上，交付用户使用。更多路的数字化噪声抑制电路也已试验成功。

关键字：噪声语音寄存器编辑：金海引用地址：语音信号的数字化噪声抑制技术

上一篇：语音信号的数字化噪声抑制技术
下一篇：带反并联二极管IGBT中的二极管设计

推荐阅读最新更新时间：2023-10-12 20:11

利用AI语音生物识别技术进行身份验证

人工智能的发展现在使语音生物统计具有足够的准确性，不仅可以用于识别和个性化，还可以用于支付认证等应用。Synaptics和ID R＆D的新解决方案提供了可在边缘设备中的Synaptics SoC上运行的AI语音识别技术和反欺骗算法。具体来说，该软件已针对Synaptics的VS600系列中的神经处理单元（NPU）进行了优化，以用于智能家居设备，例如机顶盒（STB），智能扬声器和安全系统。 Synaptics将其具有AI功能的SoC出售给需要处理视频流，音频流和图像的智能家居产品。例如，典型的用例可能是机顶盒，其中包含用于视频会议的摄像机。智能冰箱中的语音生物识别语音生物识别技术现在已经足够准确，可以在智能家居设备

[嵌入式]

利用AI<font color='red'>语音</font>生物识别技术进行身份验证

Android版Google Talk新增视频和语音会话功能

据国外媒体报道，Google周四面向Nexus S发布更新，Android版Google Talk新增了视频和语音会话功能。Nexus S用户可最先使用到新功能，Google表示将在未来数周内逐步推广Android 2.3.4更新。Google公司称，Google Talk视频和语音会话功能未来将进入其他Android 2.3设备，新功能适用于支持3G和WiFi无线网络的设备。 Google官方博客称：“你现在可以与朋友，家人和同事通过Android手机进行视频和语音会话，Android平板，Android手机，或是开启Gmail邮箱和Google Talk的电脑都可以实现视频会话。” Google Talk用户可以在联系人列

[嵌入式]

Android版Google Talk新增视频和<font color='red'>语音</font>会话功能

百度发布远场语音交互芯片“鸿鹄”！

7月3日，在2019年百度AI开发者大会上，百度首席技术官王海峰宣布百度正式发布远场语音交互芯片“鸿鹄”。据介绍，鸿鹄芯片使用了HiFi4自定义指令集，双核DSP核心，平均功耗仅100mW。这款芯片是根据车规级标准打造，主要应用于车载语音交互、智能家具等场景。另外，王海峰还在现场与华为消费者BG软件总裁王成录博士联合宣布，百度飞桨与华为麒麟达成深度合作。百度的深度学习平台“飞桨”，英文名字叫Paddle，飞桨官方支持超过70个主流的模型，包括视觉的自然语言处理的、推荐的、语言的等，目前“飞桨”学习平台，已经用在很多行业里面。

[手机便携]

基于HMM的连续小词量语音识别系统的研究

摘要：为了提高语音识别效率及对环境的依赖性，文章对语音识别算法部分和硬件部分做了分析与改进，采用ARMS3C2410微处理器作为主控制模块，采用UDA1314TS音频处理芯片作为语音识别模块，利用HMM声学模型及Viterbi算法进行模式训练和识别，设计了一种连续的、小词量的语音识别系统。实验证明，该语音识别系统具有较高的识别率和一定程度的鲁棒性，实验室识别率和室外识别率分别达到95．6％，92．3％。关键词：语音识别；嵌入式系统；Hidden Markov Models；ARM；Viterbi算法 0 引言嵌入式语音识别系统是应用各种先进的微处理器在板级或是芯片级用软件或硬件实现的语音识别。嵌入式技术与语音识别技术相

[工业控制]

基于HMM的连续小词量<font color='red'>语音</font>识别系统的研究

基于状态机的语音电子密码锁设计

引言随着电子技术的发展，具有防盗报警、语音提示等功能的电子密码锁代替密码量少、安全性差的机械式密码锁已是必然趋势。目前大部分密码锁采用单片机进行设计，电路较复杂，性能不够灵活。本文采用先进的EDA(电子设计自动化)技术，利用QuartusⅡ工作平台和VHDL(超高速集成电路硬件描述语言)，设计了一种新型的电子密码锁。该密码锁具有密码预置、修改、语音提示和3次输入错误则系统进入定时锁定并报警等功能，用FPGA(现场可编程门阵列)芯片和语音芯片ISD2560实现。由于充分利用了FPGA芯片密度大、功耗低、可重复编程和具有嵌入式阵列块的结构特点，且ISD2560具有抗断电、音质好、使用方便等优点，因而该密码锁体积小、功耗低、价格低

[手机便携]

当声控走下神坛语音让驾车更轻松

　　随着IT技术突飞猛进地发展，它与各行各业的交叉变得越来越紧密，已经融入到我们日常生活的方方面面。当IT技术与汽车相结合，车载智能系统便应运而生。遥想当年，好莱坞大片中的车载智能系统频频亮相，一度吸引了众多科幻迷的眼球。曾记否，电影《2012》里面一句“Enginestart！”成功启动一辆宾利，汽车语音控制的诱惑和魅力由此可见一斑。现在，语音操控和语音交互逐渐由当初的一个新生事物成长为一个不可阻挡的潮流，开始从一个崭新的层面上改变着人们的驾乘方式。也许，在很多年以后，当我们在路上看到有人还在车内操作复杂的按键时，也许会不经意地说一句：“不用语音交互系统的人们伤不起啊……” 　　与汽车对话从此解放你的双手　　苹果、

[汽车电子]

基于单片机控制的新型智能电梯语音系统设计

引言原文位置语音系统对电梯来说是不可缺少的部分，比如进行楼层报数、方向提示、报警告示、消防对讲甚至广告宣传等。目前绝大多数电梯使用语音芯片来进行语音存储和播放，而语音芯片系统存在一些缺陷，比如外围电路复杂、音质不佳、成本偏高、容量有限以及语音更改不便等。有鉴于此，本文设计了一款基于单片机控制的智能电梯语音系统。原文位置系统概述原文位置电梯控制系统的基本功能，是根据用户的楼层按键信息，显示到往楼层数字，语音播报到达楼层。系统框图如图1所示。原文位置　　原文位置原文位置　　图1 电梯语音系统结构框图原文位置硬件设计原文位置根据FLASH的读

[单片机]

单片机 C语音开发 sbit使用方法

1．bit和sbit都是C51扩展的变量类型。 bit和int char之类的差不多，只不过char=8位, bit=1位而已。都是变量，编译器在编译过程中分配地址。除非你指定，否则这个地址是随机的。这个地址是整个可寻址空间，RAM+FLASH+扩展空间。bit只有0和1两种值，意义有点像Windows下VC中的BOOL。 sbit是对应可位寻址空间的一个位，可位寻址区：20H～2FH。一旦用了sbi xxx = REGE^6这样的定义，这个sbit量就确定地址了。sbit大部分是用在寄存器中的，方便对寄存器的某位进行操作的。 2．bit位标量 bit位标量是C51编译器的一种扩充数据

[单片机]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

■STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

■免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！