“你的声音真好听~”,原来秘密在这里
“你的声音真好听~”随着VoLTE网络商用,越来越多的中国移动用户在通话过程中发出这样的感慨。从2G时代到VoLTE时代,用户的通话体验越来越好,除了中国移动不断提升的优质网络服务外,语音编解码方案的更迭也在其中起到了至关重要的作用。
注意前方高能,考验智商的时候到了!!!
用户在通话过程中,首先由终端的MIC采集语音后进行相应的语音编码,再通过无线网络传输至对端进行相应的解码流程并放音。2G网络时代,终端皆采用AMR语音编码方案进行传输。而传统VoLTE语音则采用的是AMR-WB(以下简称AWB)编码方式,同时中国移动VoLTE网络还支持终端传输EVS语音编码方案,EVS语音编解码方式则包括两种模式,EVS Primary mode和EVS AMR-WB IO mode(以下简称AWB-IO)。相较于AWB,EVS可以用更低的传输带宽换来更好的语音质量,其中EVS AMR-WB IO(以下简称AWB-IO)模式有效地解决了EVS终端与AWB终端的互通问题,降低了网络转码负载,同时AWB-IO模式可以提升语音质量,带来更好的用户体验。下面就让我们一起了解一下相较于传统的AWB编解码方案,AWB-IO模式有什么不一样的地方。
整体来看,AWB-IO模式编码器输出的语音帧可以不通过任何转码由AWB解码器解码,同样AWB编码器输出的语音帧,在不通过任何转码的情况下即可由AWB-IO解码器解码。如果终端将AWB的编解码方案替换为AWB-IO编解码器,不仅从信令层面看不出任何差别,且AWB-IO模式能够带来更好的实际体验。
从编码角度看,两种模式的差异主要在于AWB-IO模式算法较为精细,例如VAD(Voice Activity Detection)以及Pitch Search等。VAD针对信噪比处理的部分,AWB估计信号与噪声的方式较为固定,AWB-IO则根据过去长时间的信息来抓取更多的信号特性,根据不同的状况来调整估计信号与噪声的方式,如此能估计出更为准确的信噪比。Pitch Search算法相较于AWB,AWB-IO还会多考虑一些情况来确保找到的Pitch是可靠的。然而两种模式需要保证互通,AWB-IO在编码方面没有明显的音质提升,所以更为优秀的用户体验主要靠解码层面的改进。
从解码角度看,AWB-IO模式不但会对语音帧进行分类处理,在语音带宽扩展算法上也相较于AWB模式更为全面。AWB-IO模式将语音帧进行分类处理后,会针对Music、Unvoiced、inactive的语音进行额外的后处理算法,使得不同的语音帧能得到不同的处理后,带来更好的用户体验。至于语音带宽扩展算法,AWB模式在6.4k Hz-7k Hz的频谱是采用随机白噪声的方式产生excitation,而AWB-IO模式则是借由低频的excitation来估计高频的excitation,并且将语音带宽扩展到8k Hz,此方法远比采用随机白噪声的方式处理更为合理,且带宽更宽,两者解码后语音带宽比较可参考下图。
在解码算法上另一个重大改进是提升语音在信道条件较差时的处理方式。AWB-IO模式对此的处理考虑更加全面,基本原则是先将信号进行分类,在丢包时会根据分类以及之前的语音帧来预估未收到的语音。例如丢包后的音量收敛速度,AWB模式只用之前与当前的BFI(Bad Frame Indication)所组成的状态信息来决定,AWB-IO模式则会依据语音的类别以及掉包的个数来决定。进一步为了隐藏掉包,AWB会将之前的语音信息做平均拿来用,AWB-IO则会选择比较稳定或者且比较接近的语音信息来使用。在丢包后正常收到封包的处理仍有差别,AWB会直接使用收到的Gain值,AWB-IO则会采用AGC(Adaptive gain control)算法,使声音的不连续性尽量变小。
处理算法上的复杂度必然带来解码时延上的牺牲,如下图解码示意图显示AWB-IO在解码算法复杂度的提升基础上,理论上增加了6ms左右的时延,对于用户感知影响甚少,证明AWB-IO用小的时延牺牲,换来了较大的用户体验的提升。
在介绍完AWB与AWB-IO的算法区别之后,让我们一起看看两种算法实际表现差异如何。我们在中国移动终端实验室对前后语音质量打分,参加评测的是联发科曦力P60芯片,分别用AWB编解码方案以及AWB-IO编解码方案进行测试得出如下结果。
不难看出,联发科曦力P60的AWB-IO算法相较于AWB的MOS提升0.2分左右。同时,测试过程中发现无论编码为哪种方案,AWB-IO解码方案都能带来相应的语音质量提升,测试结果如下图所示,统一AWB编码时,AWB-IO解码相较于AWB可以提升MOS 0.2分左右,同样统一AWB-IO编码时,AWB-IO解码相较于AWB同样可以提升MOS 0.2分左右。
结合联发科曦力P60芯片在AWB-IO编解码上面的优异表现以及相应的理论分析得出,EVS AMR-WB IO模式在EVS终端与非EVS终端互通时,为用户的语音体验带来了较大的提升。终端同样可以采用AWB-IO底层替换AWB编解码器的方案,同样可以为用户带来更好的语音体验。
转载自中国移动终端实验室