自适应计算减少QCELP功率-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

QCELP（Qualcomm Code Excited Linear Predictive Coding-Qualcomm码受激线性预示编码）话音压缩算法是TIAIS-95北美宽带CDMA数字蜂窝电话标准的TIAIS-96话音蜂窝电话标准的TIAIS-96话音编解码所选的声码器。一个话音编解码器等于一个编码器和解码器对。依此标准进行设计对于便携系统设计人员来讲是个问题，这是因为用通常DSP方法需要异常的功耗。

QCELP是一种向量编码器型话音编解码，在话音编解码分类中被称为CELP（码受激线性预示）编码话音压缩算法。CELP编解码采用话音编码的合成分析方法。

编码器的任务是确定描述话音音频段的小的参量组，话音音频段可以最小的位数表示。编码器发送参量到译码器，译码器用这些参量重建音频段。一旦重建完成，音频段便在扬声器系统播放。

话音产生系统可模拟为声束、声调、周期激励器（声卡）或剩余噪声源。声束用线性预示编码模拟。声调和剩余噪声激励声束并用码簿（codebook）编码。

用码簿索引选择来自码簿的高斯向量（见图1）.向量也称之为激励信号，向量与增益值相乘并经2个线性滤波器滤波。第1个滤波器之为长项滤波器，它重建激励信号中语音的长项声调周期数。第2个滤波器（短项滤波器）模拟话音的谱形。短项滤波器的输出是合成语音。

LPC（线性预示编码）滤波器的频谱是语音信号的谱线包络。所以，滤波器产生话音幅度。合成器产生向量或话音取样N长度的子帧（在8KHz取样率时，N为10～40）。合成器参量以帧或子帧速率更新，一般1帧是4个子帧长。

通常，码簿索引（码）、码簿增益和长项预示参量以子帧速率更新。对于IS-96A WCELP-13，码簿参量以最大到16倍帧或4倍子帧速率更新，短项滤波器系数以帧速率传送到合成器，但通常以子帧速率线性内插。

合成分析

CELP编解采用人声音产生系统的模型，它由声束、声卡、送话器嘴和语音组成。此系统可用一个噪声源、一个音调合成滤波器和声束或共振峰合成滤波器进行模拟。话音合成器或解压缩单元的数据流激励音调滤波器（图2）。然后，信号由共振峰合成器或LPC滤波器处理，最后是后滤波。

合成器和分析器把话音分解为段（帧）。在8KHz取样率时（160个取样），帧长度是20ms话音长。对于每帧，分析器确定在多大数据率下可最佳地表示帧。速率为全，半，1/4和1/8四种。噪声源依刺于帧速率。1/4和1/8速率用于伪随机噪声源，全和半速率用于码簿。

分析器的工作是为当前话音帧确定全成器模型参量的最佳匹配。分析器或压缩单元用合成器的简化型式搜寻一帧话音的最佳参量。在数据流框图（图2）中表示为逆向工作过程。

首先用Levinson-Durbin算法求出LPC参量（al…a10），然后求出声调延迟（包括整数和小数延迟）和声调增益。最后求出全速率和半速率下的码簿索引和增益。对于1/4和1/8帧速率，是用不同方法求和伪随机数时序的。但是伪随机数时序的求解是计算不充分的。

用合成分析方法（有时称之为向量量化器）求得音调和码簿参量（见图3）。此过程包括为音调确定或搜索算法选择最佳延迟参量和为码簿搜索选择最佳索引。思想是测量与相关函数匹配的特性，相关函数与目标话音段比较时再现合成信号的误差。根据延迟或索引产生的最小误差信号选择是佳延迟或码簿索引。

对每个延迟和码簿索引，都必须执行通过合成器的数据处理和信号关联。用可编程DSP实现这两种搜索会占用大部分的计算时间和功耗。QCELP算法也需要用32位运算做绝大部分相关测量。

功率消耗程序

有8个主要的内部码环路或程序消耗绝大部分的QCELP功率。它们是码簿和声调搜索，线频谱对（LSP）计算，递归卷积和4个不同的滤波器。在QCELP的分析器/压缩器侧用DSP实现，3个内部码环路占总功耗的80%.其中声调和码簿搜索占49%；LSP和余弦占16%；各种滤波器占其余14%。在合成器/解压缩器侧，各种滤波器占功耗的56%左右，而其他功能（如正弦，余弦和除法）占别外5%。这两种QCELP函数总计占功耗的61%。

随着QCELP算法日益普及和应用（如蜂窝电话所需功能的增加），传统的DSP/微处理器和ASIC方法开始失去它们的优执。但自适应计算机（ACM）技术对各种便携设计（包括蜂窝电话）是一种更有效且功耗更低的大有前途的方法。

一般的ACM芯片集成有带大的自适应结构的RISC处理器芯核。特定的接口电路紧密配合RISC芯核和细粒状的自适应结构。硬线外设围绕芯核并与外部电路接口。几个片上SRAM支持处理器或自适应结构。最终，可配置的输入/输出口可让数据流入或流出自适应结构。这样，一个电路可在需要时形成，而一旦它的任务完成便可被自适应结构中运行的其他电路替代。

更多性能

随着要求低功耗而同时保持高性能的发展趋势。便携系统设计人员花精力分析当今技术是值得的。这样做的一种方法是比较计算效率（CPE-computational power efficiency），CPE是比较当今设计技术优缺点的量度。CPE定义为在一个时钟周期内能解决问题的有效工作门数与器件总门数之比。

一个典型的DSP芯片或嵌入式芯核的CPE是10%左右（见图4）。这意味着在一个DSP芯核或芯片中一般只有10%的门在任一时间内执行真正的工作，表明处理器只有一小部分正在真正在执行有用的工作，其余部分是额外消耗，用以维持处理器中有效工作的那一部分。

ASIC的平均CPE是25%左右，是DSP方案的2.5倍，这些增益可提高性能或降低功耗，是以牺牲灵活性来实现。ASIC设计周期中的任何不可预见的变化都会导致整个ASIC的重新设计。

ACM的CPE是60%，比ASIC好2.5倍。ACM器件也具有算法可编程的优点，这种技术允许一种算法以最短的时间运行在最有效的硬件中。这使得便携无线系统在支行时间能随时适应任务。这意味着不需要改变算法来适应预先确定的处理器硬件。一个算法所需的最佳硬件产生算法运行所需的最少时间。

QCELP功率分析

在DSP芯核上运行QCELP算法消耗大约84mW功率（图5）。这是根据0.25μm CMOS基具有DSP功能和存储器的片上系统大约占据4mm2，功耗84mW。相反，把8个最大功耗的QCELP算法放到ASIC逻辑芯核，其功耗只有19mW，即ASIC芯核功耗3mW，DSP芯核16mW。但这种设计方法占23mm2硅片。其中ASIC芯核运行8个内部码环路，而DSP芯核运行其余QCELP码。

ASIC硅面积明显大于DSP，但功率节省较大。蜂窝电话设计中的ASIC方法正在变得不实用，这是由于经常改变算法和标准以及增加更多蜂窝电话功能所致。

当便携系统设计人员把ACM加到DSP引擎以运行QCELP算法时，可大大减少功耗，这样做只增加5mm2 ACM芯片。在该设计实例中，8个最大功耗的程序从DSP运算中去掉，而加入功耗小的ACM引擎，只消耗3mW功率。采取这种设计步骤，节省了DSP运算的68mW(前面提及功耗为84mW)。现在，DSP/ACM基QCELP声码器总功耗只有19mW。

算法可编程ACM器件具有ASIC的功率特性，而大小可与DSP相比。ACM被列举进行任何时候特殊算法所需的硬件中，如本例中的8个内部码环路。每20ms，数据进入QCELP话音编解码器，所以每个内部码环路必须运行50次/秒。实质上，ACM是一片小的时限硅片，看起来像一个ASIC。结果以每秒运行400次，ACM形成运行这些算法所需的精确硬件。

引用地址：自适应计算减少QCELP功率

上一篇：TMS320C542在脱机视频编/解码系统中的应用
下一篇：具有优异功耗性能比的DSP

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

■Follow me第二季第3期来啦！与得捷一起解锁高性能开发板【EK-RA6M5】超能力！

■报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~