数字语音解码器的低功耗设计策略-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

近年来，随着个人手持多媒体设备的快速增长，低功耗设计变得越来越重要，甚至成为决定产品是否成功的关键，如笔记本电脑、PDA、移动电话等时尚消费和商务类电子产品，对电池的供电时间要求越来越高，高功耗成为延长电池使用时间突出的制约因素。

CMOS数字电路的功耗主要由3部分组成：跳变功耗、短路功耗和静态漏电功耗。其中占系统功耗比例大于90％的为跳变功耗，也称动态功耗。对于SoC而言，所有的设计方法都是围绕着动态功耗来进行。如何从各个层次、各个方面尽量减少动态功耗，将是语音解码设计中的重点内容。

1 语音解码器的低功耗设计策略

SoC低功耗的设计应该从顶层到底层各个阶段进行优化设计的工作，主要运用各级的低功耗策略，通常在系统级、算法级、结构级、电路级、布局布线以及制造工艺等层次上综合考虑。有研究表明，除了制造工艺外，高抽象层次(系统级、算法级、结构级)的设计因素对功耗的影响比其他层次要大的多。因此系统级、算法级、结构级的低功耗设计技术的研究非常重要。

1．1 系统级的低功耗设计策略

降低系统级的功耗实际上是减少动态功耗。主要方法是时钟采用power-down管理模式，在SoC处于空闲状态时，使SoC运作于休眠状态(只有部分设备处于工作之中)；在预设时间到来时，产生一个中断，由该中断唤醒其他设备；或采用门生时钟技术停掉未工作模块的时钟，从而降低系统功耗。

另外，多时钟设计也是降低系统功耗的有效方法，即让运算量小的模块采用低频率时钟；而运算量大的模块使用高频率时钟。

本设计综合使用了上述设计策略以降低系统功耗。使用一个系统主频，通过对时钟的精细控制，即时钟使能＆禁止以控制模块的工作状态；使用双向不交叠时钟技术，提高运算量大的模块的操作频率，同时消除了竞争与冒险的可能。双向不交叠时钟由系统时钟Cp分为2个不交叠的时钟，yCp和zCp，如图1所示在运算时，由yCp时钟控制输入数据，由zCD时钟控制取出结果。

1．2 算法级低功耗设计策略

算法级低功耗设计主要在于软件代码的优化，减少由于算法的低效率引起的不必要功耗。一方面是对标准C代码的优化。C语言具有易读性、可移植性，但是C语言在实际工程应用中，不便于对系统硬件资源的直接控制，无法发挥SoC的特点。用汇编语言编程，可以根据芯片自身硬件结构特点，对汇编程序进行优化与精简，往往能够使一些复杂的算法和功能模块在实时处理方面取得非常好的效果。另一方面分析了影响执行效率的数据相关、控制相关和资源冲突等因素后，在手工汇编的基础上充分挖掘算法的潜力，最大限度发挥硬件性能，以达到实时要求和低功耗设计的指标。

在本设计里主要根据SoC平台的资源和指令集特点，使用软硬件协同设计方法在C代码转化为汇编代码时，通过分析标准C算法发现，大部分循环和函数的调用存在冗余，频繁的函数调用操作(压栈出栈)占用了CPU的部分处理时间。在汇编代码中可以通过循环展开以减少不必要的循环判断，其基本原则的原始代码为：普通的单循环，一个周期执行一次乘累加(MAC)指令，优化后进行了4次循环展开。在优化后的代码中，4个MAC被同时使用，并且在作乘累加时，提取下次运算的数据，消除了流水线等待，充分应用了硬件资源，提高了效率。除了循环展开，在某些情况下进行循环合并也可提高效率。主要原因是每个循环体均需要有控制指令，减少循环的个数自然会减少控制指令的条数。注意两个合并的循环必须有相同的循环数。

对于在代码里多次用到的函数，应考虑用调用指令，这样可以大大减少代码的体积；而对于只调用少次的函数，则宜嵌入主函数中，因为它不仅可以减少传参过程中的指令，而且可以减少调用函数的压栈出栈操作。当然，对于一些大而复杂的函数，虽然它只被调用1次，但由于寄存器的数目有限，如果考虑直接嵌入主函数，可能要频繁地做push和pop操作，反而得不偿失，这时就应该用调用指令。

如果有些处理比较复杂，在整个解码过程中运算量大且耗时长，有必要设计相关硬件协处理器，通过汇编指令直接操作协处理器，既可以提高效率减少运算量也有利于控制功耗，但成本会增加。这种处理方法在实时影响明显的模块尤其关键和有效。例如在MP3的解码中，通过增加矩阵乘法器以提高子带综合滤波的处理速度，取得明显效果：可减少运算时间91％。这种软硬件协同的设计手段在语音解码器中多处用到。

在算法级中还涉及其他方面的低功耗设计，如减少存储器的存取次数，缩短片选信号的宽度等方面的考虑，本设计也做了相应的处理。总的说来，算法级的优化设计在降低系统功耗方面潜力大，对降低整个语音解码器的功耗具有重要意义。

1．3 结构级低功耗设计策略

在结构级，降低功耗最重要的策略是利用并行处理或流水线技术。流水优化后，还可以减少中间数据的读取操作，且比串行处理对存储器的读取操作减少约50％，这对降低系统功耗大有裨益。

由于语音解码的模块较多，通过研究可以发现，通过简单的消除数据相关后各模块可以流水操作，减少了解码的时间，从而降低实时处理的时钟频率；在多声道语音处理中，可以使用多声道并行处理，增加处理模块以减少处理时间。在MP3解码中，立体声处理之后，左声道的后续处理(混叠重建、IMDCT和子带综合滤波等)和右声道的后续处理可以并行进行，由于IMDCT(逆改进离散余弦变换)和子带综合滤波是解码中运算量最大的部分，左右声道的并行性几乎可以把系统的处理时间减少一半。

为了提高处理速度，还可以挖掘耗时长的模块的内部并行处理潜力。例如在IMDCT处理是MP3和ACC语音处理中运算量大耗时长的模块。可以在IMDCT内部放置2个乘法器，这样可以同时运算两列数据，速度提高1倍。

显然通过增加硬件的模式提高处理速度并未减少运算量，但提高了处理速度，其代价就是增加了芯片面积，导致成本上升，处理时必须综合考虑，以达到较好的性价比。

在电路级和工艺级的低功耗设计技术主要是全定制集成电路设计技术。全定制的设计可以将硅片充分利用，布局、布线、排版组合等均需要反复斟酌调整，按最佳尺寸、最合理布局、最短连线、最便捷引脚等设计原则设计版图，与同样功能而采用自动布局布线方法实现的电路相比较，手工设计电路可以节省一半以上的芯片面积，尤其是使用基于锁存器的手工布局布线代替基于D触发器自动布局布线，降低面积的同时系统功耗减少了约88％。

2 结论

首先分析了CMOS集成电路的功耗物理组成，得到其主要功耗。其次，SoC低功耗设计的各种级别层次采用不同的设计方法，由此重点分析了在语音解码中各层次采取各种策略以降低系统功耗，并取得了初步效果。系统级使用双向不交叠时钟技术，可以将运算主频降低50％；算法级主要使用汇编语言重写和优化原代码，将MP3解码的C代码转为汇编代码后，从原来的86 Kb降为13 Kb，AMR解码的C代码转为汇编代码后，从原来的158Kb降为25 Kb；在结构级，增加协处理器进行并行计算，在IMDCT内部放置2个乘法器，这样可以同时计算两列数据，速度提高1倍，MP3的解码中，通过增加矩阵乘法器以提高子带综合滤波的处理速度，可减少91％的运算时间。

关键字：语音解码器低功耗时钟 CMOS集成电路引用地址：数字语音解码器的低功耗设计策略

上一篇：基于FM1712的通用射频卡读写模块设计
下一篇：基于CY7C68013的高速数据传输系统的设计

推荐阅读最新更新时间：2024-05-02 21:08

DP5321超低功耗读写芯片支持NFC功能兼容pn5321

DP5321是基于80c51微控制器核的13.56 mhz 高度集成的无接触通信收发模块。它支持6种不同的操作模式: 1. PIN2PIN compatiable PN532 u 2.ISO/IEC 14443A/MIFARE Reader/Writer 3.FeliCa Reader/Writer u ISO/IEC 14443B Reader/Writer 4.ISO/IEC 14443A/MIFARE Card MIFARE Classic 1K or MIFARE Classic 4K card emulation mode 5.FeliCa Card emulation 6.ISO/IEC 18092, ECMA 340

[单片机]

ADI公司携手ARM共同提升物联网连接器件的安全性和能效

北京2016年10月27日电 /美通社/ -- Analog Devices, Inc. (ADI)，近日宣布与 ARM 携手合作，共同打造一系列超低功耗微控制器 (MCU)，以实现安全性和能效更高的物联网 (IoT) 器件。ADI 公司将其创新的超低功耗混合信号技术结合采用 ARM TrustZone 技术的新型 ARM Cortex -M33 处理器，旨在解决功率受限的物联网应用中不断增长的数据安全需求。随着世界的联系变得越来越紧密，确保每个节点的安全性是促进物联网应用发展的关键。我们很高兴与 ARM 公司展开合作，共同致力于提供适用的超低功耗 MCU，以便在节点本地实现更复杂的算法和更高级的智能。 ADI 物联网平台

[物联网]

采用CPLD来替代微处理器的6种方法

　　随着低功耗CPLD的出现，低功耗电子产品设计人员现在有新的选择来实现以前由微控制器完成的多种功能。本白皮书讨论什么时候适合采用CPLD替代微控制器，什么时候可以采用CPLD作为微控制器的辅助器件。　　引言　　如果告诉便携式电子设计人员有一种低功耗数字器件能使他们利用软件程序来重新配置硬件工作，他们中的十个会有九个认为这是某种微控制器。这是可以理解的。丰富的特性和封装、大量的软件开发工具，以及庞大的应用代码库，无处不在的微控制器几乎能够用在所有便携式应用中。然而，随着低功耗CPLD的出现，设计人员有了新的选择来实现以前由微控制器完成的功能。　　本白皮书讨论什么时候适合采用CPLD来替代微控制器，什么时候可以采用CP

[嵌入式]

关于stm32单片机低功耗的实现和唤醒

最近做的项目中要求低功耗，在单片机完成了手头上的工作之后，就进入低功耗模式，项目的需求是单片机进入低功耗模式的时候系统时钟从HSE切到HSI，但是在未进入低功耗模式之前引脚是什么状态，进入低功耗模式之后也不应该改变。可以通过RTC定时唤醒，或者接收到串口数据就唤醒，处理完数据后再进入stop模式。查询了一些资料之后，发现stop模式最符合项目需求。下面讲述一下什么是低功耗：一、stm32支持三种低功耗模式，可以在低功耗，短启动，多种唤醒模式下寻找平衡。 1、SleepMode睡眠模式，只有CPU停止运行，所有的外设处于工作状态并且可以在发生中断/事件时唤醒CPU。 2、StopMode停机模式，保持SRAM和寄存器内容不丢失，达

[单片机]

异步时钟切换电路

　　问题： 2个频率无关的时钟，在sel的选择下做切换。　　有时一个看起来简单，实际上是在考验ASIC工程师的问题。　　1.简单的讲就是做信号的2选1么，那么我们就先做一个简答的2选1吧。　　　　这是一个逻辑图，实际的2选1是由3个门电路过程的，比如2个与一个或：　　　　这个电路显然不能用于时钟的选择，因为这将导致输出时钟存在毛刺，后级电路是不能直接用的。　　2. 我们很自然的会想到，要是能在时钟低时切换到另一个时钟低电平，就能保证时钟的品质。这样在时钟切换时就必然要经历4个阶段：1）选择信号改变、2）在clk1为低时停掉clk1的选择、3）在clk2为低时打开clk2的选择端、3）正常工作，完成切换。　　这样一

[电源管理]

君正超低功耗SoC助 MIPS 持续拓展移动市场

为数字家庭、网络和移动应用提供业界标准处理器架构与内核的领导厂商美普思科技公司（MIPS Technologies, Inc）与中国领先的移动多媒体应用 CPU 厂商君正集成电路股份有限公司（Ingenic Semiconductor）共同宣布，两家公司已合作将代号为“Honeycomb”的 Android™ 3.0 用于君正集成电路新款 JZ4770 移动应用处理器，该处理器中采用了 1GHz 的高频率 MIPS-Based™ XBurst™ CPU。Honeycomb 是为平板电脑和其他产品专门设计的最新版 Android 操作系统。MIPS 将与君正集成电路紧密合作，把 Honeycomb 移植到君正的平板电脑解决方案中

[嵌入式]

Semtech低功耗SX128x 2.4GHz收发器在贸泽开售

集微网消息，最新半导体和电子元器件的全球授权分销商贸泽电子 (Mouser Electronics) 宣布即日起备货Semtech的SX128x 2.4 GHz收发器。SX128x半双工射频 (RF) 收发器为Semtech SX1200系列超低功耗无线收发器，拥有强大的抗扰性和非常广的发送范围，是最先集成时间飞行功能的系列器件之一，非常适合各种RF和物联网 (IoT) 应用。

[半导体设计/制造]

时域时钟抖动分析(上)二

让我们来对一个具有 400 fs 抖动时钟电路和 ~73 dB 热噪声的 14 位 ADC 进行分析。低输入频率(例如：10MHz 等)下，该 ADC 的 SNR 主要由其热噪声定义。由于输入频率增加，400-fs 时钟抖动越来越占据主导，直到 ~300 MHz 时完全接管。尽管相比 10MHz 的 SNR，100MHz 输入频率下时钟抖动带来的 SNR 每十倍频降低 20dB，但是总 SNR 仅降低 ~3.5 dB(降至 69.5dB)，因为存在 73-dB 热噪声(请参见图 5)：　　　　现在，很明显，如果 ADC 的热噪声增加，对高输入频率采样时时钟抖动便非常重要。例如，一个 16 位 ADC 具有 ~77

[模拟电子]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

■Follow me第二季第3期来啦！与得捷一起解锁高性能开发板【EK-RA6M5】超能力！

■报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~