如何处理好嵌入式DSP设计中的功耗优化

发布者:红尘清梦最新更新时间:2008-09-22 关键字:DSP  嵌入式  功耗优化 手机看文章 扫描二维码
随时随地手机看文章

      对基于数字信号处理器(DSP)的系统而言,优化功耗是一项重要但往往难以实现的设计目标。现在,基于DSP的设备常常把以往各自独立的多个应用结合起来,每一个应用都可能有多个工作模式。要得到这样一个设备的功率分布是非常困难的一件事,更遑论整个复杂的系统。设计人员需要获知尽可能多的最佳信息,以及能够帮助他们优化特定应用之功耗的技术和工具。

      幸运的是,近年来,在DSP芯片的设计和制造工艺方面,都在不断推出更先进的功耗降低方法。现在的片上功率优化技术能够提供更多的精细控制和更多的省电模式,以及关于处理器功耗的更完整的信息。更新型的DSP开发工具使设计人员得以更深入透彻地了解系统的功率消耗方式,并通过片上硬件来提供功耗降低技术。

      为了让开发人员能够更灵活地控制省电技术,更好地协调众多片上功能间的低功率工作和时序问题,DSP操作系统整合了多项功率管理功能。这些内建功能及工具加上系统设计的精心部署,DSP系统的功耗可得到大幅度降低。

低功耗问题

      低功耗对所有的DSP系统都很重要,虽然理由因具体应用而异。在网格供电系统中,降低功率就意味着降低开销、提高可靠性,以及实现紧凑型设计,从而可以在相同的空间中集成更多的功能性,同时需要更少的风扇和其它冷却技术。在高清医疗成像等关键应用产品中,器件工作产生的热量甚至可能导致运行故障,因此,低于设备最大额定值并增加对低功耗的要求是至关重要的。

      在便携式电子系统中,低功耗有助于尽量减小系统的尺寸及重量,同时把电池充电后的使用时间延至最长。较小电池的使用可进一步降低系统的规模。更低的功率还有助于避免便携式系统在延时使用期间过热。因功耗降低,手机、PDA、MP3播放器、数码相机和视频摄像机这些电子仪器及其他手持式设备的尺寸都日趋纤小,工作温度越来越低,而充电后的使用时间越来越长。

理解功率分布和芯片资源

      在任何类型的系统中,降低功率的第一步是了解系统的使用方式,以及这种使用是如何影响功耗的。比如,手机大部分时间都处于等待呼叫的状态中,实际通话的时间相当少。另一方面,MP3播放器通常不是开机处于激活运行状态,就是处于关断状态。其它系统、线路供电系统以及便携式系统,都有着不同的待机功耗分布和激活工作功耗分布。

      了解功耗分布有助于设计人员选择一个具功率效率的处理器,因为在某些类型的应用中,DSP的基本CMOS技术可能对功耗产生很大的影响。先进的CMOS工艺则基于工作电压极低的高性能晶体管。根据既定应用,可以量身定做晶体管,通过对静态电流进行钳位把功耗降至最小,或把性能提高到最大,尽管这样会稍微增加泄漏电流。专门为手机这样的待机时间很长的应用而设计的DSP,可通过低泄漏晶体管把静态电流降至最低,而为总是处于激活状态的高性能应用而设计的DSP则较青睐开关速度更快的晶体管。

      系统使用还包括系统对各种事件的响应,以及电路接通电源时的延迟。初始上电时可能有一些延迟,而系统从待机模式被唤醒时,较小的延迟是可以接受的。但用户一般都期望处于激活工作状态的系统能够即时响应,故而这时片上功能不能处于深度睡眠模式。这里有两方面的考虑:第一,部分功能可以较其它功能更彻底地关断,尤其是在待机期间,激活工作期间也如此。第二,处理器的功率模式控制能力越精细,设计人员就越能够进行充分的功耗调节以适合系统的操作情况。

      高功率效率的DSP芯片设计通过建立电源域,使应用能够切断不在使用中的功能的时钟输入,从而把所有这些因素都考虑在内了。正如处理内核能够进入睡眠模式,此时它不执行任何操作,直到被中断信号唤醒,外设和存储器模块也同样可以被置于睡眠模式,在需要时才被唤醒。无时钟输入功能中的晶体管除静态电流之外,没有什么功耗,而恢复时钟所需的唤醒延迟被减至最小。系统设计人员在考虑其产品的使用情况时,还需要考虑到在为各项功能提供时钟方面,DSP能够提供多少控制能力,或是否能够自动处理。

      节能DSP内建的另一项功能是能够调节核心电压和频率。如果DSP可降低核心时钟速率并仍然满足其处理要求,则工作功耗会相应地按比例节省。更低的频率加上更低的工作电压,可以节省相当可观的能量。可以在系统启动时调节电压和频率以适于整个系统的运行,也可以在应用需要改变时通过软件对之予以动态控制,这就为非峰值处理期间的功耗削减提供了一种重要的手段。

正确功率信息的获得

      复杂DSP系统可能具有多个内核、应用和管理模式,这使得对功率的估算极其困难。传统的功率确定方法基于某些信息来实现,比如器件数据手册上注明的最大电流值,每周期或每条指令的耗电量(mA/MHz, mA/MIPS)以及测试案例等。

      这些方法只能用来做粗略估算,但对内核、外设和片上存储器可以根据应用和操作模式进行独立开关的复杂系统而言,是不足以估算DSP功耗的。设计人员需要清楚了解实际应用中片上各项功能的具体功耗,因为实际的功率信息使他们能够更加精确地估算出不同实现方案的结果,并测定出在不同平台上应用是如何影响功耗的。

      在DSP制造方面,所需要的是模块化的功率估算方案,即把设备划分为若干子系统,然后独立运行每一个子系统。一旦确定了每一个片上功能的最大功率值和空闲功率值,就可以通过插值法为一个功能建立一条功耗曲线。于是,在明确了每一功能的运行级别之后,可以把从各条曲线获得的功率值累加,最后给出整个设备的实际功率估算值。

      图1是一个功率估算电子数据表,它把一个典型的DSP分解为若干个子系统,由用户输入相关参数,然后可以返回设备的功率估算值。就像这个电子数据表所显示的,估算是否正确取决于用户提供的信息是否反映出对系统使用方式的良好了解,包括数据宽度、频率、电源电压和使用中外设的可用带宽的百分比等因素。

图1:功耗估算

低功耗设计

      具有功耗意识的设计(Power-conscious design)技术可以帮助DSP设计人员充分利用正确的功率估算。在系统级,设计人员应该精心选择相关元件,使其数目尽可能地低。此外,设计人员还应该考虑到哪些未使用的元件可以置于省电模式,尤其是在待机期间。板级存储器的使用也是一个功率消耗源,因为必须同时给存储器芯片和电路板迹线供电。

      应用应该尽可能地使用DSP的内部存储器,以保持片上大带宽存储,把外部存储器保留用作偶尔的低速存取。片外存储器也可以很好地完成启动工作,但应该在启动后被置于省电模式。为了减少存储器中的代码量和所取指令的数量,应该优化软件提升性能。更紧凑的代码有助于更好地利用缓存和内部指令缓冲器,而且运行速度更快,故能减少系统处于激活模式的时间。

      大多数特定设备都是利用DSP的内建硬件能力来降低功耗的。从一启动开始,应用设备就 可以让不使用的模块处于空闲状态,外设功耗只限用于那些在指定时间才需要的I/O 。应用通常在启动时就直接控制各个模块,稍后,DSP内核可以后台执行一个循环来检测哪些功能不需要,然后把它们关断。如果应用采用了这些技术,芯片的睡眠模式就可以把空闲期间内核及芯片的功耗降至最低。

      若所要求的总体性能不等于设备的全部能力,则可以在启动时就对DSP内核电压和频率(V/F)进行调节。若系统在具有不同性能负载的应用间更替,V/F调节也可以在运行期间动态进行。要实现V/F调节,设计必需提供DSP外部电源电压控制,以及内建于后台循环程序的软件控制。由于频率调节减慢内核的运行速度,设计人员在应用设计中应该考虑到相互关联的各个操作间的时序问题。

OS中的功率管理

      不论是通过V/F调节还是通过低功耗模式来动态改变系统的功率要求,都需要涉及到DSP的实时操作系统(RTOS)。RTOS中的功率管理(PM)模块能够在启动时实现功耗节省,并在整个系统上协调各个低功耗操作。

      内核频率调节会影响子系统操作的时序,因此PM能够在完成频率调节之后进行时钟调节。如果对应用来说OS时钟精度不重要,或者是用户希望节省空间,则可以不使用PM功能

      此外,当线程被阻断时,用户还可以激活或停用自动使时钟处于空闲状态的PM功能。在其协调作用中,PM提供了一种用于功率事件通知的注册功能,当特定功率管理事件发生时,客户可以注册通知,由于系统的复杂性,PM支持多个客户端并允许客户延迟事件的完成。

      PM还提供了一个应用编程接口(API)库,可实现芯片的低功率技术软件控制。通过这些API,应用能够门控时钟,激活睡眠模式并安全管理V/F调节设置点之间的晶体管。这些设置点作为调节参数,使V/F能够按照正确的顺序降低和提高,而且具有正确操作所必需的设置时间。

      下面图2显示了设置点是如何控制V/F调节的时序的。由于电压和频率调节对设计中所用的DSP和电压调节器是特定的,PM API支持设置点延迟查询和配置,同时PM库可被重建。

图2:功耗调节结果

工具的辅助开发功能

      要有效解决上述所有技术问题,需要一些专门为功率管理而设计的工具。类似于DSP工具开发的其它领域,功率优化工具也致力于提供可视化和易于使用的优势,以帮助简化系统分析并缩短上市时间。

      这些工具结合DSP的嵌入式及RTOS功率管理技术,可以提供计量表、示波器波形、信道校准、测试代码和事件触发等等测试功能。利用这些便捷功能,设计人员可得到一个反馈机制,凭此评估各个实现方案对功耗的影响,最终获得一个最佳方案。

从一开始就进行功率设计

      在系统开发中,功率优化有时被当作一项事后工作来处理,但这是不对的。在开发周期中,越早考虑功率优化问题越好,对于具有多个应用和工作模式的复杂系统而言尤其如是。为了延长电池工作时间,低功耗通常是主要的要求之一,即使是线路供电系统也需要通过降低耗电量来减少散热和运行成本。

      为了优化功耗,设计人员需要了解系统的功率分布,以提供全面的参考信息源,从而在功率估算中把所有主要的系统功能都考虑在内。基于高功率效率的CMOS工艺的DSP集成了硬件技术,比如精细定义的低功率模式和电压/频率调节。API使这些技术很容易通过RTOS实现应用控制,测试工具可帮助设计人员估算出不同实现方案的功耗。利用这些资源,开发人员有充分的理由从开发周期的最开始就进行功率设计。

关键字:DSP  嵌入式  功耗优化 引用地址:如何处理好嵌入式DSP设计中的功耗优化

上一篇:低功耗FPGA设计技术
下一篇:CSR发表首款搭载立体声DSP的蓝牙方案

推荐阅读最新更新时间:2024-05-02 20:41

Altera和ARM发布业界第一款FPGA自适应嵌入式软件工具包
2012年12月13号,北京——Altera公司(NASDAQ: ALTR)和ARM (LON: ARM; NASDAQ: ARMH)今天宣布,通过双方特有协议,两家公司联合开发了DS-5嵌入式软件开发工具包,实现了Altera SoC器件的FPGA自适应调试功能。Altera版ARM®开发Studio 5 (DS-5™)工具包经过设计,消除了集成双核CPU子系统与Altera SoC器件中FPGA架构的调试壁垒。ARM体系结构最先进的多核调试器与FPGA逻辑自适应能力相结合,这一新工具包通过标准DS-5用户接口,为嵌入式软件开发人员提供了前所未有的全芯片可视化和控制功能。这一新工具包含在Altera SoC嵌入式设计套装中,将于
[嵌入式]
TMS320C6000嵌入式系统优化编程的研究
    摘要: 分析了TMS320C6000的硬件设计和指令系统的特点,结合应用开发过程中遇到的问题,对这种高速并行DSP器件开发方法进行了总结。     关键词: DSP TMS320C6000 嵌入式系统 并行处理 1 TMS320C6000的硬件设计和指令系统 TMS320C6000系列DSP(数字信号处理器)是TI公司最新推出的一种并行处理的数字信号处理器。它是基于TI的VLIW技术的,其中,TMS320C62xx是定点处理器,TMS320C67xx是浮点处理器。本文主要讨论TMS320C6201。该处理器的工作频率最高可以采用50MHz,经内部4倍频后升至200MHz,每个时钟周期最多可以并行执
[应用]
一种DSP内嵌DARAM的电路设计与ADvance MS仿真验证
  在复杂的系统级微处理器设计中,存储器负责系统程序和数据的储存,是整个系统的重要组成部分,在CPU执行指令的过程中,要经常被访问存储器,所以存储器的读写速度会影响指令执行的速度。RAM是系统芯片中常用的存储器,用来存放数据,普通的RAM在一个时钟周期内只能进行一次读或写操作,即CPU在一个时钟周期内只能访问存储器一次,称为单存取随机存储器(Single-Access On-Chip RAM),而双存取随机存储器(Dual-Access On-Chip RAM)可以在一个吋钟周期内进行数据的读和写两次操作。利用 DARAM 一个周期内“双存取”的特点,可以大幅提高CPU执行指令的速度,进而提高整个系统的性能。   1 DARAM整
[嵌入式]
一种<font color='red'>DSP</font>内嵌DARAM的电路设计与ADvance MS仿真验证
DSP实现FIR数字滤波器
FIR滤波器具有幅度特性可随意设计、线性相位特性可严格精确保证等优点,因此在要求相位线性信道的现代电子系统,如图像处理、数据传输等波形传递系统中,具有很大吸引力。本文简单介绍了其线性相位条件和设计方法,并且提供了一种用DSP实现的方法。   关键词:IIR(Infinite Impulse Response) FIR(Finite Impulse Response) DSP(Digital Signal Processor) 一、 引 言   在许多信息处理过程中,如对信号的过滤、检测、预测等,都要广泛地用到滤波器,而数字滤波器则因其设计灵活、实现方便等特点而广为接受。   所谓数字滤波器就是具有某种选择性的器件、网络
[嵌入式]
用<font color='red'>DSP</font>实现FIR数字滤波器
芯原推出ZSP G4 DSP架构和ZSP981核
芯原股份有限公司(芯原)日前宣布推出第四代ZSP架构(ZSP G4)和ZSP G4家族的第一个成员ZSP981数字信号处理器(DSP)核。除了与上一代架构兼容,ZSP G4架构还引入了矢量计算能力,并提供更高带宽的接口和更多的执行资源。相较于第三代ZSP核,与无线通信专家合力开发的ZSP981在满足移动设备所需的低功耗的同时,将性能提升了17倍。ZSP981为通信基带开发者提供了优秀的可编程信号处理能力以支持含LTE-Advanced(LTE-A)、802.11ac等在内的新兴无线通信技术。 ZSP G4架构下的IP核组合涵盖从4-issue、4-MAC标量核到6-issue、260-MAC矢量核的宽泛范围,不同核之间的主要区别
[半导体设计/制造]
I2C总线驱动在嵌入式系统中的两种实现
引 言 I2C总线(Inter-IC Bus)是一种通用的串行总线,是用于IC器件之间连接的二线制总线。他通过串行数据线(Serial Data Lines,SDL)及串行时钟线(Serial ClockLine,SCL)两线在连接到总线上的器件之间传送信息,并根据地址识别每个器件。一个或多个微控制器以及外围器件可以通过I2C总线接口非常方便的连接在一起构成系统。这种总线结构的连线和连接引脚少,器件间总线简单。结构紧凑,因此其构成系统的成本较低;并且在总线上增加器件不会影响系统的正常工作,所有的I。C器件共用一套总线,因此其系统修改和可扩展性好。即使有不同时钟速度的器件连接到总线上,时间同步机制也能够很方便地确定总线时钟,因此在嵌入
[嵌入式]
基于DSP实现的步进电机控制器的设计
DSP(Digital Signal Processor)是一种特别适合于进行数字信号处理运算的微处理器,其采用先进的软、硬件结构,其内部的程序空间和数据空间分开,可以同时访问指令和数据,并且具有事件模块管理功能及快速的中断处理功能,其以高性能及日趋低价位的特点,越来越广泛地应用于信息处理、控制系统中。TMS320LF2407芯片作为一款定点DSP控制器尤为适合于控制系统,其所包含的事件管理模块,可以极为方便的实现电机数字化控制。步进电机是数字控制系统的一种常见的执行元件,其接收数字控制信号(电脉冲信号),并转换成与之相对应的角位移或直线位移。步进电机具有开环控制无累计误差的优点,控制系统结构简单,因而得到了广泛的应用。本文所介绍
[电源管理]
基于<font color='red'>DSP</font>实现的步进电机控制器的设计
痞子衡嵌入式:ARM Cortex-M文件那些事(4)- 可重定向文件,
  前三节课里,痞子衡都是在给大家介绍嵌入式开发中的input文件。从今天这节课开始,痞子衡就陆续为大家讲output文件。上一节课工程文件(.ewp)里讲说到project文件是一个承前启后的文件,今天痞子衡就为大家讲project生成的第一类output文件:relocatable文件。   文件关系:源文件(.c/.h/.s) + 工程文件(.ewp) - 可重定向文件(.o/.a)   relocatable文件,即可重定向文件,这个文件是由编译器汇编源文件(.c/.s)而成的。直接生成的重定向文件叫object file,经过封装的重定向文件称为library file。可重定向文件属于ELF文件的分支,关于EL
[单片机]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved