一种基于功耗管理的DSP处理器设计

发布者:影子猎人最新更新时间:2012-07-05 来源: 61ic关键字:DSP处理器  流水线  哈佛结构  低功耗 手机看文章 扫描二维码
随时随地手机看文章

  在信息日益成为一种重要资源的今天,强大的市场需求和微电子技术的发展促成了便携式电子系统的飞速发展。这些便携式电子设备,不但对速度和面积要求非常高,而且对系统的平均功耗要求也很严格,使功耗问题日渐成为制约便携式电子设备发展的瓶颈。要获得高性能低功耗的方案,其实质也就是在处理速度、芯片面积和功耗上来权衡如何满足数字信号处理系统的要求。
  本文介绍了一种基于并行流水线的低功耗数字信号处理器(DSP)的系统设计,以改善通用处理器的不足,应用于各种便携式系统中,以便取得良好的效果。
  系统方案中,基于流水线的结构从行为级方面降低了系统的功耗;时钟管理方案则可以允许系统在不同的工作模式下使用不同的工作频率,从而使每一个单项任务所消耗的功耗最小;增强型的哈佛结构存储管理可以大大提高系统的并行性,提高系统效率。
1 流水线结构
  流水线结构是芯片行为级降低功耗的主要方法之一,下面简要分析其原理。在传统的分析方法中,CMOS电路的功耗可用下面的方程进行估计:
  
  其中f=1/Ts,Ts是原始时序系统的时钟周期。若是一个M级流水线系统,其关键路径则缩短为原路经长度的1/M,一个时钟周期内充放电电容则减小为Ccharge/M(注意总电容并没有变化)。如果时钟速度保持不变,则在原来对电容Ccharge充放电的同样时间内,现在只需要对Ccharge/M进行充放电,这就意味着电源电压可以降低到βVdd,其中β是一个小于1的常数。这样,流水线滤波器的功耗将为:
  
  和原始系统相比流水线系统的功耗降低了β2倍。
  该DSP处理器采用如图1所示的4级流水线结构。各级流水线的功能介绍如下:
  FI:取址阶段。由程序地址产生模块产生指令存储器地址,并取出指令。
  DI:译码阶段。通过指令译码产生相应的微控制信号,送入相应的控制寄存器。
  FO:取操作数阶段。从寄存器堆或外部存储器读出相应的数据,通过数据总线送入运算单元或寄存器堆。
  EXE/WB:执行及写回阶段。进行运算或操作,得出相应的结果,并将结果放到写总线(EB)上。

图1 4级流水线

2 外围接口部分
  外围接口部分提供系统内部和外部的各种连接方式,实现各种方式的信息传输。本设计把这些接口分为二大部分:(1)MCU类型的接口,如低速的串行端口(串行外围接口(SPI)和通用异步收发器(UART))、可编程通信接口(PCI)、通用串行总线(USB)以及一些外围设备。(2)适于媒体信息收发的高速接口,如异步串行端口和并行外围接口。
3 数据传输的设计
  数字信号处理是数据量很大的应用,所以如何高效地传输数据是一个影响系统性能的关键瓶颈。作为DSP处理器,必须有全面的DMA能力以便对数据在芯片内外进行传输。因为在DSP芯片内部集成足够的存储空间不大现实,所以必须采用DMA来管理流动数据,将数据传输和系统控制过程分开。这样,一方面可以提高数据传输的速度,另一方面可以降低处理器内核的负担,提高系统运行效率。
  系统设计中DMA采用基于描述符的传送,它在发起DMA传送序列时,需要一组存储在存储器中的参数。这类传送允许将多个DMA序列链接在一起,一个DMA通道可以被编程建立,并且在当前序列完成之后启动另一个DMA传送。
4 乘法器和逻辑单元的设计
  在数字信号处理应用中,实现高速的数据运算是其突出的特点,所以其结构设计中必须具有单独的乘法器以实现其性能的提高。乘法器和逻辑单元的结构框图如图2所示。[page]

图2 CALU及乘法器结构框图

  乘法器工作时,用1条LT(Load TR)指令加载TR,由TR提供一个乘数。乘法指令提供另一个操作数,它既可以是来自数据总线,也可以是来自程序总线的立即数。不管在哪种情况下,每个周期都可以获得稳定的乘积项输出。
  3个移位器(shifter)是桶式移位器,它提供对16位或32位的操作数进行移位操作,可以大大提高乘后累加的速度。
5 地址处理模块
  地址处理模块是为总线部件计算取指和取数据的地址,也包括处理一些重复指令和跳转指令。根据指令系统的特点,本文设计的地址处理单元如图3所示。

图3 地址处理模块结构框图

  派生地址可能来自S_BUS,或是上一地址的加1值,也可能是总线输入数据暂存器DataIn之一;指令指针IC的值可能来自S_BUS或者是自增1的结果;预取指针PreIC可能来自IC或者是自加1的结果。最后的输出地址是派生地址暂存器AddrTemp、指令指针IC、总线输入数据暂存器DataIn或预取指针PreIC这4种地址之一。
  当执行的指令需要计算有效地址时,输出地址是派生地址寄存器;当程序跳转时,输出地址是指令指针IC;当寻址方式是间接寻址时,输出地址是DataIn; 当预取指令时,输出地址是预取指针PreIC。
  因为AddrTemp和IC的增量计算在系统中不可能同时出现,所以结构设计中只设计一个增量器供二者共用。
6 存储器的组织管理
  在数字信号处理系统中,数据的吞吐率直接影响系统的性能,传统的冯·诺曼(Von Neuman)结构是将指令、数据存储在同一存储器中统一编址,依靠指令计数器提供的地址来区分指令和数据。取指令和取数据都访问同一存储器,数据吞吐率低。而哈佛结构则不同于传统的冯·诺曼结构的并行系统结构,其主要特点是将程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是2个相互独立的存储器,每个存储器独立编址,独立访问。系统中设置了程序和数据2条总线,从而使数据的吞吐率提高了1倍。
  本文的设计采用如图4所示的增强型哈佛结构,它包括1个程序代码存储器和2个数据存储器,其中程序代码存储器只存放指令,程序数据存储器存放程序数据,而数据存储器则存放通用数据。对这些存储器的访问是相互独立的,系统可以在取指令的同时提供2个操作数,因而大大提高了系统的执行效率。 [page]
  为了使用更大的虚拟地址空间,对存储器采用分页管理,几个不同的页可以占用同一段地址空间,由各个存储器的分页寄存器指明当前所访问的是哪一页。

图4 增强型哈佛结构

7 时钟管理方案
  由公式(1)可以看出,系统的功耗和时钟频率呈线性关系,因此,通过降低系统时钟可以有效地降低功耗。时钟管理方案为系统提供了在不同工作模式下进行工作的频率,其结构如图5所示。由图可知,外部输入时钟CLKI经过全局输入缓冲器IBUFG连接到延迟锁相环DLL,锁相环原相时钟经过全局缓冲器BUFG输出,这样就可以得到稳定的片内原时钟;系统在低功耗模式下,可以根据用户配置的时钟分频计数器的值将原时钟分频,产生分频时钟;如果系统时钟要停止,可直接将低电平作为时钟输出。

图5 时钟管理方案结构图

  以上3种时钟经过多路选择器输出,该内部产生的时钟已经不是稳定的时钟。因此,将该时钟输出到片外,然后将输入连接到片上时钟专用线,即经过全局输入缓冲器连接到延迟锁相环,锁相环原相时钟经过全局缓冲器输出产生稳定的系统主时钟。同时,锁相环二分频时钟经过全局缓冲器输出作为系统状态时钟,由它参与系统控制。此外,将该锁相环的时钟锁定标志LOCKED输出,便于在系统调试时观察内部时钟的稳定性。
  本文介绍的低功耗DSP处理器的设计,相对于其他处理器的解决方案具有成本低、复杂性小、产品上市时间短等优点,并且能够以较低的价格实现各种便携式数字信号处理性能。该设计方法可作为同类设计的参考。
参考文献
1 Hennessy J L,Patterson D A.Computer Organization and Design:The Hardware/Software
  Interface(Second Edition).北京:机械工业出版社(影印版),1998
2 Katz R H.Contemporary Logic Design.Addison Wesley,MA,1993
3 苏光大.图像并行处理技术.北京:清华大学出版社,2002
4 陈峰.Blackfin系列DSP原理与系统设计.北京:电子工业出版社,2004

关键字:DSP处理器  流水线  哈佛结构  低功耗 引用地址:一种基于功耗管理的DSP处理器设计

上一篇:单片机在电动机保护中的应用
下一篇:基于矢量控制的高性能异步电机速度控制器的设计

推荐阅读最新更新时间:2024-03-16 13:02

TipsforFPGA低功耗设计
FPGA的功耗高度依赖于用户的设计,没有哪种单一的方法能够实现这种功耗的降低,如同其它多数事物一样,降低功耗的设计就是一种协调和平衡艺术,在进行低功耗器件的设计时,人们必须仔细权衡性能、易用性、成本、密度以及功率等诸多指标。   目前许多终端市场对 可编程逻辑器件 设计的低功耗要求越来越苛刻。工程师们在设计如路由器、 交换机 、基站及存储 服务器 等通信产品时,需要密度更大、性能更好的FPGA,但满足功耗要求已成为非常紧迫的任务。而在消费 电子 领域,OEM希望采用FPGA的设计能够实现与 ASIC 相匹敌的低功耗。   尽管基于90nm工艺的FPGA的功耗已低于先前的130nm产品,但它仍然是整个系统功耗的主要载体。此外
[嵌入式]
瑞萨超低功耗RA4M2 MCU,贸泽开售
专注于引入新品的全球电子元器件授权分销商贸泽电子 (Mouser Electronics) 即日起备货Renesas Electronics的RA4M2 MCU。RA4M2产品群是RA4 系列MCU的扩充,结合了极低的有效功耗、高性能和增强的安全功能,是工业和物联网 (IoT) 应用的理想解决方案。 贸泽电子供应的Renesas RA4M2 MCU搭载基于Armv8-M架构的高性能100 MHz Arm® Cortex®-M33内核,采用Arm TrustZone®技术和Renesas的安全加密引擎。此引擎包含多个对称和非对称加密加速器、高级密钥管理、安全性生命周期管理和篡改检测功能,并可抵抗功耗分析攻击。 RA4M
[单片机]
瑞萨超<font color='red'>低功耗</font>RA4M2 MCU,贸泽开售
基于MSP430F2012和nRF24L01低功耗RFID定位设计方案
  射频识别(RFID)技术是采用无线射频的方式实现双向数据交换并识别身份,RFID定位正是利用了这一识别特性,利用阅读器和标签之间的通信信号强度等参数进行空间的定位。   RFID标签按供电方式分为有源和无源2种[1],无源标签通过捕获阅读器发射的电磁波获取能量,具有成本低、尺寸小的优势;有源标签通常采用电池供电,具有通信距离远、读取速度快、可靠性好等优点[2],但为了满足煤矿井下定位,需要考虑低功耗设计以增强电池的续航能力。本文从有源标签的设计理念出发,针对小范围空间RFID定位的需求,根据低功耗、高效率的原则进行RFID标签的设计,并阐述了其硬件组成、软件流程和防冲突能力。   2.系统硬件设计   2.1 系统结构
[单片机]
基于MSP430F2012和nRF24L01<font color='red'>低功耗</font>RFID定位设计方案
德州仪器推出全新低功耗处理器发展策略
  2008 年 7 月 31 日,北京讯   TI 首席科学家方进 (Gene Frantz) 指出:“近几年来,客户无论其规模大小,都只单纯希望 TI专注于提高器件的性能,但差不多从去年开始,人们的想法发生了变化。开发人员现在首先要面对的问题是:‘ 我的设计在功耗方面有一定的限制,TI如何在这方面帮我更多?’”   开发人员在探索新一代医疗、音频、工业以及新兴应用的设计方案时,发现业界不断对便携性和用户友好图形界面 (GUI) 等优异性能提出更高的要求。此前,如何在处理器的性能与功耗之间达成平衡一直是一种此消彼长的零和游戏,而如今这种情况终于得以改善。   德州仪器 (TI) 日前宣布推出取得突破性进展的低功耗处理器发展
[嵌入式]
德州仪器推出全新<font color='red'>低功耗</font><font color='red'>处理器</font>发展策略
如何快速打造一款超低功耗智能电表!
随着美国政府智能电网概念的提出,中国紧跟着提出坚强智能电网,集信息化、数字化、自动化、互动化为一体,加强快速建立坚强可靠,经济高效,清洁环保的智能电网。 当 前国内智能电表属于AMR(远程自动抄表)表计,仅能单向作业,满足远程自动抄表的需求,属于智能电表中智能化程度较低的产品。未来的智能电表要求不仅是 可以在控制结算中心对电表实施远程管理、控制收费,而且还能够显示电力信息、气象信息等多种信息,是一种双向多用的网络终端,以构成AMI(高级计量体 系)系统。 智能电网是个庞大的系统工程,由于应用环境以及测试系统还不够完善、成熟,在使用和运行过程中,还需进行硬件和软件的升级固化,最终形成完善成熟的智能表计和集抄;智能
[工业控制]
如何快速打造一款超<font color='red'>低功耗</font>智能电表!
STM32U575/585微控制器的超低功耗特点
引言 STM32U575/585 微控制器(MCU)基于具有 Arm TrustZone和 FPU 的高性能 Arm 32 位 Cortex‑M33CPU。这些 MCU 采用新型结构制造,得益于其高度灵活性和高级外设集,实现了一流的超低功耗性能STM32U575/585 器件可为应用实现极高的能效。 带有“Q”后缀的 STM32U575/585 器件(例如 STM32U5xxxxQ)支持在运行和低功耗模式下使用内部 SMPS,从而能够设计出非常高效的低功耗应用 通过集成 ART 加速器 8 KB 指令缓存,STM32U575/585 MCU 可在高达 160MHz 的频率下运行,实现 240 DMIPS 性能,同时保持极低
[单片机]
STM32U575/585微控制器的超<font color='red'>低功耗</font>特点
为获高质量音频,Tensilica推HiFi EP音频DSP
   美国加州SANTA CLARA 2010年2月8日讯 –可配置处理器IP供应商Tensilica宣布,即将推出基于HiFi 架构的新一代产品HiFi EP音频DSP,可同时支持家庭娱乐产品中的多声道编解码以及持续扩展的音频前/后处理等应用,如:蓝光播放器、数字电视(DTV)以及智能手机。HiFi EP增强了高效率、高质量的语音前、后处理功能,与同类产品相比,HiFiEP最多可以减少40%的功耗及50%的芯片面积。   Tensilica将于2010年2月15-18日西班牙巴塞罗那举行的全球移动大会展出其HiFi EP音频DSP(数字信号处理)引擎,展位号:7C35。   HiFi 2 DSP已成功应用于数千万的蜂窝手机、蓝光
[嵌入式]
德州仪器抛售模拟和数字信号处理器芯片
   美国IDM大厂 德州仪器 (TI)本月宣布开放C553x系列低功耗数字信号处理器(DSP)订购,并开出前所未来的1.95美元起破盘价。德仪降价抢市占率的策略,已经由模拟IC扩散到DSP市场,让国内DSP供货商如松翰(5471)、新唐(4919)、凌阳(2401)等倍感压力,第4季起降价抢单恐怕在所难免,但德仪DSP在台生产链如台积电(2330)、欣铨(3264)、菱生(2369)等则可望受惠。     德仪宣布9月起开放新型C553x系列低功耗DSP订购,帮助开发人员以前所未有的超低价格,为消费性音频及语音应用、可携式医疗设备、生物检测安全、声控家庭自动化、流量计等增添精密讯号处理功能。该系列DSP提供1.95美元起最低价,
[工业控制]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved