科因巴托尔的PSG技术学院的工程学生们最近提出了高能效DSP和其它处理器的设计提案,这些提案包括了一种新的加法器设计,可以通过逻辑分解应用于乘法器电路上。
在最近这里举行的超大规模集成电路学会上的一篇论文中,SundeepkumarAgarwal,V.K.Pavankumar和R.Yokesh描述了一种全加器结构,这种全加器基于补码传递晶体管逻辑(CPL),它主要包括NMOS晶体管和上拉PMOS晶体管,用以获得更好的输出电压,他们表示这种结构比已有的加法器更快,同时能效更高。
“基于NMOS晶体管应用的正反馈效应,这种电路结构本身就具有很快的速度,同时这种特性还可以用来缩小晶体管的宽度,因此可以在保持速度的同时减少能量消耗。”论文中还写到:“提案中的加法器的结构在‘和’以及‘进位’信号之间取得平衡,因此可以减少树状结构电路中的同时到达的信号之间不必要的干扰脉冲。
这项设计中比通常的设计使用了更多的晶体管,因为它需要7个反向器用于产生补码信号。“尽管如此,当加法器在乘法器上应用时,输入的补码信号可以通过前一级的输出产生,这样可以减少晶体管数量,”作者进一步补充:“同时,由于使用了上拉晶体管,即使不使用反向器,加法器的驱动性能也相当优秀。”
“因此,输出反向器可用于设计的其他方面。例如,在4位行波进位加法器中,第2级和第4级的加法器不需要用输出反向器进行进位产生,因此,加法器链上的反向器延迟每两级全加器抵消一次,因此可以减少4个晶体管,类似的,在乘法器这样的复杂设计中,用于产生“和”以及“进位”的输出反向器可以用于其它方面,因此可以改善电路的速度和减小面积。
乘法器设计
为了改善DSP的核心部件乘法器的性能,论文的作者们还提案了另一项利用逻辑分解的技术,利用减少内部节点的伪晶体管的数量加快速度削减能耗。
在他们的提案中,数字乘法器可以通过逻辑分解实现,乘法的过程可以分解为小的单元(更小的乘法器),同时这些小的单元的输出在组合成为最后的结果,这种并行运算的结构比传统的树状乘法器更有优势。
以一个8x8的乘法器为例,当进行逻辑分解时,研究人员在第一级使用4个4x4乘法器然后组合所有的部分积,这些4x4乘法器的输出组合成为最后的结果。实验中使用了现行的树状结构乘法器,也就是大家熟知的Wallace快速乘法器。
分解逻辑需要额外的电路结构用于进行4x4乘法器输出相加,但是其并行处理的结构可以获得极大的速度改善,由于最后的加法器电路的输入都是并行同时到达,因此减少了尖脉冲的干扰,因此也就降低了能量损失。
研究人员还表示这种逻辑分解可以进一步进行,例如4x4的乘法器可以进一步分解为两个2x4的乘法器或者4个2x2的乘法器,不过这样带来的额外电路的代价会超过从数据并行处理中的收益。
基于这项提案的仿真在TSpice平台上通过,使用台积电180纳米技术。
关键字:DSP 低功耗
引用地址:
印度学生节省功耗的DSP设计技术
推荐阅读最新更新时间:2024-05-02 20:41
基于DSP的焊接电流检测系统设计
电阻焊是一种将电网的能量经转换后直接对工件进行熔合的高自动化程度的焊接方法。它广泛地应用于汽车、航空及航天等行业。随着电阻焊应用领域的不断扩展及深入,对焊接质量也提出了越来越高的要求 。 要对焊接质量进行精确控制的关键是焊接电流及其状态电流参数的在线检测。目前国内外测量电阻焊焊接电流有效值的方法有两大类,即模拟法和数字法。其中数字法中的逐点积分法检测精度高,得到了广泛的应用 。该方法会占用大量的CPU时间 ,随着计算机技术的发展,各种高速高性能处理芯片不断出现,因此本文设计了基于DSP的电流检测系统,它可以实现电流的快速准确检测。 1 系统硬件设计 电流检测系统硬件结构如图1,本系统中采用了美国德州仪器公司(TI
[嵌入式]
数字信号处理器及软件套件 提升电池性能【欧胜】
英国爱丁堡及中国深圳,2011年2月 – 欧胜微电子有限公司日前发布了其前所未有的第一款完全可编程独立音频数字信号处理器(DSP, 产品编号为WM0010),以及一系列音效增强软件,从而在提供完整高清晰度(HD)音频的征途上又迈出了新的一步。 WM0010是市面上同类产品中,率先装备了低功耗、高性能Tensilica HiFi DSP内核的产品之一。通过与应用处理器前后协同工作,它将欧胜的低功耗音频协处理器与嵌入式系统软件、算法和软件支持整合在一起,使智能电话、平板电脑和电视的制造商能够集成他们自己的软件部件来构建个性化的音频解决方案,以支持多种多样的关键应用实例。随着音频越来越多地被分离出来到独立音频器件
[嵌入式]
基于DSP的低功耗高速数据采集系统
摘要:介绍了自行研制的基于DSP的低功耗数据采集系统。该系统以TMS320C5509为核心,实现了低功耗四通道同步高速数据采集。从同步ADC采集、存储器设计、DSP时钟设计以及电源设计等方面,详细阐述了基于低功耗的设计思想和实现方法。
关键词:DSP 低功耗 数据采集
随着电子技术的发展及新器件的不断涌现,电子系统在手持设备、便携医疗仪器以及野外测试仪器等领域得到了广泛的应用。在这些领域的应用中,由于客观条件的限制,通常采用电池或蓄电池为仪器设备提供电源。在这种情况下,如要实现系统长时间工作,必然对仪器设备系统功耗的要求较高,因此低功耗系统的设计在这些应用领域中得到广泛重视。
1 TMS320VC5509简介
TMS
[嵌入式]
使用事件系统和DMA来消除中断可实现超快响应时间和极低功耗
随着嵌入式系统与外围环境的响应越来越多,需要捕获和处理数据的外设数量也暴增。微控制器通常配备ADC、DAC、PWM、多个定时器/计数器,以及大量的TWI、SPI、CAN、USB和USART通信接口。外设的增加意味着需要循环密集(cycle-intensive)的中断,而在内存和外设之间移动的数据量也会呈指数级增加。
一般来说,CPU负责处理中断和移动数据。在某些应用中,CPU的大多数时间都花费在这些活动上。例如,管理两个同步外设之间的通信和64Mbps速率的单一数据传输就需要200 CPU MIPS,并消耗240mA电流,原因是这涉及了广泛的场景关联转换和中断处理。要应对这些额外的计算负荷,就必须提高CPU时钟速率
[电源管理]
低功耗蓝牙技术及应用研讨会9月登场
专业电子元器件代理商益登科技(TSE:3048)今日宣布携手碧德电子于9月17日在深圳举办低功耗蓝牙技术及应用推广研讨会,会议主讲者来自国际蓝牙组织、高性能模拟与混合信号IC领导厂商Silicon Laboratories等著名厂商。 本次会议将主要介绍低耗能蓝牙的发展现状和展望,并针对低耗能蓝牙的设计方法和应用,低耗能蓝牙产品中MCU和收发器的特点进行讲解,同时展示目前低耗能蓝牙样机方案。以帮助广大蓝牙用户快速了解低耗能蓝牙的特点、应用和开发方法,同时为大家创造一个充分交流沟通的平台。 蓝牙技术具有标准开放、安全、2.4 GHz 免费波段运行、手机电脑广泛支持等特点,已成为当今市场上支持范围最广泛、功能最丰富、安全可靠的近距
[手机便携]
用FPGA实现DSP与液晶显示器的快速接口
随着器件集成工艺的发展和Soc器件的出现,现在的数字系统正在越来越多地采用可编程器件设计。这样,不仅开发周期短,而且在价格和使用难易度上也显示了很大的优势。更为重要的是,还能利用器件的现场可编程特性,根据应用的要求对器件进行动态配置,简便易行地完成功能的添加或变化。
在高速的数字信号处理系统中,要涉及到大量的计算,为了提高运算速度,正大量使用DSP器件。目前的可编程器件,其时钟频率可以很高,在高速数字信号处理系统中将发挥越来越大的作用。因此,DSP+FPGA的方案正越来越多地被电子工程师们采用。
在很多的实际数字系统中,往往需要良好的用户界面,其中LCD是被大量采用的显示器件。由于LCD是典型的慢速设备(相对于DSP来讲)
[嵌入式]
DSP编程技巧---在main函数运行之前,你需要知道的
在一个 C/C++ 程序能正常运行之前,相关的 C/C++ 运行时(run-time)环境首先要正确建立。在CCS软件编程的情况下, C/C++ 的实时运行库RTS的源程序库rts.src中包含了名为boot.c或者boot.asm的启动程序(在一些TI的例子里,则使用了CodeStartBranch.asm来完成启动工作,它会自动调用库文件中的boot.asm),用于在系统启动后调用c_int00函数,并通过其中的操作来完成运行时环境的建立。通常情况下,c_int00函数位于rts2800.lib库函数中的boot.obj(即TI官方编译boot.c或者boot.asm生成的目标文件)下,这也就是为什么我们在C2
[嵌入式]
瑞萨推出兼顾超低功耗和卓越25fs-rms抖动性能的 全新FemtoClock™ 3时钟解决方案
全新卓越时钟产品,面向高性能通信和数据中心应用 2024 年 4 月 18 日,中国北京讯 - 全球半导体解决方案供应商瑞萨电子今日宣布推出适用于有线基础设施、数据中心和工业应用的全新超低25fs-rms时钟解决方案——FemtoClock™ 3,从而扩展其时钟解决方案产品阵容。 新的产品家族包含8路和12路差分输出的超低抖动时钟发生器及抖动衰减器,可为下一代高速互连系统实现高性能、简单易用和高性价比的时钟树设计。新产品的目标应用包括电信交换机和路由器、机架式数据中心交换机、医疗影像、广播音视频等。 FemtoClock 3产品具有行业领先的超低的相位噪声和抖动,可满足112Gbps SerDes速率的需要,以及在4
[半导体设计/制造]