高性能定点DSP位处理单元(BMU)设计

发布者:忠正最新更新时间:2007-12-05 来源: 现代电子技术关键字:逻辑  算术  浮点  控制 手机看文章 扫描二维码
随时随地手机看文章

1 功能概述

位处理单元(Bit Manipulation unit,BMU)总体结构如图1所示。可以看出,BMU主要由取指电路、移位数据处理电路、移位选择处理电路、桶形移位电路和输出电路等几部分组成。BMU的输入数据是36位的BMUi,经过处理后输出36位的数据BMUo作为DSP的一次运算结果。

本文设计的BMU是36位的,主要功能包括逻辑/算术移位、取指、归一化等,以下是对控制信号及相关功能较为详细的描述。

逻辑/算术左移 相应的控制信号是in arithshf,inleftshf,in_shift。将36位数据左移,低位补0;

逻辑右移 控制信号同上,他执行的是低32位数据右移,同时高位补0;

算术右移 控制信号如上,36位数据右移,高位由原最高位填充;

取指 控制信号是in_exp,取36位数据的指数,也即冗余的符号位的个数;

归一化 控制信号是in_norm,将输入数据进行归一化,得到去除冗余符号位后的结果。

指数提取的目的是进行类似于定点到浮点的数据转换。一个定点数可以用一个包含尾数和指数的浮点数来表示,这样可以提高数据的表示范围,同时使得定点DSP具有某种浮点运算的能力。取指的结果相当于浮点数的指数,而归一化的结果可以看成浮点数的尾数。这使得定点DSP能在不增加浮点算法开销的情况下获得某些浮点DSP的能力。

2 单元电路设计

2.1 桶形移位器的设计

移位和归一化操作都需要用到桶形移位器,因此桶形移位器是BMU的核心单元。通常,桶形移位器可以实现逻辑左移、右移,算术左移、右移等,一般为了减少晶体管和连线的数目以节省面积,通常只实现左移或右移中的一种。本文中只采用左移操作来实现桶形移位。设36位移位数据为BMUi,36位移位选择信号为shfsel,当shfsel[i]为1时,桶形移位器的输入数据(即经过移位数据处理后得到的数据)左移i位。

下面是实现右移的原理:

BMUi从高位到低位依次是BMUi[35],BMUi[34],…,BMUi[1],BMUi[0],BMUi重复排列两次构成72位数据BMUi[35],BMUi[34],…,BMUi[1],BMUi[0],BMUi[35],BMUi[34],…,BMUi[1],BMUi[0],将72位数据经过移位(左移)后的高36位作为桶形移位器的输出。当要求桶形移位器实现右移shfnum位时,只要将该72位数据左移(36-shfnum)位即可实现。当然在实现移位操作时,必须对72位数据的高36位(右移时)或低36位(左移时)进行处理,这个处理过程在移位数据处理电路中将会介绍。同时由于36位的shfsel最多只能选择左移35位(shfsel[35]=1时),所以72位桶形移位器的输入数据的中间2位可以合并成1位,成为71位输入数据(此时实现右移操作时应该将71位数据左移35-shfnum位)。

移位的实现主要通过移位开关网络来实现。移位网络(以8位移位数据为例,则移位器的输入数据需要处理成15位)的结构如图2所示,他是一个NMOS传输管阵列,行数等于数据字长,列数等于最大的移位数。这个移位器结构的主要优点是数据信号至多只经过一个传输管,移位的传输延时理论上是一个常数,并且与移位位数及移位器大小无关,同时结构比较规整,利于后端版图实现。但是NMOS传输管在传输高电平时有一个阈值电压损耗,降低了电路的噪声容限,因此需要在输出端增加电平提升电路。

2.2 取指电路的设计

指数(exp)指的是冗余符号位的个数,他对于二进制补码数的归一化是十分重要的,归一化是将原二进制补码左移exp位(也就是将冗余的符号位移出),例如对于二进制补码00001100,他冗余的符号位个数是3,所以exp=3,归一化就是将00001100左移3位的过程,即变成01100000。对于本文设计的BMU,符号位是BMui[31],如果高5位不完全相同,则exp为负值。表1列举了几个数据的例子。

指数的提取过程分成两步:

(1)找出从BMUi[34]到BMUi[0]第一个与BMUi[35]不同的位i。

(2)对i进行编码,得到指数值。

第一步可以通过BMUi[35]与BMUi[34-i](i=0,1,…,33,34)异或来实现,找出第一个与BMUi[35]相异的位。同时本级产生的移位选择信号必须能够屏蔽下一级的移位选择信号信号。设BMUi[34-i]位与.BMUi[35]异或的结果记为XOR[i](i=0,1,2,…,33,34),前一级产生的屏蔽信号为C[i-1],这样第i位(i=0,1,2,…,33,34)的移位选择信号可以表示成XOR[i]和C[i-1]的函数,指数选择信号的最高位exp sel[35]可以表示成C[34]的反信号,这表示如果前35位屏蔽信号都为0,则屏蔽信号C[34]无效,此时exp sel[35]=1;如果前35位已经有一个为1,则说明36位二进制位中存在与BMUi[35]相异的位,此时屏蔽信号C[34]有效,exp-sel[35]被屏蔽。综上所述,得到第i级的指数选择信号exp-sel[i]和提供给下一级的屏蔽信号C[i]如下式所示,设计电路如图3所示。



由图3可以看出,屏蔽信号最多将会经过30几级传输门,是取指电路的关键路径,经过30几级的传输门后,信号驱动能力较弱,延时较大,不符合高性能DSP的要求。可以考虑将这最长路径打断,提高速度。类似与超前进位加法器的进位传递,将屏蔽信号链打断,每4位提供一个超前屏蔽信号,用来屏蔽下一级的移位选择信号,这样隔断了最长路径,提高了驱动能力,进而提高取指电路的工作速度。

指数选择信号产生后,只要经过相应的编码就可以得到相关的指数值(二进制补码),编码表如表2所示。

2.3 移位选择处理

移位选择处理是根据移位数目shfnum和指数exp来产生移位选择信号shfsel。移位选择处理过程主要是根据输入控制信号(in norm,in shift,in leftshf)以及移位数目shfnum和指数exp产生两种信号:最终左移信号left和最终左移数目leftnum。经过分析,left和leftnum都可以写成输入控制信号、指数exp和移位数目shfnum的逻辑表达式。进一步分析表明,可以用6 b(因为最终的移位选择信号是36位,至少需用6位来表示)的加法器来产生leftnum。最终移位信号left以及加法器的被加数addA、加数addB和进位c[i]的逻辑表达式(下式)。将leftnum进行译码后就可以得到移位选择信号shfsel。

2.4 移位数据处理

该处理过程主要是产生桶形移位器的71位输入数据D[70:0],将71位数据位分成两部分,一部分叫原数据位(36位,放置经过处理的输入数据),另一部分叫扩展数据位(35位,放置考虑了逻辑右移等的扩展位)。由桶形移位器的原理可以知道,当最终左移信号有效(即left=1)时,D[70:35]为原数据位,由原36位输入数据填充,低35位D[34:0]为扩展数据位,用0来填充。而当最终左移信号无效(即left=0)时,此时需分两种情况考虑:

(1)如果是算术移位,则D[35:0]为原数据位,由原36位输入数据填充,而D[70:36]是扩展数据位,由符号位扩展形成;

(2)如果是逻辑移位,此时是将原36位数据的低32位右移,高位补0,鉴于此,需要将原36位数据的高4位清零后赋给原数据位D[35:0],高35位(即D[70:36])由0扩展形成。

由上述分析,移位数据处理电路可以分成3部分设计:原36位输入数据的高4位处理电路,扩展数据位电路,数据选择电路。分别设计这3部分电路如图4所示。

3 电路模拟

电路模拟工作在Sun Fire V880 Solaris系统环境下完成,模拟采用CSMC.5单阱CMOS工艺模型,环境温度25℃,工作电压为5 V。电路模拟采用VCS+NanoSim混合仿真的方法进行,由VerilogHDL提供激励给BMU的网表。模拟结果如图5所示:当bmui=0x1478f73时,exp=6,bmui=0x105fb31b4时,归一化后bmuo=417ecc6d,当bmui=0x603a09b12,shfnum=7左移时bmuo=ld04d8900。这表明BMU功能符合设计目标,同时测得BMU的最大延时是8.78 ns,即极限工作频率是114 MHz。NanoSim自动生成的状态记录文档指出本文设计的BMU共使用了4 527个晶体管。

4 结 语

本文设计了用于定点DSP的位处理单元电路,他有效地实现了逻辑/算术移位、取指、归一化等操作,解决了利用定点DSP进行浮点运算的问题。该BMU包括桶形移位器、取指电路、移位数据处理电路和移位选择处理电路等几部分。在设汁取指电路时,借鉴超前进位加法器中超前进位的概念.采用了超前屏蔽,将最长路径打断,提高了电路的工作速度。另外,该BMU仅包含4 527个晶体管,资源消耗较少,在5 V工作电压下,电路速度达到114 MHz,完全符合高性能DSP的要求。

关键字:逻辑  算术  浮点  控制 引用地址:高性能定点DSP位处理单元(BMU)设计

上一篇:高性能定点DSP位处理单元(BMU)设计
下一篇:高性能定点DSP位处理单元(BMU)设计

推荐阅读最新更新时间:2024-05-02 20:39

ASML:H1存储器需求续强,逻辑IC营收看增
全球半导体微影技术领导厂商艾司摩尔(ASML),2014年业绩成长逾一成。基于2014年第四季的28亿欧元未出货订单(backlog),公司预期2015年上半年来自于记忆体客户的产品营收将持续强劲,来自逻辑IC客户的营收也可望比2014年下半年成长。 艾司摩尔(ASML)公布2014第四季财报及合并年营收,2014年第四季营收净额(net sales)达到14.9亿欧元,毛利率(gross margin)为44%。2014全年营收总额(sales)58.6亿欧元,净收益(net profit)为12亿欧元。2015第一季营收净额(net sales)预估为16亿欧元,毛利率(gross margin)预估为47%。
[半导体设计/制造]
6 通道逻辑 / SPI / I2C μModule 隔离器
加利福尼亚州米尔皮塔斯 (MILPITAS, CA) – 2016 年 12 月 12 日 – 凌力尔特公司 (Linear Technology Corporation) 推出 6 通道 SPI / 数字或 I2C μModule® 隔离器 LTM2887,该器件面向低电压组件,包括较新的 DSP 和微处理器。两个经过良好稳压的可调电源轨 (高达 5V) 越过隔离势垒提供大于 100mA 的负载电流,并具有高达 62% 的效率。对于辅助电源,电压可调节到低至 0.6V,而对于 SPI 接口,隔离型逻辑电源则可低至 1.8V。每个电源提供一个精准的电流限值调整引脚,并能使用外部电阻器来调节电压。 在工业系统应用中,接地电位
[模拟电子]
6 通道<font color='red'>逻辑</font> / SPI / I2C μModule 隔离器
PWM控制电路的基本构成及工作原理
摘要:介绍了PWM控制电路的基本构成及工作原理,给出了美国Silicon General公司生产的高性能集成PWM控制器SG3524的引脚排列和功能说明,同时给出了其在不间断电源中的应用电路。 关键词:PWM SG3524 控制器 引言 开关电源一般都采用脉冲宽度调制(PWM)技术, 其特点是频率高,效率高,功率密度高,可靠性高。然而,由于其开关器件工作在高频通断状态,高频的快速瞬变过程本身就是一电磁骚扰(EMD)源,它产生的EMI信号有很宽的频率范围,又有一定的幅度。若把这种电源直接用于数字设备,则设备产生的EMI信号会变得更加强烈和复杂。 本文从开关电源的工作原理出发,探讨抑制传导干扰的EMI滤波器的设计以及对辐射
[应用]
单片机模糊PID自整定控制算法的实现及仿真
0 引言 由于液压伺服系统的固有特性(如死区、泄漏、阻尼系数的时变性以及负载干扰的存在),系统往往会呈现典型的不确定性和非线性特性。这类系统一般很难精确描述控制对象的传递函数或状态方程,而常规的PID控制又难以取得良好的控制效果。另外,单一的模糊控制虽不需要精确的数学模型,但是却极易在平衡点附近产生小振幅振荡,从而使整个控制系统不能拥有良好的动态品质。 本文针对这两种控制的优缺点并结合模糊控制技术,探讨了液压伺服系统的模糊自整定PID控制方法,同时利用MATLAB软件提供的Simulink和Fuzzy工具箱对液压伺服调节系统的模糊自整定PID控制系统进行仿真,并与常规PID控制进行了比较。此外,本文还尝试将控制系统通过单片机的
[单片机]
单片机模糊PID自整定<font color='red'>控制</font>算法的实现及仿真
清华大学 ATMEL AVR 微控制器实验室成立
爱特梅尔公司 (Atmel® Corporation) 宣布,基于企业与高校联手培养合格工程师的共同目标,清华大学 - ATMEL AVR微控制器实验室于2011年3月1日正式挂牌成立,成为爱特梅尔公司在中国地区的25个AVR微控制器大学实验室之一。该实验室作为清华大学基础工业训练中心的科研实践基地,将承担清华大学基础工业训练中心电类专业本科生微控制器的实践教学,成为推动双方长远发展、更好合作的开端。 清华大学 - ATMEL AVR微控制器实验室成立暨揭牌仪式于2011年3月1日在清华大学清华园西主楼102号报告厅举行。清华大学实验室与设备处处长武晓峰、副处长文星火,清华基础工业训练中心主任李双寿教授、中心副主任韦思健
[单片机]
基于台达PLC和变频器的位置控制系统实现
  1 引言   当今自动化控制产品日新月异,相同功能的实现有各种各样不同的方式。比如很多设备上都要使用的定位控制的实现就有很多种方法。有的利用单片机结合伺服系统实现定位控制;有的使用plc高速脉冲输出功能或配定位单元结合伺服系统实现;还有的利用变频器的多段速控制来实现定位控制。但不同的定位控制系统有不同的特点,成本也有很大的差异,于是针对不同的设备对精度和响应速度的要求,选用合适的定位控制系统以实现最优的性价比就非常必要。本文介绍一个高性价比的,应用台达plc的高速计数器和与变频器通讯的功能来实现的定位控制的例子。 2 控制实例   切纸机械是印刷和包装行业最常用的设备。其完成的最基本动作是:把待裁切的材料送到指定位置,然后
[嵌入式]
集成机器人解决方案——跨控制器机器人
一家针对跨平台Delta和DuoPod机器人的运动系统制造商MAJAtronic,在其产品组合中增加了关节臂系统。机器制造商现在可以将诸如装载和码垛等功能集成到他们首选的机器控制系统中。MAJAtronic的六关节演示机器人展示了通过mapp技术,使用贝加莱控制器可以如何快速、轻松地完成这项工作。 当机器制造商需要Delta机器人或关节机器人用于新机器或工厂时,他们的第一直觉是转向机器人行业中的大品牌。他们可以提供多种广泛适用的工业机器人、专门的解决方案(如针对焊接、涂胶或送料应用)、专用机器人控制器及。通常,无法分开订购机器人机械本体和机器人控制器。 然而,越来越多的机器和工厂建造商并不想捆绑购买机械本体和控制器,并且
[机器人]
基于汇聚式处理器BF50x轻松实现电机控制
从电梯、家电到机器人和工业自动化生产线,电机几乎无处不在。而作为高能耗设备,数量巨大的电机的电能消耗占全球电能消耗量的比例极高,在美国估计50%的电能由电机消耗。由于许多电机的效率低下,如此巨大的能耗中很大部分被浪费掉。例如,小型交流电机的效率低至 50%。 电机的低能效对于工厂等应用环境来说是祸不单行——既消耗电能还产生了影响设备性能的热量。解决这个问题的一个办法是增加智能负载匹配和可变速控制,这种解决办法可以将能效提高14%~30%。如果这种解决方案得到广泛的采用,仅美国可以节省15%的总电能,相当于减少3000亿千瓦时的能耗,节约近150亿美元的用电成本,每年减少温室气体排放量达1.8亿吨。 低碳经济的
[嵌入式]
基于汇聚式处理器BF50x轻松实现电机<font color='red'>控制</font>
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved