DSP编程技巧之22---详解浮点运算的定点编程

发布者:科技独行者最新更新时间:2014-10-25 来源: 互联网关键字:DSP  编程技巧  定点编程 手机看文章 扫描二维码
随时随地手机看文章
  我们使用的处理器一般情况下,要么直接支持硬件的,比如某些带有FPU的器件,要么就只支持定点运算,此时对浮点数的处理需要通过编译器来完成。在支持硬件浮点处理的器件上,对的编程最快捷的方法就是直接使用浮点类型,比如单精度的float来完成。但是在很多情况下,限于成本、物料等因素,可供我们使用的只有一个时,直接使用float类型进行浮点类型的运算会使得编译器产生大量的代码来完成一段看起来十分简单的浮点数学运算,造成的后果是程序的执行时间显著加长,且其占用的资源量也会成倍地增加,这就涉及到了如何在上对进行高效处理的问题。

  既然是,那么其对定点数,或者说字面意义上的“整数”进行处理的效率就会比它处理浮点类型的运算要高的多。所以在定点处理器上,我们使用定点的整数来代表一个浮点数,并规定整数位数和小数位数,从而方便地对定点数和浮点数进行转换。以一个32位的定点数为例,假设转换因子为Q,即32位中小数的位数为Q,整数位数则为31-Q(有符号数的情况),则定点数与浮点数的换算关系为:

  定点数=浮点数×2^Q

  例如,浮点数-2.0转换到Q为30的定点数时,结果为:

  定点数=-2×2^30=-2147483648

  32位有符号数的表示范围是:-2147483648到2147483647。如果我们把有符号定点数的最大值2147483647转换为Q为30对应的浮点数,则结果为:

  浮点数2147483647/2^30=1.999999999

  从上面的两个计算例子中也可以看出,在Q30格式的情况下,最大的浮点数只能表示到1.999999999,如果我们想把浮点数2.0转换为Q30的定点数,则产生了溢出,即造成了1e-9的截断误差。在此我们列出Q0到Q30对应的范围和分辨率如下表所示:DSP编程技巧之22---详解浮点运算的定点编程

  如果你嫌自己计算麻烦的话,可以借助Matlab的命令来求取它们的转换,例如,在Matlab的命令窗口中输入:

  q = quantizer('fixed', 'ceil', 'saturate', [32 30]);

  FixedNum=bin2dec(num2bin(q,1.999999999));

  回车之后就可以看到1.999999999转成Q30之后的定点数了。

  弄清楚了单个浮点数和定点数之间的转换关系,接下来就需要了解一下两个定点数所代表的浮点数进行运算时,是如何转换的了。根据乘法的结合律、分配率,浮点数转换之后的定点数是可以直接运算的,例如:

  1. 不同Q格式的转换

  设有定点数Fixed1=Float1*2^Q1,如果把它用为Q2这个不同精度/表示范围的定点数来表示,则有Fixed2=Float1*2^Q2。所以不同的Q格式直接的转换为:

  Fixed2=Fixed1*2^Q2/2^Q1=Fixed1*2^(Q2-Q1)

  因为Fixed1、Fixed2都是定点数,所以在C编程的情况下,我们可以使用高效的左移、右移操作来完成这个乘以2^(Q2-Q1)的操作。

  2. 两个相同Q格式的定点数:

  Fixed1=Float1*2^Q

  Fixed2=Float2*2^Q

  则加法操作为:

  Float1+Float2=Fixed1/2^Q+Fixed/2^Q=(Fixed1+Fixed2)/2^Q

  对于上述的加法操作,如果定点数的和Fixed1+Fixed2超过了32位整数的极值,则会发生溢出现象,造成结果的不正确,此时我们只能先损失一倍的精度,把Float1、Float2的Q值变为Q-1.

  乘法操作为:

  Float1*Float2=Fixed1/2^Q*Fixed/2^Q= Fixed1*Fixed2/2^(2Q)

  同样的道理,如果Fixed1*Fixed2之后的定点数超过了32位整数的极值,则我们也需要提前对它们进行一下折算,变换一下它们的Q值。这就涉及到对结果的一个预估问题,也是定点编程不如浮点编程简单、高效的不足之一。

  3. 两个不同Q格式的定点数:

  Fixed1=Float1*2^Q1

  Fixed2=Float2*2^Q2

  运算的规则是结合了前面的两种情况,只不过多了额外的转换工作:要么把其中的一个Q1格式的定点数先转换为另一个Q2格式,要么把它们都转换为一个中间值Q3格式的定点数,然后再进行运算。

  这些运算虽然并不复杂,但是如果在数学运算比较多的情况下,一个个的进行手工转换还是比较麻烦的,还好在近些年的处理器特别是芯片中,在其BootROM中都内置了强大的数学表来帮助我们完成这些转换工作,我们只要按照一定的格式进行书写,那么编译器就会自动调用相关的库函数来完成了。以TI的C28x系列为例,我们可以使用现成的IQMath库来完成这些繁琐的工作。它的使用方法示例为

  1)在工程属性中引用IQmath.lib库文件

  2)在使用IQMath库函数的主程序中引用相关的头文件:

  #include

  #define PI 3.14159

  _iq input, sin_out;

  void main(void )

  {

  /* 0.25 x PI radians represented in Q29 format*/

  input=_IQ29(0.25*PI);

  sin_out =_IQ29sin(input);

  }

  其中,我们可以在头文件中指定一个全局的Q格式,在不需要特别指定Q值的时候,使用默认的值。

  例如,在头文件中#define Q 28,则我们在程序中调用IQMath库函数时,

  sin_out =_IQsin(input);//使用全局定义的Q28格式

  sin_out =_IQ29sin(input); //特别指定使用Q29格式

  默认情况下,编译器使用的Q格式是24,如果追求更高的精度,则可以使用更大的Q值,但是相应地表示的浮点数的范围也要小,此时可以考虑使用标么值,使得大部分变量的值都处在-1到1的区间内。

  此外,在C语言编程时,调用方式是_IQsin(input),在C++编程时,则直接使用IQsin(input)就可以了。

  3)在CMD链接文件中指明IQMath数学表的位置:

  例如,对于281x器件:

  MEMORY

  {

  PAGE 0:

  PRAMH0 (RW) : origin = 0x3f8000, length = 0x001000

  PAGE 1:

  IQTABLES (R) : origin = 0x3FF000, length = 0x000b50

  DRAMH0 (RW) : origin = 0x3f9000, length = 0x001000

  }

  SECTIONS

  {

  IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1

  IQmathTablesRam : load = DRAMH0, PAGE = 1

  IQmath : load = PRAMH0, PAGE = 0

  }

  对于2833x器件:

  MEMORY

  {

  PAGE 0:

  PRAML0 (RW) : origin = 0x008000, length = 0x001000

  PAGE 1:

  IQTABLES (R) : origin = 0x3FE000, length = 0x000b50

  IQTABLES2 (R) : origin = 0x3FEB50, length = 0x00008c

  DRAML1 (RW) : origin = 0x009000, length = 0x001000

  }

  SECTIONS

  {

  IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1

  IQmathTables2 > IQTABLES2, type = NOLOAD, PAGE = 1

  {

  IQmath.lib (IQmathTablesRam)

  }

  IQmathTablesRam : load = DRAML1, PAGE = 1

  IQmath : load = PRAML0, PAGE = 0

  }

  对于280x器件:

  MEMORY

  {

  PAGE 0:

  PRAML0 (RW) : origin = 0x008000, length = 0x001000

  PAGE 1:

  IQTABLES (R) : origin = 0x3FE000, length = 0x000b50

  IQTABLES2 (R) : origin = 0x3FEB50, length = 0x00008c

  IQTABLES3 (R) : origin = 0x3FEBDC, length = 0x0000AA

  DRAML1 (RW) : origin = 0x009000, length = 0x001000

  }

  SECTIONS

  {

  IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1

  IQmathTables2 > IQTABLES2, type = NOLOAD, PAGE = 1

  {

  IQmath.lib (IQmathTablesRam)

  }

  IQmathTables3 > IQTABLES3, type = NOLOAD, PAGE = 1

  {

  IQmath.lib (IQmathTablesRam)

  }

  IQmath : load = PRAML0, PAGE = 0

  }

  为了方便数学运算的高效处理,IQMath库中还包含了常用的数学运算函数,包括:

  1. 格式转换

  IQN浮点转定点,IQNtoF定点转浮点,atoIQN字符串转定点,IQNtoa定点转字符串,IQNint返回定点数的整数部分,IQNfrac返回定点数的小数部分,IQtoIQN和IQNtoIQ为指定Q格式与全局Q格式的互转,IQtoQN和QNtoIQ为32位与16位互转,IQmpy2, 4, 8..64即左移,IQdiv2, 4, 8..64即右移

  2. 算数运算

  IQNmpy和IQNrmpy:乘法,IQNrsmpy为带饱和的乘法。IQNmpyI32和IQNmpyI32int为定点数与32位整数的乘法,IQNmpyI32frac可返回结果的小数位数。QNmpyIQX:不同Q格式的定点数相乘。

  IQNdiv:除法运算。

  3. 三角运算

  包括IQNasin,IQNsin,IQNsinPU,IQNacos,IQNcos,IQNcosPU,IQNatan2,IQNatan2PU,IQNatan。

  其中,PU的含义在该函数中π已经折算为1。例如:

  sin(0.25*π)=sinPU(0.25)。

  4. 代数运算

  包括IQNexp,IQNlog,IQNsqrt,IQNisqrt,IQNmag,IQNabs,IQsat

关键字:DSP  编程技巧  定点编程 引用地址:DSP编程技巧之22---详解浮点运算的定点编程

上一篇:基于射频技术的穿戴式医疗仪器的设计
下一篇:一种基于HD-SDI技术的高清图像处理系统设计

推荐阅读最新更新时间:2024-05-02 23:15

一种基于FPGA的振动信号采集处理系统
  振动现象是机械设备运行的伴随过程,结构部件处于工作状态就有振动信号产生,常见故障通过振动和由振动辐射出来的噪声反映。在飞行器的健康监控和诊断过程中,作为提取故障信息的主要手段,振动信号的采集和处理具有特殊重要的意义。   飞行器振动过程的捕捉由于采样点数密集, 传感器 数量多, 传感器 之间同步要求高,对于振动采集系统采样速率、采样精度和数据处理能力提出了更高的要求,单纯依靠CPU完成数据采样和处理越来越力不从心。   以FPGA为代表的可编程逻辑器件以其工作稳定、速度快、灵活的可编程能力等特点,获得了越来越广泛应用。本文提出了一种基于FPGA的振动信号采集处理系统;该系统具有实时性高,纠错能力强等特点,采用数据流控制的方法实
[嵌入式]
一种基于FPGA的振动信号采集处理系统
在示波器上使用DSP滤波技术的优点和缺点
当前所有高速实时数字示波器都采用了各种形式的数字信号处理技术( DSP )。某些工程师担心使用软件对采集来的数据波形滤波可能会与实际的信号有出入。但是,示波器捕获的原始波形未必表示的是实际输入信号,示波器捕获的“原始”波形数据中包括了失真的结果,这是由示波器的前端硬件滤波器造成的。在理想情况下,实时示波器拥有无限快的采样速率、完美的平坦频响、线性相位响应、没有底噪声及带宽高。但在实际环境中,示波器具有硬件限制,这种限制产生了误差。DSP滤波技术最终可以在一定程度上校正硬件导致的误差,改善测量精度,增强显示质量。 当前性能较高的实时示波器中常用的DSP滤波技术有以下五种: 每种滤波器特点都可以在用有限脉冲响应 用于波形重建的
[测试测量]
在示波器上使用<font color='red'>DSP</font>滤波技术的优点和缺点
基于DSP技术的功率电感5kW离网型光伏逆变器设计
太阳能光伏发电是当今世界上最有发展前景的新能源技术,太阳能光伏发电系统按照系统运行方式的不同可分为离网型光伏发电系统、并网型光伏发电系统以及混合型光伏发电系统。随着我国光伏发电系统的迅速发展,尤其是光伏屋顶计划的实施,国内对离网型光伏逆变器的需求将越来越大。离网型光伏发电系统主要是由光伏电池阵列、控制器、逆变器、储能装置等环节组成,如图1所示,其中逆变器是光伏系统中重要的器件之一,其可靠性和转换效率对推行光伏系统、降低系统造价至关重要。 目前,国内同类产品主要存在以下不足:a.大多采用单片机控制,实时性差,数据处理及通信能力有限;b.采用变压器,体积大、笨重;c.输出电压精度不高,不能满足社会发展的需要。本文提出了5kW
[嵌入式]
基于<font color='red'>DSP</font>技术的功率电感5kW离网型光伏逆变器设计
Autotalks获得CEVA DSP授权许可 部署V2X芯片组
    集微网4月28日消息,专注于智能互联设备的全球领先信号处理IP授权许可厂商CEVA公司和全球领先的集成式V2X芯片组供应商Autotalks公司共同宣布,Autotalks已经获得CEVA授权许可,并将在其第二代车联网(Vehicle-to-Everything,V2X)芯片组产品使用CEVA-XC DSP技术。   V2X技术在无线范围内连接车辆至其它车辆 (V2V) 、基础设施 (V2I) 、摩托车 (V2M) 和行人 (V2P) ,在各种安全和移动应用中提供各种功能,比如针对还未见到的危险及早发出报警,或者与交通信号协同工作以期最大限度减少堵车。预计美国交通部(USDOT)将会发布规章制定通告(NPRM),强制管理
[手机便携]
WCDMA系统基带处理的DSP FPGA实现方案
引言 随着Internet的迅猛发展和各种无线业务需求的增加,目前以承载单一话音业务为主的无线通信网已经越来越不适应人们的需要,所以,以大容量、高数据率和承载多媒体业务为目的的第三代移动通信系统(IMT-2000)成为无线通信的发展方向。码分多址( CDMA )技术凭借其良好的抗噪性、保密性和低功率等优点成为第三代移动通信中最主要的多址接入技术。 和传统的CDMA系统相比,第三代移动通信的最大特点在于能支持多种速率的业务,从话音到分组数据到多媒体业务,并能根据具体的业务需要,提供必要的带宽。3GPP协议规定 WCDMA 系统支持的业务类型包括:5.15Kbps~12.2Kbps话音数据、 64Kbps电路数据、
[焦点新闻]
一种新型DSP(TS101)中的链路DMA
摘要:链路DMA是在处理器内核不干预的情况下,后台利用链路口高速传送数据的一种机制。TS101是高性能浮点数字信号处理器,它有8个链路DMA通道,可以在内部/外部存储器和链路口之间、链路口与链路口之间进行多种类型的DMA传输。文章介绍了链路DMA及其在雷达信号处理系统中的实际应用。 关键词:TS101;链路DMA;TCB;转发 1 引言 雷达处理过程中大量复杂信号的处理算法要求信号处理机具有每秒超过百亿次的浮点运算能力,如此高的速度在目前的技术条件下无法用单片DSP实现,需要采用多片并行处理技术才能满足处理速度的需求。TS101处理器是Analog Devices公司推出的一种新型高速实时数字信号处理芯片(DSP),其峰值
[应用]
基于TMS320F206DSP的图像采集卡设计
    摘要: 提出了一种使用视频A/D芯片TLC5510与低档DSP芯片TMS320F206实现图像采集的接口设计方案,同时给出了接口程序,为低档DSP芯片提供了一条新的应用途径。     关键词: ADC DSP 接口设计 视频 数字信号处理器(DSP)是数字信号处理理论与超大规模集成电路(VLSI)技术融合的结晶。目前DSP技术正广泛地应用于通信、语音、图像、航天航空、仪器仪表等领域,在推动当代信息处理数字化方面正发挥着越来越大的作用。 在利用电话线传输视频图像这一低比特率多媒体通信领域中,如果选用图像处理的专用芯片,如SAA7110、8×8 3104VCP以及LSI公司的专用芯片等,或者选用
[应用]
赛灵思收购AccelChip,提供独特的DSP技术组合
赛灵思公司(Xilinx)日前宣布,已收购用于构建数字信号处理(DSP)系统的MATLAB综合软件工具的领先供应商AccelChip公司。AccelChip DSP综合工具和DSP算法知识产权(IP)库将作为赛灵思XtremeDSP解决方案的一部分,该解决方案包括System Generator for DSP设计工具、丰富的DSP库以及参考设计。这一DSP技术的独特组合使成千上万使用MATLAB和Simulink的DSP算法与系统设计者能够利用赛灵思的可重配置DSP来创建高性能系统。 与赛灵思在2005年10月发布的DSP策略与产品路线图相一致,诸如由赛灵思和AccelChip提供的这些工具将加快面向数字通信领域、多媒体、视频
[焦点新闻]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved