O 引言
美国德州仪器(TI)公司的数字信号处理器(DSP)以其处理速度快,功能强大,易于使用,且有开发软件支撑等优点而广泛应用于通信、电子、自动控制等领域。一个完整的DSP系统应当由硬件和软件两部分组成。在硬件(主要是DSP芯片)相同时,系统的性能将主要取决于软件部分的效率。而在相同的硬件平台上,不同程序员编写的软件效率相差很大,软件效率已成为影响DSP系统性能的一个重要因素。要充分发挥D-SP芯片的性能,就必须编写高效率的程序。一般在DSP进行运算时,有些操作会频繁出现(如卷积、FFT、FIR滤波等),完成这些操作的程序的效率直接影响整个软件部分的效率。为此,TI公司提供了一系列库函数(TI DSP Library,以下简称DSP Lib)来完成这些操作。这些库函数既可减少程序员的工作量,又可提高程序效率,因此,在程序开发中,合理地使用这些库函数,将大大提高系统性能。
1 TI DSP Library简介
1.1 TI DSP Library的特点
DSP Lib的核心实际上是一系列经过手工优化的汇编程序代码,这些代码封装在后缀名为.lib的文件中,可用于完成各种运算。它们对外是不可见的。这些程序(库函数,routines)可被C程序调用。由于经过了手工优化,它们的效率都非常高。由于不同系列DSP芯片的指令集不同,因此,不同系列DSP芯片的DSP Lib也是不同的,如TMS320C5000的DSP LIb就不能用于TMS320C6000。但是,各个系列DSP Lib的基本组成是相同的,一个完整的DSP Lib通常由Lib文件夹、include文件夹和其它辅助文件组成。其中lib文件夹用于存放*.lib文件,其内部封装着手工优化的汇编程序代码,是一个DSP Lib的核心部分。有的DSP Lib还有*.src文件,这些*.src文件主要是用C语言和汇编语言编写的程序源代码。使用归档器可从中提取出这些源代码;而include文件夹用于存放各个库函数的头文件,通常这些文件分为C程序头文件和汇编程序头文件两部分。
1.2 TI DSP Library的下载和安装
由于DSP Lib种类繁多,且属可选模块,通常的DSP开发环境(CCS,Code Composer Studio)并没有配备DSP Lib。因此,使用一个DSP Lib之前,必须进行DSP Lib的下载和安装。
所谓下载,就是在TI公司网站WWW.ti.com上免费下载各种DSP Lib;而所谓安装,就是在DSP Lib下载完毕后,双击安装文件,以将它安装在计算机中选定的位置(默认位置为C:\ti)。安装之后,即可在程序开发中使用DSP Lib的库函数。
1.3 TI DSP Library的使用
按处理数据类型的不同,TI DSP分为定点(fixed-point)DSP和浮点(floating-point)DSP。由于浮点DSP既有定点指令集,又有浮点指令集,因此,本文选取浮点DSP系列TMS320C67x的DSP Lib,并且选取了TMS320C67x DSP Library和TMS320C67x FastRTS Library两个DSP Lib,前者主要针对数字信号处理的常用操作,后者则针对一般数学运算的通用操作。
2 TMS320C67x DSP Library的应用
当DSP进行数据处理时,卷积、FFT、FIR滤波等操作频繁出现,故在程序开发中,使用DSP Lib来完成这些操作将大大提高整个程序的效率并简化编程。TMS320C67x DSP Library就是这样的一个DSP Lib,它的lib文件夹内含库文件dsp67x.lib和源文件dsp67x.sr、dsp67x_C.sr-c、dsp67x_sa.src。TMS320C67x DSP Library主要用于TMS320C67x系列DSP芯片的程序开发,使用它可完成FFT运算。
2.1 TMS320C67x DSP Library的使用
使用TMS320C67x DSP Library的第一步是将其核心文件“dsp67x.lib”加入到当前工程中,相关编译链接参数为“-ldsp67x.lib”;接着,将存储头文件的include目录所在路径添加到工程搜索路径中,其相关编译链接参数为“-i pathname”,具体操作可参考TI公司的有关文献。选取该DSP Lib中的库函数“DSPF_sp_cfftr2_dit()”可完成FFT运算,它使用的是基2的时间抽取算法,具体形式如下:
同时,该库函数还有一个对应的头文件“dspf_sp_cfftr2_dit.h”,使用时可将其包含到调用该库函数的程序中。此时,该库函数就可以像一般子程序一样被其他程序调用,具体使用代码如下:
为了便于比较,可使用归档器指令“ar6x”从该DSP Lib的源文件“dsp67x_c.src”中提取出库函数的源代码,以得到文件“sp_cfftr2_ dit.c”。所有归档器指令的命令文件都存储在CCS的安装目录下,这里,“ar6x”的使用格式为:
ar6x-x dsp67x_c.src sp_cfftr2_dit.c
从“sp_cfftr2_dit.c”中可得到库函数“DSPF_sp_cfftr2_dit()”的C语言源代码,相应的C程序为“void sp_cfftr2_dit(float*x,float*w,short n)”,该程序可以像一般子程序一样被主程序调用。源函数和库函数的形式完全相同。实际上,库函数就是对源函数的程序代码进行手工优化的结果。
2.2 性能分析
分别使用库函数和源函数可完成FFT运算。并可用CCS自带的剖析工具“Profiler”来分析两个函数由于编程方式的不同所带来的运行时间上的差异。改变输入数组的长度,可得到如表1所列的一组数据。由表1可以看出,库函数的效率远远高于源函数,其效率的提高量随着输入数据长度的变化而变化,最高的效率可提高40倍(40.98-1=39.98),最低仍在25倍左右,而且该DSP Lib的其他库函数也有相近的测试结果。虽然用该DSP Lib的库函数后,程序效率可以提高一个数量级,对于时间限制较为严格的系统,特别是实时系统,这仍然是非常有用的。
库函数和源函数相比,其效率有了很大提高,但这种提高是有代价的。它主要表现为通用性降低。其原因是为了最大限度的提高效率,在对代码进行手工优化的过程中,引入了一些强假设,同时,使用了大量的操作合并、并行处理等简化手段,这必然导致库函数的通用性降低。例如,库函数“DSPF_sp_cfftr2_dit()”使用时就会受到以下条件的限制:
(1)输入数组的长度必须是2的幂级数,且不得小于32;
(2)输入数组x和旋转因子数组w必须按双字对齐方式存储,即数组起始地址的末3位必须是零;
(3)数据的存储格式必须是小端模式(Little Endian);
(4)执行期间可接收中断,但不予响应,这可能导致一些实时事件得不到及时响应。
如果使用“DSPF_sp_cfftr2_dit()”时不考虑到这些限制,就有可能导致程序运行异常。因此,库函数的效率虽然高,但不能盲目的滥用,在程序开发时,必须根据实际情况在通用性和效率之间进行折衷,以合理的使用库函数。
3 TMS320C67x Fast RTS Library的应用
在DSP进行数据处理时,除了一些典型的操作外,还存在大量常规的操作,如除法操作、对数运算、三角函数等,这些操作也是很费时的,提高这些操作的代码效率,也能显著提高整个软件的效率。TMS320C67x FastRTS Library就是这样的一个DSP Lib,它通常由Lib文件夹、include文件夹和doc文件夹组成。其中lib文件夹内含库文件fastrts67x.lib(Little Endian)、fastrts67xe.lib(Big Endian)和源文件fastrts67x.src;include文件夹内含头文件fastrts67x.h和recip.h;而doc文件夹内含帮助文件。
3.1 TMS320C67x FastRTS Library的使用
TMS320C67x FastRTS Library(以下简称FastRTS Library)主要用于处理一些常规的操作。由于在通常情况下,CCS已经有一个RTSLib-rary来完成这些操作(例如,“rts6700.lib”就是一个适用于TMS320C67x的RTS Library文件),因此,如果要使用FastRTS Library,就必须在编译链接过程中先于“rts6700.lib”来编译链接“fastrts67x.lib(或fastrts67xe.lib)”,相应的编译链接命令选项为:
-l fastrts67x.lib - rts6700.lib或 -l fastrts67xe.lib - rts6700.lib
FastRTS Library同样需要注意头文件的使用,它有两个头文件: “fastrts67x.h”和“recip.h”。如果使用FastRTS Library中的特殊函数(三角函数,对数函数等),则必须包含“fastrts67x.h”;而如果使用求倒数操作,则必须包含“recip.h”。FastRTS Library的使用方式如下:
3.2 性能分析
分别使用FastRTS Library和RTS Library可完成一些常用操作,使用剖析工具可得到各个操作所需的时钟周期个数,具体如表2所列(所有的操作均处理单精度浮点数)。对比表2中的数据可以发现,和RTS Library相比,FastRTS Library大大提高了程序的效率。
4 DSP Lib的编写
事实上,程序员并非只能被动的使用DSP Lib。只要遵循相应的规则,程序员也可以自己编写一个DSP Lib。编写一个最简单的DSP Lib的步骤如下:
(1)新建一个工程newLibrary,将其属性设为“Library(.lib)”,图l所示是新工程设置示意图;
(2)编写高效率代码文件myLibl.asm、myLib2.asm、myLib3.asm,……
(3)将myLibl.asm、myLib2.asm、myLib3.asm,……等文件添加到工程new Library中;
(4)编译链接工程new Library;
完成上面4步后,工程中就会出现库文件newLibrary.lib,这样,一个DSP Lib就制作成功了。为了使DSP Lib具有保密性,通常情况下,只需保留工程中的newLibrary.lib文件,而将其他文件,特别是源代码文件*.asm删除或保密存放。这样,用户就只能使用库文件,而无法从中得到源代码的信息。
5 结束语
本文以TMS320C67x DSP Library和TMS320C67x FastRTS Library为例,详细介绍了如何在程序开发中使用TI DSP Library,并分析了使用TI DSP Library所带来的程序效率的提高。最后,还给出了编写TI DSP Library的一个应用实例。
上一篇:一种基于FPGA的太阳跟踪器的设计及实现
下一篇:Microsemi发布65nm嵌入式快闪平台
推荐阅读最新更新时间:2024-05-02 21:12
- 兆易创新GD25/55全系列车规级SPI NOR Flash荣获ISO 26262 ASIL D功能安全认证证书
- 新型IsoVu™ 隔离电流探头:为电流测量带来全新维度
- 英飞凌推出简化电机控制开发的ModusToolbox™电机套件
- 意法半导体IO-Link执行器电路板为工业监控和设备厂商带来一站式参考设计
- Melexis采用无磁芯技术缩小电流感测装置尺寸
- 千丘智能侍淳博:用数字疗法,点亮“孤独症”儿童的光
- 数药智能冯尚:ADHD数字疗法正为儿童“多动症”提供更有效便捷服务
- Vicor高性能电源模块助力低空航空电子设备和 EVTOL的发展
- 创实技术electronica 2024首秀:加速国内分销商海外拓展之路
- “跨芯片”量子纠缠实现 有助建构更强大的量子计算能力
- XDA曝光三星S10四款机型:代号beyond 有5G版本
- 外媒实测索尼Xperia XZ3续航:表现令人堪忧
- 10月发布没悬念:苹果新iPad Pro细节曝光
- 富士康旗下公司接力A股IPO,天钰科技预计10月下旬上市
- 韦尔股份拟收购芯能投资与芯力投资,再获北京豪威10.55%股
- 长江存储杨士宁:Xtacking™架构有三大技术突破,64层3D NAND将
- 基于CEVA最新一代图像和视觉DSP平台,酷芯微电子新一代Edge AI
- 紫光展锐南明凯:展锐5G芯片明年启动商业化,突破中高端市
- SK海力士从惠普和IDT公司购入多项专利,增强自身专利实力
- 高通CEO莫伦科夫:与苹果的专利纠纷已进入和解意愿加强阶