利用Virtex-5 SXT 的高性能DSP解决方案

发布者:风清扬yx最新更新时间:2007-07-18 来源: DSP杂志关键字:编程  带宽  乘法  存储 手机看文章 扫描二维码
随时随地手机看文章

SXT 平台实现 DSP 的带宽最大化、功耗最小化

作者:Brent Przybus
Xilinx 公司
高级产品部
高级营销经理
brent.przybus@xilinx.com

二十多年来,FPGA 为世人提供了最灵活、适应性极强、快速的设计环境。早期的 DSP 设计人员发现,可将一种可再编程的门海用于数字信号处理。如果把内置到 FPGA 架构中的乘法器、加法器和累加单元结合起来,就可以利用大规模并行计算实现有效的滤波器算法。

在未加工频率性能方面的损失,通过并行计算得到了弥补,而且得远大于失,可谓“失之东隅,收之桑榆”;由此获得的 DSP 带宽完全可与替代方案媲美。随着时间的推移,乘法器和加法器的实施越来越高效。1998 年,Xilinx 顺理成章推出了第一个集成于 Virtex-II FPGA 系列产品中的嵌入式乘法器。Xilinx Virtex-II 和 Virtex-II Pro 系列产品深得人心,推动基于 FPGA 的 DSP 更上层楼,打破了每秒十亿次 MAC 运算的壁障。

在数字通讯、军事、国防、视频和图像市场需求的助推下,Xilinx 进一步做出调整,成功应对了一系列独特挑战,使极大规模并行实施方式跨上又一个新台阶。随着乘法器和加法器性能和数量的增长,对功耗进行管理也变得越来越困难。

Xilinx 的工程师们设计出了 DSP48 Slice,使这一难题迎刃而解。DSP48 Slice是一种超低功耗、高性能、全方位的数字信号处理元件,可方便地实现级联,而不占用任何 FPGA 架构资源。此元件在 Virtex-5 器件中得到进一步加强,并重新命名为 DSP48E Slice,能支持更高的精度、SIMD(单指令多数据)操作、集成模式检测电路和逻辑单元。

对快速数据输入和系数存储器的需求促使 Xilinx 构建起一个数字信息处理平台,其中的 DSP48E Slice 含有率之大前所未见,并且拥有极其充裕的 Block RAM 和分布式 RAM。作为画龙点睛之笔,Xilinx 在此平台中使用了运行速度高达 3.125 Gbps 的集成高速串行通道,在芯片上移入和移出数据变得更为快捷。风云际会,这些元件组合在一起,Virtex-5 SXT 平台由此应运而生。

Virtex-5 SXT 引擎 – DSP48E Slice

想要理解 FPGA 中数字信号处理的演变过程,必须回顾一下 DSP48E Slice(见图 1),及其设计的三个主要方面。

 集成乘法器和第二阶段。利用集成的二级加法器/减法器/累加器扩展乘法器的运算。现在,在单独一个 DSP48E Slice 中,就可以执行最常见的 DSP 运算组合了。

 紧缩实施。为了提高性能、降低功耗,各个 DSP48E Slice 被设计成独立元件,然后通过接口像积木块一样连接到一起,而每一个 DSP48E Slice 都包含独立于 FPGA 架构的专用路径和缓冲。

 全方位定制设计。Xilinx 很早就确定,要实现高性能和低功耗,一个按照最新工艺尺寸度身打造的全方位定制设计是必不可少的。Xilinx 设计团队与 Arithmetica 通力协作,将乘法器和加法器电路 MathIP 库加以集成,进一步提高了效率。

以这种设计为依托,DSP48E Slice 的实施在性能和低功耗效率方面达到了前所未有的水平。Virtex-5 器件中的 DSP48E Slice 分别以高速 550 MHz、中速 500 MHz 和低速 450 MHz 运行。无论您单独使用一个 DSP48E Slice 还是将所有 640 个 DSP48E Slice 汇集到最大的 Virtex-5 SXT 器件中,都可以达到这一性能(使用专用的级联逻辑实现每秒 3520 亿次乘法累积运算)。而且,实现这一令人叹为观止的性能,仅仅使用了 DSP48E Slice,完全没有消耗逻辑或 FPGA 路径资源。
这种专用的级联逻辑意味着能耗的计算是基于每一个 DSP48E Slice 的,也即其运行速度和输入的翻转率。单个 DSP48E Slice 的实测典型功耗为 1.38 mW/100 MHz。不难算出,假定 Virtex-5 SX95T 器件中所有 640 个 Slice 均以 550 MHz 运行,而翻转率为通常的 38%,则所有 DSP48E Slice 的总体动态功耗为 4.92W。

低功耗、高性能设计技术

为了充分利用独特的 Virtex-5 SXT 架构进行数字信号处理,建议遵循如下的简易指南:

 实施能最大化使用 DSP48E Slice 的滤波器算法。每一个 25 x 18 位的 DSP48E Slice 都等同于 500 个以上可编程逻辑 Slice,功耗为同等逻辑实施的 1/10,单独或链接运行速度高达 550 MHz。

 利用 DSP48E Slice 的所有功能。每一个 DSP48E Slice 都可配置成独立的 25 x 18 乘法器,一个 25 x 18 位乘法器兼加法器/减法器/累加器,或者一个 48 x 48 位加法器或减法器。每一个 DSP48E Slice 都支持 SIMD 运行以及对称或收敛圆整。

 实施定点或浮点运算。DSP48E Slice 不仅对于定点 FIR、FFT 或复杂的过滤器运算而言是理想的产品,25 x 18 的输入大小和级联路径还使我们可以使用两个 DSP48E Slice 来实现高效的 24 x 24 无符号浮点运算。

在数字信号应用中使用 DSP48E Slice

Virtex-5 SXT 平台中 DSP48E Slice、Block RAM、逻辑和数千兆位级收发器的独特结合,为 DSP 过滤器的应用提供了高成本效益、高性能、低功耗的解决方案。为了说明这一点,让我们看看 Virtex-4 SX 和 Virtex-5 SXT 器件平台中无线卡的应用,对比一下两种情况下的功耗差别。

WiMAX 数字前端 (DFE) 集成了以下内容:数字上变频 (DUC) /数字下变频 (DDC)、振幅因数缩小 (CFR) 和自动增益控制 (AGC)。本设计中要求的过滤功能正好与一个 Virtex-4 SX25 FPGA 或一个 Virtex-5 SX35T FPGA 所能提供的 DSP48E Slice 相匹配。本设计运行频率为 276 MHz,消耗 Virtex-4 SX25 FPGA 中 73% 的 DSP48 资源(128 个中的 95 个),或者 Virtex-5 SX35T FPGA 中 48% 的 DSP48E 资源(196 个中的 95 个)。

尽管单看 WiMAX DFE 方案的表现和用于其实施的资源已令人惊叹,真正堪称一绝的还是其功耗效率。本设计主要使用 DSP48 或者 DSP48E Slice,但也消耗 Block RAM 和逻辑。表 1 对这些方案进行了对比,并展示由 Virtex-4 到 Virtex-5 器件的实测功耗和降低水平。

结论

对数字信号处理的要求在不断提高,提供可扩展高性能 DSP 的呼声日益响亮,因此,在每秒几百 GMAC 甚至更高的水平上管理功耗的难题也愈见急迫。Xilinx Virtex-5 SXT FPGA 平台提供了独特的单芯片解决方案,充分利用大规模并行计算达到超高性能,同时将功耗降到最低。欲了解 Xilinx DSP 解决方案详情,请访问 www.xilinx.com/cn/dsp


图 1 – Virtex-5 FPGA 中 DSP48E Slice 的结构图

表 1 – 真实应用情况下的实测功耗

关键字:编程  带宽  乘法  存储 引用地址:利用Virtex-5 SXT 的高性能DSP解决方案

上一篇:达芬奇数字媒体片上系统的架构和Linux启动过程
下一篇:基于DSP的软件无线电基频发射机的设计与仿真

推荐阅读最新更新时间:2024-05-13 18:37

iSuppli:2009年闪存笔记本销量将占60%
根据市场研究公司的预测,未来两年里使用闪存的笔记本电脑总量,将从今天的几乎可以忽略不计迅速发展到超过笔记本销量的50%。 根据市场研究机构iSuppli的预测,到2009年第四季度,闪存的笔记本电脑的销量将达2400万台,占整个笔记本电脑市场销量的60%。而2007年第一季度闪存的笔记本电脑的销量是14.36万台,仅占整个笔记本电脑市场销量的0.7%。 闪存相对于传统的硬盘存储器有诸多优点,比如没有运动组件、消耗更少的电量、产生更少的热量,并且抗震性能更好,存取数据也更快,非常适合应用在笔记本电脑上。 使用闪存技术的主要障碍是价格。闪存在今天相对于硬盘驱动器价格非常昂贵。随着生产商之间竞争的加剧和生产工艺的提高,闪存价格预期会下
[焦点新闻]
中关村2016年高聚工程新添53名领军人才,紫光赵伟国入围
6月29日上午,北京市委组织部、市公安局、市财政局、市人力社保局、市卫计委、中关村管委会等6家单位联合为2016年中关村高聚工程入选领军人才颁发证书。2016年共有53名行业领军人才入选中关村高聚工程。 桑德集团董事长文一波、京东集团董事长刘强东、紫光集团董事长赵伟国、太极计算机总裁刘淮松、奇虎科技董事长周鸿祎以及大北农董事长邵根伙入选中关村领军企业家; 嘀嘀无限CEO程维等9名高端人才入选创新领军人才;零零无限CEO王孟秋等25名企业家入选创业领军人才;信中利投资董事长汪潮涌等6名投资人入选投资家,U家联合创始人苏菂等7名服务人才入选创新创业服务领军人才。 据了解,中关村高聚工程人才领军带动作用明显。经中关村企业家顾问委员会推荐
[半导体设计/制造]
编程彩色光/频转换器TCS230及其应用
摘要:TCS230可编程彩色光/频率转换器是为高分辨率彩色传感器提供PWM数字接口的首款集成器件,该器件在单芯片上集成了可配置的硅光电二极管阵列和一个电流/频率转换器。文中详细介绍了TCS230的基本结构、主要性能及应用信息。 关键词:TCS230;光/频率转换器;可编程;彩色传感器 1 概述 TCS230 是TAOS公司最新推出的业界首款带数字兼容接口的RGB彩色光/频率转换器,它内部集成了可配置的硅光电二极管阵列和一个电流/频率转换器,其结构框图如图1所示。TCS230输出为占空比50%的方波,且输出频率与光强度成线性关系。该转换器对光响应范围为250000~1,典型输出频率范围为2Hz~500kHz,用户可通过两个
[电源管理]
调度器在DSP编程中的应用
   一. DSP 介绍   DSP芯片,也称数字信号处理器,是一种具有特殊结构的微处理器。它的内部采用程序和数据分开的哈佛结构,具有专门的乘法器,广泛采用流水线结构,提供特殊的DSP指令,在一个周期内完成一次乘法和一次加法。在国外,DSP芯片已经被广泛地应用于当今技术革命的各个领域;在我国,DSP技术也正以极快的速度被应用在通信、电子系统、信号处理系统、自动控制、雷达、军事、航空航天、医疗、家用电器、电力系统等许多领域中,而且新的应用领域在不断地被发掘。因此基于DSP技术的开发应用正成为数字时代的应用技术潮流。相对于单片机,它速度更快,外设集成度更高,程序存储器更大。在《时间触发嵌入式系统设计模式》一书中详细介绍了基于单片机
[应用]
基于铁电存储器的温度记录仪系统的软硬件设计
1、引言 高温测试仪主要用于加热过程中的温度跟踪测量和数据采集,通过对测试数据进行系统分析,研究炉内的温度分布和温差变化规律,分析影响加热质量的主要因素,对加热炉加热过程和加热制度进行优化,提高加热质量,降低燃料消耗。 而在一些收集存储数据的系统,系统的电压可能变化不定或者突然断电,FM20L08就是针对这些系统可以用来直接替换异步静态存储器(SRAM)而设计的存储器,也是Ramtron现有的最大容量的铁电存储器(FRAM),能够进行无限次的读写操作。 使用FM20L08能够极大的节约电路板空间。使用FM20L08存储器的温度测试仪,兼具大容量数据存储、抗冲击、抗干扰、数据断电不丢失、实时采集速度高的特点。 2、铁电存储器
[单片机]
基于铁电<font color='red'>存储</font>器的温度记录仪系统的软硬件设计
LCD1602,LCD1640液晶4位总线模式编程成功
//由于2051的IO不够用,必须省出IO口,迫不得已,又根据大量资料对程序进行了修改 //得到如下能够成功运行的程序。本程序在STC89C51RC@12MHz 4位总线模式下通过data image CM1640液晶模块 //yusung W-1602A液晶模块,广州捷胜 1602A V1.0模块的测试,均可正常写入。 #include reg51.h sbit rs=P3^5;//指令数据选择 sbit rw=P2^7;//读写选择 sbit clk=P3^4;//使能脉冲 unsigned char code Logo_text1 =" ";//文字数组 unsigned char code Logo_text2 ="Sol
[单片机]
stm32下状态机编程按键
学学状态机编程—在stm32下用状态机思想实现按键检测不用延时腾出宝贵的cup资源! 先说说有限状态机的概念:有限状态机 (FSM:Finite State Machine),简称状态机,是表示有限多个状态以及在这些状态之间转移和动作的数学模型。 以按键检测这个事件为例,可以把我们按按钮这个事件分成四个状态 ①松开态 ②抖动态 ③按下态 ④长按态 假设按键松开状态为0 按下为1 每10ms检测一次按键电平,当前状态也随之改变(可能想同也可能变为另一状态)短虚线为连续检测1s如果都为1当前状态则变为1,长虚线为连续1s检测内按键离开则认为单次按下。  1、先定义四个状态 /* 定义一个枚举类型列出该系统所有状态 */typedef
[单片机]
基于单片机USB接口的数据采集存储电路的设计
在一些特殊的工业场合,有时需要将传感器的信号不断的实时采集和存储起来,并且到一定时间再把数据回放到PC机中进行分析和处理。在工作环境恶劣的情况下采用高性能的单片机和工业级大容量的FLASH存储器的方案恐怕就是最适当的选择了。CYGNAL公司的C8051F320 SOC是一种具有8051内核的高性能单片机,运行速度为普通8051的12倍。该芯片内部528字节随机RAM和2048字节XRAM为数据缓冲和程序运行提供了充足的空间。更受欢迎的是它的串行扩展功能为当前的各种串行芯片和外部设备接口的扩展提供了极大的方便。高速的SPI硬件接口与串行FLASH RAM的无缝连接大大简化了电路板布线,而片内自带的USB接口功能使数据的存储和回放变得十
[单片机]
基于单片机USB接口的数据采集<font color='red'>存储</font>电路的设计
小广播
最新应用文章

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 安防电子 医疗电子 工业控制

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved