FPGA构建高性能DSP

发布者:peon1989最新更新时间:2011-03-31 来源: 电子技术应用关键字:FPGA  DSP 手机看文章 扫描二维码
随时随地手机看文章
    在数据通信和图像处理这样的应用中,需要强大的处理能力。当最快的数字信号处理器(DSP)仍无法达到速度要求时,唯一的选择是增加处理器的数目,或采用客户定制的门阵列产品。现在,设计人员有了新的选择,可采用现场可编程门阵列(FPGA)来快速经济地完成设计。采用现场可编程器件不仅缩短了产品上市时间,还可满足现在和下一代便携式设计所需要的成本、性能、尺寸等方面的要求,并提供系统级支持。

FPGA的方案选择

        幸运的是,需要高性能DSP功能的便携式设备设计者还有其它选择。最近FPGA开始达到了应用所要求的成本竞争力。优选的FPGA方案可用来处理计算量繁重的高端DSP算法,同时还可为设计提供可编程逻辑解决方案所固有的灵活性特点,以及定制门阵列(如ASIC)解决方案所具有的高性能及集成度。

        增强DSP处理能力的传统方法是采用多个处理器。选择此类方案的缺点是成本昂贵,需要众多附加部件,并且功耗很大。此外,开发和调试多处理器软件通常会大大延迟产品上市时间。

        定制门阵列或标准单元方案可以提供所需的强大DSP处理能力,然而,这种方案是以损失灵活性为代价的,并需要相当的工程化投资。由于他们不可重新编程,固定逻辑器件在发生错误时很难补救,也不容易对解决方案进行优化。因此,定制方案的成本、风险以及所需要的开发时间,对许多应用来说都是无法接受的。

        FPGA与传统逻辑电路和门阵列具有不同的结构,FPGA利用小型查找表(16×1 RAM)来实现组合逻辑。每个查找表连接到一个D触发器的输入器,触发器再来驱动其它逻辑,或驱动I/O。这些模块间利用金属连线互相连接或连接到I/O模块。FPGA的逻辑是通过向内部静态存储器单元加载配置数据来实现的。存储在存储器单元中的值决定了逻辑单元的逻辑功能以及模块间或与I/O间的连接,并最终决定了FPGA实现的功能。FPGA的这种结构允许无限次的重新编程。

        FPGA还具有可扩展的优点,FPGA本身复杂性的提高远远超过最终产品要求的复杂性。最新的FPGA产品,例如Xilinx的Virtex-E系列,提供的系统门密度从58000门到最高320万门不等。最新器件的速度也大大提高。例如,1.8V Virtex-E器件比前一代产品快了30%,采用源同步数据传输结构,其I/O性能可达到622Mbps。

时间和投资

        任何涉足便携式产品设计的人,特别是通信领域的设计人员,都明白及时推出产品是产品设计首先要遵守的原则之一。所以能够提供所需要的性能、达到成本要求并可以加快上市时间的器件具有重要的优势。

        与专用集成电路(ASIC)相比,FPGA可使产品上市时间更快,并具有更小的风险。FPGA库中的DSP核心不断增加,许多现在就可使用。结果,设计人员可以利用比定制门阵列方案或多处理器解决方案所需要的时间短得多的时间就完成一项DSP设计。

        加快FPGA实现和编程的一个方法是采用知识产权(IP)的模块或核心。例如,大多数标准DSP功能都在Xilinx库中以可参数配置的DSP核心的形式实现了,它们通过Xilinx公司的CORE生成器提供。包括乘法器、平方根电路、有限脉冲响应(FIR)滤波器、梳状滤波器、积分器、正弦/余弦表以及离散傅里叶变换(DFT)、快速傅里叶变换(FFT)和离散余弦变换(DCT)等都已包括在内。

         IP核心的使用也促进了设计再利用,这在生产周期中可节约大量的时间。FPGA和ASIC制造商正密切协作,使设计再利用变得更为容易。例如,Xilinx公司的IP互联网收集和封装工具使客户可以将他们为FPGA创建的IP设计收集并封装起来,并在公司内部或通过互联网与其它设计小组共享。这样的工具为设计人员提供了一个对可综合的VHDL或Verilog代码,或固定功能网表等进行明确、收集和封装并建立相关文档的自动化的方法。新的模块一旦封装好并公布出来,其它工程师就可以利用标准的互联网浏览器下载这些IP,并安装到他们的Xilinx CORE生成器系统中去。

        虽然成本曾是阻碍在大批量生产的产品中选择FPGA的重要因素,但现在却不成问题了。实际上,当今的FPGA产品单位货币(每个美元)所买到的MAC(乘法/累加运算)数比传统的DSP处理器还要高。正如任何器件一样,FPGA制造商也在持续寻求降低成本的方法。例如,除了高密度的Virtex系列以外,Xilinx最近还推出了低成本的Spartan-II系列FPGA产品,直接向固定门阵列产品挑战,对从年产5万至百万件的大批量生产都非常理想。例如,10万门的Spartan-II FPGA器件售价不到10美元(在与门阵列产品相当的批量时)。

性能和功耗

        与传统数据处理方法不同,DSP采用了高度流水线化的并行操作。而FPGA结构则可以做得更好,达到更高的性能。FPGA具有成千上万的查找表和触发器,因此FPGA平台可以更低的成本达到比通用DSP更快的速度。例如,目前的两百万门FPGA可达到每秒1280亿MAC的性能,比目前最快的DSP性能还要高一个量级。

        对多DSP处理器解决方案,需要较大的功率才能驱动连接多个处理器的板级连接(具有较大的容抗)。与此相对比,FPGA可创建具有定制数据通道的处理器,数据以最小的负载从一个并行操作传送到下一个操作,并且没有取指令的额外开销。这种结构使得在较低的时钟频率下可达到较高的性能。而功耗直接正比于电路的频率,因此运行于较低时钟频率下并行处理的FPGA方案可大大减小功耗。

设计及实施

        虽然FPGA的“可编程”特性带来明显的灵活性优势,但也需要设计编程技巧。FPGA制造商不断改进这一流程,开发专门的软件,与第三方软件供应商建立伙伴关系,从而简化编程过程,并提供最大的灵活性。

        FPGA核心与系统级模型工具的集成为设计人员提供了创建低功耗、高性能便携式DSP应用的简明方法。实际上,目前的便携式系统设计人员可以采用自动化的设计工具来完成系统设计和FPGA实施。采用与系统框图类似的图形化方法,软件可自动将模块转换成相应的FPGA DSP核心。

        为简化FPGA设计流程,设计新手和有经验的设计人员可以利用像Xilinx最近推出的系统生成器这样的工具,直接连接使用The Mathworks, Inc. (Natick, MA)的MATLAB和Simulink系统工具。设计人员采用这一解决方案可以快速建立和验证一个DSP系统。软件自动生成HDL表示,然后再映射成Xilinx LogicCORE构建模块。设计人员利用它来优化设计、并在高性能和低芯片成本之间进行平衡。

        采用这一设计方法时,设计人员可以系统模块方式定义DSP算法,并验证算法数学上是否正确,然后利用位真值模拟方法来实施定点测试。在流程中的每一步,位宽度都可以优化以与系统要求相匹配。然后,利用核心生成器实施系统级工具所指定的设计。

应用举例

        由于FPGA的性能和灵活性,以及新的简明的设计和实施方法,在很多新兴DSP应用领域,如数字通信和视频处理,FPGA都成为优选的解决方案。例如,Xilinx Virtex和Spartan-II FPGA可以用来实现通用移动通信系统(UMTS)码分多址(CDMA)应用中的匹配滤波器。UMTS标准的芯片速率有8.192MHz和15.36MHz两种选择。通过FPGA解决方案,在未来不需要额外的资源就可以改变数据速率。

       在CDMA无线通信系统中,所有移动手机和所有无线基站都工作在相同的频谱。为区分不同的呼叫,每个手机广播一个唯一的码序列。CDMA基站必须能够判别这些不同的码序列才能够分辨出不同的传输呼叫进程。这一判别是通过匹配滤波器实现的,匹配滤波器的输出显示出在输入数据流中探测到特定的码序列。

        在CDMA数字通信接收器中,匹配滤波器作为信号处理器来计算发送信号与接收信号的相关性。FPGA都能提供良好的滤波器设计,而且能完成DSP的高级数据处理功能。

结论

        充分发挥FPGA DSP核心所具有的优点,便携式系统设计人员可大大缩短设计周期。采用FPGA技术,还可以获得高性能,满足成本要求,并享有快速有效地对新设计进行优化的灵活性。

关键字:FPGA  DSP 引用地址:FPGA构建高性能DSP

上一篇:FPGA软件无线电
下一篇:基于FPGA的多通道数据采集系统设计

推荐阅读最新更新时间:2024-05-02 21:19

瑞萨全新PMIC参考设计加速FPGA和SoC产品问市
全球领先的半导体解决方案供应商瑞萨电子株式会社宣布推出三款易于使用的电源管理IC(PMIC)参考设计,用于为Xilinx Artix-7、Spartan-7系列FPGA以及Zynq-7000 SoC的多个电源轨供电,并可选配DDR存储器。瑞萨与Xilinx紧密合作,提供低风险且易于开发的电源解决方案,以加速FPGA和SoC设计。该参考设计可加快各种工业及运算类应用的电源研发速度,其中包括电机控制、机器视觉摄像头、可编程逻辑控制器(PLC)、家庭网关与家电、便携式医疗和无线设备等。 瑞萨高效PMIC参考设计提供了用户友好的交钥匙解决方案,使单个设计能够支持不同的Xilinx速度等级和DDR存储器类型,包括DDR3、DDR3
[嵌入式]
瑞萨全新PMIC参考设计加速<font color='red'>FPGA</font>和SoC产品问市
通过JTAG口对DSP外部Flash存储器的在线编程
引言 在采用TI数字信号处理器(DSP)的嵌放式硬件系统开发完成,软件也有CCS2.0集成开发环境下仿真测试通过后,怎样将编译、链接后生成的可执行文件(.Out),经过转换后的十六进制文件(.Hex)写入硬件系统的Flash存储器中,让系统脱机运行,这是许多DSP开发人员及初学者遇到并需要解决的问题。 从JTAG接口对DSP外部Flash的编程方法不只一种。本文以TMS320C6711-150 DSK板为例,介绍“在线仿真状态下”对Flash的编程。 1 Flash存储器的擦除 Flash编程之前,应对Flash进行擦除,使其每个数据位都恢复为1状态,即全FF状态。对Flash的擦除操作需要6个总线周期,总线时
[单片机]
通过JTAG口对<font color='red'>DSP</font>外部Flash存储器的在线编程
基于MCU+FPGA的LED大屏幕控制系统的设计
引言 只要在现在的市场上走一圈就会发现,大部分的中小规模 LED显示系统,采用的是传统的单片机作为主控芯片。但是内部资源较少、运行速度较慢的单片机,很难满足LED大屏幕的显示屏,因为系统要求数据传输量大,扫描速度要快。以FPGA作为控制器,一方面,FPGA采用软件编程实现硬件功能,可以有效提高运行速度;另一方面,它的引脚资源丰富,可扩展性强。因此,用单片FPGA和简单的外围电路就可以实现大屏幕LED显示屏的控制,具有集成度高、稳定性好、设计灵活和效率高等优点。 1 系统总体结构 LED大屏幕显示系统由上位机(PC机)、单片机系统、FPGA控制器、LED显示屏的行列驱动电路等模块组成,如图1所示。上位机负责汉字、字符等数
[单片机]
基于MCU+<font color='red'>FPGA</font>的LED大屏幕控制系统的设计
基于DSP的软件无线电基频发射机的设计与仿真
引言 软件无线电突破了传统的无线电台以功能单一、可扩展性差的硬件为核心的设计局限,强调以开放性最简硬件为通用平台,尽可能地使用可升级、可重配置的应用软件来实现各种无线电功能。用户在同一硬件平台上可以通过配置不同的应用软件来满足不同时间、不同环境下的不同功能需求,具有很强的灵活性和开放性。 DSP(数字信号处理器)凭着灵活性、精确性、稳定性、可重复性、体积小、功耗小、易于大规模集成,特别是可编程性和易于实现自适应处理等特点,给数字信号处理带来了巨大的发展机遇。 基于上述优点,用DSP实现基于软件无线电技术的基频发射机,不仅降低了产品的成本,减小了设备体积,满足系统的需要,而且随着DSP处理速度的不断提高,可将内插等复杂运算集成
[嵌入式]
FPGA系统的供电要求和最新DC/DC稳压器解决方案
随着FPGA制造工艺尺寸持续缩小、设计配置更加灵活,以及采用FPGA的系统的不断发展,原来只采用微处理器和ASIC的应用现在也可以用FPGA来实现了。最近FPGA供应商推出的新型可编程器件进一步缩小了FPGA和ASIC之间的性能差别。尽管这类器件的可配置性对设计工程师很有吸引力,但使用这些器件所涉及的复杂设计规则和接口协议,要求设计工程师经过全面的培训,并需要进行参考设计评估、设计仿真和验证工作。另一方面,FPGA应用中非常复杂的模拟设计,例如用于内核、I/O、存储器、时钟和其它电压轨的DC/DC稳压器,也要求新的解决方案。本文讨论的高性能DC/DC转换器有助于系统设计工程师克服这些挑战。 FPGA系统的供电要求 1.
[应用]
基于FPGA的人工神经网络实现方法的研究
   引言   人工神经网络(ArtificialNeuralNetwork,ANN)是一种类似生物神经网络的信息处理结构,它的提出是为了解决一些非线性,非平稳,复杂的实际问题。目前实现ANN还主要依靠软件程序.但是依靠程序很难达到实时性的要求。   神经网络在FPGA上实现是独立于冯·诺依曼架构,利用FPGA的并行性,在一些实时性要求很强的领域应用。通用计算机虽然编程容易,但是很多时间浪费在分析指令,读出写入数据等。于是人们想利用ASIC(专用计算芯片)完成神经网络的计算任务,但是由于资源有限,这种芯片只限于实现特定的算法结构和小规模网络,而且专用芯片的制作成本很高,只适合大批量生产。   可编程逻辑器件FPGA的出现给I
[嵌入式]
基于<font color='red'>FPGA</font>的人工神经网络实现方法的研究
Altera为三洋后视倒车摄像添图像功能
  Altera公司宣布,三洋电子有限公司在其CCA-BC200汽车后视倒车摄像系统中采用了Cyclone II FPGA和Nios II嵌入式处理器。Cyclone II FPGA的Nios II嵌入式处理器为三洋公司提供了高性能图像处理解决方案,降低了广角和偏角失真。和数字信号处理器(DSP)方案相比,单芯片FPGA是更紧凑、更可靠的解决方案,而前者通常需要两个以上的器件。   CCA-BC200是业界的首款配件市场后视倒车摄像系统。该系统可以连接至所有汽车的视频监视系统,对图像进行数字校正,实现更清晰自然的图像。三洋公司在消费类电子产品展(CES)上展示了这一后视倒车摄像系统。   三洋电子有限公司汽车高级技术中心经理Hi
[嵌入式]
基于DSP和PCI总线的通信数据采集系统
    摘要: 介绍一种基于DSP和PCI总线的移动通信数据采集系统。提出了一种双映射方式,成功地解决了DSP的主机通信接口(host port interface,简称HPI口)和PCI9052之间的通信连接。     关键词: 数字信号处理器 数据采集 PCI总线 随着移动通信突飞猛进的发展,移动通信的数据业务量急剧上升,监控大容量的移动数据业务成了电信运营商刻不容缓的需求。而移动通信数据的传输一般都是基于E1链路。因此从E1链路上采集通信数据成了移动数据业务监控最基础的一部分。 数字信号处理器能够高速地处理数据并具有强大的数字吞吐能力,在数据采集领域获得了广播的应用。而PCI总线也因为极高
[应用]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved