0 引 言
FFT(快速傅里叶变换)是计算离散傅里叶变换(DFT)的高效算法,它把计算N 点DFT 的乘法运算量从N2 次下降到N/2log2N 次。FFT 的出现对数字信号处理的发展起着至关重要的作用,它可应用于傅里叶变换所能涉及的任何领域,为广泛应用数学方法处理数字信号开辟了新局面[ 1 ] 。
传统的FFT 实现方法是通过软件(软件编程)和硬件(专用芯片ASIC)这两种方法来实现,而近年来,FPGA 发展十分迅速,这给FFT 设计提供了一个新思路[2]。为了更好地满足设计人员的需要,各大公司相继推出了I P 模块,本文提出了一种采用Altera 公司的IP Core FFT MegaCore来实现FFT 的简单方法。
1 FFT MegaCore核的性能
Altera 公司的FFT MegaCore 是一个高性能、高参数化的快速傅里叶变换处理器,可以高效的完成FFT 和IFFT 运算,支持的器件系列包括Stratix Ⅱ、StratixGX、StratixⅡGX、Stratix、Cyclone、CycloneⅡ以及CycloneⅢ等,采用基2/4频域抽取(DIF)FFT算法,运算长度从64 到16384,使用嵌入式内存,系统最大时钟频率大于300MHz。FFT 处理器可以设置两种不同的引擎结构:四输出和单输出,结构图如图1 和图2 所示[3]。
为了增加F F T 兆核函数的总吞吐量,也可以在一个FFT 兆核函数变量中使用多个并行引擎。复取样数据X[k,m]从内部存储器并行读出并由变换开关(SW)重新排序,排序后的取样数据由基4 处理器处理并得到复数输出G [ k ,m],由于基4 按频率抽选(DIF)分解方法固有的数字特点,在蝶形处理器[ 4 ]输出上仅需要3 个复数乘法器完成3 次乘旋转因子( 有一个因子为1 ,不需要乘) 计算。这种实现结构在一个单时钟周期内计算所有四个基4 蝶形复数输出。同时,为了辨别取样数据的最大动态范围,四个输出由块浮点单元(BFPU)并行估计,丢弃适当的最低位(LSB),在写入内部存储器之前对复数值进行四舍五入并行重新排序。
若要求转换时间尽量小,四输出是最佳选择;若要求资源尽量少,单输出比较合适。FFT 处理器支持3 种I/O 数据流结构:连续型、缓冲突发型、突发型。连续型允许在处理过程中连续输入数据;缓冲突发型与连续型相比,占用内存资源较小,但这是以减少平均吞吐量为代价的;突发型与缓冲突发型类似,但占用内存资源更少,也是以减少平均吞吐量为代价的。
图1 FFT处理器四输出引擎结构
图2 FFT处理器单输出引擎结构
2 整体方案
整体方案设计框图如图3 所示。输入缓冲器和输出缓冲器分别存储预处理数据和F F T 变换结果,F F T 运算器负责F F T 运算;控制器为输入缓冲器和输出缓冲器提供读写地址和控制运算时序及缓冲器的读写操作。下面重点介绍FFT 运算器的实现。
图3 整体方案设计框图
关键字:Altera MegaCore
引用地址:
基于Altera MegaCore实现FFT的方法
推荐阅读最新更新时间:2024-05-02 22:36
Infinera在DTN-X多太比特分组光传送网平台中选用Altera的28nm Stratix V FPGA
Stratix® V GX FPGA。Infinera是最近一家在下一代系统中选用性能最好的FPGA的企业。Stratix V GX FPGA所具有的性能和带宽能够满足DTN-X平台100-Gigabit以太网(GbE)线路卡的100-GbE数据量要求。 Infinera合伙人兼首席技术官Drew Perkins评论说:“Infinera通过我们的解决方案不断推动技术的发展。这需要与Altera这类同样站在技术最前沿的企业进行合作。我们在下一代DTN-X平台上评估各种方案,发现Altera是最适合的,这是因为其高性能28-nm Stratix V FPGA在SERDES功能上是性能最好的。采用Stratix V GX FPG
[嵌入式]
Jointwave于Inter BEE & ET2009展示最新H.264 IP解决方案
日本东京,2009年11月18至20日,全球领先的FPGA/ASIC 多媒体IP Core 设计服务公司Jointwave与日本最大FPGA/AISC IP分销商Spinnaker Systems 联合推广 H.264 for FPGA/ASIC IP。该IP同时在InterBEE2009 (Altera Booth #5508)以及ET2009(PALTEK Booth)两个展会上展示,运行平台分别为Altera Cyclone III FPGA以及Xilinx Spartan-3。 凭借1920×1080(FullHD)最大分辨率支持120帧每秒,该知识产权实现了最高性能和最新功能的级别。Full HD的H.26
[嵌入式]
Altera交付14.0版Quartus II软件
新版本以高达四倍更快速的编译时间来加速设计开发。 2014年7月1号,北京——Altera公司(Nasdaq: ALTR)今天发布Quartus® II软件14.0版——FPGA业界性能和效能首屈一指的软件。Altera的这一最新版软件编译时间比竞争设计工具套装平均快出2倍,保持了FPGA和SoC设计的软件领先优势。 Quartus II软件14.0版支持用户更高效的迅速实现FPGA和SoC设计。最新版包括新的快速重新编译特性,对设计进行小改动后,编译时间缩短了4倍;以及同类最佳的PCI Express (PCIe) IP解决方案,性能达到企业级水平。此外,这个版本还在Qsys系统集成工具中提供扩展的AXI™支持,以及
[嵌入式]
Altera CTO解读20nm创新
近日,Altera CTO Misha Burich时隔5个月再度访华,带来了最新Altera基于20nm的关键消息。 创新的3D集成 和赛灵思不同的是,Altera在28nm时代并没有宣传3D或者2.5D技术,因此原本在代工厂上与TSMC合作更长时间的Altera并没有在创新工艺上占据先机。 所以在下一代20nm FPGA上,Altera必须占据先机。 Misha Burich表示,“20nm 3D IC工艺可以把不同的die放在同样的一个硅晶圆上,实现异构的FPGA,比如在FPGA上加上光模块,HardCopy ASIC或者其他存储器等,从而实现不同类的产品。” 谈到两家3D技术的区别时,Misha强调:“Al
[嵌入式]
Altera发布SoC FPGA软件开发虚拟目标
Altera公司日前宣布可以提供FPGA业界的第一个虚拟目标平台,支持面向Altera最新发布的SoC FPGA器件立即开始器件专用嵌入式软件的开发。在Synopsys有限公司成熟的虚拟原型开发解决方案基础上,SoC FPGA虚拟目标是基于PC在Altera SoC FPGA开发电路板上的功能仿真。虚拟目标与SoC FPGA电路板二进制和寄存器兼容,功能等价,保证了开发人员以最小的工作量将在虚拟目标上开发的软件移植到实际电路板上。支持Linux和VxWorks,并在主要ARM辅助系统开发工具的帮助下,嵌入式软件工程师利用虚拟目标,使用熟悉的工具来开发应用软件,最大限度的重新使用已有代码,利用前所未有的目标控制和目标可视化功能
[嵌入式]
Altera公布2014三季度营收,近5亿美元
Altera日前公布了其2014年三季度营收,销售额为5亿美元,环比增长2%,同比增12%。净利润1.18亿美元。 Altera CEO John Daane表示:“我们首款FinFET制程的Stratix 10系列,得到了首批客户的广泛认可。通过我们独特的HyperFlex架构以及Intel 14nm三栅工艺,Stratix 10可以提供无与伦比的逻辑密度、性能、功耗以及扩展Altera的FPGA应用范围。”
[嵌入式]
Altera发布单片FPGA高清晰互联网协议监视摄像机
Altera 公司今天发布业界第一款单片FPGA高清晰(HD)互联网协议(IP)监视 摄像机 参考设计,进一步为监视市场提供扩展FPGA解决方案。这一独特的解决方案采用了 Altera 低成本Cyclone III或者Cyclone IV FPGA以及Eyelytics和Apical的知识产权,支持AltaSens的1080p60 A3372E3-4T和Aptina的720p60 MT9M033 HD宽动态范围(WDR) C MOS 图像 传感器 。与使用传统数字信号 处理器 和ASSP的现有体系结构相比,这一全集成解决方案帮助监视设备生产商减小 电路板 面积,降低功耗,提高了灵活性,缩短了开发时间。 传统的数字 信号处理
[嵌入式]
Altera发售6.0版Nios II嵌入式处理器和开发工具
Altera公司日前宣布正式发售6.0版Nios II嵌入式处理器和Nios II嵌入式设计套件(EDS)。Nios II EDS提供32位、单精度、IEEE 754兼容浮点支持,含有最近发布的Nios II C语言至硬件加速(C2H)编译器。此外,Altera更新了Nios II嵌入式处理器,提高了设计人员构建多处理器系统的效率。 Altera亚太区营销总监梁乐观说:“Nios II C2H编译器和浮点支持提高了嵌入式软件开发人员的灵活性,帮助他们提高设计性能,突出了Nios II处理器作为FPGA计算平台所具有的产品及时面市的优点。6.0版Nios II处理器和EDS的这些特性进一步扩大了Altera在嵌入式系统市场的领
[新品]