基于FPGA的高带宽存储接口设计

发布者:世界因你而精彩最新更新时间:2014-08-11 来源: eepw关键字:FPGA  高带宽  存储接口 手机看文章 扫描二维码
随时随地手机看文章

  如今,越来越多的应用场景都需要FPGA能够和外部存储器之间建立数据传输通道,如视频、图像处理等领域,并且对数据传输通道的带宽也提出了较大的需求,这就导致了FPGA和外部Memory接口的实际有效带宽成为了制约系统性能的瓶颈,所以Memoiy控制器的效能,则成为提升系统性能的关键要素。Altera最新一代28nm器件中的Cyclone V和Arria V系列FPGA都集成了硬核存储控制器HMC(Hard Memory Controll er)单元,相比于以往的软核解决方案,硬核解决方案能够在帮助降低系统功耗的同时显著提升接口工作性能,适合应用于对Memory接口带宽有较大需求的场合。

  1 存储器接口的底层架构

  QuartusII 11.0及以后版本提供的Controller控制器均为High Performance ControllerII(HPC II),相对于早期提供的HPC,有了部分功能和性能上的升级和改进。CycloneII/IV使用的是ALTMEMPHY,而Cyclone V可以使用新的UniPHY架构。存储器接口的底层架构和外部接口如图1所示。

 

  从图1可见,整个存储接口是由三部分组成的,Controller单元、PHY单元及一些相关接口。其中主要的便是Controller单元、PHY单元。Controller单元主要负责控制初始化、刷新等Memory的命令操作,还能够完成访问地址和数据的组织排序,支持大带宽、较高的工作频率。另外,Controller单元还支持数据重排,能够降低访问冲突,增加系统工作的效率。PHY单元工作在Controller单元和外部Memory之间,主要负责完成物理层的数据路径及数据路径的时序处理。

  Controller单元和PHY单元之间是通过Altera PHYInterface,即AFI接口进行连接的。与标准的DDR PHYInterface,即DFI接口相比,AFI接口更加适合基于ALTMEMPHY和UniPHY的开发。AFI接口可以被认为是DFI接口的子集,是对DFI接口进行了少量的简化和修改而来的。

  2 MPFE的功能及底层架构

  在视频和图像处理领域,FPCA需要频繁地访问Memory接口,完成数据的写入和渎出操作。Cyclone V的HMC能够支持多端口前端的并行访问,极大地方便了读写数据交互的操作。多端口前端,即MPFE(Multi-Port Front End),底层架构如图2所示。

 

  MPFE可以使得FPGA的多个处理进程共享一个Memory的命令队列。这样不同的端口都可以访问Memory接口,完成对Memory的读写操作。MP FE都是基于Avalon总线的时序进行地址、命令和数据的交互的。在实际有效带宽一定的情况下,MPFE可以将带宽按照不同的需求分配到相应的端口。

  如图2所示,MPFE是由6个命令FIFO,4个64bit位宽的读FIFO和4个64bit位宽的写FIFO组成,通过这些FIFO来完成命令和数据的交互。其中,读FIFO可以被配置为单向的读FIFO,写FIFO可以被配置为单向的写FIFO,也可以在一个Port里使用双向FIFO、此时该Port会调用1个读FIFO和1个写FIFO来完成。

  如果前端的数据位宽比较大,也可以将FIFO拼接起来,组合为128bit或256bit位宽的FIFO,128bit位宽情况下,会调用2个读或写FIFO 256bit位宽情况下,会调用4个读或写FIFO。如果一个Port设置为256bit位宽,同时设置为双向FIFO.则该Port会消耗全部的读写FIFO,此时也就相当于将多端口前端作为单端口前端来使用了。[page]

  如果前端的数据位宽比较小,也可以将64bit位宽的FIFO设置为32bit位宽,此时仍会占用1个FIFO,高32bit的数据位宽则会闲置。

  由此可见,MPFE在使用上十分灵活,能够适应不同的应用方式,满足FPGA内部不同逻辑模块对Memory的读写访问。

  3 多端口前端的调度策略

  MPFE本身相当于一个调度器,采用分时复用的方式,对来自不同端口的数据和命令进行调度。若干个端口之间的调度遵循两个条件,即端口的优先级(Priority)和权重(Weight)。优先级参数和权重参数是可以指定的,如图3所示,在IP例化时的Controller Settings界面中,手动填写端口的这两个参数值。

  优先级参数可以在1~7之间任意指定,优先级参数值越大,代表该端口的优先级越高。高优先级的端口相对于低优先级的端口会被优先调度。优先级是一个绝对的参数,如果一个端口的优先级设置为7,则这个端口享有最高优先级,它在任何情况下都会被优先调度,这样另外的优先级为6或更低优先级的端口必须等待优先级为7的端口工作完成之后才会被调度。

  如果两个端门的优先级一样,那么相对的优先级会取决于端口的权重参数。权重参数可以在0~31之间设置。为了避免高优先级的某个端口长时间占用接口总线的带宽,引入了加权循环调度算法(Weighted Round Robin,WRR),WRR算法仍然会优先处理高优先级的端口,但是低优先级的端口也不会出现不被调度的情况。WRR是根据端口权重与所有排队等待调度的端口的权重总和的比来平等地分配带宽。因此,在处理多个端口的高优先等级的业务时,可以确保每个端口都不会过度地占用接口的总线带宽。

 

  在端口的优先级参数都一样的情况下,权重参数能够决定端口间相对的带宽分配,如图3所示,端口0和端口1的优先级均为1,权重参数值分別为4和6,则端口0和端口1分別会占用大致40%和60%的Memory接口总带宽。

  4 HMC的ModelSim功能仿真

  仿真过程不仅能够观察到HMC内部工作的时序,还能够大致测箅出HMC工作时的有效带宽。在系统设计开始阶段,可以用于评估Memory接口实际有效带宽是否满足设计需求。如图4和图5所示。

 

  系统设计的过程需要确保Avalon侧和Memory侧的带宽相等,所以在IP例化参数选择时,根据DDR3器件参数,DQ数据线选择的是16 bits位宽,mem_ck为400 MHz;Avalon侧的数据位宽为64 bits,时钟选择200 MHz即可。两侧带宽为16 bitsx400 Mhzx2(DDR双沿传输)=64 bitsx200 MHz=12.8 Gbps,这也是HMC的理论带宽。

  5 结论

  在一些视频、图像等高带宽按口应用中,Cyclone V器件的HMC理论上能够达到至少12.8Gbps的带宽,如果DQ位宽变为32位,则理论带宽翻倍到25.6Gbps,这也是一个HMC所能达到的理论带宽的上限。部分Cyclone V器件带有2个HMC,则整体的理论带宽上限值为51.2Gbps,已能够满足高带宽存储场合对FPGA和DDR3间接口带宽的要求。

关键字:FPGA  高带宽  存储接口 引用地址:基于FPGA的高带宽存储接口设计

上一篇:基于FPGA的车电总线接口技术研究
下一篇:基于DSP的以太网通信接口设计方案

推荐阅读最新更新时间:2024-05-02 23:06

基于DSP+FPGA多通道单端/差分信号采集系统
   在信号处理过程中,经常采用DSP+FPGA协同处理的方法。是因为DSP虽然可以实现较高速率的信号采集,但其指令更适于实现算法而不是逻辑控制,其外部接口的通用性较差。而FPGA时钟频率高、内部延时小,全部控制逻辑由硬件完成,速度快、效率高,适合于大数据量的传输控制,可以集成外围控制、译码和接口电路,在高速数据采集方面有着DSP以及单片机无法比拟的优势,但缺点是难以实现一些复杂的算法。因此,若采用DSP+FPGA协同处理的方法,便可以使DSP的高速处理能力与FPGA的高速、复杂的组合逻辑和时序逻辑控制能力相结合,达到互补,使系统发挥最佳性能。     在目前的信号采集及测试系统中,由于应用背景的复杂,经常需要对多路信号进行采集,
[嵌入式]
基于DSP+<font color='red'>FPGA</font>多通道单端/差分信号采集系统
基于FPGA的彩色LED大屏幕控制系统
led(Light Emitting Diode)大屏幕作为现代信息发布的重要媒体,正受到社会各界尤其是商业界和广告界的极大重视。随着科技的进步,全彩LED显示屏(RGB三基色)逐渐得到普及应用。LED大屏幕是21世纪广告业发展的趋势,是具有音视频功能的户内外广告展示设备,属国际领先的高科技产品。不仅外观新颖独特,其面积可随意调整,能播放音视频广告节目,而且四面还可装固定灯箱广告位,现各地政府都鼓励推行使用户外LED大屏幕,陆续取消帆布广告、灯箱广告审批。   本方案采用ActEL的FPGA实现对彩色LED屏的控制,对于系统的可靠性大大增强,而且低成本的单芯片大大减轻了系统的成本。   1.概述   1.1 功能概
[电源管理]
基于<font color='red'>FPGA</font>的彩色LED大屏幕控制系统
FPGA电源设计适合并行工程吗?
  如果设计师可以在开发过程早期就满足基于 FPGA 的设计,提出的功耗要求和约束条件,那么在系统的最终实现阶段就能形成极具竞争力的优势。然而,根据整个技术文献中这种自我暗示式的反复祷告,今天基于 FPGA 的系统中还有什么会使得完全遵循这个建议变得不切实际或过于困难呢?尽管能够使用各种开发工具,如专门针对 FPGA 项目开发的早期功耗预估器和功耗分析器,但对 电源设计 师来说,在设计过程早期就考虑最坏情况而不是最佳情况的电源系统是有好处的,因为在许多方面仍有太多的不确定性,比如在硬件设计完成和功耗可以测量之前,静态小电流状态与全速工作状态之间的动态负载要求将如何波动。   采用并行工程(CE)技术,可以为在项目中
[电源管理]
<font color='red'>FPGA</font>电源设计适合并行工程吗?
基于FPGA的LCD%26amp;VGA控制器设计
摘要:介绍了基于FPGA的图形式LCD%26;amp;VGA控制器的设计,详细讨论了用VHDL设计行场扫描时序的方法,这种设计方法稍作改动便可产生任意行场扫描时序,具有很好的可重用性。该控制器已成功地在某型飞机座舱图形显示系统中使用。 关键词:仪表装置 LCD VHDL FPGA VGA 飞机座舱图形显示系统已发展到第六代,即采用有源矩阵彩色液晶显示器AMLCD(Active Matrix Liquid Crystal Display)。当前高分辨率的军用AMLCD显示模块还只能依靠进口,且控制电路板须安装在该显示模块提供的机箱内。这种安装方式对AMLCD控制电路板的尺寸要求高,要求尽可能减少所设计电路板的尺寸。在笔者设计的新一代飞
[半导体设计/制造]
产、学 、研联手推动FPGA创新应用——Xilinx杯中国高校开放源码硬件创新大赛拉开帷幕
2007年6月21日,北京 ——由中国电子学会主办、赛灵思公司(Xilinx, Inc. (NASDAQ:XLNX))承办的首届“Xilinx杯中国高校开放源码硬件创新大赛”日前在包括如清华大学和复旦大学在内的全国高校隆重拉开帷幕。此次大赛在国内首次提出了“创建开放源码硬件社区”的口号,并为此推出了独立的开放源码社区 www.openhard.org 作为此次大赛的活动平台,以推动基于现场可编程门阵列(FPGA)的开放源码创新应用,营造“交流、奉献与分享”的开放社区精神,促进中国自主知识产权IP及芯片的发展。 本次创新大赛主要面向全国高校的在读研究生、博士生及大三、大四的本科生,设立一、二、三等奖及单项奖共20个。获奖者除获得丰
[焦点新闻]
采用FPGA实现发电机组频率测量计的设计
1 引言 在现代社会中,电资源成为人们生活当中不可缺少的一部分,而发电机和电动机在电力系统中扮演着非常重要的角色。在很多场合,需要对电机组和电网的频率进行测量。目前,频率测量的电路系统很多,这里介绍一种数字电路测频:基于FPGA的发电机组的频率测量计。 随着电子技术的不断发展和进步,以EDA为代表的数字电路设计发生很大变化。在设计方法上,已经从 电路设计 硬件搭试 焊接 的传统设计方式到 功能设计 软件模拟 下载调试 的电子自动化设计模式。在这种状况下,以硬件描述语言(Hardware Description Language)和逻辑综合为基础的自顶向下的电子设计方法得到迅速发展。Verilog HDL语言是目前应用最广泛的硬件描述
[测试测量]
采用<font color='red'>FPGA</font>实现发电机组频率测量计的设计
莱迪思 Crosslink-NX FPGA在工业摄像头平台上大显身手
低功耗可编程器件的领先供应商莱迪思半导体公司宣布,CVCAM选择莱迪思CrossLink™-NX FPGA为其索尼iMX344传感器的全新百万级像素工业摄像头平台提供16通道sub-LVDS转MIPI CSI-2传感器桥接支持。CrossLink-NX FPGA与同类FPGA竞品相比,功耗更低、尺寸更小、稳定性更高、性能更强,能在工业和汽车系统中实现高附加值的嵌入式和智能视觉应用。 莱迪思CrossLink-NX FPGA解决了开发低功耗、小尺寸、性能强劲的嵌入式视觉应用时面临的设计复杂性和上市时间方面的挑战。该FPGA采用业界首款基于28 nm FD-SOI工艺的莱迪思Nexus™技术平台开发,支持各类接口,包括每通道速率高
[嵌入式]
4DSP推出的FM480是基于Virtex-4 FPGA的PCI夹层卡
4DSP的PMC扩展卡可加速信号处理算法 4DSP公司日前推出的FM480是一款基于Virtex-4 FPGA的PCI夹层卡(PMC)。FM480已通过几种现场测试,所开发的首个应用是一个基于IEEE-754标准浮点FFT内核的2维快速傅立叶变换。 FM480 PMC可选传导散热方式,配有大容量的SRAM和DRAM资源以及超高速DMA引擎,因而适于作为协处理器单元以满足信号处理算法的需求。该卡还提供了几个前面板I/O模块,可实现相机、前端面板数据端口以及ADC连接。 FM480目前已向几个主要用户提供了样件,已开发的项目包括在Virtex-4 FPGA中实现的实时JPEG2000压缩。有关该产品的价格目前尚未公布。
[新品]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved