FPGA动态局部可重构中基于TBUF总线宏设计

发布者:科技梦行者最新更新时间:2011-12-01 关键字:TBUF总线  FPGA 手机看文章 扫描二维码
随时随地手机看文章
  引 言

  FPGA动态局部可重构技术是指允许可重构的器件或系统的一部分进行重新配置,配置过程中其余部分的工作不受影响。动态局部可重构缩短了重构的时间,减少了系统重构的开销,提高了系统的运行效率。局部动态可重构技术中通常将系统划分为固定模块和可重构模块。可重构模块与其他模块之间的通信(包括可重构模块和固定模块之间、可重构模块和可重构模块之间)都是由总线宏实现的。

  动态可重构技术在FPGA中的实现是Xilinx公司首先提出的,并且提供了相应的开发工具和开发流程。他们从Virtex系列器件开始支持动态可重构技术,同时他们提供了现成的总线宏文件给动态可重构系统开发者使用,但是它们提供的总线宏设计与软件版本的兼容性很差。Xilinx提供的总线宏可能因为软件版本的问题会无法正常使用,所以用户需要借助正在使用的版本软件设计总线宏,以实现FPGA动态局部可重构设计。

  在研究总线宏的结构基础上,采用FPGA Editor可视化的方法设计基于TBUF的总线宏,并通过FP-GA动态可重构实验验证了该方法的正确性。

  1 基于TBUF的总线宏结构

  在不同系列的Xilinx FPGA器件中,使用不同的总线宏来实现动态局部可重构技术。在Virtex,Virtex-E,Virtex-ⅡPro X,Spartan-Ⅱ,Spartan-ⅡE和Spartan-3系列器件中所使用的总线宏都是基于TBUF的,可重构模块的位置固定不变;在Virtex4,Virtex5更高性能的器件中,所使用的总线宏是基于Slice的,可重构模块的位置是可变的;而Virtex-Ⅱ,Virtex-ⅡPro所使用的总线宏既可以基于TBUF,也可以基于Slice。

  目前,使用最多的总线宏,其物理实现是使用6个三态缓冲器(TBUF),实现4位的双向通信。每个TBUF占用1位,每位使用1根TBUF长线,从FPGA的最左侧到最右侧,如图1所示。TBUF的T端是三态使能端口;I端是数据输入端口;O是数据输出端口。相应地,总线宏的T端(LT和RT)是方向控制端口,控制总线宏从左或从右输出;I端(LI和RI)是数据输入端口;O端(LO和RO)是数据输出端口。


  总线宏的信息通信是双向的,既可以从左到右,也可以从右到左。但是对于一个设计来说,一旦信息通信方向确定以后就不能再改变。总线宏的位置精确地跨骑在模块A和模块B之间(A或B是可重构模块,或AB全是可重构模块),其中四栅三态缓冲器在模块A内,另外四栅在B内。对于Virtex-Ⅱ等系列器件,因内部结构不同,故两栅跨骑在模块A内,另外两栅跨骑在模块B内。

  2 基于TBUF的总线宏设计

  这里在深入研究Xilinx公司所提供的总线宏的基础上,结合宏的设计技术,完善了总线宏的设计。

  (1)TBUF的内部路由。图2给出内部路由后的TBUF电路结构图。TMUX的T端决定总线宏的控制端LT和RT高电平有效,而T_B端决定低电平有效。


  无论控制信号是高电平有效,还是低电平有效,在使用总线宏进行通信时,LT和RT的值必须是相反的,或者是同时无效的。例如,当控制信号高有效时,即T端为1时,TBUF打开。如果总线宏是从左向右传递数据,则必须将LT设为1,RT为0,反之亦然;如果总线宏不需要传递数据,那么两个控制信号应同时为0,此时总线宏输出为高阻态。

  (2)TBUF添加的方法。Virtex,Virtex-E,Spar-tan-Ⅱ,Spartan-ⅡE的内部结构类似,与TBUF添加的方法是相同的。在相应的位置选择一个可编程逻辑块(Configurable Logic Block,CLB)中的一个TBUF作为总线宏的一个TBUF(1个CLB包含2个TBUF),依次选择同一行相连下一个CLB中的一个TBUF,直至选够8个TBUF为止;对于Spartan-3,Virtex-Ⅱ,Virtex-ⅡPro和Virtex-ⅡPro X系列器件;每一个CLB中的2个TBUF都作为总线宏的TBUF被选用,在同一行中依次选择相连的4个CLB中的8个TBUF作为总线宏的TBUF,如图3所示。


  (3)TBUF外部端口的命名规则。根据图1的总线宏结构,对各个TBUF的外部端口T,I和O进行相应的命名,命名时要符合所使用版本软件的要求。例如,若对端口进行如下命名:LI<3>,LT<3>等,而端口在进行物理设计规则检查(Design Rule Check,DRC)时会出错,根据所提示的出错信息将命名改为:LI(3),LT(3)等,即能顺利通过DRC,完成端口的命名。

  (4)总线宏输出端口的定义。总线宏输出端口的定义只能通过手工路由(Manual Route)方法,把相应TBUF的输出端口通过端口连线和TBUF长线连接起来。

  (5)参考TBUF的设置。设计中通过约束参考TBUF的位置来决定整个总线宏的位置,若用户没有设置参考TBUF,则FPGA Editor工具会将用户添加的第一个TBUF默认为参考TBUF。

  至此,整个总线宏的设计完成,如图4所示。


  3 总线宏的验证

  为了验证上述总线宏设计方法的正确与否,这里设计了一个功能简单的FPGA动态局部可重构实验。电路重构前实现的功能为:(A+B)*(C-D),重构后实现的功能为:(A+B)》(C-D)。根据电路功能将电路划分为3个模块。其中,加法(A+B)、减法(C-D)为固定模块M1,M2;乘法/移位(*/》)为可重构模块M3。M1与M3,M2与M3之间分别用总线宏BM1和。BM2实现通信,如图5所示。


  该实验采用的软件开发平台:Xilinx ISE6.2i;硬件开发平台:可重构硬件平台——XCV800验证板。

  每一个总线宏只能传递4位的信号。当可重构模块间需要多于4位的数据通信时,可以通过多个总线宏的拼接实现。这种拼接只是简单地将多个宏拼接为一个文件,而不是将多个宏拼接为一个宏,所以在使用约束语句,约束总线宏的位置时,仍然必须单独约束每个宏,而不是直接约束一个文件。例如该实验中模块M1与模块M3之间的数据通信是8位,则需要2(8/4)个总线宏来实现模块M1与M3间的通信,M2与M3之间也一样:

  按照FPGA动态可重构软件设计流程生成局部动态可重构.bit文件;通过JTAG电缆下载到可重构硬件平台——XCV800验证板进行调试验证;通过逻辑分析仪观察结果,如图6所示。

  A,B的和Q1作为总线宏BM1的数据输入LI1;C,D的差Q2作为总线宏BM2的数据输入RI2;BM1和BM2的方向控制端LT1,RT2为高(255),RT1,LT2为低(O);数据输入端RI1,LI2悬空,R01,L02分别为总线宏的输出;Q3为可重构模块M3的输出。由实验结果可知,总线宏的设计是正确的。

  4 结 语

  目前,Xilinx公司提倡使用最新的EAPR(Early Access Partial Reconfiguration)方法实现FPGA动态局部可重构技术。该方法中用于可重构模块与其他模块之间通信的总线宏是基于Slice的,但这个方法只适用于Virtex-Ⅱ,Virtex-ⅡPro,Virtex-IV和Virtex-V等器件,对于Virtex,SpartanⅡ,SpartanⅢ等器件,只能使用基于TBUF的总线宏实现动态可重构技术,因此该文对基于TBUF的总线宏研究是有意义的。

关键字:TBUF总线  FPGA 引用地址:FPGA动态局部可重构中基于TBUF总线宏设计

上一篇:基于PCI接口芯片外扩FIFO的FPGA实现
下一篇:现场控制总线CAN网络与有线无线网的转换

推荐阅读最新更新时间:2024-05-02 21:45

采用MPSoC/3D架构 赛灵思16纳米FPGA出鞘
赛灵思(Xilinx)发布首款16奈米(nm)现场可编程闸阵列(FPGA);该产品采用多重处理系统单晶片(MPSoC)、三维(3D)电晶体架构,以及台积电16奈米进阶版鳍式场效电晶体(FinFET+)制程,将锁定LTE-A/5G通讯系统、先进驾驶辅助系统(ADAS)、工业物联网等应用领域,预计于2015年第二季投产、第四季正式出货。 赛灵思全球资深副总裁暨亚太区执行总裁汤立人表示,16奈米FPGA能提供较28奈米元件二至五倍的效能。 赛灵思全球资深副总裁暨亚太区执行总裁汤立人表示,无线通讯网路、高解析度视讯系统、光纤封包网路传输、云端与资料中心、工业物联网等应用的未来发展,效能扩充性、系统整合度、智慧化以及资料安全性、可
[嵌入式]
一种基于FPGA的电子稳像系统的研究与设计
  电子摄像系统已广泛应用于军用及民用测绘系统中,但是效果受到其载体不同时刻姿态变化或震动的影响。当工作环境比较恶劣,尤其是在航空或野外操作时,支撑摄像机平台的震动会引起图像画面的抖动,令观察者视觉疲劳,从面产生漏警和虚警。所以在运行中,如何稳像成为十分重要的问题,特别是在长焦距、高分辨力的监视跟踪系统中更加突出。具璞蒿、实性性强、体积小巧等特点,得到更广泛的应用。   稳像系统的反应速度是电子稳像要解决的关键技术之一。传统的基于“摄像机-图像采集卡-计算机”模式的稳像系统、图像检测和匹配算法全部由计算机以软件方式实现。尽管当今计算机的性能很高,能够部分满足单传感器电子稳系统的实时处理要求,但在以下几个方面有着难以解决的问题
[嵌入式]
一种基于<font color='red'>FPGA</font>的电子稳像系统的研究与设计
嵌入式系统让AI+IoT成为可能,专家们如何解读AIoT?
在 半导体技术 进步与 AI 朝专用化发展两大因素的加持下,人工智能得以与物联网中各种嵌入式系统(Embedded System)结合,形成AIoT(AI+IoT)。 展望未来AI的发展可以透过很简单的接口或方式完成,比如功能的新增只要透过简单的拖拉就可以,而且AI的发展应该不是要取代人类而是协助人类。 物联网(IoT)结合人工智能(AI)是今年产业界发展的重头戏。 随着半导体业者大举投入,市面上出现不少专为人工智能所设计的芯片,像是英特尔的Intel Xeon Phi、NVIDIA的Tesla P100  GPU ,而许多专为嵌入式应用设计的芯片如现场可编程门阵列( FPGA ),也开始对AI提供更广泛的支持。 另一方面,传统A
[嵌入式]
Ximmerse VR/AR跟踪平台采用莱迪思的低功耗、小尺寸ECP5 FPGA
莱迪思半导体公司(NASDAQ: LSCC),客制化智能互连解决方案市场的领先供应商,今日宣布广东虚拟现实科技有限公司(Ximmerse),移动AR/VR应用交互系统提供商,选择采用莱迪思ECP5™ FPGA为其AR/VR跟踪平台实现立体视觉计算解决方案。得益于低功耗、小尺寸和低成本的优势,市场领先的莱迪思ECP5 FPGA是用于实现网络边缘灵活的互连和加速应用的理想选择,可实现低功耗、低延迟的解决方案。 随着对于AR/VR设备市场需求的不断增长,目前基于头戴式显示器(HMD)的系统在使用移动应用处理器(AP)处理内容时的性能瓶颈日趋明显。由此可见,使用移动处理器执行基于视觉的位置跟踪功能挑战性颇高。莱迪思的ECP5 FPG
[嵌入式]
Ximmerse VR/AR跟踪平台采用莱迪思的低功耗、小尺寸ECP5 <font color='red'>FPGA</font>
降低FPGA部署门槛,Achronix联合BittWare推出加速卡
日前,Achronix联合BittWare宣布推出全新的、面向高性能计算和数据加速应用的FPGA加速卡。新推出的VectorPath S7t-VG6加速卡搭载了Achronix采用7nm工艺打造的Speedster 7tAC7t1500独立FPGA芯片,它在同类PCIe FPGA加速卡中,提供了目前业界最高性能的接口。这些高性能接口包括1x400GbE和2x100GbE接口,以及总带宽为4Tbps的8组GDDR6的板上存储器,使该加速卡成为高带宽数据加速应用的理想选择。 此次发布得到了Achronix及BittWare双方的高度重视,在京联合召开发布会。包括Achronix公司市场营销副总裁Steve Mensor、Achron
[嵌入式]
降低<font color='red'>FPGA</font>部署门槛,Achronix联合BittWare推出加速卡
利用搭载全域硬2D NoC的FPGA器件去完美实现智能化所需的高带宽低延迟计算
随着大模型、高性能计算、量化交易和自动驾驶等大数据量和低延迟计算场景不断涌现,加速数据处理的需求日益增长,对计算器件和硬件平台提出的要求也越来越高。发挥核心器件内部每一个计算单元的作用,以更大带宽连接内外部存储和周边计算以及网络资源,已经成为智能化技术的一个重要趋势。这使得片上网络(Network-on-Chip)这项已被提及多年,但工程上却不容易实现的技术再次受到关注。 作为一种被广泛使用的硬件处理加速器,FPGA可以加速联网、运算和存储,其优点包括计算速度与ASIC相仿,也具备了高度的灵活性,能够为数据中心与边缘计算提供理想的数据处理加速;除此之外,FPGA还在传感器融合和输入数据流整理汇流等领域发挥关键作用,是智能化应用
[嵌入式]
基于DSP Builder数字信号处理器的FPGA设计
DSP技术广泛应用于各个领域,但传统的数字信号处理器由于以顺序方式工作使得数据处理速度较低,且在功能重构及应用目标的修改方面缺乏灵活性。而使用具有并行处理特性的FPGA实现数字信号处理系统,具有很强的实时性和灵活性,因此利用FPGA实现数字信号处理成为数字信号处理领域的一种新的趋势。 以往基于FPGA的数字信号处理系统的模型及算法采用VHDL或VerilogHDL等硬件描述语言描述。但这些硬件描述语言往往比较复杂,而采用Altera公司推出的专门针对数字信号处理器设计工具DSP BuildIer则可大大简化设计过程,提高设计效率。 1 基于DSP Builder的数字信号处理器设计流程 DSP Builder是一个系统级(或者说算
[嵌入式]
基于DSP Builder数字信号处理器的<font color='red'>FPGA</font>设计
BittWare发布配备Intel® Agilex™ M系列和I系列的PCIe 5.0/CXL FPGA加速器
BittWare发布配备Intel® Agilex™ M系列和I系列的PCIe 5.0/CXL FPGA加速器,推动内存和互连性改进,并且降低风险 • BittWare加入Intel的Agilex M系列早期使用计划,以推动开发用于内存密集型应用的FPGA解决方案 • BittWare新添两种全新的Intel Agilex I系列 SmartNIC加速器,打造最广泛的Intel基于FPGA加速器的企业级产品组合 • 与Intel进行数十年的合作,使客户可随时获取高性能计算、计算存储、网络和传感器处理领域的的成熟产品 新罕布什尔州康科德 - 2022年8月3日 - Molex莫仕旗下的子公司BittWare是用于边缘
[嵌入式]
BittWare发布配备Intel® Agilex™ M系列和I系列的PCIe 5.0/CXL <font color='red'>FPGA</font>加速器
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
更多每日新闻
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved