28纳米FPGA: 降低功耗 提高带宽

发布者:HappyExplorer最新更新时间:2011-03-18 来源: eepw关键字:28纳米  FPGA 手机看文章 扫描二维码
随时随地手机看文章
    低功耗和高带宽是下一代高端设计的两个主要需求。对全球范围多个应用领域的调研表明,以相同甚至更低功耗及成本来实现更大的带宽已成为大势所趋。现在应对带宽不断增长的技术是演进中的40G和100G系统(以及即将出现的400G系统)。设计下一代来满足目前对宽带和低功耗需求的难度越来越大。

  选择合适的工艺技术

  采用更小的工艺结构总是能够提高集成度,降低功耗,性能会优于前一代产品,28nm工艺也不例外。28nm工艺具有明显的性能优势,但是,要充分发挥这些优势,需要为28nm工艺创造合适的环境。选择TSMC28nm高性能(28HP)HKMG工艺,借助与TSMC长达17年的合作关系,优化StratixV低功耗工艺。28HP工艺同时支持StratixV,提供28Gbps高功速收发器,适用于超宽带应用。

  特别需要指出,与TSMC密切协作,定制开发低漏电流晶体管,在各种StratixV功能模块中使用这些晶体管,在相对性能要求不高的地方降低功耗。此外,定制了28HP工艺来实现可编程功耗技术,这是降低静态功耗的关键创新。而且,利用28HP工艺提供的低电压,大幅度降低功耗,而且对性能没有影响。

  体系结构创新

  以下将以最近的四代Stratix系列为例,说明的体系结构创新。

  StratixV基于StratixIV的高性能体系结构,通过关键体系结构创新,前所未有地提高了系统集成度,实现了非常灵活的系统,帮助设计人员获得更大的带宽,更低的功耗。这些创新包括引入嵌入式HardCopy模块、28G收发器以及部分重新配置功能。

  嵌入式HardCopy模块用来实现硬核或者需要消耗大量逻辑的模块,例如接口协议、特定的功能应用和专业定制IP等。StratixV集成的这些特性使得这款可以应用于众多大带宽的应用,例如,PCIExpress(PCIeR)Gen1/Gen2/Gen3和40G、100G等。

  嵌入式HardCopy模块使用户能够提高容量,在单芯片中集成更多的功能,不会增加功耗和成本。如果芯片中没有包含嵌入式HardCopy模块,那么随着设计密度的加倍,设计人员必须使用较大的,不但增加了成本,而且静态功耗也增加了一倍。

  利用StratixV中丰富的硬核IP模块,设计人员显著降低了设计的功耗和成本,同时满足了目标应用的宽带要求。与软核逻辑实现相比,使用硬核IP实现的设计功耗低65%,性能提高2倍,可以确保达到时序收敛。此外,硬核IP模块使设计人员能够使用密度较小的,这也达到了降低成本和功耗的目的。

  在28nm引入的另一关键创新是高功效28Gbps高速串行收发器。这些28Gbps收发器设计用于芯片至芯片或者芯片至模块的数据传输,用于满足固网市场光模块接口向28Gbps的发展趋势。

  部分重新配置功能是指能够重新配置部分,而器件其他部分仍然正常运行。设计人员使用这一特性的一个主要优势在于降低了器件密度,从而减小了功耗,降低了成本。这一技术的重要应用包括可重配置通信系统以及高性能计算平台。

[page]

 

    控制功耗最显著的一项技术创新是使用可编程功耗技术。可编程功耗技术能够降低静态功耗,而且对设计性能不会有影响。通过改变晶体管的电气特性,StratixV可编程功耗技术以高速逻辑和低功耗逻辑的最佳组合实现了性能与功耗的完美平衡。

  在降低功耗方面引入的另一创新是通用I/O模块。StratixV提供丰富的I/O特性,在支持设计人员控制功耗的同时保持产品性能。

  在改进工艺和创新体系结构的同时,在QuartusII软件的功耗优化算法方面进行了大量的投入。功耗驱动的编译流程致力于降低设计的总功耗,它包括功耗驱动综合和功耗驱动布局布线功能两部分。设计工程师将时序约束简单地设置为设计输入过程的一部分,对设计进行综合,可满足性能要求。QuartusII自动平衡每个模块功能和性能需求,并通过功耗导向的布局布线及时钟技术来降低总功耗。QuartusII软件含有功耗优化向导功能,它根据当前的工程设置,提供某些功耗优化建议。功耗顾问为设计人员介绍功耗分析最佳策略,向设计人员提出功耗优化建议,这样,设计人员可以充分利用硬件和软件功能来降低设计功耗。

  全面的解决方案帮助StratixV用户获得了很多优势,这是一款性能更好、功耗更低的,通过大量的硬核IP增强集成度,极大地提高了灵活性,StratixV是宽带和低功耗高端应用的理想器件。

关键字:28纳米  FPGA 引用地址:28纳米FPGA: 降低功耗 提高带宽

上一篇:Altera有望2012年成FPGA龙头
下一篇:采用EPM7032实现自动交通控制系统

推荐阅读最新更新时间:2024-05-02 21:18

基于FPGA器件EPXA10实现MPEG-2传输流解复用器的设计
随着芯片技术的发展,FPGA的容量已经达到上百万门级,从而使FPGA成为设计的选择之一。Altera公司的FPGA芯片EPXA10应用SOPC技术,集高密度逻辑(FPGA)、存储器(SRAM)及嵌入式处理器(ARM)于单片可编程逻辑器件上,实现了RISC和FPGA的完美结合。本文使用EPXA10芯片,利用片上的ARM微处理器对MPEG-2传输流进行解码,得到必要的解码参数,实现了将传输流分成视频流和音频流的解复用。 EPAX10器件简要介绍 ALTERA公司的EPXA10器件单片集成了ARM硬核,百万门级的FPGA,以及SDRAM存储器的接口。它将FPGA和ARM处理器完美结合在一起,是一个典型的SOPC结构。 其中ARM
[单片机]
基于<font color='red'>FPGA</font>器件EPXA10实现MPEG-2传输流解复用器的设计
基于FPGA的高速可变周期脉冲发生器的设计
  1 引 言   要求改变脉冲周期和输出脉冲个数的脉冲输出电路模块在许多工业领域都有运用。采用数字器件设计周期和输出个数可调节的脉冲发生模块是方便可行的。为了使之具有高速、灵活的优点,本文采用Atelra公司的可编程芯片FPGA设计了一款周期和输出个数可变的脉冲发生器。经过板级调试获得良好的运行效果。   2 总体设计思路   脉冲的周期由高电平持续时间与低电平持续时间共同构成,为了改变周期,采用两个计数器来分别控制高电平持续时间和低电平持续时间。计数器采用可并行加载初始值的N位减法计数器。设定:当要求的高电平时间以初始值加载到第一个减法器中后,减法器开始减计数,计数到零时自动停止,同时启动第二个记录低电平持续时
[测试测量]
FPGA全局时钟资源相关Xilinx器件原语及使用
   FPGA全局时钟资源一般使用全铜层工艺实现,并设计了专用时钟缓冲与驱动结构,从而使全局时钟到达芯片内部的所有可配置单元(CLB)、I/O单元(IOB)和选择性块RAM(Block Select RAM)的时延和抖动都为最小。为了适应复杂设计的需要,Xilinx的FPGA中集成的专用时钟资源与数字延迟锁相环(DLL)的数目不断增加,最新的Virtex II器件最多可以提供16个全局时钟输入端口和8个数字时钟管理模块(DCM)。   与全局时钟资源相关的Xilinx器件原语包括:IBUFG、IBUFGDS、BUFG、BUFGP、BUFGCE、BUFGMUX、BUFGDLL和DCM等。   1. IBUFG即输入全局缓冲
[单片机]
突发通信中Turbo码的FPGA实现
  Turbo码是一种低信噪比条件下也能达到优异纠错性能的信道编码。早期为了强调Turbo码接近香农限的优异性能,研究的码字长度非常大 ,存在译码复杂度大、译码时延长等问题。突发数据通信以传输中小长度的数据报文业务为主,所以突发通信中的Turbo码的码长也是中等长度以下的。本文面向突发数据通信中的信道编码应用,研究了短帧长Turbo码编译码算法的FPGA实现。实现中采用了优化的编译码算法,以降低译码复杂度和译码延时。最后仿真和测试了Turbo译码器的纠错性能和吞吐量。    1 Turbo码编码器的FPGA实现   Turbo码的编码器是由两个RSC(递归系统卷积码)分量编码器和一个交织器组成。RSC码不仅具有系统码的优点,而
[嵌入式]
突发通信中Turbo码的<font color='red'>FPGA</font>实现
利用FPGA的DSP功能提高图像处理的实例分析
  intevac是商用和军用市场光学产品的前沿开发商。本文介绍该公司nightvista嵌入式电子系统的开发,该产品是高性能超低亮度紧凑型摄像机。该摄像机最初采用了流行的数字信号处理器、几个assp和外部存储器件。系统对性能的需求越来越高,工程师团队决定试验一种替代方案——在可编程逻辑中实现可配置软核处理器。这一决定带来了以下好处:   达到了目标所要求的性能   在单个fpga中集成了分立的元件和数字信号处理(dsp)功能   功耗降低了近80%   将五块元件板缩减到一块,显著降低了成本   缩短了开发时间         图1 intevac nightvista摄像机中cyclone系列fpga功能框图
[安防电子]
同步数字复接的设计及其FPGA实现
摘要:在简要介绍同步数字复接基本原理的基础上,采用VHDL语言对同步数字复接各组成模块进行了设计,并在ISE集成环境下进行了设计描述、综合、布局布线及时序仿真,取得了正确的设计结果,同时利用中小容量的FPGA实现了同步数字复接功能。 关键词:同步数字复接/分接 FPGA位同步 帧同步检测 基群速率数字信号的合成设备和分接设备是曜网络中使用较多的关键设备,在数字程控交换机的用户模块、小灵通基站控制器和集团电话中都需要使用这种同步数字复接设备。近年来,随着需要自建内部通信系统的公司和企业不断增多,同步数字复接设备的使用需求也在增加。FPGA(现场可编程门阵列)器件的高性能简化了数字通信系统的设计与实现。本文基于FPGA的技术特点
[应用]
采用CEM插卡模式的VectorPath®加速卡在业内率先通过PCIe Gen5 x16 32 GT/s认证
加利福尼亚州硅谷,2023年5月25日—— 高性能FPGA芯片和嵌入式FPGA IP(eFPGA)领域的领导性企业Achronix半导体公司今日宣布 : 其搭载了Speedster®7t FPGA器件的VectorPath加速卡已通过PCI-SIG的PCIe Gen5认证 ,并且是PCI-SIG 集成商列表中的第一款也是唯一一款通过 PCIe Gen5 x16 认证的FPGA(CEM)加速卡,传输速率达到了32GT/s。设计旨在人工智能(AI)、机器学习(ML)、网络和数据中心应用等领域可以使用VectorPath S7t-VG6加速卡开发高性能运算和加速功能,从而缩短产品上市时间。VectorPath加速卡目前即可发货。 “
[嵌入式]
采用CEM插卡模式的VectorPath®加速卡在业内率先通过PCIe Gen5 x16 32 GT/s认证
深圳四部门:重点突破 CPU、GPU、DSP、FPGA 等高端通用芯片设计
今(6)日,深圳市发改委、深圳市科技创新委员会、深圳市工信局、深圳市国资委发布《深圳市培育发展半导体与集成电路产业集群行动计划(2022-2025 年)》(以下简称《计划》)。 《计划》提出,到2025年,产业营收突破2500亿元,形成3家以上营收超过100亿元和一批营收超过10亿元的设计企业,引进和培育3家营收超20亿元的制造企业,集成电路产业能级明显提升,产业结构更加合理。 《计划》指出,要建成较大规模生产线,设备、材料、先进封测等上下游环节配套完善,形成从衬底、外延到芯片制造到器件应用完整的宽禁带半导体产业链条。到2025年,产业链国产化水平进一步提升,本地产业链配套和协作能力显著增强。 在高端芯片突破方面,《计划》强调
[手机便携]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved