利用Virtex-5 FPGA 降低功耗-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

全球首款65纳米 FPGA在不影响性能的同时实现最低功耗

作者：Derek Curd
Xilinx公司高级产品部
高级应用工程师

VirtexTM-5 系列产品的推出，使得 Xilinx 公司再一次成为向 FPGA 客户提供新技术和能力的主导力量。过渡至 65 纳米工艺的 FPGA 具备采用更小尺寸工艺所带来的传统优势：低成本、高性能和更强的逻辑能力。尽管这些优势能够为高级系统设计带来激动人心的机会，但65纳米工艺节点本身也带来了新的挑战。

例如，在为产品选择 FPGA 时，功耗的考虑变得越来越重要。很可能下一代设计会需要在功耗预算不变（或更小）的情况下，集成更多的特性和实现更高的性能。

在本文中，我将分析功耗降低所带来的好处。还将介绍 Virtex-5 器件中所使用的多种技术和结构上的革新，它们能提供功耗最低的解决方案，并且不会在性能上有任何折扣。

降低功耗的好处

低功耗的 FPGA 设计所带来的优势不仅是能满足器件工作的散热要求。虽然满足元件指标对于性能和可靠性十分重要，但如何实现这一点对于系统成本和复杂性都有着巨大的影响。

首先，降低 FPGA 的功耗使你能够使用更便宜的电源，这样的电源使用的元件数量较少，并且占用的 PCB 面积也较小。高性能的电源系统的成本通常为每瓦0.5到1美元。低功耗的 FPGA 直接降低了系统的整体成本。

其次，由于功耗直接与散热相关，低功耗使你能够使用更简单、更便宜的热量管理解决方案。在很多情况下，设计者将不再需要散热器，或者只需要更小、更便宜的散热器。

最后，由于低功耗工作意味着更少的元件和更低的器件温度，因此将提高整个系统的可靠性。器件工作温度每降低10℃，就相当于元件寿命提高了两倍，因此对于需要高可靠性的系统而言，控制功耗和温度十分重要。

功耗：挑战和解决方案

FPGA （或任何半导体器件）中的总功耗等于静态功耗和动态功耗之和。静态功耗主要由晶体管的泄漏电流引起，即晶体管即使在逻辑上被关断时，从源极“泄漏”到漏极或通过栅氧“泄漏”的小电流。动态功耗是器件核心或 I/O 在开关过程中消耗的能量，与频率相关。

图1：85℃时的静态功耗比较

静态功耗

在缩小晶体管尺寸时（例如，从90纳米到65纳米），泄漏电流将会增大。新工艺结点所使用的短沟长和薄栅氧使电流更容易从晶体管的沟道区或通过栅氧泄漏。

在90纳米 Virtex-4 系列产品中，Xilinx 公司使用了“三栅极氧化层”的工艺技术，向 Xilinx 电路设计者提供了一种强有力的阻止漏电工具。在前几代 FPGA 中，使用两种栅氧厚度：薄栅氧用于 FPGA 核心中高性能、低工作电压的晶体管，而厚栅氧用于 I/O 模块中尺寸较大，需要承受大电压的晶体管。简单地来说，“三栅极氧化层”指增加一种中间厚度栅氧的晶体管，它的漏电比薄栅氧的核心晶体管要小得多。

“中间栅氧”的晶体管用在器件核心外围非关键性能的电路（像设置存储器）或不需要对变化的栅压进行快速开关响应的电路（像传输门）中。薄栅氧、漏电最大的晶体管只保留在需要快速开关速度的路径部分。结果，总的器件漏电被大大减小，同时性能仍能比上一代 FPGA 有很大提高。

三栅极氧化层工艺使 Virtex-4 器件比竞争性90纳米 FPGA 在静态功耗上平均减少了超过70%。这一结果非常成功，因此 Virtex-5 系列产品中大量使用了这一技术，在65纳米工艺结点上降低漏电。

虽然业界预测65纳米器件的静态功耗将会有大幅度提高，但是图1显示了三栅极氧化层工艺使65纳米 Virtex器件在最坏（温度最高）工作条件下达到了与尺寸相当的90纳米 Virtex-4器件相同水平的静态功耗。因此，Virtex-5 系列产品和竞争性高性能 FPGA 产品相比，在静态功耗方面具有真正的优势。

动态功耗

动态功耗为65纳米 FPGA带来一些其它方面的挑战。动态功耗的公式为：

动态功耗 = CV2f

其中C是结点开关时的电容，V是电源电压，f是开关频率。65纳米工艺节点使 FPGA 的逻辑能力和性能比传统器件有了显著提高，也就是说更多的结点工作在更高的频率上。如果其它方面的条件不变，动态功耗将会增大。

但是，对于65纳米工艺节点的动态功耗而言，也有一个好消息：FPGA 核心的电源电压（V）和结点电容（C）通常在每一代新工艺中都会下降，从而使得动态功耗比上一代 FPGA 有所下降。

Virtex-5 器件中，核心电源电压（VCCINT）从Virtex-4 中所使用的1.2V下降到1.0V。由于寄生电容变小（与更小的晶体管相关），以及逻辑块间的互联线长度变短、电容变小，使结点电容减小。此外，Virtex-5 器件在金属互联层之间使用了一种介电常数较低的材料。

Virtex-5 器件的平均结点电容比Virtex-4 器件大约减小了15%。加上电压降低带来的好处，至少相当于将 Virtex-5 器件的核心动态功耗降低了35-40%。

除“工艺尺寸缩小”到65纳米所带来的固有的35-40%的动态功耗降低外，Virtex-5 器件的架构创新，还能进一步降低每个设计的功耗。大多数可增加动态功耗有的结点电容，是由逻辑功能间的互连线引起的。新型 Virtex-5 架构在两个方面从根本上减小了连线电容：

　Virtex-5的可配置逻辑模块（CLB）是基于6输入查找表（6-LUT）逻辑结构的，在以前的器件中是使用4输入查找表。这意味着在每个 LUT 中能够实现更多的逻辑，相当于较少的逻辑级，从而降低了对逻辑功能之间大电容连线的需求。
　
　Virtex-5 的互联结构目前包括了对角线对称的连线，意味着每个 CLB 与所有相邻的模块（包括处于对角线位置的模块）之间都有直接的“单一”连接。当逻辑功能之间需要连接时，这一连接更有可能成为总电容最小的“单一”连接，而以往的互联结构对于相同的连接问题可能会需要两个或更多结点。

图2：计数器标准设计的动态功耗比较

6-LUT 结构和改进的互联模式，通过降低平均结点电容来降低核心的动态功耗，效果远远超过仅使用65纳米工艺所带来的改进。图2显示了来自标准设计的核心动态功耗的测量结果，其中每个 Virtex-5 器件和 Virtex-4 器件中都有1024个8位计数器。这些实际的测量结果显示，工艺和结构上的共同优化所带来的动态功耗的降低超过了50%。

硬IP模块

Virtex-5器件中包含的硬IP模块（专门用来实现一些常用功能的电路）的数量，超过业界其他任何一款 FPGA。相比使用通用 FPGA 逻辑而言，使用搭载这些模块的 FPGA 设计来实现这些功能，可进一步降低功耗。

与 FPGA 结构不同，这些专用的模块中只有实现所要求的功能必需的晶体管。并且没有可编程的互联，因此互联电容最小。较少的晶体管和较小的结点电容能降低静态和动态功耗。从而使这些专用模块在实现相同功能的同时，功耗只有使用通用 FPGA 结构的十分之一。

除增加新型的专用模块外，Virtex-4 器件中融合的很多模块，在 Virtex-5 器件中都被重新设计，以增加新的特性，提高性能，降低功耗。例如，Virtex-4 系列中18-Kb 的 block RAM 存储器在 Virtex-5 器件中被增加到了36-Kb；每个 block RAM 能被分成两个独立的 18-Kb 的存储器，以便向下兼容 Virtex-4 的设计。

有趣的是，从功耗的角度来看，每个 18-Kb 的子模块由两个 9-Kb 的物理存储阵列构成。对于大多数的 block RAM 配置，任何对于 block RAM的读写请求一次只需要访问 9-Kb 物理存储器中的一个。因此其余的 9-Kb 存储器能在不被访问时被有效地“关断”。在过渡至65纳米工艺所带来的功耗降低的基础上，这种结构又使功耗进一步降低了50%。这一对于9-kB 模块的“乒乓”访问是新的 block RAM结构所固有的，这就意味着使用这项功能不需要用户或软件来进行控制。它能动态并自动地进行，使所有使用 block RAM的设计降低了大量的功耗，并且不会影响模块的性能。

Virtex-5 器件中专用的 DSP 元件也进行了大量的改进，以实现更多的功能，提高性能，并降低功耗。在片与片的比较中，新型的 Virtex-5 DSP 片的功耗比 Virtex-4 DSP 片的功耗降低了大约40%。这主要归功于前面所讨论的65纳米工艺中电压和电容的减小。

然而，由于 Virtex-5 DSP 片具有更强的功能和更广泛的接口，许多 DSP 运算通过利用这些附加的功能进一步降低了功耗。在许多情况下，当使用新型 DSP 片的全部功能时，总功耗最高可降低75%。请记住即使你不是在设计一个 DSP 产品，也能使用 DSP 片来实现标准的逻辑功能（计数器、加法器、桶式移位器），这样会比在标准 FPGA 逻辑中实现同样的功能节省功耗。

最后介绍的经过改进的专用模块是 Virtex-5 系列的 LXT 平台，其中包括了几吉位的串行收发机，能以高达 3.125Gbps 的速率工作。这些 “SERDES” 模块在实现时着重考虑了低功耗需求。每个 Virtex-5 LXT 器件中的全双工收发机在 3.125Gbps 的速度下的总功耗小于100毫瓦，与Virtex-4串行收发机相比降低了大约75%。

图3：典型设计中现有 FPGA 的功耗比较

结论

Xilinx 公司悠久的创新历史能够追溯到20多年前第一块 FPGA 的发明。因此 Xilinx 公司理所当然地成为第一家在深亚微米技术中将降低功耗作为首要任务的公司。与 Virtex-4 系列产品一样，Virtex-5 器件也采用了一系列工艺和架构上的革新，力求在提供尽可能低的功耗的同时，仍然使性能提高30%或更多。

如图3所示，Virtex-5系列产品的静态功耗与 Virtex-4 器件相当，但比竞争性 FPGA 具有明显的优势。作为唯一的65纳米 FPGA，Virtex-5 器件核心的动态功耗比市场上其它高性能 FPGA 低至少35-40%。像新型 6-LUT 和对角线对称的互联等架构上的革新，使实际核心动态功耗进一步降低了50%或以上。此外，利用数量空前的专用模块进一步降低了功耗。

欲获取更多关于如何利用 Virtex-5 器件低功耗性能的资料，请访问www.xilinx.com/cn//power。

Xilinx 功耗估算器（XPE）

2006年1月上世的Xilinx 功耗估算器（XPE），是一种基于电子数据表的功耗工具，支持VirtexTM-4 和最新推出的 Virtex-5 和 SpartanTM-3 FPGA 系列产品。XPE 被设计用来替代网络功耗工具，是所有新型 XilinxFPGA 系列产品在初步设计时使用的主要功耗估计工具。与以往的功耗估计工具相比，XPE 的主要优势在于改进的用户界面、更高的精度和对重要数据更好的显示方法。

XPE 的概要页显示了能量使用的完整概述，首先是资源类型，接着是电源电压。你能够使用概要页上的导航按钮来查询更详细的信息。XPE 会自动显示一些图表，帮助用户创建能量使用图。

继发布初始版本之后，Xilinx 又陆续发布了一些更新版本的XPE，包括了许多附加特性和精度的提高。www.xilinx.com/cn/power上提供了这些版本和它们所支持的 Virtex-5 和Spartan-3E 器件的列表。

Kevin Bixler
Xilinx公司功耗工具产品市场工程师

关键字：工艺纳米散热泄漏引用地址：利用Virtex-5 FPGA 降低功耗

上一篇：FPGA简介
下一篇：利用Virtex-5 SXT 的高性能DSP解决方案

推荐阅读最新更新时间：2024-05-02 20:36

三星4nm工艺良品率低：高通将部分订单转交给其他厂商

据国外媒体报道，在5nm之后，台积电和三星电子的4nm制程工艺也都已顺利量产，有报道称，高通上月底推出的骁龙8 Gen 1移动处理器，就是交由三星采用4nm制程工艺代工。在高通目前已经推出的骁龙系列移动处理器中，采用4nm工艺的，只有上月30日推出的骁龙8Gen 1，骁龙888+ 5G和骁龙780G 5G采用的都是5nm工艺。高通若将采用4nm工艺的高端处理器的代工订单多元化，就将是新推出的骁龙8 Gen 1，或者即将推出的其他骁龙新品。

[手机便携]

LED喷射式点胶工艺的优点

目前，针筒式点胶正被喷射式点胶所替代。所谓的喷射(jetting)，属于新技术，它采用喷嘴式替代针筒，解决了许多难题。Jetting喷嘴可在需要进行底部填充的器件上方进行点胶，无需到达其顶面以下的位置。Jetting喷嘴在整个电路板上方沿x、y方向运动，而无需垂直运动。与点胶针筒不同，喷嘴并不是形成连续的底充胶液流，而代之以每秒鐘喷射200点以上经过精确测量的胶点。随着喷嘴的水准移动，胶点可形成各种需要的线型与图案，如实线、虚线等以及其他各种不同图形。每次喷射都经精确控制，一次喷射所形成的胶点直径最小可达0.33mm，这对于涂敷贴片胶等需要对面积进地精确控制的场合非常重要。喷射技术是把胶水以很快的速度从喷嘴喷出

[电源管理]

汽车车灯的起雾机理及解决方案

汽车车灯作为汽车的眼睛，不仅美观，且用于道路照明，增强视野，对车身的安全有着至关重要的作用。目前，汽车车灯出现的主要问题包括车灯进水、起雾等，其不仅影响车辆车灯寿命，且使得车灯的照明效果大受影响，进而影响行车安全。车灯进水属于质量问题，可以避免并且不允许发生；起雾则属于自然现象，本文主要对车灯起雾现象进行阐述，分析其机理，并提出优化解决方案。 01、车灯起雾机理车灯起雾实际为车灯内部的水汽凝结，是水蒸气在一定条件下转化为液体或液气共存的状态。湿空气中凝结出液态水有定温和定压两种状况，现在车灯大部分为半封闭结构，存在通风口，用于内外部气流交换，保证内外压力一致，故车灯内的水汽凝结主要是在定压状况下发生的；在定压状况下

[嵌入式]

碳纳米管可望为手机导入超级电脑运算效能

根据史丹佛大学的研究人员表示，利用碳奈米管(CNT)材料，可望将IBM华生(Watson)系统的超级电脑运算性能力封装于智慧型手机中。在日前举行的半导体年度盛会Semicon West 2014上，史丹佛大学教授黄汉森(H.S. Philip Wong)介绍了一种以碳奈米管材料打造、交错下一代记忆体与逻辑技术组成的 3D 晶片堆叠架构。不过，他也坦承，在这款材料得以导入实际应用以前，还面临着巨大的挑战。黄汉森展示这种由碳奈米管制造的「三明治」夹层结构——由电阻式记忆体层、磁性 RAM 层以及由1D与2D场效电晶体逻辑层交错组成。「这项设计还需要采用新式的高效率散热器，因为在热方面更重要，」他说。

[手机便携]

碳<font color='red'>纳米</font>管可望为手机导入超级电脑运算效能

适于电路板制造的Multitest脉冲电镀工艺赢得客户赞誉

2012年8月---面向世界各地的集成元件制造商（IDM）和最终测试分包商，设计和制造最终测试分选机、测试插座和负载板的领先厂商Multitest公司，日前欣然宣布其脉冲电镀工艺在制造成本和生产周期方面具有显著优势。Multitest的脉冲电镀工艺业已付诸所有主要电路板客户的电路板制造。在不同的客户应用中， Multitest之该专有工艺已被证明具有市场领先的性能。该工艺的最初研发宗旨是支持0.4 mm间距条件下的超高厚径比。针对ATE测试所使用的高层数印刷电路板的小通孔直径，Multitest已经研制出了定制型电镀工艺。该工艺可适应多达40层印刷电路板的.0051"直径通孔。 Multitest脉冲电镀工艺尤其适用于BGA

[半导体设计/制造]

安森美半导体推出集成无源元件的IPD2工艺技术

安森美半导体(ON Semiconductor，美国纳斯达克上市代号：ONNN)推出新的集成无源元件(IPD)工艺技术——IPD2。这新工艺是公司增强既有的HighQ™硅铜(copper on silicon) IPD技术，第二层的铜层厚度仅为5微米(μm)，增强了电感性能，提高了灵活性，配合设计高精度、高性价比的集成无源元件，用于便携电子设备中的射频(RF)系统级封装应用。 HighQ™ IPD2工艺是安森美半导体定制代工部众多创新制造服务之一，采用先进的8英寸晶圆技术，典型设计包括平衡/不平衡转换器(balun)、低通滤波器、带通滤波器和双工器，用于最新便携和无线应用。基于IPD2的设计为电路设计人员提供重要优势

[半导体设计/制造]

LIN及混合信号工艺的发展提升汽车传感器与传动装置性能

电子产品在汽车中日益突出的重要性引发了对低成本、高可靠性传感器及传动装置日益增长的需求。这些器件并非独立存在，而是必须与系统的主电子控制单元 (ECU) 进行通信。过去的传感器／传动装置通信通常采用单向模拟信号，每一远程设备都采用自己的专线与 ECU 连接。由于汽车环境充满电气噪声，因此很难在这些线路上保持信号完整性，而且系统的可靠性也会受到影响。布线会带来其他问题 ——占用空间，增加重量及成本且难以维护。幸好数字多路复用通信技术可以解决上述问题，这种技术可以保持信号完整性，减少所需线路数量并提供实现整台车辆智能控制的新机会。　　当今的两大趋势——汽车通信总线标准化及半导体技术正推动着智能化更高的传感器与传动装置的发展，同时还通

[传感技术]

提高纳米技术竞争力，美学院着眼培养下一代纳米工程师

　　在行业、联邦政府和美国大学结成的合作伙伴关系当中，美国国家纳米工程学院(Nine)承诺将使研究生和大学生从事纳米项目的研究，以此作为振兴美国在全球工程和科学领域中地位的举措。　　Sandia National Laboratories的材料科学与工程高级经理Justine Johannes表示，“我们想提高美国在纳米技术上的竞争力，希望通过用强制性的问题激励学生，并为他们提供以解决方案为导向的真正发展机会，从而获得工程或科学学位。” 　　与8月9日通过的美国竞争法案相一致，该法案为解决科学和工程发现及教育问题而提供用于建立创新学院的资金，Nine承诺普及纳米科技，并深化学生们对三个关键主题的承担义务：纳米电子、纳米能量代和

[焦点新闻]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■验证并选择心仪MOSFET，探寻选型奥秘！注册、体验双重好礼等你拿~

■评论有奖：元器件采购的秘密法宝，助你做个自带“松弛感”的职场人！

■新栏目器件口碑专辑上线~快来点评吧！

■中星联华直播 | 高速信号完整性分析与测试 — “码”上行动系列线上讲堂