使用ISE设计工具优化FPGA的功耗

发布者:wmghyu最新更新时间:2007-12-17 来源: 电子产品世界关键字:辅助  静态  信号  工艺 手机看文章 扫描二维码
随时随地手机看文章

自从Xilinx公司推出FPGA二十多年来,研发工作大大提高了FPGA的速度和面积效率,缩小了FPGA与ASIC之间的差距,使FPGA成为实现数字电路的优选平台。今天,功耗日益成为FPGA供应商及其客户关注的问题。

降低FPGA功耗是降低封装和散热成本、提高器件可靠性以及打开移动电子设备等新兴
市场之门的关键。

Xilinx在提供低功耗FPGA解决方案方面较有经验。本文说明如何应用计算机辅助设计(CAD)技术,如Xilinx ISE(集成软件环境)9.2i版本软件使功能有效降低。

CMOS电路中的功耗由静态(漏电)功耗和动态功耗两部分组成。动态功耗是由电路信号
上的瞬变所致,由下式决定:

式中Ci表示信号i的电容;fi为"开关率",表示信号i上的瞬变率;V是电源电压。

静态功耗是电路在静止、空闲状态下的功耗。工艺尺寸缩小(如65纳米工艺)意味着更低的电源电压和更小的晶体管尺寸,致使导线长度缩短、电容量减小以及总动态功耗降低。较小的工艺几何尺寸还意味着较短的晶体管沟道和较薄的栅极氧化层,致使静态功耗随着工艺尺寸缩小而增加。

FPGA的功耗

对于实现给定的逻辑电路而言,FPGA的可编程性和灵活性使其功耗效率比定制ASIC要低。FPGA的配置电路和配置存储器要占用硅片面积,致使导线延长和互连电容增加。在FPGA中,预制金属导线段上附加的可编程布线开关产生互连,从而加重了信号产生的电容性负载。

FPGA中的动态功耗大部分消耗在可编程布线架构中。同理,静态功耗与晶体管总宽度成正比。FPGA的晶体管有相当一部分是互连架构,这是造成漏电流的主要因素。因此,互连架构应该是FPGA功耗优化的主要攻关目标。

当然,可以通过工艺技术、硬件架构或电路级修改来解决功耗问题。例如,Virtex-5FPGA含有"对角线"互连资源,允许用较少的布线导体构成连接,从而减少互连电容。在晶体管级,Virex-4和Virtex-5两种FPGA都是采用三氧化层工艺技术来抑制漏电流。根据其速度、功耗和可靠性要求,可以为每个晶体管使用三种氧化层厚度。与在标准FPGA架构中实现同样功能相比,扩大使用DSP和处理器等硬IP模块也可以降低功耗。

不必花费钱去更改硬件,也可以降低功耗。您可以通过新型的功率驱动的CAD算法和设计流程(如ISE9.2i软件中采纳的算法和设计流程)来解决功耗问题。

布局

Xilinx布局器的核心算法采用了解析(数学)技术。这种算法从有重叠的初始设计布局开始,然后使用强化抽象法从高度拥挤区去除逻辑块,最终形成可行的无重叠布局。一旦完成解析布局,便在已布局的设计上运行交换式局部优化,以进一步细化布局。本布局器使用的传统成本函数按下式考虑导线长度和时间:

总成本=a×w+bT

式中W和T分别是导线长度成本和时间成本,a和b是标量加权系数。a和b的值可以根据时间对导线长度的相对优先级设定。布局器的成本核算方案如图1所示。

因为进行布局时还没有实际线路,所以导线长度成本是依据导线长度估算。同理,时间成本是依据用户提供的限制条件和连接延迟的估算值。为了优化功耗,我们用为成本函数增加功耗成分的方法扩展了解析布局和局部优化,如图1右侧所示。修改后的成本函数如下:

总成本=a×W+b×T+c×Pdynamic

式中Pdynamic是估算的动态功耗,c是标量加权系数。可以从仿真中提取信号开关率数据,然后将其提供给工具。反之,如果不提供任何开关率数据,则工具根据逻辑功能为初始输入,为后续输出假定一个默认的开关率,并且将开关率推广到其余信号。为了获得最佳结果,需要有用户提供的开关率数据。

在布局过程中,信号的电容是未知的,因此必须估算。根据布局过程中已有的信号参数,我们建立一个电容估算经验模型:

式中f是普通数学函数;Ci是信号i的电容;FO是信号i的扇出数;XSi和Ysi分别是布局中信号i的X跨度和Y跨度。这些参数与架构无关,并且在布局过程中已经具备。

为建立此模型,我们提取了从Xilinx客户那里收集的一组设计中每个信号的电容、扇出数、X跨度和Y跨度。然后,我们用最小平方回归分析法,将电容整理成模型参数的一个二次函数。就各种设计平均而言,该解析公式的误差为30%。

布线

一旦将逻辑块分配到FPGA上的物理位置,我们就必须为各块之间的连接进行布线。布线器采用一种协商拥挤布线算法,该算法在初始迭代中允许信号间短路。在后续迭代中,对短路的产生逐渐加大处罚,直到仅剩一个信号使用布线导体。对时间关键型连接布线的方式,应尽量缩短其延迟,这涉及密集型的RC延时计算。不过,大多数连接并非时间关键型。 在功耗监控型布线器中,我们选择优化这类非关键型连接的电容。为达到这一目的,我们针对非时间关键型连接修改了布线器的成本函数,以便考虑电容,这与上述根据其他因素(如估算的延迟或不足)的方法截然相反。为了解这种算法,请看图2中的布线图。


该布线图中的每个节点表示一个布线导体或逻辑块引脚,每条边线表示一个可编程布线开关。布线器必须在源引脚和目标引脚之间选择一条路径。图中各节点内部所示为该节点的原始成本和电容成本。若要尽量降低原始成本,源引脚和目标引脚之间的布线就应采纳蓝色路径。然而,在功耗监控型流程中,布线器会使用绿色路径,因为这条路径的总体电容较低。

功耗监控型布局与布线的结果

我们使用传统布局布线流程和上述功耗型流程两种方法,对一组工业设计进行了布局布线。这些设计的初始输入附加一个基于线性反馈移位寄存器(LFSR-based)的伪随机矢量生成器,从而增加了内置的自动输入矢量生成功能。这样,无需大量使用外部波形就能完成动态功耗的板级测量。

我们把这些工业设计映射到了Spartan-3、Viitex-4和Viltex-5器件中。结果显示,动态功耗降低率对于Spartan-3FPGA达14%,对于Virtex_4FPGA达11%,对于Virtex-5FPGA达12%。就所有设计平均而言,动态功耗降低率对于Spartan-3FPGA为12%,对于Virtex-4FPGA为5%,对于Virtex-5FPGA为7%。就所有系列平均而言,速度性能下降在3%和4%之间。我们队为,这样小的性能损失在注重功耗的设计中是可以接受的。考虑到这些仅仅是软件修改的初始结果,我们认为所取得的功耗效益是令人振奋的。

降低逻辑块内部功耗

本文讨论的布局和布线优化旨在降低互连架构中的功耗。我们还设计了一种降低逻辑块内部功耗的方法,尤其是在未使用全部查找表(LUT)时,降低LUT中的功耗。K个输入的LUT是小存储器,只用几个K输入即可实现任意逻辑功能。图3所示为用一个假设的三输入LUT(输入A1、A2和A3)实现二输入逻辑"与"功能的过程。多路复用器树左侧的LUTSRAM所示内容为逻辑"与"的真值表。

请注意,图3中的输入A3未使用。通常,未使用的输入作为"无关项"处理,假设为0或1。所以,为了在图3所示的情况下说明这一点,Xilinx软件在LUTSRAM存储器内容的上下两半部分中重复了该逻辑功能。客户设计中经常出现未使用的LUT输入,特别是Virtex-5设计,它的LUT有六个输入。


为了评价在工业设计上进行的这一优化,我们进行了板级功耗测量,发现动态功耗节省了几个百分点。这些结果说明大有前途,因为可以在布线后进行优化,不会造成面积或性能损失,从这种意义上讲,这种优化是"免费"的。

结语

结果显示,在通过Xilinx ISE设计工具降低功耗方面已经取得长足的进步。在使用软件进一步降低功耗方面,我们认为前景一片光明。注重降低功耗的解决方案由功耗监控型CAD算法和功耗优化器件(如Virrex-5FPGA)组成,这一成功事例令人鼓舞。低功耗软硬件的不断进步将为Xilinx FPGA打开进入新兴功耗敏感型市场的大门。

关键字:辅助  静态  信号  工艺 引用地址:使用ISE设计工具优化FPGA的功耗

上一篇:基于内插和QLA技术的并行DDS的实现
下一篇:基于DSP的指纹采集系统的研究

推荐阅读最新更新时间:2024-05-02 20:39

自动辅助驾驶再添一位老司机 聊聊小鹏NGP系统
众所周知,虽然我们经常听到有关自动驾驶的信息,并且越来越多的车型都有搭载自动驾驶技术,但是真正实现全自动驾驶时代离我们还有一定的距离,不过针对特定场景下的自动驾驶已经有一些车企可以触及。比如,特斯拉的NOA自动辅助导航驾驶以及蔚来的NOP领航辅助驾驶都可以在高速上实现自动辅助驾驶功能。而现在,小鹏汽车也推出了自己的自动驾驶辅助系统--NGP。    高速辅助驾驶是否就是自动驾驶?    业界对自动驾驶已经有了比较明确的划分,而其中明显的界限是需要人监控(辅助驾驶)还是机器监控(自动驾驶)。目前市面上能见到的自动驾驶技术基本都是人在监控,也就是说诸如特斯拉、蔚来、小鹏这些由人工监控的半自动驾驶,仍然是驾驶辅助系统。 而高速辅助驾
[汽车电子]
自动<font color='red'>辅助</font>驾驶再添一位老司机 聊聊小鹏NGP系统
基于ARM和DSP的地震加速度信号处理系统
  引言   ARM和DSP作为嵌入式技术应用在地震信号处理系统中,能很好地满足地震加速度计对实时性、高精度以及网络化的要求,因此,利用光线传感基于ARM 和DSP双核微处理器的嵌入式系统设计方案,一方面发挥DSP的快速信号处理能力,且能进行小数运算,提高运算精度,完成地震加速度已调信号的解调和频谱分析;另一方面充分利用ARM丰富的片上系统资源,能实现解调信号及其频谱信息的网络传输和显示,该方案仅通过改变软件无需重构电路就能方便快捷地实现系统升级。   1 系统构成及工作原理   地震加速度计由传感探头、光电转换及信号处理系统构成。传感探头由采用基于3x3耦合的光纤M—z干涉仪和相关机械部分组成。如图1所示,干涉仪的输入端是
[单片机]
基于ARM和DSP的地震加速度<font color='red'>信号</font>处理系统
研究人员发现,自动驾驶汽车可能淘汰超速罚单和交通信号
据外媒报道,汽车专家认为,未来,自动驾驶汽车可让日常通勤变得更顺畅,道路更通畅。此外,自动驾驶汽车的到来可能会淘汰交通信号灯和烦人的超速罚单。特拉华大学(与波士顿大学和弗吉尼亚大学合作)的一项突破性研究探讨了无人驾驶汽车效率及其对传统道路基础设施的潜在影响。研究人员表示,具有联网功能的自动驾驶汽车能够利用其与道路上其他车辆进行通信的能力,做出有效的驾驶决策。 利用控制理论,科学家们研究出算法的几乎无需人类驾驶员的操作。该小组在缺乏交通信号灯等基础设施的繁忙十字路口,在自动驾驶和网联汽车上测试其解决方案。在测试期间,汽车软件用于生成模拟和结果。科学家们还利用UD按比例缩小的智能城市(UDSSC)试验平台支持他们的理论。UDSSC是一
[汽车电子]
MSF250的DS1/E1信号格式
摘要:MSF250是一个多业务成帧芯片。它带有DS1/E1接口,可将28个DS1或21个E1信号以位异步方式映射/解映射到VT.5/TU2路径中。文章从各种不同的帧格式和成帧原理论述了MSF250在DS1/E1映射/解映射中的应用方法。 关键词:MSF250;DS1/E1;SONET;SDH;信号格式 通过多任务成帧器芯片MSF250的DS1/E1接口,可将28个DS1或21个E1信号以位异步方式映射/解映射到VT.5/TU2路径里,以便通过SONET/SDH接口传输。而DS1/E1信号也能够被映射进入DS3/E3有效载荷,然后再通过DS3/E3功能模块中的M13/E13特性被映射进STS-1/VC-3/TU-3。DS1/E1
[网络通信]
运算放大器电路的固有噪声分析与测量(4)
第四部分:SPIC 噪声分析介绍 作者:Art Kay,德州仪器 (TI) 高级应用工程师 在本系列的第三部分,我们对简单的运算放大器电路进行了实际分析。在本部分中,我们将采用所谓 “TINA SPICE” 电路模拟套件来分析运算放大器电路。(您可在 TI 网站 www.ti.com 上通过输入 TINA 搜索,获得 TINA SPICE 的免费版 TINA-TI)。TINA SPICE 能够就 SPICE 套件进行传统类型的模拟(如 dc、瞬态、频率域分析、噪声分析等)。此外,TINA-TI 还配有众多 TI 模拟宏模型。 在本部分,我们将介绍 TINA 噪声分析以及如何证明运算放大器的宏模型能准确对噪声进行建模。重要的是,
[模拟电子]
2010电子产业展望之警惕10个不好的信号
  对于电子产业而言,2009年的开头比较糟糕,不过现在已经显现出积极的信号。      感谢上帝,电子产业看起来正在恢复中。但2010年又会如何呢?进入2010年,市场上将会向大家传达一些好的、以及不好的信号。下面让我们继续分享来自不同分析师的观点:       不好的信号      1. 模拟产品价格上涨?FBR的Berger表示:“注意我们已经提高了对飞兆半导体和国际整流器公司的财务估计,这两家公司在过去几周内对第四季度做出了正面的预计。考虑到2010年第一季度渠道压力和分销商库存补给的潜力,我们认为在2010年初,分立和低利润模拟芯片供应商也许会提高这些产品的价格。”      2. 应用处理器大战即将打响。Broadpoi
[半导体设计/制造]
用SG270/LM4884和AT89C51设计的音频信号均幅控制放大器
引言 现在的学校,有许多已经采用计算机加网络多媒体系统来进行现场教学。此外,工程施工人员在施工现场进行对讲通话,驾驶人员在开动的坦克等自行火炮车辆上进行通话等,都避免不了讲话时嘈杂的背景噪声或无线干扰(包括网络射频干扰),因而声音有大有小。怎样才能使听到的广播声或耳机中说话的声音平稳清晰?本文给出了一种用SG270、LM4884电路配合AT89C51单片机来解决干扰问题的实现方案。 1 电路主要器件 1.1 SG270放大器 SG270电路为国产工业级(-40℃~+85℃)可控增益音频放大器,该芯片的1、2脚为正、反相信号输人端,A、B、C为压控输入端,增益控制电压范围为2.1~2.5 V,可通过输出反馈信号来即时进行自动增益控制
[单片机]
用SG270/LM4884和AT89C51设计的音频<font color='red'>信号</font>均幅控制放大器
苹果自研5G基带2023年量产,采用台积电4纳米工艺
据日经新闻报道,苹果公司正在与台积电建立更密切的合作伙伴关系,希望减少对高通的依赖,该公司计划从2023年开始让台积电制造5G iPhone基带。 知情人士表示,苹果计划采用台积电的4纳米工艺来量产其首款自研5G基带,其还在自研射频、毫米波组件和电源管理芯片,而在最新iPhone 13中,这部分组件均由高通提供。 苹果一直想要摆脱对高通的依赖,想对iPhone中的半导体实现更强大的控制,高通近日证实,其在iPhone基带订单中的份额将在2023年下降至20%左右。 消息人士称,对于新的5G iPhone基带,苹果正在使用台积电的5纳米芯片生产来设计和测试生产该芯片,未来将使用更先进的4纳米技术进行大规模生产,但商业化要到202
[手机便携]
小广播
热门活动
换一批
更多
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

更多精选电路图
换一换 更多 相关热搜器件
更多每日新闻
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved