基于门控时钟的低功耗电路设计方案

最新更新时间:2012-02-16来源: 互联网关键字:门控时钟  低功耗电路 手机看文章 扫描二维码
随时随地手机看文章

集成电路工艺节点的提升带来了芯片集成度的极大提高,同时也导致了功耗的急速增加。另外,市场对电子设备的大量需求使得系统功耗成为系统性能的一个重要指标,功耗的高低成了芯片厂商竞争力的焦点之一,功耗控制与管理已成为绝大多数芯片厂商首要考虑的问题。SoC设计的功耗包含两部分:静态功耗和动态功耗。静态功耗主要由泄漏电流引起,在130 nm工艺下,静态功耗相对较小,可以忽略不计。动态功耗主要包括短路功耗和翻转功耗,是本设计功耗的主要组成部分。短路功耗即内部功耗,指由器件内部由于P管和N管在某一瞬间同时导通引起的瞬时短路引起。翻转功耗由CMOS器件的输出端负载电容充放电引起。芯片工作时,很大一部分功耗是由于时钟网络的翻转消耗的,如果时钟网络较大,这部分引起的功耗损失会很大。在众多低功耗技术中,门控时钟对翻转功耗和内部功耗的抑制作用最强。本文主要讲述门控时钟技术的具体实现。另外,基于高阈值单元具有较低的功耗,设计采用高阈值单元库。

  1 门控时钟技术的基本原理

  对于一个设计中的寄存器组,经DC编译后一般会生成如图1所示的电路。由图1可以看出,当EN为1时, DATA_ IN的值由多路开关传至寄存器组的数据输入端,当CLK上升沿来临时,传至DATA_OUT。当EN为0时, OUTPUT保持不变。但由于时钟信号CLK的翻转,寄存器组会持续在CLK的上升沿来临时读取数据输入端的数据,而这时读取的数据是不变的,这就消耗了额外的功耗。

  

带有多路开关的同步使能寄存器

 

  为保证此时寄存器组不受时钟翻转的影响,可在EN信号为0时关断寄存器组的时钟输入端,使其不受CLK端的变化而变化,这一操作可通过门控时钟技术来实现,如图2所示。图中的门控单元由一个Latch和一个与门组成。门控单元也可以采用非latch结构,直接由与门或或门组成。但由于这种电路会引发毛刺,故此处采用基于Latch的门控单元电路。插入门控时钟后,当EN为1时, Latch单元在时钟低电平时将EN锁存至ENL,时钟上升沿来临时, ENCLK随CLK变化,寄存器组执行正常的读入读出操作。当EN为0时,寄存器时钟输入端ENCL保持为0,不随源时钟CLK的翻转而变化,故此时寄存器组不消耗额外功率。

  

基于latch的门控单元电路

 

  由此可见,插入门控时钟能消除寄存器组冗余翻转引发的内部功耗,同时由于多路选择器组被一个基于latch的门控单元代替,所以也减小了电路的面积。

  另外,为了进一步减小设计的功耗,可采用一些特定的门控技术。目前应用比较广泛的有多级门控时钟,层次化门控时钟等。在多级门控时钟技术中,一个门控单元还可用来驱动其他一个或一组门控单元。这样就通过分级控制减少了门控单元的数目,而且这种方法可组合尽可能多的寄存器组使得门控单元向顶层靠近,节省更多功耗。

  2 门控时钟的物理实现

  电路在功能仿真通过后,开始进行寄存器级综合。采用高阈值标准单元库和多级门控时钟技术相结合,在RTL阶段插入门控时钟单元,并在布局布线时在IC Compiler中进行了基于门控时钟的布局布线优化,布局布线正确完成仿真通过后,在PT中做静态时序分析并进行最终的功耗分析。以下分三个部分讲述。

  2. 1 时钟门控的RTL级实现

  在RTL级,门控时钟的实现不需要对设计本身进行修改,而只需在综合脚本中加入一些控制项。

  本文采用多级门控时钟,相关的脚本如图3 所示。

  

门控时钟的基本描述

 

  图中,传统的综合流程用实线标出。虚线部分为门控时钟的操作。

  控制项set_clock_gating_ STyle是门控时钟的核心。它的参数大小决定门控时钟的质量,对功耗的优化效果和对CTS的影响。目前尚无完备的体系介绍如何设置控制项以使门控效果达到最优。本设计中有以下各个参数的设置方法。

  首先确定时序单元的类型。为了避免非Latch单元易产生毛刺的缺点,此处选定时序单元的类型为Latch。由于库中提供基于锁存器的门控单元,固正边沿逻辑positive_edge_ logic采用工艺库提供的专用单元。采用集成单元的优势在于不仅不需要设置门控单元输入端建立时间和保持时间,因为集成单元的时序信息在单元库中已有说明,而且有效缓解了插入门控单元对延时带来的不利影响。以下重点阐述实验中bitwIDTh, fanout和stage的确立方法。

  fanout的大小对功耗和时序都有影响。数值越大则表示一个门控单元可承受较多的负载,即代表越节省功耗,需要的门控单元也越少,但对门控单元输入端建立时间的要求也就更加严格。位宽决定一组寄存器能被门控的最小宽度。级数则确定多级门控时钟的最大级数。本设计在这三个参数的选取上,主要是依据设计本身对功耗的要求,结合综合时的时序约束和单元库中门控单元的时延信息加以估计,确定一个粗略的数值范围。fanout的值在满足时序的前提下,不经编译就可确定,方法如下:首先按约束文件中的扇出值约束此处fanout,然后insert_clock_tree,加入时序约束并传递至门控时钟,用re_port_clock_gating– multi_stage查看报告,重点关注第1项。发现fanout按约束文件取值为15时,门控单元的数目达到61个, fanout取值为20或更高时,门控单元数目为41,见表1,而被门控的寄存器数目却保持不变,多级门控单元的数目也由fanout取值为15时的7级减小到当前的6级。由于门控单元也会消耗相当大功耗,因此在被门控的寄存器数目相同的情况下门控单元数越少就越节省功耗。因此确定fanout为20。

  num_stages最初取值为2,插入门控时钟后的报告显示平均级数为1. 4,其值增至3时,平均级数为2. 3,如表1 所示。从对时钟网络的平衡性来讲,stage值为2时要优于取值为3时的情况,但结合其后的编译,综合考虑时序面积功耗因素,折衷考虑选定stage为3。

  bitwidth初值为3,经过编译,得出了功耗和延时信息。以此为基准,根据设计改变bitwidth数值,然后再编译,对比功耗延时。发现当bitwidth取值为5时,设计的各个性能指标达到最优。

  通过以上试验,得出下列结论: 对门控时钟而言,若不考虑设计的平衡性,插入的门控单元越少且被门控的寄存器越多, 门控的效果就越好,反之亦然。

  经编译,查看时序功耗报告,在满足电路性能指标情况下, RTL级代码经综合生成层次化门级网表和门级时序约束文件。

  为查看门控单元在不同设置下的插入情况,用report_clock_gating– multi_stage得到表1所示报告。

  从中可知,有23. 68 %的寄存器没有被门控,原因在于位宽, 使能等不满足门控要求,对设计无影响。

  

门控时钟总结
2. 2 时钟门控的版图级实现

  在布局布线阶段,基于门控时钟的功耗优化流程主要如下:在布局之前,设置set_Power_op tiONs–clock_gating true,之后在布局、时钟树综合和布线阶段的主要命令中添加选项- power即可。上述设置可实现最基本的门控时钟布局布线,但在本设计中生成的时钟网络分布不均匀,而且skew很大。需要采取额外的优化措施来消除其带来的不利影响。

  门控单元的加入给CTS带来的影响主要有两个方面,一方面会造成整个时钟网络分布不平衡,另一方面导致时钟偏移增大。单采用上述措施,时钟偏移最大可达到1. 11,见图4中的第二项,严重偏离了不采用门控时钟时的偏移量0. 12。在优化时钟偏移上,目标有三个方面:构造一个相对平衡的时钟网络,使得在各个层上,层的各个分支上的单元数目相近;减小时钟偏移至可承受范围;尽量保持功耗同只采用门控时钟而不优化时钟偏移状况下的功耗相近或更小。

  

各种操作方式下的时钟偏移

 

  分析引起skew偏大的原因,通过在ICC中跟踪路径,查看时钟网络电路图,发现时钟层分布极不均匀,分支节点最大相差6 层。在具体时序路径中,两条路径延时过大,插入了许多不必要的buffer,为构造一个平衡的时钟树,减小skew并减少对功耗的影响,在CTS阶段采取了三个措施。

  第一,设置set_clock_tree_op tions– LOGIC_ level_bal2ance为true。CTS的操作模式有三种: 模块模式,顶层模式,逻辑级平衡模式。默认为模块模式。

  此处选取逻辑级平衡模式可得到最佳的skew,但对功耗有一定影响。第二,复制门控单元。主要是通过修正ICG输出端的DRC来平衡扇出,并添加缓冲单元来驱动没有被门控的寄存器使得整个时钟树的结构更加平衡。首先设置cts_push _down_ buffer为true。然后split_ clock _ gate – ob2jects { 3 . / Latch} – gate_ sizing– gate_ relocation。

  并且在时钟树综合时结合使用- inter_clock_bal2ance选项。最后,为了弥补功耗优化方面的不足,在CTS完毕之后用p synop t– power。不采用门控时钟、采用门控时钟但不做skew优化、采用门控时钟且进行skew优化三种情况下的skew见图4。由此可见,优化后的skew较原来相比虽有所增大,但要远小于优化前的设计。

  2. 3 功耗测量过程及实验结果分析

  布局布线完成后,导出网表到VCS中进行后仿,并得到分析功耗所需的saif文件。将此saif文件和布局布线后带有实际延时信息的网表读入PT中,加以适当的时序约束进行功耗分析,得到如图5所示的分析结果。

  

布局布线完成后的功耗分析结果

 

  由图5可知, 采用门控时钟技术后的设计总体功耗下降了22. 6 %。其中, 开关功耗下降了63. 2 % ,内部功耗下降了21. 9 %,体现了引入门控时钟技术的优势,因为门控时钟主要用于降低动态功耗,泄露功耗略有下降。总功耗由原来的1 mW降低至778 uW,功耗降低效果非常明显。除此之外,芯片核的面积也略有减小。

  3 结语

  越来越多低功耗设计方法的出现为低功耗设计提供了无限的空间。门控时钟技术作为当前比较成熟的一种低功耗方法,已经得到普遍应用。本设计全面讲述了门控时钟的后端实现方法,并提出了一种门控控制项的设置方法,解决了由其引起的时钟偏移问题,对VLSI深亚微米低功耗电路物理层的实现有一定的实用价值。

关键字:门控时钟  低功耗电路 编辑:神话 引用地址:基于门控时钟的低功耗电路设计方案

上一篇:非同步恒定导通时间控制器XRP6124
下一篇:MAX6495–MAX6499低电流过压保护电路

推荐阅读最新更新时间:2023-10-12 20:35

PIC单片机低功耗电路的设计方法介绍
引言 20世纪90年代以来,随着集成电路特征线宽的持续缩小以及芯片密度和工作频率的相应增加,降低功耗已经成为亚微米和深亚微米超大规模集成电路设计中的一个主要考虑因素。功耗的增加会带来一系列问题,例如电路参数漂移、可靠性下降、芯片封装成本增加等。因此,系统的功耗在整个系统设计中,尤其是在采用电池供电的系统中显得十分重要。 MICroChip公司PIC系列的单片机为设计高性能、低功耗的单片机系统提供了很好的解决方案。下面从低功耗设计方法及具体例子来介绍PIC单片机低功耗应用。 1 低功耗设计方法 为使系统工作在低功耗状态,必须正确设置单片机的配置及工作方式。下面结合最常用的PIC12、PIC16等单片机介绍低功耗系统的设计方法
[单片机]
PIC单片机<font color='red'>低功耗</font><font color='red'>电路</font>的设计方法介绍
电子知识大全:树电运行低功耗电路
    美国华盛顿大学的一组研究人员成功地演示了树木产生的电力足以独立地维持定制电路的运转。这个研究小组并不指望使用树电替代太阳能,但这套系统可以为那些可能被用于检测环境条件或森林火灾的树木传感器提供一种低成本的选择。     通过将钉子挂到各种树上并连接至电压表,研究人员发现大叶枫树(校园里常见的一种树)会产生稳定的电压,高达数百毫伏。下一步就是设计一种可以在这种功率下运行的电路。这将需要开发一种升压转换器来接收低输入电压并将其存储起来以产生更高的输出电压,它需要适用于低至20mV的输入电压,这个输入电压要比任何现有的同类器件都低。这种器件将输出1.1V的电压,足以运行小功率传感器。     这种电路使用130nm的部
[模拟电子]
低功耗电子电路系统设计原则
以手机为代表的电池供电电路的兴起,为便携式仪表开创了一个新的纪元。超低功耗电路系统(包括超低功耗的电源、单片机、放大器、液晶显示屏等)已经对电路设计人员形成了极大的诱惑。毫无疑问,超低功耗电路设计已经对低功耗电路提出了挑战,并将扩展成为电子电路中的一个重要应用领域。 虽然超低功耗设计仍然是在CMOS集成电路(IC)基础上发展起来的,但是因为用户众多,数千种专用或通用超低功耗IC不断涌现,使设计人员不再在传统的CMOS型IC上下功夫,转而选择新型超低功耗IC,致使近年来产生了多种超低功耗仪表。电池供电的水表、暖气表和煤气表近几年能够发展起来就是一个证明。目前,电池供电的单片机则是超低功耗IC的代表。 本文将对超低功耗电路设
[电源管理]
耗电流只有30UA的越低功耗基准电压发生电路
耗电流只有30UA的越低功耗基准电压发生电路 电路的功能 采用普通齐纳二极管或温度补偿式齐纳二极管制作基准电压发生电路。消耗电流达10MA。对于电池驱动的电子仪器来说,如果因消耗电流大,电源耗电占全部比重过大就很不合算,所以需要驱动电流小,稳定度好的电路。本电路由可在小偏流下工作的带隙基准二极管和低电流OP放大器组合而成,消耗电流只有30UA。 电路工作原理 LM385-2.5是最小偏流为20UA的基准电压发生器,端电压为2.5V±3%,温度系数为20PPM/℃,性能良好。 本电路中OP放大器仅作为同相放大器用,要使输出电压为+10V,电压放大倍数必须为4倍并且R3=R2(A-1),反
[电源管理]
耗电流只有30UA的越<font color='red'>低功耗</font>基准电压发生<font color='red'>电路</font>
基于GP21+EFM32的超低功耗超声波热量表电路模块设计
  基于32位Cortex-M3内核的超低功耗微控制器EFM32与ACAM公司的高集成度TDC-GP21芯片推出的超声波热量表方案,能够充分发挥EFM32的超低功耗与高运算能力的特点及GP21高精度的测量能力,它将成为超声波热量表方案中的最优之选。    主控及显示部分   超声波主控MCU采用EFM32TG840F32,它是基于ARM公司的32位Cortex-M3内核设计而来,对比于传统的8位、16位单片机,它具有更高的运算和数据处理能力,更高的代码密度,更低的功耗。实际数据显示,EFM32TG840在执行32位乘法运算仅需4个内核时钟周期,32 位除法运算仅需8个内核时钟周期,而相应热表上运用的16位单片机却分别需要50和4
[电源管理]
基于GP21+EFM32的超<font color='red'>低功耗</font>超声波热量表<font color='red'>电路</font>模块设计
鲁棒、低功耗的电池监控电路前端
电路功能与优势 图1所示电路为鲁棒的电池监控前端,专为可能发生瞬变的环境而设计,例如工业或过程自动化环境。该电路使用 ADG5408 4通道CMOS多路复用器,后接AD8226 仪表放大器,以低功耗和低成本精确监控各电池的电压,且无需额外的外部瞬变保护电路。 瞬变过压条件可造成传统CMOS开关发生闩锁。通过结隔离技术,PMOS和NMOS晶体管的N和P井形成寄生硅控整流器(SCR)电路。过压条件触发此SCR,导致电流被显著放大,进而引起闩锁。闩锁是一种在关闭电源之前会持续存在的不良高电流状态,它可能导致器件故障。 如果输入或输出引脚电压之一超过供电轨一个二极管压降以上,或者电源时序控制不当,则可发生闩锁。如果通道上出现故障,且信号
[电源管理]
鲁棒、<font color='red'>低功耗</font>的电池监控<font color='red'>电路</font>前端
便携式产品低功耗电路设计的综合考虑
    集成电路和计算机系统的发展对低功耗的要求越来越高。本文探讨了低功率电路和系统的发展趋势,分析了功耗产生的主要原因以及与成本的关系,并提出了几种实现低功率的方案。      如今,集成电路和计算机系统正变得越来越复杂。为了适应这一变化,设计师需要在主要设计参数表中考虑功耗的要求。低功率逻辑电路的标准被定义为每一级门电路功耗小于1.3uW/MHz,而在模拟电路中被定义为小于5mW。最终用户认为,低功率系统应该满足低功耗的要求。     对于总体系统设计来说,功耗在设计中的地位已变得越来越重要,这是电子工业发展的必然趋势。电子工业发展总的趋势是提供更小、更轻和功能更强大的最终产品。目前许多产品领域中还出现了无线和便携式的
[嵌入式]
锂离子电池用保护电路低功耗设计
90 年代出现的锂电池是能源技术领域的一个重要的里程碑。和其它二次电池相比, 锂电池具有更高的体积密度和能量密度, 因此在移动电话、个人数字助理(Personal Digital Assistan t, PDA )、计算机等手提式电子设备中获得了极为广泛的应用。 一方面, 以锂电池为供电电源的电路设计中, 要求将越来越复杂的混合信号系统集成到一个小面积芯片上, 这必然给数字、模拟电路提出了低压、低功耗问题。在功耗和功能的制约中, 如何取得最佳的设计方案也是当前功耗管理技术( PowerManagement, PM ) 的一个研究热点。 目前研究得较多的是系统级的动态功耗管理技术(Dynam ic PowerM anagemen
[电源管理]
锂离子电池用保护<font color='red'>电路</font>的<font color='red'>低功耗</font>设计
小广播
最新模拟电子文章
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved