处理器存储器子系统中的SoC功耗优化设计

发布者:李国永最新更新时间:2015-04-22 来源: eechina关键字:SoC  处理器  存储器  功耗  子系统 手机看文章 扫描二维码
随时随地手机看文章
在新的系统级芯片(SoC)设计中,尤其是对便携式设备而言,对整个系统功耗的优化正变得与性能和面积优化同样重要。有些EDA工具具有门控时钟、降压、降频和减少漏电电流等功能,有些芯片制造商能够提供低功耗库和工艺,所有这些工艺都非常费时;在最好情况下能够提供两倍的性能提升,因为这些提升是在设计周期的后端进行的。  

功耗优化的最佳时间是在设计周期的一开始进行,即在确定体系结构的系统级进行优化。确定系统级体系结构对功耗影响非常大,如局部存储器和高速缓存的数量和容量。在设计周期的一开始进行优化可以减少功耗十倍以上。  

Tensilica公司的Xenergy是业界第一个用于评估功耗对整个处理器子系统(处理器、高速缓存和局部存储器)影响的软件工具,该工具基于在子系统上实际执行应用程序代码。这种在设计周期的一开始就进行功耗估计的方法只需要几分钟时间,而那种基于RTL的功耗分析方法则需要几个小时甚至几天。SoC体系结构设计人员可以使用这些数据对软件程序和Tensilica的Xtensa处理器进行功耗优化。对Tensilica公司的钻石标准处理器用户而言,该工具有助于软件优化,但钻石标准处理器不能改变。  

处理器和存储器功耗优化  

Xenergy工具包括一个二进制代码软件及相关信息,前者表示目标处理器,后者表示制造工艺及工作条件。Xenergy工具使用Tensilica的指令集仿真器ISS来执行二进制代码软件,其输出是一个处理器核及存储器功耗和能量报告,包括动态功耗、漏电功耗、全部功耗以及处理器核与紧密耦合的本地存储器功耗。设计人员可以修改程序软件或者Xtensa配置硬件来优化处理器功耗分布,并重新运行Xenergy工具。整个流程如图1所示。  

设计人员可以使用Xenergy工具来执行两项基本任务。一是通过修改应用程序软件来减少存储器访问次数,进而减少处理器和存储器功耗;二是可以调整Xtensa可配置处理器及其相关存储器,这通过选择不同的配置选项,增加指令扩展、寄存器文件、新执行部件,并改变本地存储器和高速缓存的数量和容量。  

考虑的焦点是整个系统的能量消耗,在有些情况下具有一定的欺骗性。整个系统的功耗是功耗系数(mW/MHz)和执行一定负载所需要的时钟周期数(毫秒)的乘积。如果一条新指令加到Xtensa可配置处理器后,虽然增加了功耗系数,但却减少了整个时钟周期数。例如,功耗系数增加20%,但导致程序执行速度提高3倍。在这种情况下,整个系统功耗实际上降低了60%。  


图1:Xenergy能量估计软件能够对运行在Tensilica Xtensa可配置处理器或者钻石标准处理器上的应用程序进行功耗评估。  

工作原理  

针对各种处理器配置情况以及不同的制造工艺,Tensilica生成的访存(读和写)功耗统计模型和每条指令的功耗统计模型均经过详细的综合、RTL代码设计以及门级仿真。Xenergy工具使用这些模型,即使采用Tensilica指令扩展(TIE)语言编写的由设计人员定义的指令也不例外。  

Xenergy工具使用访存功耗统计模型和指令功耗统计模型,包括了用Tensilica指令扩展语言编写的由设计人员定义的扩展指令。针对各种处理器配置情况以及不同的制造工艺,这些统计模型的开发包括了详细的综合、RTL代码设计以及门级仿真。  [page]

Xenergy工具采用Tensilica的指令集仿真器ISS对应用程序进行仿真,仿真精度达到时钟周期。仿真后可以给出每条指令执行以及每次访存的综合统计信息。针对采用的处理器和存储器,Xenergy工具可以估计出相应的动态功耗、漏电功耗和全部功耗。  

存储器和应用程序代码效应  

有些TIE指令可以改善应用程序的性能,但极大地增加了访存次数,进而增加了系统功耗。而且,对高速缓存的更新(容量和关联度)有助于功耗优化。Xenergy程序能够帮助设计人员理解整个处理器的变化所造成的影响,这些变化是在处理器配置过程中随着存储器的不同所引起的。  

类似地,Xenergy工具能够帮助开发人员修改应用程序代码来减少处理器和存储器的能量消耗。例如,在应用程序中对数据结构进行重构能够降低访存次数。通过使用Tensilica的标准软件工具,开发人员可以发现应用程序的改善情况。通过使用Xenergy工具,开发人员能够发现通过修改程序代码来降低系统功耗。 

一个例子  

我们采用EEMBC(嵌入式微处理器典型程序联盟,参见网址www.eembc.org)中的RGB到YUV颜色转换典型程序来说明Xenergy工具是如果在实际应用程序中使用的。  

我们也可以采用Tensilica的XPRES(Xtensa处理器扩展综合)编译器,该编译器利用C或者C++编写的应用程序软件作为输入数据,并产生用TIE语言表示的处理器扩展。通过XPRES编译器可以为Xtensa处理器产生三种扩展指令集。  

1. 要求XPRES编译器产生TIE指令,完成指令操作融合,即将多个操作符融合成一个单一复杂操作。  

2. 然后,我们可以要求XPRES也产生SIMD(单指令多数据)功能部件(及相应的指令),进行向量操作,即对多个数据元素施加相同的操作符。  

3. 最后,我们要求XPRES编译器将Xtensa处理器扩展成一个VLIW(超长指令字)体系结构,并利用Tensilica的FLIX(定长指令扩展)技术。XPRES编译器利用VLIW指令构建多发射数据通路,VLIW指令可以包括多个操作。  



图2:对不同Xtensa处理器扩展后的性能、功耗和面积对应关系。  

三种Xtensa配置结果如图2所示。周期数与性能是等价的,这由在指令集仿真器ISS上执行的颜色转换应用程序来决定。门数可以由Tensilica的TIE编译器来估计得到。所有其它数据均由Xenergy工具来生成。  

图2表示由XPRES编译器生成的SIMD操作以及融合操作性能改善情况,大约是3.8倍,而门数为大约5倍。处理器和存储器功耗与性能的对应关系相当好。另外还表示了当XPRES编译器生成VLIW(FLIX)体系结构时,性能的改善情况是大约20%。然而,门数为两倍,且处理器功耗很差。  

因此,由于SIMD操作引起的性能改善将使得功耗降低,且由于芯片面积(门数)的增加使得系统功耗/能量增加。这是最好的优化情况。  

上述例子说明Xenergy评估工具是SoC设计人员在对性能、面积和功耗进行折衷时不可或缺的软件工具。  

本文小结  

Tensilica公司的Xenergy工具软件为SoC设计人员提前对运行在某些应用程序时的处理器和存储器子系统所消耗的总能量进行评估。设计人员能够马上看到Xtensa配置和TIE指令代码改变后的整个系统功耗情况。这对那些使用Xtensa处理器来代替RTL去设计SoC数据通路的设计人员尤为重要。通过使用定制TIE指令可以尽早评估系统的功耗情况,这有助于正确评估系统功耗、面积和性能。
关键字:SoC  处理器  存储器  功耗  子系统 引用地址:处理器存储器子系统中的SoC功耗优化设计

上一篇:应用RC低通滤波器扩展微处理器输出端口
下一篇:编程和可配置工具开始决定微控制器的选择

推荐阅读最新更新时间:2024-03-16 13:59

由MCU走向SoC,汽车芯片转战下一代ADAS和自动驾驶
定义一辆现代化汽车的不再只有外形、舒适度与行驶性能,还有汽车的智能化。从车载信息娱乐系统(IVI)到ADAS,这些都离不开车载芯片的功劳。过去汽车内部的控制系统相互孤立,如今在各大系统逐渐整合的趋势下,汽车芯片也慢慢由 MCU 转向SoC。 据统计机构的研究报告指出,2018年全球汽车SoC的总市值达129.315亿美元,预计在2019到2028年的周期内,其市值还将以8%的年复合增长率大幅上升。其中以增强型IVI的需求仍在不断增长,而终端用户中,对驾驶辅助以及安全意识的提高,将成为ADAS应用SoC增长的关键要素之一。出于同样的原因,专注于消费芯片的厂商,也开始在汽车芯片领域布局。 由于疫情影响了一定的汽车出货量,但从已经回
[汽车电子]
由MCU走向<font color='red'>SoC</font>,汽车芯片转战下一代ADAS和自动驾驶
Nut寻物防丢器使用 Nordic SoC 通过 Apple Find My 应用程序进行低功耗蓝牙定位
Nut寻物防丢器使用 Nordic SoC 通过 Apple Find My 应用程序进行低功耗蓝牙定位 Nutale Air Tag-F11X防丢器使用 nRF52832 SoC 帮助用户定位贵重物品,成为 Apple Find My 网络的一部分 挪威奥斯陆 – 2022年6月28日 –– 中国科技品牌 Nut 成功开发轻巧的全新寻物防丢器“Nutale Air Tag-F11X”以帮助用户寻找丢失的贵重物品。 这款产品专门与全球数亿台 Apple 设备组成的Apple Find My™网络配合使用 。用户将支持 Find My功能的Nutale Air Tag-F11X 贴附到钥匙、背包、钱包或钱夹等个人物品上
[网络通信]
Nut寻物防丢器使用 Nordic <font color='red'>SoC</font> 通过 Apple Find My 应用程序进行低<font color='red'>功耗</font>蓝牙定位
储存就是存储器?你可能真的想错了
  目前最广泛使用的数字储存装置是硬盘( HDD ),但它受欢迎的程度正迅速下滑…下面就随嵌入式小编一起来了解一下相关内容吧。   数字数据储存正历经强大的成长态势,2016年即已增加到超过10,000艾位元组(Exabyte;EB)或10皆位元组(Zettabyte;ZB)的电子数据。   值得一提的是,在位元的次方单位表中,目前只剩下“佑位元组”(Yottabyte;YB)了。Yotta,是在1991年第19届国际度量衡大会(General Conference on Weights and Measures)决议使用的字首,以免我们很快就用尽了所有的十进位字首。   这个专栏将讨论数据储存技术的发展,并介绍两种主要的现有和
[嵌入式]
让低功耗 MSP430 的功耗更低 — 第 2 部分
在上周的《让低功耗 MSP430 的功耗更低》一文中,我们探讨了特别有趣的 MSP430 属性:尽管 MSP430 的电源电压范围很宽(1.8 至 3.6V),但功耗会随提供给 MCU 的特定电压变化而变化。换句话说,电源电压从 1.8V 提高到 3.6V 会明显增大电池的流耗。这是我们想要尽量避免的,因为这样只会导致电池电量更快耗尽,最终给这部分用户带来困扰。 这就是稳压器能帮上忙的地方。我们正在通过降低电源电压有效限制流耗。 然而,在选择稳压器时有几个应该重视的注意事项。首先,一定要知道何时使用 LDO,何时使用 DC/DC 转换器。尽管 DC/DC 转换器的高效率特性很有吸引力,但考虑应用的占空比或您希望 MSP43
[单片机]
让低<font color='red'>功耗</font> MSP430 的<font color='red'>功耗</font>更低 — 第 2 部分
Picocom采用Andes RISC-V内核设计O-RAN SoC
Picocom已为其即将面世的5G小型蜂窝分布式单元(DU)片上系统(SoC)选择了AndesCore N25F RISC-V 32位内核。 Picocom是一家5G O-RAN基带半导体公司,在小型蜂窝领域拥有丰富经验。 Andes(晶心科技)是高性能,低功耗紧凑型32/64位RISC-V CPU内核的领先供应商,并且是RISC-V联盟的创始会员。 Picocom倡导“开放式RAN”(5G无线电接入网络(RAN)),这将开放供应链,使新供应商能够进入市场并参与竞争。 借助Andes高效能内核,Picocom的DU offload SoC将提供所需的灵活性,效率和性能,以应对5G小型蜂窝带来的挑战。 “Ande
[网络通信]
快速学Arm(42)--外部存储器控制器(3)
我们看一个EMC的时序设置的例子: EMCStaticConfig0=0x0; //禁止页模式 EMCStaticWaitWen0=0x0; //写使能延时为1cclk EMCStaticWaitWr0=0x1F; //延时33cclk写 EMCStaticWaitOen0=0x0; //输出使能延时为1cclk EMCStaticWaitRd0=0x1F; //延时为33cclk读 EMCStaticWaitPage0=0x0; //页读模式延时为1cclk EMCStaticWaitTurn0=0x0; //总线空闲为1cclk 我并没有去仔细的查手册来看每一个寄
[单片机]
英特尔八代奔腾处理器曝光:3.9GHz主频!
自锐龙处理器发布后,四核心处理器已沦为入门级产品,六核心成为主流,而八核心的设计则重新定义了高端处理器。目前,距8代酷睿i7-8700K发布已近半年,如今仍迟迟未见到八代中低端产品的身影。 2018年1月25日,外媒获得一份关于英特尔八代中低端处理器的规格信息,信息表明将会有2款赛扬、3款奔腾以及3款酷睿处理器。 2款赛扬处理器仍为双核双线程设计,其中赛扬G4900的主频为3.1GHz,售价为64美元(约合人民币409元)。 而性能更高的奔腾G5600则延续了此前神U奔腾G4560的双核心四线程设计,不同的是奔腾G5600拥有更高的主频(3.9GHz),售价142美元(约合人民币908元)。
[嵌入式]
英特尔已经被迫提高凌动处理器产量
  5月3日消息,Diamondville凌动处理器的需求远远超过了预期,英特尔已经被迫提高了这款处理器的产量。   据国外媒体报道称,英特尔的一名发言人考尔德表示,英特尔要到6月份才会正式发布Diamondville处理器,但它的需求非常强劲。他说,多家PC厂商计划在6月份公布开发基于Diamondville处理器产品的计划,许多在6月份公布的产品将于第三、四季度上市销售。   考尔德在接受媒体采访时说,我们已经预期到需求会增长,并已经提高了产量。但Diamondville的需求超过了预期,我们正在调整生产计划,增加产量。无论是现在,还是将来我们都能够满足预期的需求。   加百利咨询顾问集团的分析师奥尔兹表示,Diamon
[焦点新闻]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved