基于自适应DVFS的SoC低功耗技术研究-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

从当前嵌入式消费电子产品来看，媒体处理与无线通信、3D游戏逐渐融合，其强大的功能带来了芯片处理能力的增加，在复杂的移动应用环境中，功耗正在大幅度增加。比如手机，用户往往希望待机时间、听音乐时间，以及看MPEG4时间能更长。在这样的背景下，如何降低嵌入式芯片的功耗已迫在眉睫。

1 低功耗技术分析

　　表1给出低功耗技术分析表。由表1可见，随着沟道宽度的减少，单位面积上的动态功耗和静态功耗都在不断增加。

这样芯片功耗则可描述为：

式中：CeffVdd2fclock是动态功耗部分。其中a为当前频率下的翻转率；Ceff为节点负载电容；Vdd为工作电压；fclock为工作频率。IleakVd是静态功耗部分，其中Ileak为漏电流。由式(1)可知，降低芯片功耗所需要降低的参数。

1．1 降低动态功耗的手段

1．1．1 降低α

降低α有两种方法：一是通过工具优化逻辑结构来降低α；二是通过编码方式来实现低的α，例如采用翻转码。实际上假设每一次翻转都是有效和最优的，则afclock可视为一常数，但真实情况并非如此，每次时钟驱动下的设计往往存在冗余，同时对于某种额定的上层任务本身，也可能不适合软硬件划分。对于fclock，若不使用该模块时，可直接gated该模块。这种gated有三种手段：

(1)在时钟产生端进行gated，由软件配置。该手段要求在前端设计这样的功能，包括正向时钟gated和反相时钟gated，其结构是对称的。实际上设计时，器件lib会提供标准的gated单元，这使得前端设计变得较为容易。

(2)在模块中进行硬件判断，以gated clock时钟。例如，在AHB总线上有一块memory，作为AHB从动装置。由于软件频繁访问该模块，因此若采用软件频繁gated，则导致操作不连续；若将模块设计在内部，则因AHB的HSEL信号变高，下一拍时钟在模块内部被打开，这样即可节省时钟翻转的功耗。尤其对于memory来说，时钟翻转和不翻转的功耗差别较大。

(3)利用综合工具在近端加gated，而无需在前端设计。

理论上，单纯的频率下降，并不能带来功耗的变化，因为工作量一定，频率的下降只能带来运行时间的增加，但是芯片功耗中，时钟树的功耗几乎占去30％，所以在合适降低频率时，会减少时钟树上的功耗。

1．1．2 降低Ceff

Ceff的降低因工艺选择的不同而存在较大的差别。因此，选择合适的工艺更有利于降低Vdd这样可使功耗得到平方关系的下降。然而，基于成本、可靠性及商务等考虑，只能选择某一种工艺，如130 nm工艺，可通过DVFS来改变电压。它的核心是：(1)某种工艺下的library可以在一定电压范围内工作正常。

(2)由于模块或系统工作在不同任务下所需的工作频率不同，因此可以计算DVFS的收益。假设一个系统可以进行MP3或MP4的解码任务，这样在MP3解码时，所需频率只有100 MHz；在MP4解码时，所需频率是200 MHz。通过STA分析，在1．1 V电压下工作时，系统可运行频率为100 MHz；在1．3 V电压下工作时，系统可运行频率为200 MHz，这样便可采用DVFS技术调节。假设翻转率、电容都没有发生变化，则在两种不同工作模式下，所需功耗下降64％。当然，前面的数值都是假设的，实际情况并非这么理想。

1．2 降低静态功耗的手段

降低静态功耗可采用Multi-Vdd，Multi-Vth两种方法，在此不做详述。

2 DVFS系统

如果DVFS是基于CPU自身OS调度的需求，则在自身频率需要变化时才进行电压变化，此时可认为是一个开环的DVFS技术。比如说，Windows Mobile中的OEMidle进程就提供了一个根据CPU占用率来调节CPU频率和电压的方式。但是，在采用开环方式调节时，需要足够的余量，同时需要软件，尤其是操作系统予以支持，这对软件来说也不是透明的。

对于一个闭环系统，则需要一个性能monitotor，以监控性能，并根据性能变化，直接调节电压和频率。图1给出一个简单的自适应DVFS系统。

在该系统中，CPU是一个电压可变的Power do-main，称为CPU-subsys。然而，对于其他模块，则是另一个power domain，称为peri_subsys，其中包括外部memory接口(EMI)、媒体协处理器(MCP)、LCD控制器(LCDC)，以及与电压控制相关的PeRFormaneeMonitor(PM)模块，用于对芯片性能进行正向监控；．Power Controller(PC)模块用于在接受到PM的性能描述后计算得到控制参数，并传递给Power Supply(PS)模块，用于提供可变的电压Vdd_arm，同时armsubsys与peri subsys之间有Level shifter相隔。

对于PM模块，ARM可以通过总线进行配置，PM通过监测可变电压区的电流实现性能监控。对于处理MIPS需求比较高的操作，CPU空转时间变少，电流需求变小；对于处理MIPS要求比较低的操作，CPU执行密集操作，电流需求变大。 [page]

该设计核心在于如何使PM模块能根据某种算法来自适应地预测电流的需求，而且预测的响应时间、额外功耗都比较小，即达到适时、恰好的电压要求。对于自适应算法，可选取图2所示的简单前向线性预测。

3 仿真实验与结果

图3给出系统模型。构造这样一个系统，使得测试将按事先在开发板上的运行给定benchmark程序。测试得到的功耗参数，则按CPU负载折算成为归一的nop和mac两种类型指令程序，这两种指令在测试向量中间或分布。CPU行为模型执行相关程序，该模型只能取指令，执行2级流水。对于nop操作，在执行阶段进行nop；对于mac：操作，在执行阶段对固定数据进行mac，这样即可简化设计。CPU BM采用Verilog进行编写。CPU有一条AHB总线，对memory进行访问控制。MEM模块采用ahb接口，存放编译好的二进制指令，并固定频率。PM Model对CPU BM的翻转率进行monitotor在监控各阶段的翻转率后，作为输入流入自适应滤波器，计算得到所需的调节电压，给PS Model；同时输出翻转率，给PC Model。

PC Model将翻转率、时钟、电压作为输入，用于计算系统功耗。PS Model按照PM发出的电压调节指令进行电压频率调节。由于是rtl Model，所以电压调节是不可见的，只是按照实际情况，若电压从低到高，则先调节电压，再调节频率；反之亦反。

对于自适应选取的电压，可按图4予以实现。表2给出按照130 nm工艺实现电压时，CPU与总线频率的关系。在调节电压时，时钟被停顿若干时钟周期。假设电源网络的RC参数不变，则认为电压切换与切换电压差成正比，如图4所示。

对于前向预测的步长，按照实时操作系统的节拍，从1～50 ms进行调节。通过实践，可得图5所示不同步长下的不同功耗数值，同时每次切换的额外开销也计算在内。

由图5可见，对功耗、效率与调节步长都有一定的关系，合理选取调节步长后，可得效率与功耗的均衡。采用步长为25 ms时，功耗不到DVFS的25％，而效率损失只有1／3。由此可见，在CPU资源总负荷利用率为30％时，该步长相对较为合理。

4 结语

提供了一种自适应动态电压频率调节方式，构造了与之对应的系统模型。在计算机上对该模型进行了模拟实验，得到一组均衡的前向预测参数。实验结果验证了自适应动态电压频率调节方式的有效性，给出了评估动态电压频率调节仿真的有效途径。

关键字：自适应DVFS CPU SoC 低功耗技术引用地址：基于自适应DVFS的SoC低功耗技术研究

上一篇：嵌入式应用对微处理器的需求
下一篇：浅析嵌入式DVR在金融监控中的设计思路

推荐阅读最新更新时间：2024-03-16 13:42

基于嵌入式无线CPU短信通信终端系统的设计

　　1. 引言　　当前单片机和PC 机通过串行接口构成的多微机系统已经广泛应用于工业控制、环境监测等场合,这些系统大多采用RS - 232、RS - 485 或是有线modem的通信方式, 虽然很经济适用, 但是有线数据传输方式很大程度上限制了其使用的场合, 使得架设通信线路比较困难的地区无法应用。针对这种情况, 本文利用支持语音、短消息SMS ( ShortM es.sage Service)、数据通信、传真等业务的嵌入式无线CPU, 结合已有的单片机系统通过RS- 232接口连接嵌入式无线CPU, 从而利用GSM网络实现数据的无线传输。嵌入式无线CPU 在短信息方面的应用具有永远在线、不需拨号、价格便宜、覆盖范围广等特点

[嵌入式]

展锐重磅发布首款人工智能LTE SoC SC9863

集微网消息，2018年5月17日，紫光集团旗下紫光展锐宣布推出其首款支持人工智能应用的8核LTE SoC芯片平台——紫光展锐SC9863，该平台采用高性能的8核1.6GHz Arm Cortex-A55处理器架构，是一款高集成度的LTE芯片解决方案。紫光集团全球执行副总裁、紫光展锐首席执行官曾学忠先生表示：“紫光展锐SC9863芯片平台的推出，将帮助主流机型具备稳定丰富的AI功能，让全球普通用户也可以享受AI带来的创新科技及智慧交互体验。” AI能力 SC9863为紫光展锐首款采用Arm最新Cortex-A55处理器架构的SoC芯片平台，在Cortex-A55人工智能的基础上，进行了应用开发。 Cortex-A75与Cortex-

[手机便携]

打造可灵活配置的辅助驾驶和智能驾舱SoC平台

近日，由谈思实验室Taas Labs主办的AutoAI 2021第四届无人驾驶及智能驾舱中国峰会在上海召开。来自全球范围内的整车厂商、一二级供应商、电子电器供应商、自动驾驶汽车开发商、车载软件和网关、汽车以太网方案商、半导体设计公司等众多领域的400多位行业人士一起就全球自动驾驶、智能座舱、汽车以太网技术市场现状及未来发展趋势、技术难点和挑战进行了探讨。 Socionext汽车市场部总监陈博宇受邀出席本次大会，在【自动驾驶发展趋势与核心技术创新】分论坛上发表题为“可灵活配置的智能驾驶和智能驾舱的SoC平台”的主题演讲，并和与会嘉宾共同深入探讨汽车智能驾驶和智能驾舱发展新趋势。图：Socionext汽车电子市场部总监陈

[汽车电子]

打造可灵活配置的辅助驾驶和智能驾舱<font color='red'>SoC</font>平台

官方详解为何SoC是手机芯片中最贵的

集微网5月24日消息，小米集团合伙人、中国区&国际部总裁、Redmi品牌总经理卢伟冰即将在5月26日的Redmi Note10系列发布会上谈全球缺芯的问题，在此之前，Redmi官方就科普手机芯片方面的知识。官方称手机中常见的芯片包括SoC移动处理平台、DDIC显示驱动芯片、ISP图像处理芯片、PMIC电源管理、电荷泵芯片、基带芯片、射频芯片、Wi-Fi芯片、蓝牙芯片、NFC芯片、音频芯片等等。其中SoC就是大家比较熟知的处理器，内部是极其复杂的，并且精密度极高，主要包含负责基础运算的CPU、负责图形渲染的GPU、负责AI运算的NPU/APU、存储控制器等。现阶段SoC内部往往还集成了负责图像处理的ISP、负责移动通讯的Mo

[手机便携]

苹果的A14和A15仿生, 苹果改变游戏规则的SoC解决方案

法国里昂讯 - December 16, 2021 | System Plus Consulting 的技术和成本分析师 Ying-Wu Liu 表示：“苹果的A14仿生系统, 完全致力于iPhone12系列和iPad,于2020年问世,这是一个正确的时机”. “苹果公司的A15仿生产品紧随其后, 为iPhone13和 iPad Mini系列提供了多种优势,” Ying-Wu Liu 补充道. 苹果的 SoCs 一直处于性能和工艺技术的领先地位.A14和A15也不例外.苹果公司的A15仿生芯片在智能手机处理器行业成为性能领导者,预计将为芯片设计师带来350亿美元的收入. System Plus Consulting 和

[手机便携]

官方详解为何SoC是手机芯片中最贵的

集微网5月24日消息，小米集团合伙人、中国区&国际部总裁、Redmi品牌总经理卢伟冰即将在5月26日的Redmi Note10系列发布会上谈全球缺芯的问题，在此之前，Redmi官方就科普手机芯片方面的知识。图片来源：微博官方称手机中常见的芯片包括SoC移动处理平台、DDIC显示驱动芯片、ISP图像处理芯片、PMIC电源管理、电荷泵芯片、基带芯片、射频芯片、Wi-Fi芯片、蓝牙芯片、NFC芯片、音频芯片等等。其中SoC就是大家比较熟知的处理器，内部是极其复杂的，并且精密度极高，主要包含负责基础运算的CPU、负责图形渲染的GPU、负责AI运算的NPU/APU、存储控制器等。现阶段SoC内部往往还集成了负责图像处理的ISP、

[手机便携]

官方详解为何<font color='red'>SoC</font>是手机芯片中最贵的

采用统一功率格式的SoC的低功耗设计方案

　　为了帮助日益壮大的设计队伍，EDA行业必须为设计人员提供能够使整个流程顺利执行的自动化解决方案。这些解决方案必须对功率进行优化，同时满足所有其它的设计和市场要求，包括速度、成本和IC制造良率。　　功率问题概况　　通过在系统级进行权衡取舍，作出相关决策，可以最大限度地降低消费设备的功率和能耗。有关系统划分 (亦即确定哪一种功能性由硬件还是软件来实现)、元件及IP选择的决策，对降低功率和系统性能及功能性的影响最大。　　例如。在一个基于硬盘的MP3播放器中，对功率管理而言，关键的架构性特征之一是软件控制数据缓冲系统，其允许硬盘每次提供相当于长度几分钟的音乐，然后停止旋转，等待下一次的音乐。尽管现在许多移动电话都已在架

[嵌入式]

采用统一功率格式的<font color='red'>SoC</font>的<font color='red'>低功耗</font>设计方案

最新 A5 芯片设计曝光只有一颗 CPU 核心

过去几天，最新Apple TV中使用的尺寸更小A5芯片一直是讨论的焦点，很多人都想弄明白Apple为什么要将A5芯片的尺寸缩减至一半。昨天Chiworks的专家称新A5芯片仍然来自三星，使用32纳米工艺，不过Apple可能采用了全新的设计。现在Chipworks公布了A5的最新图片，展示了小尺寸A5芯片实际上只包含了一颗ARM CPU核心。去年第三代Apple TV发布，Apple就将其列为单核A5设备。不过之前的老款A5芯片只是将其中的一个CPU核心遮蔽，而新设计只包含一颗CPU核心。当然，与上代A5芯片相同，新A5仍然拥有双核GPU。 Chipworks公司Dick James表

[手机便携]