浅谈如何通过整合电源管理提升电信业务处理性能

最新更新时间:2013-09-21来源: 电子发烧友关键字:CPU  电源管理  嵌入式 手机看文章 扫描二维码
随时随地手机看文章

  对于嵌入式开发者来说,如何在低功耗和高性能之间取得平衡,是一项艰巨而持久的工作。而电源管理和工作负载整合两种技术的诞生,正是为了帮助供应商解决这些困难与挑战。

  通过基于策略性的电源管理和动态迁移来降低能耗

  根据国际能源机构(IEA)最新的报告数据来看,能源消耗正在稳步上升并且在未来的一段时间仍会持续增长。该报告还预估,到2015年,全球的能源消耗每年将以2.5%的速度增长,其中矿物能源消耗占据了主导地位。增长的部分主要来自于发展中国家生活方式的改变,而世界第一产业将持续为全球能源消耗的日益减少做出贡献。

  业界领先的电信运营商年报显示,电信业的能源消耗持续增加,并出现在一些国家能源消耗大户的名单上。因为这些运营商持续的引入复杂的信息和通信技术,导致外围硬件设备的需求数量剧增,因此对能源的需求也随之增加,进而导致二氧化碳排放量的增加,同时能耗的成 本也随之上升。但是运营商长期的财务压力,势必要求在降低能耗支出,同时满足企业的社会责任需求和/或符合相应的法律法规。但是数据处理以及传输速率的提高,需要更多的通信设备来支持,这反过来又扩大了电信业的总体功耗。

  为了获得可持续的发展,电信运营商及设备提供商开始逐渐意识到并加强电源管理技术的投入,通过重点开发能源效率计划,实现节能减排。部署于网络系统中的AdvancedTCA?(ATCA)机箱,在其整个生命周期中,大部分二氧化碳排放主要来自于机箱本身的性能需要以及冷却散热的需求。功耗则主要来自于运营阶段,在此阶段的二氧化碳排放量占整个产品生命周期总排放量的 80%左右。运营阶段中的三个层次(辅助设备、网络设备和能量转换)将消耗能量,同时也是可以管理的部分。通过对相关技术的掌握,我们可以实现能耗的管理。

  

  图1. 仅有36%的能量消耗来自于网络设备,如服务器、存储设备以及网络装置,其中大部分的能量直接转化为热能,大约只有2.4%的能量是有效输出。如今,供应商所提供的基于ATCA架构的网络设备都采用了提升能源效率的解决方案,可以大幅节约辅助设备及电源转换过程中的能耗。

  合理的设计对于散热管理非常重要,通过降低CPU的利用率,电源输出随之减少,进而降低机房内的散热需求。最终既降低了二氧化碳的排放,又减少了因散热产生的能源消耗成本。

  电源管理的理念和技术

  对于设备本身而言,也有一些设计理念可以用来帮助减少能耗。其中最为大家熟知的就是处理器级动态电源管理技术,这使得设备或系统可以被设置成不同的工作模式,如:性能/按需/节能/紧急。通过这项技术,可以对处理器进行动态电压调节和动态频率调节,从而进行有效的电源管理。通过动态电压调节和动态频率调节,处理器的核心电压、时钟频率或者两者都可以减小以降低能耗,同时还能满足系统的性能所需。功耗限制功能可以让系统或组件保持其能耗使用峰值在设定的数值范围内 (此数值通常根据实际的服务模式下的策略而定),如CPU使用率的原始数据、并发会话数量等等。

  ATCA机箱级的电源管理策略包含了用于负载整合的虚拟化动态迁移,此策略可以降低能耗和相关的成本/费用。服务器管理员可以借助动态迁移将一个正在运行的虚拟设备(VM)或应用在两个不同的物理设备间迁移,且不会断开与客户端的链接或应用。动态迁移最典型的一个应用就是云计算中的资源管理。电信运营商拥有的成千上万个虚拟设备(VM)都运行在其数据中心,为了节约能源和成本、负载均衡,这些电信运营商可以利用动态迁移对虚拟设备进行转移,而无需中断运行在这些虚拟设备中的客户应用程序。

  实时迁移的配置策略可以基于能耗感知的迁移模式和/或负载调度的模式而定,这取决于首要目的是节能还是优质的服务品质。实时迁移节能的关键是有效地对服务进行打包并提供给更少的物理服务器,物理服务器数量的减少意味着对电力能源的需求就会减少,所产生的热量也随之减少,从而实现节能的最终目的。

  虽然实时虚拟设备迁移具有诸多益处,如资源(CPU,内存等)的分配和能耗感知的整合,但是虚拟设备的迁移本身也需要消耗额外的能量。曾经有一篇关于虚拟设备实时迁移的性能和能量模式的文章,发表在第20届高性能分布式计算国际研讨会会议论文集上,该篇文章讲述了一个测试方法,用来测试实时迁移的功耗。结果显示,当部署了能耗感知以及服务器整合模型后,实时迁移所消耗的能量大幅减少。这种模式引导的决策,大幅减少了 72.9%的迁移成本,并且节能73.6%。

  配置和控制管理策略

  以电信行业为例,现今的ATCA机箱通常包括一组高品质的电源模块以及智能风扇系统,可以用来控制温度输出和功耗。我们使用一个典型的ATCA机箱来做相关的测试,通过自动调整策略(根据周围的温度来决定风扇的转速),风扇(整个机箱的1/8)的功耗可以减少40%。

  对于机箱剩余的7/8部分,可以通过嵌入式软件设置每个刀片上的CPU、内存以及其他设备的频率和工作模式,从而实现动态电源管理和/或功耗限定。通过智能固件和软件层面的控制部署电源管理策略,可以大幅减少能耗。

  从系统管理的角度来看,当系统的工作负载运行在满负荷水平之下时,就可以按既定策略实现动态电源管理。同时在峰值期间也可以使用动态电源管理以减少功耗。然而,当功耗(能量)节约模式启用时,处理器频率将降低,从而影响工作负载的性能和吞吐量。

  功耗限定功能可以通过显示器或制动器的内部或外部处理实现。制动器可以提升处理器的电压或提升处理器/内存的频率。制动器也可以“抑制”处理器,即通过注入死循环来延迟对指令的处理。当功耗限定达到时以及限定技术启用时,工作负载的性能可能会受到影响。  嵌入式电源管理软件

  电源管理软件的拓扑结构是由多个系统守护进程的组件构成,其中每个组件都会管理一个刀片,和一个客户端组件。

  

  图2:嵌入式电源管理的基本组件

  客户端代表电源管理系统搜集与电源有关的数据。系统守护进程是加载在每一个刀片上的应用,扮演者电源管理模块的角色。它提供了CPU、内存、硬盘、网络和虚拟化的工作方法以及功耗限定等功能,在满足性能需求的前提下尽量降低功耗。实际的管理端可以运行在台式机或者笔记本上,通过整合并显示输出机箱、板卡和传感器(如温度)等实际功耗的信息。

  

  图3:功耗限定功能实例

  主动电源管理

  通过策略的配置,将ATCA刀片上CPU的工作模式切换至节能或主动电源管理模式后,每个刀片的功耗相比持续运行在性能模式下减少15%(参见图4和图 5)。每片板卡在加载服务的情况下可以节约0.4KW的功耗(参见图5)。如果一个14槽的ATCA机框中使用了10个刀片,那每天节约的功耗大约 4KW。

  

  

  图4&5:CPU在三种独立模式下的功耗比较

  动态迁移

  减少功耗的另一个非常有效的方法就是只使用必要的设备来处理相关事件。利用Erlang概率分布算法(图表6)可以有效检测出使用率较低的时段。

  

  图6:Erlang概率分布算法在电信网络流量监测中的实例

  通过上面的图表我们可以了解到,1点至7点期间的CPU使用率最低,然而,即使运行在省电模式下,每片板卡仍然在消耗电能。在这种情况下,每片板卡在主动电源管理的策略下会消耗90W的功耗,峰值性能时会上升至140W。解决的办法就是利用实时迁移策略,用最少的CPU刀片在处理这些工作负载,同时将节能模式下的刀片切换到睡眠模式,这样相比主动电源管理的模式可以节约超过25%的功耗。  通过工作负载整合提升系统性能

  在工作负载和I/O处理方面,目前的市场和技术发展趋势比较倾向采用将传统的网络架构整合到一个通用平台或模块化的组件上来,以支持多网络设备和提供不同的服务功能,如应用处理、控制处理、包处理和信号处理功能等。处理器架构以及新的软件开发工具的功能提升,让开发人员可以很容易的将工作负载整合到统一的刀片架构中,这些负载包含了应用、控制以及包处理等。通过软硬件的整合,可以大幅度提升性能,并使得刀片式服务器架构在包处理解决方案中的应用大幅增加。

  为了说明工作负载整合的演变,我们设计了一系列的测试方法。这些测试方法是在单一平台中,通过将CPU制造商提供的DPDK整合到 ATCA处理器刀片上,以此验证处理器刀片提供的性能以及整合的IP转发服务。比较在没有使用Intel? DPDK做任何优化时,采用原生 Linux(Native Linux) IP转发时的第三层转发性能。然后,我们再分析采用Intel? DPDK技术之后所获得的IP转发性能提升的原因。

  数据平面开发套件

  DPDK(Data Plane Development Kit,数据平面开发套件)是一个专为x86架构处理器提供的轻量级运行环境。它提供了低功耗和Run-to-Completion(RTC,运行到完成)模式,以此最大限度的提升数据包的处理性能。而且DPDK还包含了优化的和高效的函数库,为用户提供丰富的选择,例如我们熟知的环境抽象层(EAL,Environment Abstraction Layer),它负责控制低级资源并提供优化的轮询模式驱动(PMD,Poll Mode Driver),以及更高级别应用的完整API接口,图7为软件层级结构图。

  

  图7: Linux应用环境下的EAL和GLIBC

  测试拓扑结构

  为了测量ATCA处理器刀片在第三层处理和转发IP包的速度,我们使用图8中所示的环境进行测试。

  

  图8:IP转发测试环境

  我们的测试使用了ATCA处理器刀片的2个10GbE外部接口和两个10GbE Fabric接口(总计40G),通过比较使用和未使用DPDK的结果,我们可以得出结论:在相同的硬件平台下,使用DPDK后的Linux仅用两个 CPU线程进行IP转发的性能,与原生 Linux(Native Linux)使用全部的CPU线程进行IP转发的性能相比,前者是后者的10倍。使用DPDK的平台,3层小数据包的转发线速可以达到》70%。 DPDK中优化过的软件堆栈可以实现10倍性能的提升。如果在一个基于IA架构的刀片的控制层和数据层配备DPDK,就可以减少一个40G的NPU刀片。通常一个40G的GPU刀片的功耗为180W,因此通过工作负载整合可以节省56%的能耗。

  从图9可以看出,搭配DPDK后的处理器刀片的IPv4转发性能,可以让客户以更好的性价比成本,将包处理应用从基于硬件的网络处理器移植到基于x86的计算平台,同时使用同一个平台来部署不同的服务,如程序处理、控制处理和包处理服务。更多关于我们的测试过程和结果,请登录凌华科技网站www.adlinktech.com查询凌华科技的技术白皮书:采用Intel? DPDK技术的凌华科技aTCA-6200刀片式服务器完美实现包转发服务性能的提升。

  

  图9:采用4个10GbE的IP转发性能比较

  结论

  目前有很多途径可以优化多板卡/多处理器系统的电源使用及效率。我们已经看到了使用嵌入式电源管理、整合嵌入式电源管理的动态迁移以及优化吞吐量的工作负载整合等方法的可能性。由于每个系统的配置和对工作负载的需求都不尽相同,因此没有一个绝对的解决办法。对于每一个方案,都需要仔细选择适合的技术和策略,以满足预期的吞吐量和功耗。

  在未来,随着每个系统的功耗密度(瓦/立方英寸)的持续增加,必然对散热和运营的花费造成一定的影响,因此电源管理对于电信运营商而言将仍旧是一个需要重视的问题。

关键字:CPU  电源管理  嵌入式 编辑:探路者 引用地址:浅谈如何通过整合电源管理提升电信业务处理性能

上一篇:DC-DC转换器的电磁兼容技术浅谈
下一篇:具扩展频谱频率调制和坚固短路保护的110V LED 控制器

推荐阅读最新更新时间:2023-10-12 22:26

WinCE在嵌入式工业控制系统中的应用思考
 1 嵌入式系统 嵌入式系统(Embedded System)是指有特定功能或用途的计算机硬、软件的集合体,分为嵌入式软件系统和嵌入式硬件系统。在智能控制设备、便携式智能仪器等应用场合,出于对产品体积、成本等诸因素的考虑,往往要求将智能控制部分安装于设备内部,且占用的空间尽可能小,在这种情况下,处理器没有一般意义的硬盘,只有有限容量的内存及常用的Flash电子盘,这样的系统称为嵌入式系统。嵌入式系统的操作系统和功能软件集成于计算机硬件系统之中,也就是软件与硬件的一体化。嵌入式系统目的性或针对性很强,具有软件代码小、高度自动化、响应速度快等特点,这也是与通用计算机系统的最主要区别。嵌入式技术与实时性有着必然的联系。 2
[嵌入式]
基于嵌入式实时操作系统的现场控制系统
1 引言   今天,随着控制、计算机、通讯、网络等技术的发展,信息交换领域正在迅速覆盖从工厂的现场设备层到控制、管理的各个层次。基于以太网的工业控制网络具有数据传输率高、可靠性好、易维护、可远程传输、互操作性好等优点。随着互联网技术的普及与推广,以及网络通信速率的提高、交换技术的发展,使得它受到了全球的拥护和软硬件支持,并得到了迅速发展和普及。本文设计和开发了具有工业以太网功能的现场控制设备。 2 嵌入式操作系统的选择   实时嵌入式操作系统的种类繁多,大体上可以分为两种:商用型和免费型的。商用型的实时操作系统功能稳定、可靠、有完善的技术支持和售后服务,但往往价格昂贵,如QNX和Windows CE等。免费型的实时操作
[嵌入式]
德思普将正式发布我国首款物联网嵌入式人工智能“中国芯
“2018物联网及嵌入式人工智能芯片平台及生态战略发布会”论坛将于2017年12月8日在北京北辰洲际酒店举行,是“2017年物联网开发者大会”的分论坛之一。 作为国内领先的物联网芯片平台提供商,德思普科技有限公司将在本次论坛上发布其最新推出的物联网嵌入式人工智能(AI)系列芯片产品,这也是该公司在业界率先推出的首款将广域物联网与边缘计算、嵌入式人工智能融于一体的单芯片平台方案,处于全球同行业的前沿水平。 据了解,德思普将在本次论坛上以“给物联网插上AI的翅膀”为主题,从智能物联网芯片的开发平台、生态建设、应用服务等角度,发布最新的低功耗软件定义无线电、智能物联网终端以及嵌入式人工智能三大类芯片平台。 目前,已有多家企业
[网络通信]
嵌入式设计必备ARM仿真器知识
一、嵌入式产品的开发周期 典型的 嵌入式 微控制器开发项目的第一个阶段是用C编译器从源程序生成目标代码,生成的目标代码将包括物理地址和一些调试信息。目前代码可以用软件模拟器、目标Monitor或在线仿真器来执行和调试。软件模拟器是在PC机或工作站平台上,以其CPU(如x86)及其系统资源来模拟目标CPU(如P51XA),并执行用户的目标代码;而目标Monitor则是将生成的目标代码下载到用户目标板的程序存储器中,并在下载的代码中增加一个Monitor任务软件,用来监视和控制用户目标代码的执行,用户通过目标板上的串行口或其它调试端口,利用桌面计算机来调试程序。 程序的调试是通过设置断点、使程序在指定的指令位置停止运行来
[电源管理]
魅族16X对比小米8青春版:其实差距不只在CPU
    9月19日是个热闹的日子,因为魅族和小米不约而同地选择在这一天发布各自旗下的中高端新机——魅族16 X和小米8青春版。历史上,这也不是魅族和小米第一次在同一天发布新品了,对飙意义非常明显。那我们顺应各位观众老爷的要求,来个魅族16 X大战小米8青春版吧。 魅族16 X的6+64GB版售价2098元,6+128GB版售价2398元;而小米8青春版6+64GB版的售价1699元,6+128GB版售价则是熟悉的1999元。 参数来看,处理器无疑是最吸睛的,魅族16 X搭载的是几乎是今年中高端机型标配的高通骁龙710,而小米8青春版搭载的是反复打磨了几百年的骁龙660。那除了处理器之外,两者在其他方面还有哪些差异呢?我们现在就
[手机便携]
基于APIC时钟的嵌入式Linux内核实时化研究
引言      嵌入式Linux是指对Linux进行剪裁后,将其固化在单片机或者存储器中,应用于特定场合的专用Linux系统。嵌入式系统要求实时性能高,但Linux为分时系统设计的操作系统,尽管最新的内核在实时性能方面有所提高,但它仍然不是一个实时系统,在很多场合不能满足实时性要求。一般地,通过改造Linux的内核以提高其实时性能有2种策略:一种是采用底层编程的方法对Linux内核进行修改(如调度算法、时钟修改等),典型的系统有Kansas大学开发的KURT。文献提出了抢占式内核调度算法,容易引起内核优先级翻转,文献针对非抢占式内核,增加抢占点,该方法需要优秀的调度算法。另一种途径是Linux的外部实时性扩展,在原有Linux基
[嵌入式]
一种通用的嵌入式系统ISP方法
摘要:针对没有集成ISP功能的MCU系统,提出了一种通用的嵌入式系统Flash在线编程(ISP)方案。该方案借用RAM作为ISP的程序存储器,可降低系统成本并具有较大的灵活性。以MC68332平台为例,详细介绍了这种ISP方案的具体实现过程。 关键词:嵌入式系统 Flash ISP MC68332 随着嵌入式系统技术的发展,电可擦除的Flash芯片以容量大、价格低、编程方便等优势得到了广泛的应用。由于同一片Flash作业程序存储器的系统无法直接实现在系统编程(ISP)。为了方便现场调试和程序升级,可以采用集成ISP功能较新的MCU(如AVR、部分ARM芯片等),或者采用双Flash设计等方法实现ISP功能。但有不少系统仍然使用
[单片机]
DSP器件为核心的嵌入式系统技术
    摘要: 以DSP为信心的嵌入式系统具有实时性、利于并行处理等优点,这也是嵌入式系统中的重要技术。本文在讨论嵌入系统基本技术特征的基础上,比较详尽地介绍了DSP嵌入式系统的基本结构和技术特征,并对应用特性进行了讨论。     关键词: 嵌入式系统 DSP 嵌入式系统的目的是提供一个以多任务和网络为信心,易于开发的复杂数字系统。从数字技术和信息技术的角度看,嵌入式系统已成为现代信息网络技术应用的基础技术,已成为现代工控领域的基本技术。 使用嵌入式系统技术,不仅可以实现硬件和软件的优化集成,更主要的是提供了使用“数字基因技术”的基本工具。从计算机和信息网络技术发展的角度看,嵌入式系统标志着网络化计算机
[应用]
小广播
最新电源管理文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved