Linux下ColdFire片内SRAM的应用程序优化设计

发布者:大泉人家最新更新时间:2010-02-08 来源: 单片机与嵌入式系统应用关键字:片内SRAM  ColdFire5329  优化  μClinux-2.6 手机看文章 扫描二维码
随时随地手机看文章

  本文以MP3解码器为例,介绍了一种在嵌入式Linux系统下配置使用处理器片内SRAM的应用方案,有效提高了代码的解码效率,降低了执行功耗。该方案不论在性能还是成本上都得到了很大改善。

  1 硬件平台和软件架构

  硬件平台采用Freescale公司的MCF5329EVB开发板。终端硬件包括ColdFire5329处理器、32 KB的片内SRAM、1 800×600矩阵LCD显示屏、9×3阵列矩阵键盘、I2S音频解码芯片、64 MB的SDRAM、10/100M以太网接口,以及3个UART接口。软件构架如图1所示,主要包括MP3解码器、音频驱动、键盘驱动和用户图形界面(GUI)等模块。采用μClinux作为操作系统。μClinux针对嵌入式应用的特点作了较大的简化和修改,支持多种文件系统和多任务处理,而且具有相对完整的网络体系协议,因而特别适合嵌入式应用。

  2 MP3解码算法分析

  本文选用MP3解码程序作为方案验证代码。MPEG-1/2 Audio Layer 3是专门针对音乐和语音数据设计的有损压缩算法。该算法的解码过程比较复杂,主要包括反向修正离散余弦变换(IMDCT)、逆量化、Huffman解码、子带综合等功能模块。读入一段MP3数据后,首先要检测数据流中的同步字,以确定一帧数据的开始;然后提取帧头信息,特别是解码所需要的一些参数,同时分离出帧边信息和主数据;之后对边信息数据解码得到Huffman解码信息和逆量化信息,再经过重新排序、立体声处理、反混叠处理、IMDCT变换和子带综合滤波器组后,就可以得到PCM输出。

  MP3解码流程如图2所示。大致分为两个阶段,即数据流控制阶段和数值计算阶段。数据流控制阶段包括帧同步、边带信息解码和Huffman解压缩等过程。其中,Huffman解压缩是对编码数据进行操作,其他过程则是对帧控制部分进行操作。

  3 基于片内SRAM的优化设计方案

  3.1 方案分析

  SRAM指令执行速度要比DRAM快得多。Cold-Fire5329处理器内部集成了32 KB的SRAM,本设计方案将充分利用处理器片内SRAM来对解码程序进行优化。首先对源代码中的主要解码函数进行分析,如表1所列。可以看到驱动写函数(write)、子带综合(MPEGSUB_synthesis)、反向修正离散余弦变换(imdct_I)和快速离散余弦变换(fast_dct)对处理器资源消耗较大,几乎占用80%的解码时间。根据分析结果,分别把音频驱动程序和上述解码函数放进SRAM中执行,以提高流媒体解码器的执行速度,降低其对处理器资源的消耗。

  3.2 配置音频驱动程序到片内SRAM中执行

  Linux操作系统把内核和运行在其上的应用程序分成两个管理层次,也就是常说的“内核态”和“用户态”。内核态具有较高的应用权限,可以控制处理器内存的映射和分配方式。音频驱动程序是系统内核的重要组成部分,工作在内核态,实现不断从用户空间解码文件中读取音频信息,以及驱动音频芯片播放声音等相关功能。通过修改μClinux-2.6内核代码,可以将音频驱动程序配置到片内SRAM中执行,主要通过修改系统链接文件来实现。系统链接文件用于将输入文件根据一定的规则合并成一个输出文件,并对符号与地址进行绑定。

  为了在修改内核代码的同时不影响系统其他文件的正常运行,要在内核链接脚本中添加新的段区定义(.sramcode),指定该段区链接加载地址为处理器片内SRAM,并在.sramcode段区内定义代码段(.sramtext)和数据段(.sramdata),分别用于存储驱动中的代码和数据。对齐方式采用ALIGN(4),因为对32位微处理器来说,该对齐方式将有效减少处理器执行周期,提高执行效率。然后,使用2个指针_lsramcode和_lsramcodeend分别指向,sramcode段区的段首和段尾,具体实现如下:

  完成对操作系统链接文件的修改之后,使用宏定义在音频驱动程序中把相关函数和数据分别指定链接到,sramcode代码段和数据段,并由copy函数把相关函数复制到SRAM中执行。编译、链接完成后,可以在系统内核存储映射文件Sys-tem.map中查看驱动函数和数据在内存中的地址。图3显示了音频驱动函数在处理器片内SRAM中的映射地址。

  3.3 配置实时数据和函数到片内SRAM中执行

  把用户空间的实时数据和函数放置到片内SRAM中执行,由于处理器可以直接从片内SRAM中存取数据和指令,减少了处理器存取数据和指令的周期,提高了程序的执行效率。首先,放置实时数据到处理器片内SRAM中。通过S_malloc和S_free函数来实现:S_malloc用来申请处理器内存空间,S_free用来对这一申请的空间进行释放。为了灵活使用定义的S_malloc和S_free函数,需要定义一个结构体和地址指针:

  然后,通过动态内存分配方式可以把MP3解码程序中的实时数据放入处理器内存中执行。加载函数到SRAM中与加载实时数据不同,需要通过指针和枚举变量来实现。首先通过一个宏定义设置每个函数大小为4 KB,并使用枚举变量为函数分配处理器片内SRAM执行的起始地址。

  SRAMFUNC2=SRAM_BIG_FUNC1+BIG_FUNC_SIZE,…};

  在定义完函数运行时加载的存储地址之后,把MP3解码程序中的MPEGSUB_synthesis和imdct_1等函数通过字符串拷贝的方式复制到处理器片内SRAM中执行,经过编译、链接这些函数在执行时将会加载到相应的SRAM单元块中。这样就减少了处理器执行解码函数所需的时间,提高了程序的执行效率。

  4 性能测试与分析

  为了验证基于处理器片内SRAM的优化设计方案,我们在MCF5329EVB开发板上对经该方案优化过的MP3解码器进行了验证和测试。

  首先,进行功能测试,应用MPEG组织推荐的测试码流(128 kb/s,44.1 kHz)。选用一段音频test.mp3,分别用标准浮点解码器和本文设计的音频解码器进行本地解码测试,并对其解码波形进行比较分析。从图4的波形比较可以看到,经过本方案优化设计的解码器解码波形与标准浮点解码器基本无差别。经人耳测试,无法辨别出两者解码输出的差别。所以,从功能上讲本文设计的基于片内SRAM的应用程序优化方案是可行的。

  其次,进行性能测试。在测试平台上分别对优化前后解码器的MIPS消耗数和空间消耗量进行比较分析,如表2所列。

  优化前,解码器MIPS消耗数为68 MIPS@240MHz;优化后,解码器MIPS消耗数为39.2 MIPS@240 MHz。在硬件条件允许的情况下,消耗的内存虽然有一定的增加,但是经过本文方案优化后,解码效率得到了很大的提高。

  结 语

  本文提出了在嵌入式Linux操作系统下基于处理器片内SRAM的应用程序优化设计方案。以MP3解码器为例,通过从配置音频驱动程序、实时数据和函数到处理器片内SRAM中执行来对解码器进行优化设计,并在ColdFire5329开发平台上成功实现该方案。优化后的MP3播放器不仅解码效率高,而且音质好,完全可以在中低端处理器上实现实时播放,使低性能CPU处理复杂应用程序成为可能。该方案有效地提高了应用程序的执行效率,降低了功耗,对嵌入式Linux应用产品开发有着重要参考价值。

关键字:片内SRAM  ColdFire5329  优化  μClinux-2.6 引用地址:Linux下ColdFire片内SRAM的应用程序优化设计

上一篇:风河嵌入式软件开发工具套件全面升级
下一篇:一种支持I/O的核外中断执行算法

推荐阅读最新更新时间:2024-05-02 21:00

MIPS科技优化Yahoo! TV Widgets
美普思科技公司(MIPS Technologies, Inc., 纳斯达克代码:MIPS)宣布,为 MIPS-Based™ 数字家庭设备集成优化的Yahoo!Widget引擎。MIPS科技将为运行Yahoo!Widget引擎的数字电视和机顶盒应用开发优化参考平台。利用该参考实现平台,MIPSTM 的授权厂商将能迅速开发出集成Yahoo!TV Widget的设备。通过专门针对电视观众需求创建的应用,Yahoo!TV Widgets可将备受欢迎的因特网服务和在线媒体提供给更多观众。 MIPS科技营销副总裁Art Swift表示:“这是我们承诺提供全面解决方案、优化参考平台以加速客户产品开发周期迈出的又一重要步骤。Yaho
[嵌入式]
谷歌展示Android Q折叠屏优化 可实现应用无缝过渡
在本届Google I/O大会上,谷歌介绍了新版Android Q操作系统对于折叠屏手机的支持。 Android Q利用了折叠屏的天然属性,可让多款应用同时在屏幕上运行,从而进一步强化了设备的多任务能力。此外,谷歌还加入了一项名为“屏幕连续性(Screen Continuity)”的新功能,可将用户在小屏上运行的应用无缝过渡到大屏上。 谷歌表示,今年将有多家厂商推出自己的折叠屏设备,而它们所运行的自然都是Android系统。
[家用电子]
谷歌展示Android Q折叠屏<font color='red'>优化</font> 可实现应用无缝过渡
IR 推出优化的600 V车用IGBT系列
全球功率半导体和管理方案领导厂商国际整流器公司 (International Rectifier,简称IR) 近日新推出600V车用IGBT系列,专门针对电动汽车和混合动力汽车中的变速电机控制和电源应用进行了优化。 新器件适用的电流范围很广,提供最小为 5μs的短路额定值、低Vce(on) 和正Vce(on)温度系数,适用于从电动空调到要求24A-160A高功率密度的主牵引逆变器的多种电机驱动系统。该系列其它的特点还包括方形反向偏压安全操作区 (SRBSOA) 、集成软恢复二极管和最高 175°C 结温。 IR 亚太区销售副总裁潘大伟表示:“IR全新600V车用IGBT系列具有低传导和开关损耗的特点,非常适合电动汽车和混合动力
[汽车电子]
车轮结构的拓扑优化方法
摘 要: 主要介绍利用HyperMesh_OpTIStruct模块对某乘用车车轮进行拓扑优化,以满足NVH性能要求。该方法以响应点的侧向动刚度及一阶模态为约束,以质量最小化为目标,对车轮进行拓扑优化分析;之后对优化前后的模型进行模态及动刚度计算,验证了优化方法的有效性。拓扑优化方法对车轮结构的局部微调有着重要意义,它可以帮助优化车轮减重窝的结构,建议在不大改造型的情况下使用。 0 引言 车轮是介于轮胎和车轴之间承受负荷的旋转组件,如图1所示,通常由两个主要部件轮辋和轮辐组成。轮辋是在车轮上安装和支撑轮胎的部件,轮辐是在车轮上介于车轴和轮辋之间的支撑部件。 在汽车路噪开发中,车轮是轮胎激励向整车传递的第一环节,车轮刚度越大,
[嵌入式]
车轮结构的拓扑<font color='red'>优化</font>方法
高通宣布与百度合作优化DuerOS人工智能系统
  据外媒12月7日报道,第二届 高通 骁龙技术峰会正在夏威夷举行,会议第二天,美国 高通 公司与百度共同宣布,双方将携手在骁龙移动平台,包括即将推出的骁龙845移动平台上,优化百度 DuerOS 在手机上的人工智能解决方案。下面就随网络通信小编一起来了解一下相关内容吧。   高通宣布与百度合作优化DuerOS人工智能系统    高通 公司可以帮助百度在Qualcomm Aqstic软硬件上优化 DuerOS 技术,提供运行于Qualcomm Aqstic音频编解码器上的始终在线、低功耗的语音激活功能,支持 DuerOS 的“小度”唤醒词、支持回声消除和噪音抑制功能,用户可以随时与搭载骁龙且支持DuerOS的终端沟通。  
[网络通信]
韩媒:三星优化Galaxy Fold 或于6月份在韩销售
尽管三星延迟发布Galaxy Fold,也一直在不断努力改进它。近期,韩媒详细报道了三星做出的努力。 三星解决了之前的两个最主要问题。一是杂物(如棉绒、灰尘、沙子等)能够藏在转轴下面并对设备造成损坏。二是人们能很轻易地撕掉显示器顶部的保护层,这也导致显示器很容易损坏。 三星将保护膜的下半部分安置在手机机身内,以解决第二个问题。所以现在即使用户想剥掉它,也没有那么简单。同时三星也将在适当的地方提醒用户,如果撕掉保护膜可能会导致这款1980美元的设备损坏。 至于转轴的情况,据报道,三星正在缩小转轴顶部和底部之间的间隙,以防止外来物质进入。当然,这无法确保Galaxy Fold不会积聚灰尘或棉绒,但至少能减少很
[手机便携]
串联LED照明电路保护的优化策略汇总
发光二极管( LED )是一种易碎的装置,容易受到热、机械冲击、静电放电及闪电的威胁,特别是在室外应用时。由于照明及背光显示的LED灯串使用的增加,需要研发工程师对LED串的可靠性给予更多关注。高亮度的LED,因其蓝宝石基板,对邻近的雷击闪电攻击造成的电压瞬变非常敏感。即使是在家庭应用,LED串仍需要静电放电(ESD)保护装置,以确保整个组件长期、可靠的运行。在缺少这种保护的条件下,如果串联中的一个LED出现故障,并断开电路,所有其他的LED灯将关闭。     LED照明 系统保护   很多的保护装置可以用于电源与 LED驱动 ,且有许多出版物可以对选择提供指导。图1中的电路是演示LED路灯照明系统中的开关电源保护的举例。在该电
[电源管理]
串联LED照明电路保护的<font color='red'>优化</font>策略汇总
AMD高级副总裁、大中华区总裁潘晓明:制程、架构、平台优化突破计算边界
IC Nansha特别报道 AMD高级副总裁、大中华区总裁潘晓明:制程、架构、平台优化突破计算边界 6月25日, 中国•南沙国际集成电路产业论坛 在广州南沙顺利举行。AMD高级副总裁、大中华区总裁潘晓明出席了本次会议,并在高峰论坛环节中以 《高性能计算的未来》 为主题发表了演讲。 (AMD高级副总裁、大中华区总裁 潘晓明) 作为一家深耕半导体领域的全球性公司,AMD在年初完成了对赛灵思具有转型意义的收购,扩展了领先的计算引擎产品组合,涵盖数据中心、嵌入式、客户端和游戏市场,这为AMD提供了重要机会。随着其高性能和自适应产品在 3000亿美元 多样化市场中占据更大份额,AMD有望实现收入持续强劲增长。将3000亿计
[半导体设计/制造]
AMD高级副总裁、大中华区总裁潘晓明:制程、架构、平台<font color='red'>优化</font>突破计算边界
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved