基于矩阵乘法器的MP3音频解码系统的优化设计

发布者:心灵舞动最新更新时间:2018-02-19 来源: eefocus关键字:矩阵乘法器  MP3  音频解码 手机看文章 扫描二维码
随时随地手机看文章

0 引言

MP3(MPEG Audio Layer 3)是一种以高保真为前提实现的高效压缩技术。MP3音频编码器复杂,压缩率很高,但其音色和音质还可以保持基本完整,因此该音频格式文件在计算机、网络和各种电子设备上都得到了广泛运用。

由于MP3音频解码相对比较复杂,为了达到在控制成本的范围内实现快速解码的要求,提出了在SoC上通过增加矩阵乘法器运行快速的两个16点DCT算法,进一步提高MP3解码速度的可行性方案。

1 MP3解码流程分析

MP3解码的流程如图1所示,解码的主要过程包括同步处理、解帧头、解边带信息、解比例因子、Huffman解码、逆量化、频率线重排序、立体声处理、混叠重建、改进离散余弦逆变换(IMDCT)、频率倒置处理、子代综合滤波,最后输出原始的PCM数据。

在这些过程中由于IMDCT和子带综合滤波的算法比较复杂,占用硬件资源较多,处理时间长,因此功耗所占比例相应较高。表1是在DSP平台上成功移植后,对代码进行耗时分析的结果。

根据表1可知,子带综合滤波占了整个解码时间的60 %以上,是决定解码速度的最关键模块;其次是长块IMDCT运算,占了整个解码时间的10%以上。若采用MPEG-1建议的算法流程,数值计算主要集中在子带综合滤波上。以两声道48 kHz采样率为例,乘法运算量为(48 000/32)×(64×32+512)×2=7 680 000次/s。因此,子带综合滤波是MP3解码器的优化重点,减少子带综合滤波的计算量和计算时间是MP3解码器实现的核心。

2 子带综合滤波分析

子带综合滤波是MP3解码的最后一部分,也是解码过程中最为耗时的关键步骤。它负责从IMDCT的输出值中把PCM值还原出来,可以分成5个步骤。首先是Matrixing(矩阵)运算,即,2,…,63。由公式可知,它从32个子带Sk的每个子带中取出一个值组成32个值送入一个矩阵中进行运算,然后把输出Vi的64个结果放入一个1 024的先入先出(FIFO)缓存中,再从1 024值中取出一半,组成一个512矢量Ui,并对这512矢量进行加窗运算,即Wi=UiDi,i=1,2,…,511,加窗系数Di由MP3官方协议 AnnexB Table3-B.3提供。最后将加窗结果Wi进行叠加生成32个时域PCM输出。

1次矩阵运算乘法和加法运算过程分别为1 024次和992次,完成1个声道的解码需要18次矩阵运算。矩阵运算是子带综合滤波的关键步骤。实际上,Konstantinos Konstantinides提出的方法,只需要做一些变化就可以通过32点DCT变换成矩阵运算。

2.1 32点快速DCT算法分析

快速DCT变换算法主要基于系数矩阵分裂方法,增加输入的预处理,使得乘法和加法计算量减半。32点的DCT变换到矩阵运算如图2所示。其中V(1×64)表示矩阵的输出,A,B都是长度为1×16的矢量,(A,B)表示32点DCT的输出。

由于32点的DCT可以分解成2个16点的DCT变换,依次类推可以分解成8点的DCT变换,考虑到定点数字信号处理中的有限字长效应,实际只需分解1 次,将32点DCT化成2个16点的DCT。简化子带滤波流程以及使用快速DCT变换后,子带综合滤波部分的运算量可以减少约60 %。

由32点DCT分解为2个16点DCT过程推导如下:

 

 

2.2 基于矩阵乘法器的快速DCT算法优化

3×3矩阵乘法器由触发器和乘累加器组成,是高性能DSP处理器的重要部件,也是实时处理的核心,其速度直接影响DSP处理器的速度。矩阵乘法器的实现有很多种,基本上都基于并行计算原则。由于每列结果与其他列不相关,因此可以通过增加乘法器多列同时计算,经过n次乘累加就可以得到最后结果。图3给出矩阵乘法器的结构。

显然,这种结构的计算速度很快,但是使用乘法器会因矩阵维数n的增加而快速增加,使用的触发器也很多。在很多场合下,只要满足处理速度的要求,完全没有必要浪费这么多硬件资源,而是只要1个乘累加单元流水作业,分步计算每1列结果既可。在做乘累加计算1个元素时候,准备下一组参与运算的数据,如此循环,同样可以获得较高的处理速度。

在该设计中,由于B矩阵是1×n的一维向量输入数据,A矩阵为DCT系数矩阵,A矩阵中的元素为n个系数的线性组合,因此整个矩阵乘法器需要2组n个触发器分别存放输入数据和n个系数,1个乘累加单元。输入数据X[0:n],从X[O]到X[n]循环n次进入乘法器,使用选择信号Assi-gn[0:n] 选择系数C[0:n],另外系数符号由Sign信号软件控制,基本结构如图4所示。

 由于DCT计算本质上就是n×n矩阵乘法运算,而n×n矩阵乘法器是在通用乘法器的基础上增加2组分别存放系数矩阵的系数C(n)和输入X(n)的n个寄存器,使之实现长度为n的乘累加功能,同时还需保存上次乘法结果。其中,DCT中的系数是一组n维基的n种线性组合。只需1次输入n个系数,使用软件进行选择和符号控制就可实现这些不同系数组合,无需反复往寄存器中置数,大大提高了取数/置数的效率,节省了整个DCT的运算时间。

因此在计算32点的DCT,可将32点DCT分解为2个16点的DCT计算,计算量也减少1倍。可以使用2组16×16的矩阵乘法器并行计算,使得计算时间大幅减少。表2是通过增加矩阵乘法器优化处理后,子带综合滤波使用不同实现方式所需要的时间。

结果表明,第2.1节中使用快速32点DCT算法改进子带综合滤波计算是有效的,直接减少59%的计算时间。在采用并行2个16×16矩阵乘法器加速快速 32点DCT的计算,可以取得明显的效果:使得计算时间比原算法减少了约91.4%,而且硬件上只增加1个乘法器和30个数据锁存器,以及部分控制电路。使用软硬件协同操作就可以获得子带综合滤波计算速度上的大幅度上升。

3 结语

该设计面向SoC实现了利用增加矩阵乘法器就可加快基于32点快速DCT算法的MP3解码中子带综合滤波的处理速度,大大缓解了系统的颈瓶,使得采用系统主频比较低(fs≤100 MHz)的SoC平台进行MP3的解码成为可能。


关键字:矩阵乘法器  MP3  音频解码 引用地址:基于矩阵乘法器的MP3音频解码系统的优化设计

上一篇:面向手持移动设备的触摸传感技术简介
下一篇:基于DM642的定位视音频采集器的系统设计与实现

推荐阅读最新更新时间:2024-05-03 02:29

儿童早教机MP3音乐芯片选型!
宝宝学语言是潜移默化的,早教机能够帮助孩子语言的培养。它就像是一位不知疲倦的早教老师,接通电源即可实现与儿童的互动,寓教于乐。在与儿童游戏的同时传授儿童拼音、看图识字、数学等知识,而且还会跟小朋友一起做智力游戏提高儿童智力,发展儿童的潜能。 儿童早教机结合多元智能教育理论,根据孩子的生活经验和心理特点选取主题场景,将英语、汉语、数学逻辑、成语、儿歌、唐诗、故事等整合到各个主题中,知识全面,分类清晰;趣味学习,对幼儿注意力、思维能力等方面提升有很大帮助,既能开启孩子内在潜能,又能教孩子挖掘自身的爱好。 而早教机实现中英文语音播放,音质优美是加入了N9305 MP3音乐芯片,N9305音乐芯片是广州九芯电子研发的一款支持云端更
[嵌入式]
儿童早教机<font color='red'>MP3</font>音乐芯片选型!
基于ARM的MP3播放器设计与实现
0 引言 MPEG(Moving Picture Experts Group)是运动图像专家组的英文缩写。MP3是MPEG Audio Layer-3的缩写,即MPEG第3层音频编码标准,使用MP3标准对音频数据编码既可以获得较大的音乐数据压缩比,又可以得到较好的音乐回放质量。国内外现有的MP3解码方案实现有2种方案:硬件和软件解码。利用专用解码芯片的硬件解码,其灵活性不好,并且硬件解码芯片的价格昂贵。基于DSP或ARM等处理器开发平台的软件解码,扩展新能好,性价比高。 ARM(Advanced RISC Machines)既可以认为是一个公司的名字,也可以认为是对一类微处理器的通称,还可以认为是一种技术。目前,采用ARM技
[单片机]
基于ARM的<font color='red'>MP3</font>播放器设计与实现
基于ARM的多通道专业MP3播放器设计
1 引 言   随着微电子技术的飞速发展,嵌入式产品以其自然的人机交互界面和丰富的多媒体处理能力迅速得以推广,并取得了巨大成功 。 目前,在多媒体音频领域中,MP3播放器占据了绝对的主导地位。但现有的MP3播放器驱动能力非常有限,只适合个人使用,不能满足大型公共场所在不同区域播放不同背景音乐的多通道播放需要。基于以上分析,本文设计了一种基于S3C44B0X芯片的μClinux环境下的多通道专业MP3播放器。   2 系统功能分析与结构设计   多通道专业MP3播放器是专为满足公共语音广播市场的需求而设计的,其主要功能包括: (1)音频解码和播放功能; (2)通过USB接口与大容量外部存储设备
[单片机]
基于ARM的MP3播放器设计与实现
摘要:为了克服目前市场上MP3储存量小,价格昂贵,操作复杂,播放歌曲的单一性等不足,设计了一款基于ARMLPC213l的MP3播放器。该播放器主要由音频解码模块和音乐文件存取模块2部分组成。实验结果表明,该设计实现了存储在U盘里按自己设定的顺序自动播放歌曲,并拥有储存量大,价格较低,操作简单,播放种类较多等特点,具有一定的实用和推广价值。 关键词:MP3音乐播放器;ARM LPC2131;VS1003;CH375 0 引言 MPEG(Moving Picture Experts Group)是运动图像专家组的英文缩写。MP3是MPEG Audio Layer-3的缩写,即MPEG第3层音频编码标准,使用MP3标准对音频数据
[工业控制]
基于ARM的<font color='red'>MP3</font>播放器设计与实现
输出6V,0.5A的手机MP3开关电源充电器电路
输出6V,0.5A的手机MP3开关电源充电器电路
[电源管理]
输出6V,0.5A的手机<font color='red'>MP3</font>开关电源充电器电路
调查显示一半山寨机和MP3存隐患 用户听力易损
    便携音频播放设备最大音量调查 -->   新浪科技讯 3月4日消息,在“国际爱耳日”到来之际,工信部电信研究院专家提醒,长时间接听电话,或者佩戴耳机听MP3有可能对人耳造成永久性的听力损伤。一项在中国的调查一显示,上述人群有30%的人存在着不同程度的听力损失。    手机音量超过限额将造成人耳受伤   目前,包括手机和MP3在内的信息终端设备越来越普及。有调查表明,现代人们已经习惯于在各种场合长时间的通话和收听音乐,其中青少年占有很大的比重。然而,研究证明,无论是短时间的非预期噪音还是长时间的声暴露,如果超过了一定的限值,都会带来暂时或者永久性听力损伤甚至失聪。换句话说,无论是噪声还是音乐,只
[手机便携]
基于新型ASSP LTC3455的硬盘MP3电源设计
     MP3播放机的产量已接近3,000万部,其中50%是硬盘(HDD)MP3播放机。MP3播放机的电源供应通常来自于AC适配器、USB线缆或锂离子电池。然而,管理这些不同电源之间的电源通路控制是一个关键的技术难题。   硬盘MP3播放机市场快速成长的主要动力,来自于苹果iPod与iPod迷你型硬盘MP3的巨大成功,这两款产品在4~40GB的存储范围内均具有多种硬盘选择。这些MP3用微型硬盘的盘片直径大多不足2英寸。例如,东芝的硬盘在直径仅为1.8英寸的单一盘片上具有30GB的容量;日立的微型硬盘则在直径仅1英寸的单一盘片上具有4GB的容量。   不论哪种硬盘驱动器在3.3V下正常运行时,仅需要大约200mA的电流供应。然而
[电源管理]
基于新型ASSP LTC3455的硬盘<font color='red'>MP3</font>电源设计
MP3芯片专利战背后暗战 传爱国者倒戈有蹊跷
  7月4日消息,日前有消息称,受到拖延一年多的涉嫌侵权官司影响,珠海炬力集成电路设计有限公司已经开始丢失大客户,其中国内最大的本土MP3制造商北京爱国者数码音频科技股份有限公司已经“倒戈”,开始从珠海炬力的竞争对手Sigmatel处采购MP3芯片。   7月3日下午,天极Chinabyte记者从珠海炬力一位内部人士处获悉,虽然珠海炬力与Sigmatel之间的专利权纠纷尚未有结论,但是珠海炬力的产品并不像Sigmatel所说,受到任何法律限制,珠海炬力在美国市场大可自由来去。该人士认为,“爱国者倒戈”事件很可能是由Sigmatel导演,珠海炬力很可能在近日会对“爱国者倒戈”以及与Sigmatel专利之争做出官方回应。“华旗也许在
[焦点新闻]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved