H.264_AVC视频编码变换量化核实现

最新更新时间:2012-07-23来源: 互联网关键字:H.264_AVC  视频编码  变换量化 手机看文章 扫描二维码
随时随地手机看文章

2003年推出新的视频压缩标准H.264 /MPEG-4 -10AVC,简称H.264/AVC。 H.264/AVC采用一系列新的压缩方法[1],可获得更好的压缩效果,其压缩率达到以往标准的1.5~2倍。因此,基于这一标准的相关研究和硬件实现具有重要的意义。视频压缩硬件实现的关键是编解码模块,其中尤以编码模块最为核心。本文主要研究编码模块中的4×4整数变换量化核,提出硬件实现的优化方法,并采用Verilog HDL语言进行硬件设计和综合。

  1 4×4整数变换量化核的原理

  在以前的视频编码标准如MPEG-2和H.263中,对于预测的残差数据都是采用8×8离散余弦变换(DCT)[1]作为变换的基本运算操作;而在H.264/AVC编码标准中,则采用类似DCT变换形式的基于4×4 像素块的整数变换。由于变换块的尺寸缩小,运动物体的划分更精确,而且运动物体边缘处的衔接误差大为减小。

  对于整数变换方式,4×4像素块的变换公式[3]为:

  

 

  式中,(CXCT)是二维变换核,Ef是缩放因子矩阵,符号表示CXCT矩阵里的每个元素和Ef矩阵中相同位置的元素相乘,a=1/2,b=

。为了更有效地压缩数据,需要利用量化的方法对变换后的数据进行有损压缩。同时,由于整数变换需要利用矩阵行向量的归一化因子进行系数缩放处理,为降低变换的运算量,在H.264/AVC标准中将变换的系数缩放并进行量化运算处理,避免了复杂的实数运算和除法运算,更有利于硬件的实现。

 

  对于量化方式,正向量化运算可由如下公式[3]实现:

  

 

  式中, Zij为量化后的系数;Wij为变换矩阵W=CXCT中的元素;MF=

·2q,PF 称为缩放系数,根据元素在阵列块中的不同位置,其取值如表1所示,Qstep为量化步长,由0至51共52个量化参数QP决定,QP增加1, Qstep增加12.5%; q=15+QP/6,QP/6取整数;对于帧内宏块f取2q/3,帧间宏块f取2q/6。需要指出的是,MF的值可根据PF和QP的取值经简单计算得到,并可形成表格,通过查表方式便可实现硬件运算,并有效地提高了运算速度。

 

  

 

  2 4×4整数变换量化核的优化设计

  为进一步提高硬件运算速度,减少硬件开销,设计中采用了如下优化方法:

  (1)在求取变换阵W=CXCT时,根据变换的对称性,将X的列变换(矩阵左乘)与行变换(矩阵右乘)分开实现,把二维变换分割为两次一维变换,并采用快速堞形算法[4]来实现。一维变换的快速算法实现如图1所示,其中的列变换可用如下算式表示:

  

 

  

 

  对于每列变换,需要进行8次加法和2次移位运算,而行变换则可根据矩阵转置的性质ABT=(BAT)T,将经过列变换后的结果矩阵先进行转置,再采用相同的变换形式运算。这样对4×4点数据做一次变换,只需通过8×8次加法和2×8次移位运算便可完成。

(2) 针对不同运算的位宽需要,设计专用的加法器和乘法器。本文对整数变换中的加法器采用三级流水线加法器,实现9位加法,每级流水线完成三位超前进位加法,将逻辑延迟限制在三位加法器之内。图2给出了9位加法器的流水线实现框图。选用EPF10K10LC84-3作为适配器件,经过Synplify Pro 7.3综合,结果表明这种加法器具有较优的最高工作频率和硬件开销。如表2所示, 常规加法器的最高工作频率为37.0MHz,消耗资源却为28LC,而经过优化的三级流水线加法器在消耗资源增加不多的情况下,其最高工作频率相比常规加法器提高了257%,达到94.5MHz。

  

 

  

 

  在量化过程中,对于给定的量化参数QP, MF只有三种取值,因此乘法实现可以采用无符号数乘法运算,乘法结构则采用16×14位加法树乘法器。这样,在提高运算速度的同时节约了芯片面积。

  (3)对于f的计算,在不影响运算精度的情况下本文采用近似处理。为了避免除法运算,将f的计算式变形,即:

  f=2q/3=(215/3)×2m≈[(215+1)/3]×2m≈10923×2m

  式中, m取值为0~8,具体由相应的QP给出。由于f在完成加法运算后其结果还需左移q位,所以计算精度不会受影响。这样,对f的计算只需进行移位操作。

  3 4×4整数变换量化核硬件实现

  基于上述算法原理及其设计,本文首先对4×4整数变换量化模块进行C语言编程,验证了该模块所采用算法的正确性。然后采用Verilog HDL语言描述4×4整数变换和量化核(帧内模式)的硬件功能,并通过仿真软件Modelsim SE 5.7进行功能仿真,验证了该模块输出结果与设计要求相一致。最后采用Synplify Pro7.3综合工具,并以Altera公司的Stratix系列FPGA作为主要目标适配器件进行综合。

  

 

  4×4整数变换量化核的二大子模块的综合结果如表3所示,表中同时给出经本文优化设计前后的综合结果作为对比。可见,经本文采用的三种优化设计处理后,在硬件开销改变不大情况下,变换子模块的最高工作频率达到59.4MHz,是未优化前的1.73倍,而量化子模块的最高工作频率达到55.8MHz,是未优化前的1.82 倍。4×4整数变换量化核的最高工作频率取各子模块的最低频率,这样其优化后的最高工作频率是55.8MHz,相比优化前的30.7MHz提高了82%。

  本文对H.264/AVC协议中的4×4整数变换量化核从算法原理到硬件实现进行了分析和设计。采用自顶向下的Verilog HDL设计流程,实现了4×4整数变换量化核硬件功能的优化设计,模块的最高工作频率提高了82%,为H.264/AVC视频编码标准的硬件实现提供了参考。

关键字:H.264_AVC  视频编码  变换量化 编辑:神话 引用地址:H.264_AVC视频编码变换量化核实现

上一篇:EZ-USB FX2实现图像采集系统
下一篇:全息投影与幻影成像

推荐阅读最新更新时间:2023-10-12 20:41

Communitek上市Minicaster视频编码解决方案
      据报道,Communitek视频系统公司现已上市独立的/单机编码系统Minicaster——专门为互联网视频广播与IPTV应用的高清与标清实时流编码而设计。凭借着实时的MPEG4/H.264、Adobe Flash与Windows Media编码功能,这一紧凑型设备是那些从现场及演播室内进行实况广播(经由IPTV以及互联网)的理想选择。       该编码系统可以实时生成从100kb/s到15Mb/s比特率范围的视频流,支持的信源有HD-SDI、SD-SDI、S视频或复合视频(并带有离散的或嵌套音频)。Minicaster还可以装备高达2TB容量的内置磁盘存储器,用于在广播期间同时存档实时视频流。这一独立自备/自给
[家用电子]
基于嵌入式Linux的视频采集编码系统实现一
摘要: 本文设计了嵌入式远程监控系统中的视频采集端。提出了基于 ARM Linux的视频采集编码设计方案,采用 S3C2440 作为主处理器,选用 OV511+OV7650 构造USB 摄像头进行视频采集。介绍了USB 摄像头驱动程序的设计以及视频原始码流采集的实现过程。由于嵌入式Linux在各种视频设备中已经得到了广泛应用,故设计具有一定的通用性。    关键词: 嵌入式;Linux;视频采集;S3C2440    引言   嵌入式系统由于其体积小可便携,较 PC机而言很有优势。随着计算机技术的发展,一些基于PC机的应用也得以在嵌入式系统上实现。由于 USB 接口摄像头价格低廉,性能较好,即插即用,加上Linu
[模拟电子]
基于嵌入式Linux的<font color='red'>视频</font>采集<font color='red'>编码</font>系统实现一
苹果、谷歌、亚马逊等携手研发视频编码技术 体积将缩小三
据报道说苹果、谷歌、亚马逊等科技巨头正在研发下一代视频编码AV1 ,如果研究成功视频文件体积将缩小三分之一,也就是能够减少25%到35%,并且将对使用者免收技术授权费。 人类社会进入了视频时代,视频的传输消耗着巨大的流量和带宽。据外媒最新消息,苹果、谷歌、亚马逊等科技巨头,正在开发下一代的视频编码技术,视频文件体积将缩小三分之一。 据报道,本周三,“开放媒体联盟”的网页进行了更新,显示苹果公司已经加入该联盟,并且成为创始会员。 这意味着苹果将会和谷歌、亚马逊、思科、IBM、英特尔、微软、ARM、Netflix、英伟达等科技巨头进行合作,开发新一代的视频编码技术。 据称,下一代视频格式被称为AV1,将对使用者免收技术
[家用电子]
如何使用FPGA实现高清低码流视频编码
3G网络和智能手机的迅速普及推动了移动互联网的发展,为安防网络从局域网扩展到移动互联网提供了条件。通过对移动互联网的上行带宽和下行带宽的实测可以知 道,512 Kbps是一个有效而且可靠的带宽值,如果能够在这个带宽值限制条件下实现高清视频的传输,必将可以推动移动监控应用的普及。本文介绍了FPGA在实现高清低码流视频编码中的作用以及如何具体实现。    概述   安防摄像机的分辨率和码流是正关联的,进入高清时代后,码流就在2Mbps以上,比以前D1时代要高3倍以上,这么大的码流在 100M/1000M的局部网络传输是没有任何问题的,硬盘存储的代价也可以接受;但是如果想在互连网和3G网络上传输高清视频,低码流的要求就凸现出
[模拟电子]
基于DM642DSP的视频编码优化方法
引言 当前在视频监控,视频会议,网络流媒体等方面数字视频编码成为最核心,最基本的技术手段,尤其是视频监控现已成为最为普通的安保设备之一。基于电脑硬盘为存储体的数字DVR已日渐取代模拟DVR。数字DVR的最关键技术就是视频压缩技术,而视频压缩技术又含有两大选择。首先是视频压缩采用何种算法标准,当前视频算法的国际标准有MPEG2、MPEG4、H.264,H.264以其高压缩效率,在低码率下优良的图像质量成为目前视频监控系统中首选的压缩方式。 但任何事物都有其两面性,H.264编码的高效率,优质图像是用算法的复杂性来换取的。H.264编码器的复杂性是MPEG2的4-5倍。第二个选择是用什么芯片来实现,TI公司的TMS320D
[模拟电子]
基于DM642DSP的<font color='red'>视频</font><font color='red'>编码</font>优化方法
45纳米芯片大战结局:松下IBM或击败英特尔
8月9日消息,关注芯片领域四核之战的朋友可能不会陌生,英特尔不断以45纳米芯片重磅新闻轰炸AMD,宣称自己的45纳米芯片将第一个上市。然而现实可能出乎业界的预料,第一个将45纳米芯片搬上货架的可能既不是英特尔,也不是AMD,而是松下或IBM。 据国外媒体报道,以45纳米竞赛“王者”自居的英特尔,可能对上述说法不以为然,它会说英特尔已在内部演示了45纳米芯片,代号为“Penryn”,根据计划今年底该芯片将上市,而AMD的45纳米芯片可能要到2008年才能上市。然而业界所关注的并非产品演示,就真正供货而言,真正的胜者可能是松下和IBM。 日本消费电子巨头松下6月份开始制造45纳米视频编码与解码芯片,名为“UniPhier”,该芯片用
[焦点新闻]
AVS I帧视频编码器的FPGA实时实现
  第一节 系统设计   本项目基于FPGA平台完成CIF分辨率图像的实时采集、AVS全I帧压缩编码,和网络传输。本项目主要由视频采集系统,数据调度系统,I帧编码系统和以太网传输系统构成,其实现框图如图1-1所示。   视频采集系统主要完成将复合视频解码成YUV(4:2:0)数字视频,为AVS 全I帧编码准备好视频数据。   数据调度系统主要完成向I帧编码系统提供原始数据,同时将编码后的码流传输到以太网传输系统。视频数据吞吐量大,带宽高,涉及到低速存储器(如DDR)和高速存储器(如FPGA内部RAM)之间大量的数据交换,成功的数据调度策略是实时实现编码的关键技术之一。本系统包含实验室设计的DDR控制器IP核和数据调度IP核。
[电源管理]
AVS I帧<font color='red'>视频</font><font color='red'>编码</font>器的FPGA实时实现
面向MPEG4视频编码/译码器的DSP
=众所周知,DSP在移动电话等便携机器领域里已成为实时处理语音编码/译码、语音识别和图像处理等多媒体应用的关键性器件。现在,市场上有许许多多的高速16位定点的DSP 产品,像μPD7711x/μPD7721x系列等在语音编码/译码领域已获得广泛应用。 此外,随着最近几年的Internet应用普及,人们利用数码摄像机和数码照相机等便携式视听(AV)机器拍摄的活动图像和静止图像,可在Internet上自由发送,欣赏从网上下载的视频及图像文件已成为流行时尚。随着便携式AV 机器的推广应用,愈来愈要求能很容易地向存储器里记录那些按照MPEG4压缩的信息。随着通信带宽的拓展,这些AV 机器的功能也在移动电话中有所体现,已成为移动通信的业
[嵌入式]
小广播
最新模拟电子文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved