H.264/AVC视频压缩编码标准的新进展

发布者:火星最新更新时间:2012-10-27 来源: 21IC 关键字:H.264  AVC  视频压缩  编码标准 手机看文章 扫描二维码
随时随地手机看文章

  H .264/AVC是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准,于2003年5月完成制订。相对于先前的标准,H.264/AVC无论在压缩效率、还是在网络适应性方面都有明显的提高,因此,业界普遍预测其将在未来的视频应用中替代现有的视频压缩标准。

  但是,H.264/AVC标准由于对视频源的限制,仅支持娱乐级视频质量。为了进一步扩大其应用范围,使其适应高保真视频压缩的应用,JVT于2004年7月对H.264/AVC做了重要的补充扩展,称为FRExt(Fidelity Range Extensions)。

FRExt概述

  H.264/AVC标准第一版支持的源图像为每象素8b,且采样方式仅限于4∶2∶0;而新近扩展的FRExt部分则扩大了标准的应用范围,如专业级的视频应用、高分辨率/高保真的视频压缩等。FRExt对H.264/AVC的改善主要在:(1)进一步引入一些先进的编码工具,提高了压缩效率;(2)视频源的每个样值均可超过8b,最高可达12b;(3)增加了4∶2∶2与4∶4∶4的采样格式;(4)更高的比特率,更高的图像分辨率;(5)可达到图像高保真的要求,支持无损压缩;(6)支持RGB格式的压缩,同时避免了色度空间转换的舍入误差。 



   
图1 FRExt 编码工具

  FRExt增加了4个新的类:(1)High Profile(HP),支持8b、4∶2∶0采样;(2)High 10 Profile(Hi10P),支持10b、4∶2∶0采样;(3)High 4∶2∶2 Profile(H422P),支持10b、4∶2∶2采样;(4)High 4∶4∶4 Profile (H444P),支持12b、4∶4∶4采样、无损编码与多种色彩空间的编码。

  H.264/AVC FRExt详细说明了一组4个新的类,它们如同性能的嵌套子集一样被创立。这4个类全都继承了主类的工具集,就像它们的公共交集;而高类(HP)还额外地包含了所有能够提高编码效率的主要的新工具。相对于主类(MP),这些工具在算法复杂度上只是稍有提高。因此,在数字视频应用中,在4∶2∶0色度采样格式中使用8b视频的高类有可能代替主类。

  增加了高类之后,H.264/AVC各类的关系如图2所示,具体所包含的编码工具如下: 




                                   
图2 H.264 各个类的关系

  1.所有类的共同部分:I片、P片、CAVLC;

  2.基本类(Baseline):FMO、ASO、冗余片;

  3.主类(Main):B片、加权预测、CABAC、隔行编码;

  4.扩展类(Extended):包含基本类的所有部分(FMO、ASO、冗余片)、SP片、SI片、数据分割、B片、加权预测;

  5.高类(High):包含主类的所有部分(B片、加权预测、CABAC、隔行编码)、自适应变换块尺寸(4×4或8×8整数变换)、量化矩阵。 
FRExt增加的关键算法

  FRExt之所以能进一步提高编码效率及保真度,是因为加入了一些有效的编码工具。其中大部分是在取样点比特深度和色度格式方面;而在提高编码效率方面,主要是利用8×8的亮度帧内预测、4×4变换及8×8变换、量化矩阵等技术。[page]

  9种8×8的亮度帧内预测

  H.264/AVC第一版的帧内预测包括9种4×4亮度块、4种16×16亮度块和4种色度块的预测。



                                    
图3 帧内预测方向

    在FRExt中增加了9种8×8亮度块的预测,其预测方向(如图3)、预测块的计算与4×4块的基本一样,如图4所示。在一个给定的8×8亮度块中,每个象素值可从相邻的参考象素值(A~X、Z)中预测得到,编码器可选择8种不同的预测方向和直流预测。

  还有一点与4×4块的不同,就是要对预测值进行低通滤波,以提高预测的精确度。新的8×8帧内预测中,给出了一个简单的二阶低通滤波器,它在预测之前被用来重建亮度的参考象素值。经过滤波的参考象素按照9种模式的预测方法进行预测。

  8×8的整数变换

  H.264/AVC第一版中,对所有的残差块采用了4×4整数变换;对16×16亮度块进行帧内预测;整数变换后的16个DC系数采用4×4哈达玛变换,色度块的DC系数采用2×2哈达码变换。

  4×4整数变换除了算法复杂度低外,还可以有效地降低块效应。但是,对于大尺寸、高保真的视频,须要很好地保存图像的细节和纹理,这就需要更大尺寸的变换。为了达到各方面的平衡,FRExt引入了8×8整数变换,且编码器可以在宏块级自适应地选择4×4或8×8变换。在制定H.264/AVC标准之前,曾提出可变块尺寸的变换,其算法复杂度要低一些。 [page]



                                        
图4 用于8×8空间亮度预测的样本

  8×8正变换和逆变换都可以通过快速蝶形算法实现,对于n比特的输入视频,只需要(8+n)比特的运算动态范围。8×8变换蝶形算法的复杂度只略高于4×4变换。

  新的变换同时要求相应的量化方法。FRExt在第一版的基础上做了扩展,与MPEG-2一样可以选择量化矩阵进行量化,而量化矩阵可以提高图像的主观质量。同时,CABAC也做了改进,增加了3个内容模型,而CAVLC把8×8的系数分为4组4×4的系数。 



  
表1 FRExt中的二维8×8变换矩阵

  须要指出的是,编码器可以对每一个宏块选择4×4或8×8变换,但变换尺寸的选择过程受到两种约束:(1)对于帧内预测,只有在采用8×8亮度块的预测时,选择8×8整数变换;(2)对于帧间预测,宏块中包含一个或多个小于8×8的块(4×8、8×4、4×4),必须采用4×4整数变换。

高保真编码

  在高类中,H.264/AVC对FRExt定义了特别的编码方案——支持无损编码和多种颜色格式。

  (1)无损编码

  为满足视频信号高保真的要求,H.264/AVC只在H444P类中引入了无损压缩编码方案。第一个是PCM方案,它没有预测、变换和量化,直接传送取样点的值以达到无损编码的目的;第二个是无变换的无损编码方案,运用预测与熵编码技术来表示图像高效无损,相对于第一个方案提高了编码效率。

  (2)支持多种颜色格式

  RGB与YCbCr相互之间的颜色转换使用的都是浮点运算,这必将引入舍入误差。为了消除在浮点运算中引入的舍入误差,H.264/AVC在支持RGB的同时引入了新的彩色空间YCgCo:

  Y=1/2(G+(R+B)/2), Cg=1/2(G-(R+B)/2),Co=(R-B)/2

  上面的公式减小了色彩空间转换的复杂度;但是,为了避免舍入误差,要求增加额外的比特以保持精确性。为了把这个额外比特降到1b,使用下面的公式:

  Co=R-B,Cg=G-(B+(Co>>1)),Y=(B+(Co>>1))+Cg>>1)

压缩效率

  从压缩效率上讲,H.264/AVC已经大大超过了以往的视频压缩标准,加入了FRExt之后,其在大尺寸、高保真等视频压缩方面更具优势。图5示出H.264/AVC FRExt与MPEG-2在HDTV图像主观评价方面的一个比较,H.264/AVC在不同的码率下压缩,而MPEG-2的压缩码率是24Mb/s,由此图可见8Mb/s的H.264/AVC FRExt与MPEG-2相当。 



                                   
图5 H.264/AVC FRExt 与MPEG-2的性能比较



  由于引入了基于空域的帧内预测技术,并且经过FRExt的改善,H.264/AVC的I帧与JPEG2000的编码效率相当,非常适合高质量的视频压缩应用。

小结

  新一代视频压缩编码标准H.264/AVC的新进展——FRExt,相对于第一版标准扩展了视频源的采样格式与比特深度,加入了一些提高编码效率的工具。从而H.264/AVC进一步提高了编码效率,扩大了应用范围。

  目前,高类已经代替主类而成为广播和其他娱乐应用的首选。主要原因是,它比起先前的主类只增加了极小的算法复杂度,却大大提高了压缩性能且编码器控制的灵活性。其中,H422P类可望在演播室环境中得以应用。在补充了FRExt之后,H.264/AVC被迅速推广到各种应用中,主要包括:欧洲数字视频广播标准DVB;美国先进电视系统委员会ATSC;DVD论坛的HD-DVD规范;蓝光光碟协会(BDA)的BD-ROM规范。

关键字:H.264  AVC  视频压缩  编码标准 引用地址:H.264/AVC视频压缩编码标准的新进展

上一篇:H.264的技术优势及在H.323系统中的应用
下一篇:MPEG-4技术的演进与在中国的应用

推荐阅读最新更新时间:2024-05-02 22:24

日韩众厂商转战高清H.264设备市场
  数家半导体公司都在小心翼翼地从快速发展但日益商品化的H.264解码器IC市场上撤退,转而在高清H.264编码器/解码器市场上试水。由于日本和韩国消费电子产品制造商将掀起编解码器需求的热潮,芯片供应商都希望在高清数码相机、数字视频便携式摄像机和存储设备等领域占据自己的一席之地。富士通微电子就在上周宣布开始提供一款面向视频格式高规格第4级标准的硬接线H.264编解码器的样品。Ambarella公司则早在一年前就推出了业界首款高清H.264编解码器,但从那以后就几乎没什么消息了。   Ambarella公司首席技术官Les Kohn表示,Ambarella的芯片已经赢得了“数家一流的日本和韩国公司”的设计项目。   目前市场上的
[焦点新闻]
消费级DV当红,今年全球出货迈进1300万台
  DIGITIMES Research分析师杨宜蓁指出,随着数字信号处理器(DSP)大厂加速开发低功耗、高画质 H.264 编译码芯片(SoC),平价的消费级DV 也可拍摄出高画质动态影像;加上影音分享网站兴起,让影片的分享更为容易,助推个人化摄录风潮持续不减。   消费级DV 机种依消费者使用习惯与偏好的不同,目前市场上常见包括有qiang型直立式、横式及手机型简易式等三种产品设计型态。其中,手机型简易式 DV 是由已并入思科(Cisco)的 Pure Digital 率先发表,自2007年首度推出 Flip DV 后即在北美市场造成热销,也推升全球消费级DV 出货量快速成长,引起多家品牌业者高度关注,并相继宣布推出同级产品
[半导体设计/制造]
消费级DV当红,今年全球出货迈进1300万台
数字使智能视频监控超越传统系统
  模拟系统构成了目前绝大部分视频安全系统,但是这些基于传统TV线缆技术的系统具有很多缺点:建设与维护可提供连接的宽带线缆基础设施耗资巨大;依靠人力监视多个摄像头来检测可疑活动会耗费大量人能监控系统能够高效运行至少5种算力,而且由于人为错误还会造成假警报和降低安全性;最重要的是,发生违反安全的行为和发现这种行为的间隔往往太长,因而无法预防犯罪,甚至也无法逮住不法分子。   毫不夸张地说,模拟视频监控技术已经走进死胡同。一大堆人需要整天坐在那里盯住一大堆屏幕,因此有可能产生一大堆假警报,而安全性也更是无从谈起。视频监控市场正在迎来一种具有颠覆性的技术,它依赖的概念是通过在网络中嵌入机器智能来提高性能并降低成本。新的模式变革正姗姗而
[焦点新闻]
五大方面全面解释高清视频会议技术
  高清视频离我们越来越近,在视频会议领域,各厂商也主打“高清”概念,那么高清视频会议到底是什么呢,想必对一些新手来说,可能还比较模糊,下面我们从高清视频的概念、高清晰度视频会议的标准、高清视频会议和高清电视的区别、高清视频会议的技术要求、高清视频会议的优点五个方面详细介绍一下: 一、什么是高清晰度视频 大家都熟悉标准清晰度(SD)模拟电视。这是我们所了解并且几十年来一直使用的电视。NTSC制式(用于北美及其他一些地区)水平解像度为525线,每秒30帧画面。PAL制式(用于世界上的其他地区)则为625线,每秒24帧画面。先扫描静止画面的奇数行,然后扫描同一幅图像信息的偶数行。这样一来,两幅画面会同时显示在显示器上,
[安防电子]
NTT电子支持H.264/AVC HDTV的编解码器
  2008年12月2日- NTT电子株式会社开发出了搭载有支持H.264/AVC (备注1)HDTV实时编解码LSI "PINEA"(备注2)的PCI Express模组“PINEA模组”。   本产品搭载有内建DDR存储器且采用了堆栈封装的编解码LSI,该模组可轻松实现PC平台的H.264/AVC编解码系统的构筑。   作为数字视频压缩格式,H.264/AVC开始被广泛应用于广播、新一代DVD及移动终端等领域。H.264/AVC采用了高度压缩演算法,能够实现高压缩率。另一方面,为了执行庞大的演算处理,还需要高度的处理能力。虽然PC高速化得到快速推广,但是,在使用软件对全高清视频和标清视频进行多通道编码实时处理方面还略显不足
[安防电子]
统计2010年全球H.264芯片出货量增加51%
当前,H.264解码器逐渐出现在许多解决方案中,压缩方案也开始受到大家青睐了。对于H.264来说,卫星机顶盒仍然是最大市场。 此外,越来越多的数字电视都在使用H.264,而不是仅仅只选择MPEG-2。在相关的数据调查中显示2010年全球H.264芯片出货量将比2009年增加了51%。在卫星机顶盒市场,Broadcom是H.264的最大供应商。 因此,In-Stat预计到2013年H.264解码器芯片每年将增长20%。“由于其较低的比特率和较小文件可以帮助网络视频解决方案,所以先进的压缩标准如H.264越来越受用户的欢迎,”首席分析师MichelleAbraham说,“视频的应用如用户生成的内容和在线视频流,在嵌入式
[安防电子]
H.264中插补算法的VLSI设计与实现
  H.264/AVC 是由ITU和ISO/IEC的专家共同组成的联合视频小组JVT(Joint Video Team)发展和制定的新一代视频编码国际标准。在相同的视觉感知质量下,H.264的传输码率比以往的H.263、MPEG-4等降低了50%左右 。   运动矢量位移的精度越高,则帧间剩余误差越小,压缩比越高。H.263中采用了半像素估计,在H.264中则进一步采用1/4像素精度的运动估计。分数运动估计和运动补偿用到的非整数像素点必须通过插补(interpolation)运算来实现,因而插补运算的硬件加速对整个H.264编解码系统性能的提高有重要意义。在H.264中采用了6抽头FIR滤波器的内插获得1/2像素位置的值,则1/
[安防电子]
数字视频压缩的大容量记录系统设计
  引言   随着计算机技术、多媒体和数据通信技术的迅速发展,数字视频的应用越来越广,如视频监控、视频会议和移动电视等。数字视频数据量巨大,不利于传输和存储,使其应用受到很大限制。为解决视频数据的存储和传输问题,唯一的途径就是对视频数据进行压缩。常见的视频压缩方法有MPEG系列和H.26x系列。考虑到压缩技术的成熟度、成本和主要用途,采用MPEG-1作为压缩标准,设计出基于ARM处理器的嵌入式数字视频记录系统。该系统适用于视频监控、视频会议等多种应用场合,同时还可安装在飞行器上,用于实时记录飞行器的飞行及训练过程中的各种信息。   目前,市场上有大量的基于PCI总线的MPEG-1视频压缩卡和PC机构架的网络视频服务器。与之相
[测试测量]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved