H.264与AVS视频标准核心技术比较-电子工程世界

　　视频编码技术在过去几年最重要的发展之一是由ITU和ISO/IEC的联合视频小组 (JVT)开发了H.264/MPEG-4 AVC[8]标准。在发展过程中，业界为这种新标准取了许多不同的名称。ITU在1997年开始利用重要的新编码工具处理H.26L（长期），结果令人鼓舞，于是ISO决定联手ITU组建JVT并采用一个通用的标准。因此，大家有时会听到有人将这项标准称为JVT，尽管它并非正式名称。ITU在2003年5月批准了新的H.264标准。ISO在2003年10 月以MPEG-4 Part 10、高级视频编码或AVC的名称批准了该标准。

H.264 实现的改进创造了新的市场机遇

　　H.264/AVC在压缩效率方面取得了巨大突破，一般情况下达到MPEG-2及MPEG-4简化类压缩效率的大约2倍。在JVT进行的正式测试中，H.264在85个测试案例中有78％的案例实现1.5倍以上的编码效率提高，77％的案例中达到2倍以上，部分案例甚至高达4倍。H.264 实现的改进创造了新的市场机遇，如：600Kbps的VHS品质视频可以通过ADSL线路实现视频点播；高清晰电影无需新的激光头即可适应普通 DVD。

　　H.264标准化时支持三个类别：基本类、主类及扩展类。后来一项称为高保真范围扩展 (FRExt)的修订引入了称为高级类的4个附加类。在初期主要是基本类和主类引起了大家的兴趣。基本类降低了计算及系统内存需求，而且针对低时延进行了优化。由于B帧的内在时延以及CABAC的计算复杂性，因此它不包括这两者。基本类非常适合可视电话应用以及其他需要低成本实时编码的应用。

　　主类提供的压缩效率最高，但其要求的处理能力也比基本类高许多，因此使其难以用于低成本实时编码和低时延应用。广播与内容存储应用对主类最感兴趣，它们是为了尽可能以最低的比特率获得最高的视频质量。

　　尽管H.264采用与旧标准相同的主要编码功能，不过它还具有许多与旧标准不同的新功能，它们一起实现了编码效率的提高。其主要差别，概述如下：

　　帧内预测与编码：H.264采用空域帧内预测技术来预测相邻块邻近像素的Intra-MB中的像素。它对预测残差信号和预测模式进行编码，而不是编码块中的实际像素。这样可以显著提高帧内编码效率。

　　帧间预测与编码：H.264中的帧间编码采用了旧标准的主要功能，同时也增加了灵活性及可操作性，包括适用于多种功能的几种块大小选项，如：运动补偿、四分之一像素运动补偿、多参考帧、通用 (generalized)双向预测和自适应环路去块。

　　可变矢量块大小：允许采用不同块大小执行运动补偿。可以为小至4(4的块传输单个运动矢量，因此在双向预测情况下可以为单个MB传输多达32个运动矢量。另外还支持16(8、8(16、8(8、8(4和4(8的块大小。降低块大小可以提高运动细节的处理能力，因而提高主观质量感受，包括消除较大的块化失真。

　　四分之一像素运动估计：通过允许半像素和四分之一像素运动矢量分辨率可以改善运动补偿。

　　多参考帧预测：16个不同的参考帧可以用于帧间编码，从而可以改善视频质量的主观感受并提高编码效率。提供多个参考帧还有助于提高H.264位流的容错能力。值得注意的是，这种特性会增加编码器与解码器的内存需求，因为必须在内存中保存多个参考帧。

　　自适应环路去块滤波器：H.264采用一种自适应解块滤波器，它会在预测回路内对水平和垂直区块边缘进行处理，用于消除块预测误差造成的失真。这种滤波通常是基于4(4块边界为运算基础，其中边界各边的3个像素可通过4级滤波器进行更新。

　　整数变换：采用DCT的早期标准必须为逆变换的固点实施来定义舍入误差的容差范围。编码器与解码器之间的 IDCT 精度失配造成的漂移是质量损失的根源。H.264利用整数4(4空域变换解决了这一问题——这种变换是DCT的近似值。4(4的小区块还有助于减少阻塞与振铃失真。

　　量化与变换系数扫描：变换系数通过标量量化方式得到量化，不产生加大的死区。与之前的标准类似，每个MB都可选择不同的量化步长，不过步长以大约12.5％的复合速率增加，而不是固定递增。同时，更精细的量化步长还可以用于色度成分，尤其是在粗劣量化光度系数的情况下。

　[page]　

　　熵编码：与根据所涉及的数据类型提供多个静态VLC表的先前标准不同，H.264针对变换系数采用上下文自适应VLC，同时针对所有其他符号采用统一的VLC (UniversalVLC)方法。主类还支持新的上下文自适应二进制算术编码器 (CABAC)。CAVLC优于以前的VLC实施，不过成本却比VLC高。

　　CABAC利用编码器和译码器的机率模型来处理所有语法元素 (syntax elements)，包括：变换系数和运动矢量。为了提高算术编码的编码效率，基本概率模型通过一种称为上下文建模的方法对视频帧内不断变换的统计进行适应。上下文建模分析提供编码符号的条件概率估计值。只要利用适当的上下文模型，就能根据待编码符号周围的已编码符号，在不同的概率模型间进行切换，进而充份利用符号间的冗余性。每个语法元素都可以保持不同的模型（例如，运动矢量和变换系数具有不同的模型）。相较于VLC熵编码方法 (UVLC/CAVLC)，CABAC 能多节省10％bit速率。

　　加权预测：它利用前向和后向预测的加权总和建立对双向内插宏模块的预测，这样可以提高场景变化时的编码效率，尤其是在衰落情况下。

　　保真度范围扩展：2004年7月，H.264标准增加了称为保真度范围扩展 (FRExt) [11]的新修订。这次扩展在H.264中添加了一整套工具，而且允许采用附加的色域、视频格式和位深度。另外还增加了对无损帧间编码与立体显示视频的支持。FRExt修订版在H.264中引入了4种新类，即：

　　•High Profile (HP)：用于标准 4:2:0色度采样，每分量8位彩色。此类引入了新的工具—— 随后详述。

　　•High 10 Profile (Hi10P)：用于更高清晰度视频显示的标准 4:2:0 色度采样，10位彩色。

　　•High 4:2:2 10 bit color profile (H422P)：用于源编辑功能。

　　•High 4:4:4 12 bit color profile (H444P)：最高品质的源编辑与色彩保真度，支持视频区域的无损编码以及与新的整数色域变换（从RGB到YUV及黑色）。

　　在新的应用领域中，H.264 HP对广播与DVD尤为有利。某些试验显示出H.264 HP的性能比MPEG2 提高了3倍。下面介绍H.264 HP中引入的主要附加工具。

　　自适应残差块大小与整数8(8变换：用于变换编码的残差块可以在8(8与4(4之间切换。引入了用于8(8块的新16位整数变换。较小的块仍然可以采用以前的4(4变换。

　　8(8亮度帧内预测：增加了8种模式，除之前的16(16和4(4块以外，使亮度内部宏模块还能够对8(8块进行帧内预测。

　　量化加权：用于量化8(8变换系数的新量化加权矩阵。

　　单色：支持黑／白视频编码。

AVS

　　2002 年，中国信息产业部成立的音视频技术标准 (AVS)工作组宣布准备针对移动多媒体、广播、DVD等应用编写一份国家标准。该视频标准称为AVS [14]，由两个相关部分组成针对移动视频应用的AVS-M和针对广播与DVD的AVS1.0。AVS标准与H.264相似。

　　[page]

　　AVS1.0同时支持隔行和逐行扫描模式。AVS中P帧可以利用2帧的前向参考帧，同时允许B帧采用前后各一个帧。在隔行模式下，4个场可以用作参考。可以仅在帧级执行隔行模式中的帧／场编码，这一点与H.264不同，其中允许此选项的MB级自适应。AVS具有与H.264相似的环路滤波器，可以在帧级关闭。另外，B帧还无需环路滤波器。帧内预测是以8(8块为单位进行。MC允许对亮度块进行1／4象素补偿。ME的块大小可以是16(16、16(8、8(16或8(8。变换方式是基于16位的8(8整数变换（与WMV9相似）。VLC是基于上下文自适应2D运行／级别编码。采用4个不同的Exp-Golomb编码。用于每个已量化系数的编码自适应到相同8(8块中前面的符号。由于Exp-Golomb表是参数化的表，因此表较小。用于逐行视频序列的AVS 1.0的视频质量在相同比特率时稍逊于H.264主类。

　　AVS-M主要针对移动视频应用，与H.264基本规范存在交叉。它仅支持逐行视频、I与P帧，不支持B帧。主要AVS-M编码工具包括基于4(4块的帧内预测、1／４象素运动补偿、整数变换与量化、上下文自适应VLC以及高度简化的环路滤波器。与H.264基本规范相似AVS-M中的运动矢量块大小降至4(4，因此MB可拥有多达16个运动矢量。采用多帧预测，但仅支持2个参考帧。此外，AVS-M中还定义了H.264 HRD／SEI消息的子集。AVS-M的编码频率约为0.3dB，在相同设置下稍逊于H.264基本规范，而解码器的复杂性却降低了大约20％。

H.264和AVS的背景

　　H.264/MPEG-4AVC是ITU-T的VCG（Video Coding Experts Group）和ISO/IEC的MPEG(Moving Picture Experts Group)联合开发的新一代视频编码标准。应用范围包括可视电话、视频会议等。H.264的主要特色就是极大得提高了压缩率，是MPEG-2及MPEG-4压缩效率的一倍以上。H.264核心技术与之前标准相同，仍采用基于预测变换的混合编码框架，但是在细节的实现上有很大不同，就是细节上的改进导致压缩效率极大得提高。而且新一代视频编码标准H.264具有良好的网络适应性和容错等特点。

　　AVS的诞生可以说是一个历史的机遇，面对H.264以及MPEG-2等标准高额的专利费，我国数字视频产业面临严重挑战。加上我国致力于提高国内数字音视频产业的核心竞争力，由国家信息产业部科学技术司于2006年6月批准成立了“数字音视频编解码技术标准工作组”，联合国内从事数字音视频编解码技术研发的科研机构和企业，针对我国音视频产业的需求，提出了我国自主知识产权的信源编码标准―――《信息技术先进音视频编码》系列标准，简称AVS(audio video coding standard).自主的AVS标准在技术和性能上处于国际先进水平，如果抓住这次机遇，我国在技术－专利－标准－芯片－系统－产业这个产业链上，就有可能具有全面的主动权。

H.264和AVS核心技术分析及对比

　　H.264和以前的标准一样，还是采用的混合编码的框架，AVS视频标准采用了与H.264类似的技术框架，包括变换、量化、熵编码、帧内预测、帧间预测、环路滤波等模块。他们核心技术的不同包括以下几点：

　[page]　

　　一、变换和量化

　　H.264对残差数据采用基于块的变换编码，去除原始图像的空间冗余，使图像能力集中在小部分系数上，直流系数值一般来说是最大的，这样可以提高压缩比、增强抗干扰能力。先前标准一般采用DCT变换，这种变换的缺点是会出现失配现象，原始数据经过变换和反变换恢复后会有一个差值，由于是实数运算计算量也比较大。H.264采用的是基于4×4块的整数变换。

　　AVS采用8×8的整数变换，可以在16位处理器上无失配地实现。对高分辨率的视频图像去相关性要比4×4变换有效，采用了64级量化，可以适应不同的应用和业务对码流和质量的要求。

　　二、帧内预测

　　H.264和AVS技术都采用帧内预测的方式，用相邻的像素预测当前块，采用代表空间域纹理的多种预测模式。H.264的亮度预测有4×4块和16×16块2种预测方式，对于4×4的块：从－135度到＋22.5度方向加上一个直流预测一共是9种预测方向；对于16×16块：有4种预测方向。色度预测是8×8块，有4种预测模式，类似于帧内16×16预测的4种模式，其中DC为模式0、水平为模式1、垂直为模式2、平面为模式3。

　　三、帧间预测

　　H.264帧间预测是利用以编码视频帧和基于块的运动补偿的预测模式，与以往标准帧间预测的区别在于块尺寸范围更广、亚像素运动矢量的使用和多参考帧的运用。

　　H.264有16×16、16×8、8×16、8×8、8×4、4×8和4×4一共8种宏块及子宏块划分，而AVS只有16×16、16×8、8×16和8×8一共4种宏块划分方式。

　　H.264支持使用多个不同的参考帧对帧间宏块和片进行预测，AVS中P帧可以利用至多2帧的前向参考帧，B帧采用前后各一个参考帧。

　　四、熵编码

　　H.264制定了基于信息量的熵编码效率，一种是对所有的待编码的符号采用统一的可变长编码（UVLC），另一种是采用基于内容的自适应二进制算术编码（CABAC, Context-Adaptive Binary Arithmetic Coding），大大减少了块编码相关性冗余，提高了编码效率。UVLC计算复杂度较低，主要针对对编码时间很严格的应用，缺点就是效率低，码率较高。CABAC是一种效率很高的熵编码方法，其编码效率比UVLC编码高50%。

　　AVS熵编码采用自适应变长编码技术。在AVS熵编码过程中，所有的语法元素和残差数据都是以指数哥伦布码的形式映射成二进制比特流。

　　采用指数哥伦布码的优势在于：一方面，它的硬件复杂度比较低，可以根据闭合公式解析码子，无需查表；另一方面，它可以根据编码元素的概率分布灵活地确定以K阶指数哥伦布码编码，如果K选得恰当，则编码效率可以逼近信息熵。

　　对预测残差的块变换系数，经扫描形成（level、run）对串，level、run不是独立事件，而存在着很强的相关性，在AVS中level、run采用二维联合编码，并根据当前level、run的不同概率分布趋势，自适应改变指数哥伦布码的阶数。

　　另外，在AVS中没有SI、SP帧。可以这样说，AVS是在H.264的基础上发展起来的，吸收了H.264的精华，但为了绕过专利的困扰，又不得不放弃H.264的一些核心算法。换来的代价就是，编码效率稍微降低一点的情况下，复杂度极大得降低了。

　　AVS是我国自主知识产权的标准，现在还没有大规模使用，处在起步阶段。大多数企业处于观望状态，没有资金大量投入，面临重重困难，但是它的广阔前景是不容忽视的，又有国家的大力支持，一定会发展的更加完美。

关键字：视频编码 H.264 AVS 标准引用地址：H.264与AVS视频标准核心技术比较

上一篇：数字电视一体机的发展与滞障因素分析
下一篇：数字一体机普及在即标准统一成核心点

推荐阅读最新更新时间：2024-05-03 19:20

标准的PID处理例程

/*==================================================================================================== 这是从网上找来的一个比较典型的PID处理程序，在使用单片机作为控制cpu时，请稍作简化，具体的PID 参数必须由具体对象通过实验确定。由于单片机的处理速度和ram资源的限制，一般不采用浮点数运算，而将所有参数全部用整数，运算到最后再除以一个2的N次方数据（相当于移位），作类似定点数运算，可大大提高运算速度，根据控制精度的不同要求，当精度要求很高时，注意保留移位引起的余数，做好余数补偿。这个程序只是一般常用p

[单片机]

国家车联网产业标准体系建设指南(车辆智能管理)公开征求意见

11月21日，为加快推动车联网产业发展，工信部对《国家车联网产业标准体系建设指南(车辆智能管理)》公开征求意见，公示时间自11月21日起，至11月30日止，如有意见或建议可反馈至工信部工业和信息化部科技司。《建设指南》介绍，车联网产业是依托信息通信技术，通过车内、车与车、车与路、车与人、车与服务平台的全方位连接和数据交互，提供综合信息服务，形成汽车、电子、信息通信、道路交通运输等行业深度融合的新型产业形态。《建设指南》要求，针对车联网产业发展技术现状、未来发展趋势及道路交通管理行业应用需求，分阶段建立车辆智能管理标准体系：到2022年底，完成基础性技术研究，制修订智能网联汽车登记管理、身份认证与安全等领域重点标准20项

[汽车电子]

国家车联网产业<font color='red'>标准</font>体系建设指南(车辆智能管理)公开征求意见

最新中国机器人产业联盟标准发布

上半年国产工业机器人累计销售18519台，销量同比提高了19.1%，多关节机器人首次成为国产工业机器人销量第一的机型。12月14日，2017中国机器人产业发展大会在重庆召开，大会上发布2017年上半年国产工业机器人统计数据和中国机器人产业联盟标准。国产机器人市场持续增长上半年销量达18519台据中国机器人产业联盟统计，在国家产业规划的引导下，自主品牌企业愈发重视多关节机器人的生产和销售，行业产品结构调整升级持续推进。2017年国产工业机器人销量继续增长，上半年累计销售18519台，国内企业实际销量同比增长19.1%。多关节机器人首次成为国产工业机器人销量第一的机型，上半年累计销售7423台，同比增长44.9%；坐标

[嵌入式]

工信部推进无人机地理围栏标准化大疆再负重责

近日，工业与信息化部发布公告，公开征集对《民用无人机地理围栏数据技术规范》等2项强制性国家标准计划项目的意见。消息一出，“无人机地理围栏”这个曾经火热传播过一段时间的名词再度引发了行业人士的强烈关注。如今，随着相关核心技术的进步以及产业链的成熟，无人机已经实现了民用化转型，不仅在各行各行广泛应用，更是成为了不少个人消费者手中的“自拍神器”与飞行玩具。不过，无人机保有量的快速增长，也对公共安全和航空安全造成了巨大隐患。 2018年12月，英国盖特威克机场受到无人机干扰，不得不进行关闭，致使数百架航班停飞，机场中断运营三天，上千人出行受阻；此外，美国纽瓦克自由机场、阿联酋迪拜机场和爱尔兰都柏林机场都发生过无人机导致的运营中断。数

[机器人]

汽车应用中的快速模拟视频切换

模拟视频是一种成熟、可靠的技术，经过拓展后可以满足汽车应用的要求。继续使用模拟视频的原因包括：很容易获得低成本电路设计、可以使用低廉的铜线缆，以及在嘈杂的环境中模拟视频性能的下降比较平缓。现在的轿车、越野车和卡车具备许多改进的特性，如环视摄像头、消费娱乐单元和导航系统等，所有这些都会产生模拟视频内容。一台包含这些特性的典型车辆如图1所示。　　　　图1 典型车载视频系统　　由于对“车载视频”的需求不断增长，汽车信息娱乐应用中的模拟视频快速切换已成为一项关键标准。消费者希望能在眨眼之间(200ms或更短)就无缝切换到不同的模拟视频源。当出于安全原因必须瞬间切换到后视摄像头等视频源时，快速切换特性尤其重要。在保持

[工业控制]

基于PCI ExPress总线传输的视频采集系统方案

　　视频采集系统在工业领域应用广泛，随着多媒体技术的快速发展，对视频采集、处理和传输性能的要求也不断提高，如高采集速度、低功耗、抗干扰性、实时性及扩展性等。这里提出了以Virtex-5为核心，由ADV7188为视频解码器，PCIExpress为传输总线组成的集视频采集、压缩、传输于一体的多功能视频处理系统。该系统能够实现实时海量传输多路数字视频。Virtex-6支持的PCI Express的×1通道的传输率已达3．2Gb／s。　　由于该系统设计体积小、功耗低且满足工况要求，可应用于公共场合、工厂和井下作业等需多点远距离监控环境较恶劣场所。　　1 PCI Express总线简介　　PCI Express是一种主流

[嵌入式]

IT之家科普：5G移动网络标准是如何出炉的

　　本文将尽量以通俗的语言解释上面三个问题。首先是5G的使用场景，与绝大多数读者关系最为密切的是eMMB场景，也就是我们常用的手机移动数据网络，下面我们将围绕这个场景展开叙述。下面就随网络通信小编一起来了解一下相关内容吧。　　 5G 标准是如何出炉的? 　　 5G 标准的投票有何玄机? 　　 5G 标准最终结果是什么? 　　本文将尽量以通俗的语言解释上面三个问题。首先是5G的使用场景，与绝大多数读者关系最为密切的是eMMB场景，也就是我们常用的手机移动数据网络，下面我们将围绕这个场景展开叙述。　　5G通信分为控制信道和数据信道，控制信道主要传输指令和同步数据参数等，数据信道主要传输数据。对于标准的主导企

[网络通信]

荣耀70系列发布：新增Vlog主角模式双录视频输出 2699元起售

北京时间5月30日，荣耀70系列正式发布，其中包含3款机型，分别为荣耀70、荣耀70 Pro与荣耀70 Pro+。本次荣耀70全系采用IMX800大底，数字系列引入HONOR Image Engine计算影像平台与RAW域算法，能够实现全焦段HDR影像，几款产品覆盖2000元档到4000元档，售价2699元起步。设计方面，荣耀70系列采用钻彩工艺，通过双膜三纹双镀处理后形成菱格纹理，同时引入了扇形对称造型。配色上，荣耀70拥有四款配色：亮黑色、流光水晶、墨玉青、冰岛幻境；荣耀70 Pro共有四款配色：亮黑色、薄雾金沙、墨玉青、流光水晶；荣耀70 Pro+ 有三款配色：亮黑色、墨玉青、薄雾金沙。屏幕方面，荣耀70 Pro和

[手机便携]

荣耀70系列发布：新增Vlog主角模式双录<font color='red'>视频</font>输出 2699元起售

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

■Follow me第二季第3期来啦！与得捷一起解锁高性能开发板【EK-RA6M5】超能力！

■报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~