H.264的技术优势及在H.323系统中的应用-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

一、引言

近年来，随着我国通信网络基础设施的快速建设，视讯业务由于可以为处于多点的与会者提供音视频等多种信息，节省大量费用，提高工作效率，因而发展迅速，并有望成为NGN的主要业务。视讯会议系统从产生至今，发展了多种适于各类通信网络的系统，目前传输多媒体信息的主要有H.323、H.324和H.320等系统。IP技术的开放性特点使得它非常适合承载多种业务，随着IP的安全和QoS等问题的逐步解决，以IP作为承载网的优势将更加明显，下一代网络也将采用IP技术作为承载网技术。因此，本文以适用于在IP网上提供多媒体业务的H.323系统为主进行阐述。H.264是由JVT为实现视频的更高压缩比，更好的图像质量和良好的网络适应性而提出的新的视频编解码标准。事实证明，H.264编码更加节省码流，它内在的抗丢包、抗误码能力和良好网络适应性使它非常适于IP传输，H.264有望成为H.323系统中首选的视频标准。

H.323系统对视频编解码标准提出了以下三个主要要求：

（1）一些IP网络接入方式如xDSL可提供的带宽有限，除去音频、数据占用的带宽，传输视频的可用带宽就更少，这就要求视频编解码压缩率高，这样就可以在一定的比特率下具有更好的图像质量。

（2）抗丢包性能和抗误码性能好，适应各种网络环境，包括丢包和误码严重的无线网络。

（3）网络适应性好，便于视频流在网络中传输。

二、H.264适于H.323系统的三个技术优势

H.264在制定时充分考虑了多媒体通信对视频编解码的各种要求，并借鉴了以往视频标准的研究成果，因而具有明显的优势。以下将结合H.323系统对视频编解码技术的要求，阐述H.264的三个优势。

1. 压缩率和图像质量方面

对传统的帧内预测、帧间预测、变换编码和熵编码等算法的改进，使H.264的编码效率和图像质量在以往标准的基础上进一步提高。

（1）可变块大小：帧间预测时可以灵活选择块的大小。在宏块（MB）划分上H.264采用了16×16，16×8，8×16，8×8四种模式；当划分为8×8模式时，又可进一步采用8×4、4×8、4×4三种子宏块划分模式进一步划分，这样可以使运动物体的划分更加精确，减小预测误差，提高编码效率。帧内预测一般采取两种亮度预测模式：Intra_4×4和Intra_16×16。Intra_4×4适合图像中细节丰富的区域，而Intra_16×16模式更适合粗糙的图像区域。

（2）高精度运动估值：在H.264中亮度信号运动补偿预测的精度是1/4像素。如果运动矢量指向参考图像的整像素位置，预测值就是该位置上参考图像像素的值；否则使用6阶FIR滤波器的线性内插获得1/2像素位置的预测值，通过取整数和1/2像素位置像素值均值的方式获得1/4像素位置的值。显然采用高精度运动估计会进一步减小帧间预测误差。

（3）多参考帧运动估值：每一个M×N亮度块都要经过运动补偿预测得到运动矢量和参考图像索引，子宏块中的每个子宏块划分都会有不同的运动矢量。选择参考图像过程是在子宏块层次上进行的，因而一个子宏块中的多个子宏块划分在预测时使用相同的参考图像，而同一个slice的多个子宏块之间选择的参考图像可以不同，这就是多参考帧运动估值。

（4）参考图像的选取更加灵活：参考图像甚至可以是采用双向预测编码方式的图像，这就允许选取与当前图像更加匹配的图像为参考图像进行预测，从而可以减小预测误差。

（5）加权预测：允许编码器以一定的系数对运动补偿预测值进行加权，从而在一定的场景下可以提高图像质量。

（6）运动补偿循环内的消除块效应滤波器：为消除在预测和变换过程中引入的块效应，H.264也采用了消除块效应滤波器，但不同的是H.264的消除块效应滤波器位于运动估计循环内部，因而可以利用消除块效应以后的图像去预测其他图像的运动，从而进一步提高预测精度。

2. 抗丢包和抗误码方面

参数集、片的使用、FMO、冗余片等关键技术的使用可以大大提高系统的抗丢包和抗误码性能。

（1）参数集：参数集及其灵活的传送方式会大大降低因关键的头信息丢失而造成错误发生的可能。为保证参数集可靠地到达解码器端，可以采用重发的方式多次发送同一参数集，或传送多个参数集。

（2）片（slice）的使用：图像可以划分成一个或几个片。将图像划分为多个片，当某一片不能正常解码时的空间视觉影响就会大大降低，而且片还提供了重同步点。

（3）PAFF和MBAFF：当对隔行扫描图像进行编码时，由于两个场之间存在较大的扫描间隔，这样，对运动图像来说帧中相邻两行的空间相关性相对于逐行扫描时就会减小，这时对两个场分别进行编码会更节省码流。对帧来说，存在三种可选的编码方式，将两场合并作为一帧进行编码或将两场分别编码或将两场合并起来作为一帧，但不同的是将帧中垂直相邻的两个宏块合并为宏块对进行编码。前两种称为PAFF编码，对运动区域进行编码时场方式有效，非运动区域由于相邻两行有较大的相关性，因而帧方式会更有效。当图像同时存在运动区域和非运动区域时，在MB层次上，对运动区域采取场方式，对非运动区域采取帧方式会更加有效，这种方式就称为MBAFF。

（4）FMO：通过FMO可以进一步提高片的差错恢复能力。通过片组（slice group）的使用，FMO改变了图像划分为片和宏块的方式。宏块到片组的映射定义了宏块属于哪一个片组。利用FMO技术，H.264定义了七种宏块扫描模式。

（1）帧内预测：H.264借鉴了以往视频编解码标准在帧内预测上的经验，值得注意的是，在H.264中，IDR图像可以使参考图像缓存无效，之后的图像在解码时不再参考IDR图像之前的图像，因而IDR图像具有很好的重同步作用。在一些丢包和误码严重的信道中，可以采取不定期传送IDR图像的方式进一步提高H.264的抗误码和抗丢包性能。[page]

（2）冗余图像：为提高H.264的解码器在发生数据丢失时的顽健性，可以采用传送冗余图像的方式。当基本图像丢失时，可以通过冗余图像重构原图像。

（3）数据划分：由于运动矢量和宏块类型等信息相对于其他信息具有更高的重要性，因而在H.264中引入了数据划分的概念，将片中语义彼此相关的语法元素放在同一个划分中。在H.264中有三类不同的数据划分，三类数据划分分开传送，若第二类或第三类划分的信息丢失，使用差错恢复工具仍然可以通过第一类划分中的信息对丢失信息进行适当恢复。

（4）多参考帧运动估值：多参考帧运动估值不但可以提高编码器的编码效率，还可以提高差错恢复能力。在H.323系统中，通过使用RTCP，当编码器得知有参考图像丢失时，可以选择解码器已经正确接收的图像作为参考图像。

（5）为阻止错误在空间上的蔓延，解码器端可以指定当P片或B片中的宏块在做帧内预测时不使用相邻的非帧内编码宏块作为参考。

3. 网络适应性方面

为适应各种网络环境和应用场合，H.264定义了视频编码层（VCL）和网络提取层（NAL）。其中VCL功能是进行视频编解码，包括运动补偿预测，变换编码和熵编码等功能；NAL用于采用适当的格式对VCL视频数据进行封装打包。

（1）NAL Units：视频数据封装在整数字节的NALU中，它的第一个字节标志该单元中数据的类型。H.264定义了两种封装格式。基于包交换的网络（如H.323系统）可以使用RTP封装格式封装NALU。而另外一些系统可能要求将NALU作为顺序比特流传送，为此H.264定义了一种比特流格式的传输机制，使用start_code_prefix将NALU封装起来，从而确定NAL边界。

（2）参数集：以往视频编解码标准中GOBGOP图像等头信息是至关重要的，包含这些信息的包的丢失常导致与这些信息相关的图像不能解码。为此H.264将这些很少变化并且对大量VCL NALU起作用的信息放在参数集中传送。参数集分为两种，即序列参数集和图像参数集。为适应多种网络环境，参数集可以带内传送，也可以采用带外方式传送。

三、在H.323系统中实现H.264

由于H.264是一种新的视频编解码标准，在H.323体系中应用H.264存在一些问题，比如如何在H.245能力协商过程中定义实体的H.264能力，因此必须对H.323标准进行必要的补充和修改。为此，ITU-T制定了H.241标准。本文仅介绍与H.323相关的修改。

首先，要规定如何在H.245能力协商过程中定义H.264能力。H.264能力集是一个包含一个或多个H.264能力的列表，每一个H.264能力都包含Profile和Level两个必选参数和CustomMaxMBPS、CustomMaxFS等几个可选参数。在H.264中，Profile用于定义生成比特流的编码工具和算法，Level则是对一些关键的参数要求。H.264能力包含在GenericCapability结构中，其中CapabilityIdentifier的类型为standard，值为0.0.8.241.0.0.1，用于标识H.264能力。MaxBitRate用于定义最大比特率。Collapsing字段包含H.264能力参数。Collapsing字段第一个条目是Profile，ParameterIdentifier类型为standard，值为41，用于标识Profile，ParameterValue类型为booleanArray，其值标识Profile，可以为64、32或16，这三个值依次表示Baseline、Main和Extended三个Profile；Collapsing字段第二个条目是Level，ParameterIdentifier类型为standard，值为42，用于标识Level，ParameterValue类型为unsignedMin，其值标识H.264 AnnexA中定义的15个可选的Level值。其他的几个参数作为可选项出现.

其次，由于H.264中图像的组织结构与传统的标准不同，一些原有的H.245信令不在适用于H.264，如MiscellaneousCommand中的videoFastUpdateGOB等，因此H.241重新定义了几个信令提供相应功能。

最后，H.264的RTP封装参考RFC 3550，载荷类型（PT）域未作规定。

四、结束语

作为一种新的国际标准，H.264在编码效率、图像质量、网络适应性和抗误码方面都取得了成功。但随着终端和网络的快速发展，对视频编解码的要求在不断提高，因此H.264仍在继续地完善和发展以适应新的要求。现在对H.264的研究主要集中在如何进一步降低编解码时延、算法优化和进一步提高图像质量上。目前，使用H.264进行编解码的视频会议系统越来越多，大多数做到了在Baseline Profile上的互通。随着H.264自身的不断完善和视频通信的不断普及，相信H.264的应用将越来越广泛。

参考文献

[1] I TU-T H.241．Extended video procedures and control signals for H.300 series terminals．July 2003

[2] Wiegand T，Sullivan G J，BjΦntegaard G．Overview of the H.264/AVC video coding standard．IEEE Trans，Circuits，Syst Video Technol，2003，13（7）

关键字：H.264 技术优势 H.323系统引用地址：H.264的技术优势及在H.323系统中的应用

上一篇：基于WSC1115的液晶电视的设计实例
下一篇：H.264/AVC视频压缩编码标准的新进展

推荐阅读最新更新时间：2024-05-02 22:24

IPTV机顶盒的智能化配置和维护方案设计

　　IPTV接收终端，即IPTV机顶盒，是IPTV系统关键设备之一，其主要功能包括：支持LAN或xDSL网路传输、接收及处理IP数据和视频流；支持H.264、MPEG-2、MPEG-4、WMV和Real等视频解码；支持相应CA技术；支持HTML网页浏览及网络游戏等。　　由于机顶盒硬件资源有限，其操作系统一般采用WINCE、嵌入式Linux、RTOS等嵌入式操作系统。　　由于IPTV基于网络传输，因此作为网络接入设备的机顶盒在使用前应进行IP地址、网关等网络参数的设置。如果在实际工程中采用人工逐台进行设置，会大大增加运营商的人工成本，而且日后的维护费用也会相应增加。因此在IPTV机顶盒的设计中应考虑实现即插即用功能，即实现自

[家用电子]

郭明池：苹果AR技术优势正被中国厂商迅速瓦解

BI中文站 4月12日报道凯基证券知名分析师郭明池在日前的投资者报告中指出，中国手机制造厂商在AR技术方面发展迅速，而苹果CEO蒂姆-库克（Tim Cook）此前曾将这一技术称为公司未来的“核心技术”。接着，郭明池用腾讯旗下知名手游《王者荣耀》（Honour of Kings）举例，该游戏在全球范围内拥有超过2亿玩家，并即将在今年5月推出AR版本。 “它（《王者荣耀》AR版本）将带来比Pokemon Go更优秀的AR体验，其所采用的是人工智能初创公司SenseTime的算法，而后者目前的估值已经达到了30亿美元。”郭明池在报告中写道。他还补充道：“苹果虽然是AR技术的先行者，但其领先地位正在逐渐被OPPO赶超

[手机便携]

解析：比亚迪元的技术优势与市场展望

2016年4月11日，比亚迪首款小型SUV元上市。与其品牌车系不同的是，比亚迪元包括搭载1.5自然进气发动机、1.5T增压发动机和1.5+2台电动机的传统与混动车型。元的售价从5.99万元-24万元。其中入门级车型1.5手动挡（售价5.99万元）陈星，将成为不久之前上市的长安CS15与长城哈佛M2有力竞争对手。而搭载油电混动动力总成与超级电四驱系统的混动版元，更是比亚迪首款更换了车标的小型混动四驱车。 2010年开始，中国汽车市场上SUV车型的热销，让厂家赚的“锅满瓢满”的，但车型的单一让消费者选择余地并不大。无论合资车厂还是自主品牌，在2010年-2012年都不断推出不同级别的SUV，唯独小型SUV并不被市场所

[汽车电子]

Jointwave:没有风投，我们就卖IP

作为为数不多的IP公司之一，Jointwave(北京技微联合电子科技有限公司)经过的旅程并不平坦，然而几位年轻人凭借着坚韧不拔的精神，在危机中能够成功转型，也实属不易。在仅有的几句交谈中，笔者已深深被他们团队协作精神所感动。“我们的企业文化不倾向突出个人。”公司共同创始人王秋石短短的一句话，令笔者相信，务实的态度会引领Jointwave走得更远。以下是采访实录。 EEWORLD:请简要介绍一下Jointwave及其成长历史。 Jointwave: Jointwave是2003年底筹建2004年7月成立的，前面三年是一直坚持以最高图像质量的视频编解码器ASIC为目标，摸着石头过河从无到有在技术上一点

[嵌入式]

网通力挺AVS，电信与国外芯片巨头还在观望

在中国第二大有线电信运营商中国网通决定其 IPTV 标准采用国产音视频标准 AVS 之后，该标准的支持者认为中国最大的电信运营商也将转投AVS。 AVS标准工作组秘书长黄铁军表示，成本将是其中的主要原因。“运营商考虑的是未来10年中的系统成本，因此我们不能只考虑今天的成本。”黄铁军表示，他承认目前采用AVS成本较高。“AVS的系统成本最终将与 H.264 相同，或者略低于后者。” 中国网通本月稍早的时候表示，将采用AVS标准，尽管它的多数IPTV试验用的都是H.264。网通表示，将倾向于把免费提供系统转变的设备制造商作为其长期伙伴。中国最大的电信公司——中国电信，没有公开暗示将采用AVS。实际上它的态度正好相反

[焦点新闻]

H.264 SVC/MVC一致性测试工具包

　　Allegro DVT，H.264 AVC最近推出H.264 SVC Scalable High Profile at Level 4.2一致性测试工具包和H.264 MVC Stereo High Profile at Level 4.1一致性测试工具包。S2C在中国销售和支持Allegro DVT产品。S2C丰富的设计经验和强大的技术支持为Allegro DVT客户提供增值的服务。　　H.264 SVC与H.264 MVC是可适性视频传输的新兴标准。借助这类标准，运营商可以传输最佳高清视频内容（1080p60和全高清3D），同时避免同播多重H.264 AVC码流，从而节省网络带宽。　　在H.264 AVC测试工具包

[测试测量]

浅谈H.264 DVB-T机顶盒解决方案

H.264作为新一代的视频编解码技术，与传统的MPEG-2相比，其卓越的压缩性能，使其能在较小带宽下实现更高画质的视频传输，在视频数据存储中占用更少的存储空间。传统的DVB-T市场，MPEG-2是主流视频编解码格式。近年来，随着带宽和频率资源越来越珍贵，欧洲新兴地区、俄罗斯、土耳其等地区的运营商选择H.264作为视频编解码格式，形成了一定规模的市场，引起了机顶盒厂商的关注。上海富瀚微电子有限公司在几年前就看到这一需求，推出了H.264解码芯片FH8601。这款ASIC芯片与业已成熟的DVB-T机顶盒芯片组合成一种双芯片解决方案。FH8601作为协处理器可接收来自主芯片(如LSI9700、NEC61123)的指令和H.264

[嵌入式]

液体流量计的技术优势有哪些

1、液体流量计的传感器结构简单，测量管内没有可动部件，也不有任何劝止流体运动的浪费部件。以是当流体经由流量计时不会惹起任何附加的压力流失，是流量计中运转能耗最低的流量仪表之一。 2、可丈量赃污介质、侵蚀性介质及悬浊性液固两相流的流量。这是由于仪表丈量管内部无妨碍流动部件，与被测流体干戈的只不过测量管内衬与电极，其材料可依据被测流体的素质来选择。比方，用聚三氟乙烯或聚四氟乙烯做内衬，可丈量种种酸、碱、盐等氧化性介质；采用耐磨橡胶做内衬，就格外恰当于测量带有固体颗粒的、磨损较大的矿浆、水泥浆等液固两相流以及种种带纤维液体与纸浆等悬浊液体。 3、液体流量计是一种体积流量测量仪表，在测量历程中，它不受被测介质的温度、粘度、密度以电导率（

[测试测量]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■验证并选择心仪MOSFET，探寻选型奥秘！注册、体验双重好礼等你拿~

■评论有奖：元器件采购的秘密法宝，助你做个自带“松弛感”的职场人！

■新栏目器件口碑专辑上线~快来点评吧！

■中星联华直播 | 高速信号完整性分析与测试 — “码”上行动系列线上讲堂