H.264/AVC中扩展空域可伸缩编码的研究

发布者:诗意世界最新更新时间:2007-09-14 来源: 电子技术关键字:视频  时域  图像  比特 手机看文章 扫描二维码
随时随地手机看文章

1 概述

H.264/AVC 国际视频编码标准的逐渐成熟和推广,越来越多的视频应用已经或即将采用H.264/AVC标准。由于存在不同的网络和不同的终端,因此对于视频编码的可伸缩性方面的要求也越来越迫切。所谓的可伸缩视频编码(scalable video coding:SVC)技术要求视频编解码器在比特流级别具有以下可伸缩特性:通过简单的丢包或截断码流等操作提取出的子码流具有较低的空间-时间分辨率和/或较低的码率(对应于较低的视频质量),同时任何可能子码流的编码效率应该与相应非可伸缩视频编解码器相当。

当前国际上对于视频编码技术的研究热点逐渐集中于在H.264/AVC 基础上实现可伸缩视频编码(Scalable Video Coding, SVC)。2005年1月,ISO的MPEG和ITU-T的VCEG,同意联合起来将SVC作为H.264/AVC的扩展集并由联合视频组(JVT)提出了草案,收录为H.264/AVC的Annex G。此后,每次JVT的会议都围绕着SVC技术对草案进行修订和完善。在2006年10月的JVT会议上,提出了H.264/AVC可伸缩扩展集的第8版草案。

2 基于H.264/AVC的SVC

H.264/AVC可伸缩扩展集的一大特点是,扩展集中所采用的H.264/AVC中的大部分技术都与AVC标准中的定义一致(例如,运动补偿预测,intra预测,变换编码,熵编码,去块滤波器等),只加入或修改了很少一部分内容。H.264/AVC的可伸缩扩展的技术要点为:(1)时域分级预测结构;(2)用于空域可伸缩性的层间预测机制;(3)基本层与H.264/AVC兼容;(4)用渐进细化片(progressive refinement slices)实现精细颗粒的质量可伸缩性;(5)NAL单元概念的使用和扩展。

H.264/AVC的SVC扩展集以不同的空间尺寸的图像为基础形成分层结构,并且在此丛础上,用等级B图像来实现时域的可伸缩性,用渐进细化(progressive refinement)的纹理编码来实现质量可伸缩性。一个降低的时/空分辨率序列所对应的比特流可以简单的通过丢弃NAL单元(或网络包)来得到,该完整的流对于获得所需的时-空分辨率是没有必要的。对应渐进精细片的NAL单元也可以被任意截断以进一步降低比特率和相应的重建质量。

实际应用的SVC编码器结构取决于要实现的可伸缩性的维度。图1所示为一个具有三个空域层的编码器。

3 基本的空域可伸缩性

基于图像空间尺寸的空域可伸缩性是通过使用金字塔形的空域分辨率概念来实现的。将原始尺寸的输入视频序列进行下采样,得到所需的较低的空域分辨率,每个空域分辨率都用一个新的层进行编码,并且在各空域分辨率层的基础上进一步实现时域和质量的可伸缩性。由于低层是由高层通过下采样得到的,因此在相同的时域分辨率情况下,每一个高层帧都有与之相对应的低层帧,两者之间存在着显而易见的相关性,我们称之为层间冗余。显然,为了获得更高的压缩效率,有必要通过各种层间预测技术来消除层间冗余,这也是空域可伸缩性技术的关键所在。 SVC允许编码器自由选择哪些空域分辨率层间的相关性需要被消除。在具体实现时采用以下三种方式:

(1)Intra宏块的预测使用上采样的基本层incra块;(2)运动信息的预测使用上采样后的基本层运动数据;(3)残差信息的预测使用上采样后的基本层残差块。同样的技术可以用于基本层与当前层具有相同的空间分辨率的情况。此时,就不用进行上采样了。

4 扩展的空域可伸缩性

在基本的空域可伸缩编码中,对于高低层之间的空间关系有较严格的限定,即,低层必须对高层的完整图像进行以2为倍数的尺寸缩小。但是在实际应用中,由于网络状况、终端能力和用户需求多样,因此以上的限制使得应用中的需求无法得到充分满足。例如,当网络带宽减小时,用户可能更希望对感兴趣区域保留原始的空间分辨率的同时玄除其他区域(切割),而非对整个图像进行整体缩小;又如,为了适合终端显示尺寸,可能要对原图像进行非2倍的尺寸缩小。为了满足类似上述需求,JVT提出了扩展空域可伸缩件(ESS:extended spatial scalability)的概念。

ESS使得相邻的空域层之间具有了一般化的关系。这包含了两方面的意义:低空域层的图像可以来自于高分辨率图像中任意位置剪切出的矩形区域,并且相邻层分辨率的比例关系不再限制于2倍。

相应的,为实现以上功能,ESS 中新定义了以下两种技术: (1)剪切; (2)一般化的上采样(任意的水平和竖直层间尺寸比例)。

考虑两个连续的空域层,基本层(Base layer)和增强层(Enhancement laver),几何关系如图2所示。增强层图像的宽度和高度分别表示为wenh和henh。基本层图像的宽度和高度分别表示为wbase和hbase。基本层图像是从增强层图像中位置(xorig,yorig)起,宽高尺寸分别为wextract和hextract,部分或全部在增强层图像中的矩形区域,通过下采样得到的。增强层和基本层图像被划分为宏块。wextract/wbase和hextract/hbase对应了基本层图像和增强层提取图像之间实际的下采样比率。因此,参数集(xorig,yorig,wextract,hextract)完整的定义了基本层和增强层图像之间的几何关系。作为特例,在基本的2倍空域伸缩关系的配置中,这些参数为(0,0,2*wbase,2*hbase)。

如同基本的空域可伸缩性一样,ESS的增强层宏块可以使用基本层的运动信息进行层间预测,增强层的宏块使用从基本层获得的运动数据进行重建。由于ESS使得空域层间的关系变得更为复杂,因此层间预测技术也有了相应的发展,包括运动信息和纹理信息两个方面的内容。

5 ESS层间运动信息的获取

ESS运动信息上采样通过以下步骤完成:

(1) 获取几何参数

如图3所示,是图2中的基本层经上采样后与增强层重叠所表现出的两层宏块的对应关系,虚线表示基本层上采样后的宏块,实线表示增强层的宏块。

由图可知,对于ESS来说,增强层的某一个宏块可能在基本层中没有对应的宏块(在增强层图像的边界上),也可能有一个或几个对应的宏块。因此,首先有必要决定相应的高层宏块所对应的1、2或4个基本层的宏块,及它与这些基本层宏块的几何关系。

(2) 确定层间宏块对应关系类型

根据获得的几何参数,一个高层的宏块可能分属以下4个类型:

Comer:高层宏块有1个对应的基木层宏块;

Hori:高层宏块有2个对应的上下排列的基本层宏块;

Vert:高层宏块有2个对应的左右排列的基本层宏块;

Center:高层宏块有4个对应的基本层宏块。

(3) 获取宏块类型和分割类型

通过层间宏块对应关系,从相应的基本层宏块获取分割和子分割信息。使用这些变量来判断高层宏块是否(有可能)被分割。

例如,考虑一个高层宏块,如图4所示。如果对应的基本层宏块分别按照8×8和16×16分割,因为左边的8×8块由一个宏块边界获得,则获得的宏块分割为8×8。此外,子分割的类型也直接由对应的摹本层8×8块获得。

(4) 运动数据的继承

在得到了宏块分割和子分割的信息之后,最后一步就是从每个(子)分割继承运动信息(例如,参考帧索引和运动矢量)。首先,确定考虑的高层(子)分割的左上方的4×4块,计算确定对应的基本层4×4块,继承覆盖了基本层4×4块的(子)分割的参考帧索引和运动矢量,最后对运动矢量进行相应的伸缩。

当使刚的剪切窗口与宏块边界对齐,且上采样比率为1或2时,运动和纹理信息的上采样过程与基本的空域可伸缩编码相同。台则,必须使用一般化的上采样工具。根据当前SVC草案中的规定,只有当宏块完全在基本层内的时候,才进行层间预测。

6 ESS的层间纹理预测

层间纹理预测过程由对基本层纹理进行基于直接内插的上采样来完成。对于intra纹理,使用一组6抽头的滤波器,同时内插会跨越块边界,所使用的基于整数的6抽头滤波器,由Lanczos3滤波器变化而来;对于残差纹理,使用双线性滤波器,同时内插不跨越块边界。

考虑到基本层和增强层之间存在潜在的色度相移,因此对于亮度和色度的处理存住细微的差别。

对于亮度样点,增强层中在位置(X,Y)的实际的预测点pred[X,Y]由以下式子得到:



interp是来自于基本层亮度纹理1/16样点内插的样点向量。

对于色度样点,增强层中在位置(X Y)的实际的预测点predC[X,Y]由以下式子得到:

predC[X,Y]=interpC[xI,yI]

其中



interpC是来自于基本层色度纹理1/16样点内插的样点向量(C可以是Cr或Cb)。xorigC,yorigC,wextractC,hextractC,wextractC,hextractC,wextractC,hextractC是色度几何参数,Pbasex,Pbasey,Pextractx,Pextracty是水平和垂直的色度相移,单位是基本层或增强层亮度点的1/4像素距离。

7 结论和展望

作为当前JVT工作的中心任务,围绕SVC的研究还在不断深化,更多细节和新技术被添加到草案中。

作为一项新技术,ESS能解决实际应用中对于空域伸缩的一般化的要求,但是对这一技术的具体实现还存存一些问题。

在H.264 SVC实现的软件参考模型JSVM中,采用了自适应的层问预测方式选择,以实现更高的编码效率。但目前只实现了图像级的自适应,即对于整幅图像的所有宏块决定是否进行层问预测。因此在ESS中采用图像剪切的情况下,部分高层宏块将没有对应的基本层宏块。此时在图像级判断自适应的结果只能不进行层间预测,这使得ESS的编码效率大受影响。为了充分消除帧间冗余,必须要引入宏块级的自适应层间预测。

关键字:视频  时域  图像  比特 引用地址:H.264/AVC中扩展空域可伸缩编码的研究

上一篇:基于水印技术的MPEG-4形状错误隐藏
下一篇:数字娱乐设备中采用多锁相环和扩频时钟进行设计的优势

推荐阅读最新更新时间:2024-12-18 22:14

比特币彻底疯狂!10nm矿机订单竟超越华为
比特币等各种虚拟货币的暴涨暴跌搅动了整个世界,而为了挖矿,众多矿工也是不折手段,除了抢购各种显卡,专业矿机也是火爆异常。 比如说比特大陆,2013年才成立,但却成了矿机中的战斗机,全球份额高达80-90%,据称每个月的净利润可达3000万美元,今年上半年就赚了10多亿人民币。 而凭借自己设计的比特币、莱特币等挖矿专用AS IC芯片 , 比特大陆已经跃居中国 IC设计 公司前五名行列,利润更是远超其他厂商。 比特大陆已经成功开发并量产了多款ASIC定制芯片和整机系统,制造工艺涵盖28nm、16nm、12nm、10mm,矿机年销量数十万台,而每台矿机就要用上百颗ASIC芯片,例如蚂蚁矿机S9配备多达189个ASIC芯片,售价高达1.
[嵌入式]
新型薄膜图像传感技术实现柔性薄膜指纹和掌纹识别
据麦姆斯咨询报道,5月下旬在美国洛杉矶举办的SID国际显示会展上,比利时微电子研究中心(IMEC)和霍尔斯特中心(Holst Centre)展示了他们的新型柔性薄膜 传感器 ,该传感器基于薄膜图像传感技术可实现对指纹和掌纹识别。该薄膜传感器的厚度只有0.2毫米,可以安装在任何物体上进行身份的验证,比如门把手、手机屏幕、汽车方向盘等。 他们展示了该薄膜传感器的两种示范机,如图1所示。第一个示范机(a)尺寸大小为6厘米 x 8厘米,它可以同时检测4根手指,分辨率为200 ppi。第二个示范机(b)是为单个指纹设计的,分辨率为500 ppi,可以提供更高的图形质量。其精准度达到联邦调查局(FBI)身份识别的标准。 其 图像传感器 可以检
[安防电子]
一种视频自动增益控制(AGC)电路的应用
1 引 言   在工业视频传输系统中,由于接收环境不同或外界干扰以及器件老化等产生的影响,接收到的信号的强弱可能变化很大。当信号较弱时,图像的对比度会变小,清晰度差且同步不稳定,无法成像。信号较强,将使后级放大器进入饱和区和截止区,导致信号严重失真,而且还会将同步脉冲切割掉,得不到良好的图像。在涉及安全生产的监控系统中,高质量、稳定的视频图像信号 ,对企业的生产尤其具有重要意义。   为此,本文介绍了一种峰值型视频自动增益控制(Automatic Gain Control,AGC)电路。它根据视频信号中同步头幅度最大的特点,取出同步头峰值作为放大器增益的控制电压,与传输图像内容无关,并且能够抑制混在视频信号中的低频干扰。 2
[嵌入式]
一种<font color='red'>视频</font>自动增益控制(AGC)电路的应用
基于VxWorks的T比特路由器2.5G POS接口板设计与实现
   1. 引言   随着IP网络的蓬勃发展、新的应用不断涌现,用户对网络带宽的要求也越来越高。运营商采用OC一192(10Gbps)接口的光纤传输大大提高了光传输网络的容量,而路由器作为网络的主要节点设备,其处理速度就成为网络通信的主要瓶颈之一。一台具有50个oc一192接口的路由器交换容量将达到T比特级,国外T比特路由器已经开始试运行,国内开发T比特路由器也迫在眉睫。本文所研制的T比特路由器,系统总吞吐率可达1.28Tbps,峰值交换能力为2.4Tbps,而每端口可达到10G的转发速率;为达到10G的转发速率,本路由器采用了4路2.5GPOS接口。    2. 硬件总体结构设计   本路由器硬件体系结构由线路接口子系
[嵌入式]
ZDS2022示波器百集实操视频之89:基于原始采样点测量统计
大家好,每当说起测量波形,我们总会想起示波器这样一种仪器,之前去拜访客户,问其示波器需求,有时客户会说,我只是简单地测一下波形而已,对示波器需求不大,这时可能会引起您的共鸣,我也只是用示波器简单地测一下波形,需求不大。 难道简单地测一下波形,对示波器的选择就真的无关紧要了吗?简单测波形其实是不简单的。客户所说的简单测量一下波形,无非就是利用示波器来测量下波形的特征,比如频率、幅值、电压峰峰值等参数。但是,即使是在简单测量波形的特征参数的背后,是隐藏着一些非常重要并且不得不知的内幕的。 大家好,每当说起测量波形,我们总会想起示波器这样一种仪器,之前去拜访客户,问其示波器需求,有时客户会说,我只是简单地测一下波形而已,对示波器
[测试测量]
无损质量等级视频浅压缩领域的实践与探索
浅压缩又称夹层压缩,是一种视频压缩级别,可以有效降低视频带宽,并能保持视频整体质量,压缩比通常为2:1到8:1。根据这一压缩比,4K、8K节目都可以用10G接口进行传输,这极大降低了网络设备成本。LiveVideoStackCon 2023上海站邀请到杨海涛老师为我们介绍AVS标准组以及上海海思等硬件厂商在无损质量等级视频浅压缩领域的实践与探索。 非常荣幸能够有机会和大家交流AVS最新制定的视频压缩标准——感知无损压缩。顾名思义,感知无损强调压缩图像的质量达到无损等级。最开始时起名是轻压缩,与重压缩相对,主要强调在编解码的过程中相对较低的计算复杂度。之后从效果考虑,又将其称为浅压缩,相对于深压缩,浅压缩更加强调较低的压缩比。在
[嵌入式]
无损质量等级<font color='red'>视频</font>浅压缩领域的实践与探索
如何合理选用dvs、dvr以及视频采集卡
    一般来说,工程商们在选用网络传输设备时,往往会具有这样的困惑:视频服务器、硬盘录像机以及视频采集卡都具有网络传输的功能,可是价格却千差万别,到底选用哪一种比较好呢?确实,刚刚入行的人往往并不了解其中的差异,还是让我们先来了解一下这三种产品各自之间的差异吧:     硬盘录像机     硬盘录像机(DigitalVideoRecorder,DVR),即数字视频录像机,相对于传统的模拟视频录像机,采用硬盘录像,故常常被称为硬盘录像机,也被称为DVR。它是一套进行图像存储处理的计算机系统,具有对图像/语音进行长时间录像、录音、远程监视和控制的功能,DVR集合了录像机、画面分割器、云台镜头控制、报警控制、网络传输等五种功
[安防电子]
突破带宽瓶颈 3G视频监控市场前景广阔
  近日,中兴通讯发布了“网络视讯”的3G视频监控方案,华为同期发布了3G高清视讯——ViewPoint9000系列产品。作为国内通信设备制造领域的龙头企业,两家公司同时推出基于3G视频监控领域应用的产品和方案,是否预示着3G视频监控业务有望成为3G时代的“杀手级”业务?运营商能否借力3G视频监控业务掘得3G市场的“第一桶金”? 突破无线带宽瓶颈       相对于传统的2G/2.5G移动视频监控应用,3G视频监控应用最大的优点是打破了无线带宽瓶颈的限制,尤其是3G网络升级到HSPA阶段后,3G网络的传输带宽可以达到几兆,可以完全满足某些特殊场景下高清视频监控的要求。       3G视频监控业务突破了无线带宽瓶颈的
[安防电子]
小广播
最新手机便携文章

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved