SVC/ROI技术提升数字摄影机设计

发布者:BlissfulCharm最新更新时间:2011-11-21 关键字:摄影机  SVC  ROI 手机看文章 扫描二维码
随时随地手机看文章

可延展视频编码(或称为可调性视频编码,SVC)早已是老生常谈的话题,目前在市场上也能够看到具有wavelet-base SVC(小波编码为基础的可延展视频编码)这一功能的实际芯片。不过,市场上对这种技术还并不太熟悉,因此,本文将向大家介绍数字网络摄影机用ASC8851(M2)芯片的一些新功能和与之相关的SVC-T及ROI技术。

SVC的优势

为何可延展视频编码会受到学术界与研究单位的重视?目前在应用上H.264格式已几乎占据主导地位,但目前无论是DVR、NVR、IPC、DVS,还是视频会议系统,都需要具有子码流或是多码流的编译码能力。同样的内容分别被编成不同的分辨率,不同的比特率(或码流),以及不同的帧率。这对编/译码器而言涵盖了多种子码流,它们都是比较大的负担,不仅如此,在实际使用上,网络带宽、存储容量和负载也都是额外的成本考虑。仔细斟酌,对于同样的内容,为何我们不能只编一次就包含所有信息,按需获取资源,其他不重要的部分直接把封包丢掉就好?如果我们能够把影像资料有系统地排列,把重要部分和较不重要的部分在压缩时用头文件标示清楚,那么就太完美了!所有的影像一次压缩到最高的分辨率并采用最高的比特率和最多的帧率,然后就能完成一切。在译码取用的时候或是往外部串流的时候,筛选封包依照所需的分辨率。在允许的带宽范围内提供最合适的帧率做串流或译码即可。这就是可延展视频编码的目标和功效。

什么是SVC-T

延展性视频编码在时间轴上的应用就是SVC-T,也就是前面说到的对不同帧率上的应用。举例而言,1080p@30fps的数据流无需重新编码,而只需舍弃掉某些帧的数据,就可以译码成1080p@15fps,甚至是1080p@7.5fps的资料。同理,1080p@25fps到1080p@12.5fps,再到1080p@6.25fps,以此类推均可。


SVC-T的原理


罗列了这些好处之后,就不得不介绍应该如何实现,图1所示示意图可方便大家了解。

 

 

 

以一个简单的GOP(图像组)为例,I-P-P-P-I-P-P-P-I分别代表I帧和P帧在GOP内的排列顺序,时间轴上从T0到T8代表帧-帧间编码顺序。图1所示箭头代表P帧所用的参考I帧关系,而不同的0~2层则代表不同帧率所需取用的编码资料。


在最开始的T0时刻先以I帧编码,下一帧T1的P帧编码以T0为参考帧,T2也以T0为参考帧做P帧编码,T3以T2为参考帧做P帧编码,T4又以I帧编码,依照之前的顺序重新做一轮新的GOP编码。


在串流或是译码的时候,若是把所有的0~2层(包含T0~T8)I-P-P-P-I-P-P-P-I帧资料都拿来使用,就是25fps(或30fps);若把第2层的资料舍弃不用,则剩下0~1层的T0、T2、T4和T8就是一半的帧率12.5fps(或是15fps),如果只用第0层的T0、T4和T8,那么,帧率就将再减一半,即6.25fps(或7.5fps)。

SVC-T的其它注意事项


SVC-T可支持所有帧率减半和再减半及以此类推的码流。但是当帧率减半时,码流却并未减半(可能只有变成原本的3/4)。可以理解,因为I帧压缩得较少,而P帧却压缩得较多。较高层所用均是P帧,而此时码流相对较低。在SEI(补充增强信息)的语法里,可以记录不同帧率下所需要的比特率,这样,就可以视带宽、译码能力与网络状况去决定需要用多少帧率(对应于多少层)的压缩数据做串流或是译码。


SVC-T比分辨率与比特率上的可延展性视频编码更容易实现,可以在现有的基础上增加NAL层语法而做特别标示,批注是0层、1层或是2层的资料,而这种特别批注会被旧有译码语言所忽略。因此,SVC-T所做的改动最小,影响的层面也最小。这将发挥可延展性视讯编码在节能(降低多余的编译码)和降低比特率(舍弃帧率)等方面的优势。虽然降低帧率可能会牺牲影像的流畅性,但如果能保证其在视觉可接受的范围内,便将是在目前可延展性视频编码中最可行的方案。


目前的VLC免费软件支持SVC-T译码,可以用图2所示方式并加上svc-tlayer=#(#为层号)来开启串流(rtsp://172.17.208.9/live1.sdp?svc-tlayer=2)。

 

 


什么是ROI


ROI(感兴趣的区域)简单来说就是在视频编码时把感兴趣的区域编得更细腻些,让此区域的画面能够比其它区域显示得更清楚。通常我们把整张画面的主体放在ROI区域内,在相同的带宽条件下更加突显主体,将大部分的码流花在压缩主体的重要画面上,而将小部分的码流花在背景的影像压缩上。[page]

ROI如何达成

在不考虑码流控制的情况下,我们将整张画面的压缩套用相同的量化值(QV),此量化值越大,则压缩率越高(比特率较低),画质也越差;相反,若量化值越小,则压缩率越低(比特率越高),画质将越好。在同一个量化值区间内量化后均视为相同值,因此量化值越大,则代表被舍弃的误差越多,那么画质也就越差,但是压缩出来的码流却较低。

在ROI区域内和区域外分别给定不同QV,ROI区域内给定较小QV(压缩画质较清晰),而ROI之外给定较大QV(压缩画质较模糊),用户可以针对ROI区域内外影像重要程度的差异幅度大小,设定大、小QV的差距拉大或缩小,因此,ROI的功能除了设定ROI范围、位置及大小外,还有强度上的差别。

ROI的范例说明


图3可以大致看到ROI的效果,在ROI区域内,具有较清晰的画质;而在ROI区域外,背景则较不重要,因而也就能模糊一些。在整张画面里看似一块块的小方块,其实显示的是QV值。以此例而言,在ROI区域内,我们给定了较小的QV值(QV=5),而在ROI区域外我们给定了较大的QV值(QV=25)。

 

 


本文小结


视频编码格式统一为H.264后,到底还有何种新技术将出现并推广呢?今天我们介绍了两种实现在NXP ASC8851M2上的新技术,并尽量用图片及较容易理解的方式进行了说明。每种技术都是努力研发的成果,恩智浦在监控产品上不断创新和进步,以后还将有更多的想法,更好的技术,以及更丰富的产品推出。

 

 

关键字:摄影机  SVC  ROI 引用地址:SVC/ROI技术提升数字摄影机设计

上一篇:3G手机操作系统的研究和分析
下一篇:基于DM6437的数字摄像机

推荐阅读最新更新时间:2024-05-02 21:43

TQ2440国嵌学院gboot-设定CPU为svc模式
通过之前学习设定ARM的中断向量表,完成基本框架的设计,下面开始设定CPU到SVC模式(这里是指32位模式)。 同样是在ARM Architecture Reference Manual手册中,Exceptions的子目录下,找到对应的Reset模式: 关键部分我已标注红色,可以看到CPSR =0b10011 ,通过备注我们可以知道通过设定CPSR寄存器的0-4位可以设定CPU进如SVC模式。CPSR寄存器的第6、7位是关闭快速中断和中断,在bootloader启动时同样关闭。也就是CPSR =0b11010011=0xd3。代码如下: reset: bl set_svc //在reset下添加跳转指令b
[单片机]
夏普的8K摄影机仍未浮出水面?
夏普 公司刚刚发布了一张照片,该照片上是一年前就展示过的 8K 摄影机 ,看得出来它正在进行拍摄测试。根据官方的说法,这台机器目前仍处于开发状态。 图源:微博 有消息称,夏普这款 8K 摄影机将搭载 M43 传感器。外媒指出这款摄影机可以在 10bit/200Mbps 下拍摄 8K/30p 或 4K/60p 的视频,机身搭载了全尺寸 HDMI 输出接口、一个 mini XLR 接口以及耳机和麦克风接口。夏普 8K 摄影机目前还没有正式名称,它首次亮相是在 2019 年初,之后在 2020 年 CES 上再次亮相,预计价格在 4000 美元以下。 外媒 Techradar 称,夏普发言人表示该摄影机将于 202
[嵌入式]
夏普的8K<font color='red'>摄影机</font>仍未浮出水面?
广达、Celeno和Imagination合作开发支持WebRTC的IP摄影机解决方案
OEM与服务供货商可提供视频会议、家庭监控等应用的自有品牌解决方案。 2015年4月28日 ─ 广达电脑、Celeno Communications以及Imagination Technologies 三家公司已结盟,共同开发新款支持WebRTC技术的端到端IP摄影机,可让OEM与服务供货商针对视频会议、家庭监控及其他应用推出自有品牌的解决方案。这款共同开发的解决方案将由广达电脑以白标(white-label)IP摄影机的形式供应,或是作为可集成到电视等OEM产品里的摄影机模块。在这款全高清 1080p摄影机中包含了浏览器应用程序、移动应用程序、嵌入式软件以及云端服务。 广达 WebRTC IP摄影
[嵌入式]
广达、Celeno和Imagination合作开发支持WebRTC的IP<font color='red'>摄影机</font>解决方案
智原开发出网络摄影机和网络电视基站用SoC设计平台
智原科技日前与台湾地区的工业技术研究院资通所开发完成针对网络摄影机(Network Surveillance Camera)与网络电视(IP TV Station)双重应用0.18μm CMOS的 SoC设计平台。 此平台整合了影音截取、串流处理,数字影像压/解/播放,网络数据储存等多重功能,并整合计算机与通信工业研究所针对网络摄影机与网络电视所开发的核心应用软件,包含高性能IP网络协议以及影音串流(Media Streaming)处理技术。此一整合将大幅简化开发符合网络数据与3G 通信网路通用平台标准之单芯片系统,将网络影音串流以及各种网络通讯协议技术整合于单一芯片平台中。 目前双方合作开发之单芯片是架构在智原的影像
[嵌入式]
传统车用后视镜即将消失摄影机将成未来新趋势
一般民众眼中的汽车配置已经多年不变,尤其是左右两边的后视镜更是保障行车安全的重要伙伴,但随着科技进步,无后视镜技术即将成为全球趋势,日本更率先开放相关法规,知名车辆零件厂Magna在近日发布ClearView系统,并指出无后视镜已经成为趋势。 根据外媒《Newswire》报导,知名汽车零配件大厂Magna在近日发布ClearView系统,主要的画面来源是通过摄影机,显示在车内A柱的屏幕上,同时驾驶还可以点击屏幕切换视角,或是锁定特定车辆进行盲点侦测。通过摄影机与屏幕的配合,让驾驶的视线死角无限缩小,而且夜间行车也不会被后方车辆的大灯影响。 Magna指出,美国有超过84万起交通事故是因为视线死角所引起,这套系统推出后,有望
[汽车电子]
传统车用后视镜即将消失<font color='red'>摄影机</font>将成未来新趋势
ARM920T_内核 und与svc异常模式分析
一、undefined异常模式 0. 当执行未定义指令时进入und模式,进入过程: CPU跳至0x4地址执行代码,自动保存CPSR寄存器值至SPSR寄存器,我们要做的就是在0x4处跳转到另一段代码,用这段代码完成现场保护,以及异常处理,最后退出异常。此处使用NOR启动,并且在0x0处执行reset时已经将NOR中的所有代码重定位至SDRAM中,所以跳转时不能用相对跳转(b和bl),必须使用绝对地址跳转,这样CPU将到SDRAM(0x30000000)中执行代码。 ldr pc, =und /*vector 4*/ und: /*设置专属sp_und*/ ldr sp,=0x34000000 /*保护现场*/
[单片机]
ARM920T_内核 und与<font color='red'>svc</font>异常模式分析
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved