视频智能分析之Web视频播放通用解决方案

发布者:恬淡如云最新更新时间:2021-09-30 来源: eefocus关键字:浏览器  视频编码  PC 手机看文章 扫描二维码
随时随地手机看文章

通常,摄像机H265视频编码在传输快、存储小、画质高等方面的优势使得其备受企业青睐,但是由于主流浏览器不能够支持这种格式,因此在浏览器下播放和解析视频都受到一定的约束。那么,如何实现 Web 视频播放的通用就成为了我们必须研究的课题。本期技术的真相将带你了解旷视盘古系统是如何解决 Web 视频播放通用方案这一难题的。

 

一、背景

在视频智能分析领域,绝大部分摄像机视频码流均支持 H264 和 H265 两种编码格式,H265 视频编码相比 H264 有着诸多优点:视频数据传输带宽减半、存储减半、画质提升等。因此,在大部分智慧安全管理项目中, H265 视频编码使用较为广泛,能够直接减少用户项目成本。


但当下主流浏览器对 H265 视频编码格式仍然未能够支持,主要还是支持 H264 视频编码格式,随着 Flash 插件退出市场后,在 Chrome 浏览器下支持视频播放难度雪上加霜,所以大部分智慧安全管理厂家依然是在 IE 浏览器插件机制下支持着摄像机视频播放。


旷视在浏览器端视频播放也有诸多实践,旷视的盘古系统深耕智慧园区领域,在业内各项指标均遥遥领先,系统功能繁多,其中视频播放就是其必不可少的一部分,面向 ToB 市场,盘古平台系统自然需要适配用户各种使用场景,能够在不同浏览器中进行视频播放是基本要求。因此,在视频播放方面,我们需要研究一套通用的 Web 视频播放解决方案,来适配不同使用场景:高性能多路视频播放、强实时性视频播放等,并能够兼容不同的浏览器(IE / 360 / Chrome)。

 

 

二、当前解决方案

 

 

 

盘古系统中视频数据来源


如上图所示,盘古系统中,视频数据来源各异、数据内容各异、甚至视频编码也各不相同,怎么样实现 PC 端跨浏览器进行 Web 视频播放,当前也有诸多方案,下面简易介绍下各个方案的实现关键点。


2.1 Web 前端封装 FMP4 + H5 video 播放显示

 

 

 


方案说明:


Web 前端收取到视频流后,进行 FMP4 封包,并使用 MSE 扩展 video 标签进行视频播放,对于智能帧( Intelligence Frame 即结构化信息)采取透传方式,前端 Canvas 绘制。


MSE 即 Media Source Extensions,是一个 W3C 草案,MSE 扩展了 HTML5 的 Video 和 Audio 标签能力,目前支持的视频封装格式是 MP4,支持的视频编码是 H.264 和 MPEG4 ,支持的音频编码是 AAC 和 MP3,FMP4 即 Fragment mp4,前端将封装好的 FMP4 数据直接送进 MediaSource 即可实现浏览器视频播放,当前主流浏览器支持情况:

 

 

当前浏览器对MSE支持情况


2.2  Web 前端 WebAssembly 解码 + Canvas 显示

 

 


方案说明:


前端收取到视频流后直接使用 ffmpeg 生成的 WebAssembly 进行软解码,输出 YUV、PCM,前端通过 WebGL 在 Canvas 上绘制视频画面,同时通过 Web Audio API 播放音频。


WebAssembly 是一种新的编码方式,可以在现代的网络浏览器中运行,它是一种低级的类汇编语言,具有紧凑的二进制格式,并为其他语言提供一个编译目标,以便它们可以在 Web 上运行。它也被设计为可以与 JavaScript 共存,允许两者一起工作。近几年已经被各主流浏览器所广泛支持,支持情况:

 

 


2.3 后端解转码 + H5 video 播放显示

 

 


方案说明:


前两方案基本是依靠 Web 前端实现视频播放,压力基本都在前端,播放路数受限,而此方案是需要部署一台服务器,进行视频码流的解码、编码、封装等动作,前端 Web 拿到 FMP4 视频数据后,依靠 MSE 扩展 video 标签的方式进行视频播放。 上述方案各有优缺点,如下:

 

 


那么我们依然面对以下问题:

 

 

  • 如何面对服务器端资源紧张的情况下播放多路视频?如何面对跨浏览器播放各种音视频编码视频数据?如何面对端到端实时性要求高的使用场景?

 

三、Web 视频通用解决方案


我们经过大量分析讨论及预研,发现要解决这些问题的依然可行,在没有服务端资源情况下,我们只能将视频播放资源消耗前置,但考虑到浏览器对密集型数据计算并不擅长,我们决定在视频播放端使用后台程序,来实现视频封装、解码等动作。

 

 


在这个架构基础下,我们能够支持各种音视频编码格式,如 H264、H265、MJPEG、SVAC 等,同时,我们增加了多种模式来应对不同的使用场景。


3.1 适配兼容性好,实时性优先的视频播放需求:解码成 YUV + Web 前端 WebGL 显示


具体流程:

 

 

  • 组件获取音视频码流,CPU 软解成视频帧 YUV 、音频帧 PCM ;电脑环回地址 Websocket 数据传输,不受网络带宽限制; 前端视频帧 WebGL 渲染,音频帧 Audio 标签音频播放,支持各种浏览器;通用性较强,支持各种音视频编码格式;支持 4 路 1080P 或者 9 路 4CIF ,端到端播放延迟 300ms 左右


3.2 适配视频码流自适应、性能优先的视频播放需求


具体流程:

 

 

  • 组件获取音视频码流,若视频码流是 H264 ,封装成 FMP4 ,音频码流解码成 PCM ;Web 前端 H5 播放显示,利用浏览器硬解码能力,性能消耗较少;若视频码流非 H264 格式,解码成 YUV ,前端 WebGL 渲染;通过判断视频码流格式,自适应输出不同视频数据给前端,来达到综合性能消耗最低,支持路数更多的效果,支持各种浏览器。

 

3.3  适配高分辨率、多路数的视频播放需求


具体流程:

 

 

  • 在 IE 引擎下,Web 前端可以加载组件中 OCX 控件,控件获取音视频码流;控件支持 H264 、H265 视频编码的 GPU 解码及显示;GPU 解码显示能力较好,使端到端播放延迟能够在 200ms 以内;支持 16 路 1080P , 支持 400万 、 800万 等更高分辨率。

 

YUV输出Web视频播放

 

四、总结

总结:当然每个视频播放方案各有实际的使用场景及约束条件,在浏览器尚未支持 H265 等视频编码格式前,每个方案实现起来都有其对应的代价,怎么样实现 Web 视频播放并满足各自项目需求应该是百花齐放,各有略同。

关键字:浏览器  视频编码  PC 引用地址:视频智能分析之Web视频播放通用解决方案

上一篇:智能电视为什么开机变得越来越慢了
下一篇:荣耀智慧屏向上:互联重写大屏行业新拐点

推荐阅读最新更新时间:2024-10-30 11:40

谷歌推出人体浏览器 展示3D人体模型
  谷歌人体浏览器 谷歌人体浏览器   谷歌最近推出了一款名为谷歌人体浏览器(Google Body Browser)实验项目,可以浏览3D人体模型。   谷歌人体浏览器其实相当于一款针对人体推出的谷歌地球(Google Earth),可以对人体模型进行3D浏览。   谷歌在WebGL Camp环境中展示了这款应用。WebGL是一种跨平台的低级3D图形API(应用编程接口),无需任何插件,即可将3D图形引入万维网。由于使用了HTML5 Canvas元素,因此不需要借助Flash、Java或其他图形插件来运行。   如果使用支持该技术的浏览器访问 bodybrowser.googlelabs.com
[医疗电子]
平板电脑5年内可占PC市场18%份额
    据《福布斯》杂志报道,联想总裁兼COO罗瑞德(Rory Read)日前表示,虽然平板电脑市场仍然很年轻,但在大约5年内可占全球PC市场15至18%的份额,与此同时,“上网本已逐渐衰微,与笔记本电脑的界限慢慢模糊”。联想当前的战略是“保护与进攻”(protect and attack)。保护指的是在传统领域捍卫自己的强势地位,如中国市场和商务电脑 Thinkpad品牌。进攻指的是积极寻找新的发展机遇,包括拓展新兴市场与开发新一代移动设备。平板电脑乐Pad(LePad)便是联想发起的第一轮进攻。   首款乐Pad平板电脑配备10英寸屏幕,运行于谷歌Android操作系统,今年3月在中国上市销售。升级版乐Pad将从6月
[手机便携]
日经:PC用DRAM价格月增6%,能见度到九月
    行动记忆体需求暴增,在晶片制造商穷于应付的同时, PC用DRAM却也因此受惠,现货价格持续攀升。 据日经新闻报导,行情指标4-Gigabit DDR3 DRAM过去一个月上涨6%,目前来到1.74美元,某些产品甚至还涨到2美元以上。PC出货量萎缩、需求能见度明明不佳,但PC用DRAM价格之所以还能往上攀升,是因为美光等记忆体大厂将部分产能移作生产行动产品,以致供给减少。 PC制造商夏季机种目前已陆续上市,尽管此时季节性需求已开始减缓,但许多专家仍旧看好DRAM这波反弹行情将一直延续至九月,毕竟下半年智慧型手机大战才要进入最高潮,记忆体制造商也会持续调整产能。 据市调机构DRAMeXchange表示,整体DRAM市
[手机便携]
山寨占有率达40% 中国PC电源市场堪忧
  8月25日超频三在北京召开了自家电源产品的发布会,在会上我们了解到超频三自家关于中国电源市场的调查数据。如下图,山寨电源在国内的市场达到了恐怖的40%,一线厂商的占有率为25%左右;二,三线为三分一33%,台系和国际品牌只有2%左右。    目前国内的一线电源厂商基本就是长城和航嘉两家,这里我们根据行业人员和经销商的实际信息作一些修正,长城和航嘉在国内的影响力很大,在市场占有率大约能到30%左右,二三线占有率大概也是在30%左右,台系和国际品牌加起来的确只有2%,山寨电源的占有率依然是达到38%!   长期以来,在装机市场存在着这么一个现象:人们总是先考虑CPU,主板和显卡这三大件,装机时候机箱电源总是排在并不重要的位
[电源管理]
ZiLOG的8位MCU用于PC电视调谐卡,增强遥控功能
ZiLOG公司在推进8位集成微控制器和通用远程处理方案技术革新的同时,又宣布了与Hauppauge Computer Work公司的战略伙伴关系。Hauppauge公司是个人电脑数字视频、电视和信息广播接收机类产品的开发和生产商。在合作计划中ZiLOG的Z8 Encore! F08闪存微控制器系列将会使Hauppauge公司的WinTV-PVR-150型板卡先进的遥控功能得到进一步的增强。 WinTV-PVR是一款便于安装的个人电脑电视调谐卡,它使消费者可以通过他们的电脑观看、暂停或录制有线电视和卫星电视。消费者无需购买新的多媒体娱乐电脑就可以廉价快捷地在已有的电脑上收看电视或享受其它娱乐功能。 除了为Hauppauge公司提
[焦点新闻]
全新超极本:PC平板二合一
最近,同事给我换上一台全新一代超极本,这是前所未有的设备,将PC和平板合二为一。它全新的体验,让我再次为超极本的发展而振奋。 这是英特尔的参考设计样机,黑色金属外壳,相当薄而酷;拿起来也很轻,便携性非常棒;机器启动特别快,关机也只需3秒钟。最新酷睿i7处理器带来的旗舰性能,让我能高效工作。最让我兴奋的是触控功能,它把精彩的平板体验集成了进来。过去几周我天天用它早晨读新闻、看报纸,发现它内容整合得比我的新iPad更好,能一站式获得所有新闻内容,阅读体验更加平滑流畅,视觉效果亮丽得令人震撼。超极本屏幕比我的新iPad更大,窗口切换也更好,有了它,我几乎不再用新iPad了。 我一直喜欢体验新设备。记得iPad刚推出我就买了一部,不可
[家用电子]
手机秒变PC:三星S9无需Dock扩展坞即可连接电脑
        根据外媒phone Arena的报道,直到2018年夏季,三星的DeX还只能通过DeX Pad 或者是 DeX Station连接。将三星S系列或者是Note系列的手机插进去,连上显示器,键盘和鼠标就能获得不错的PC界面体验。             phone Arena表示,根据内部人员泄露,三星S9和S9+将会得到无Dock连接DeX的升级,只需一个USB Type-C转HDMI线就能搞定了。 ▲图自phone Arena            外媒表示,从长远来看, 用DeX Station 或者DeX Pad还是最好的连接方案,扩展坞可以在使用的时候给手机充电,内置的风扇还可以给手机降温。虽然用US
[手机便携]
程序的思考(从单片机到PC)
关于程序的执行,以前想的不多,没有意识到一个程序在运行时,从哪里读指令,数据又写在哪里。 最近在看CSAPP时这个念头经常在脑袋中晃荡。 从单片机上知道,在上电的那一刻,MCU的程序指针PC会被初始化为上电复位时的地址,从哪个地址处读取将要执行的指令,由此程序在MCU上开始执行(当然在调用程序的 main之前,还有一系列其他的的初始化要做,如堆栈的初始化,不过这些我们很少回去修改)。PC在上电时,和MCU差不多,不过读取的是BIOS,有它完成了很多初始化操作,最后,调用系统的初始化函数,将控制权交给了操作系统,于是我们看到了Windows,Linux系统启动了。如果将操作系统看作是在处理器上跑的一个很大的裸机程序(就是直接在
[单片机]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved