摩尔定律走到尽头了吗?视频编解码技术未来如何卷?

发布者:HeavenlyLove最新更新时间:2023-08-03 来源: elecfans关键字:摩尔定律  视频编解码技术 手机看文章 扫描二维码
随时随地手机看文章

我们在追求怎样的编码未来?

Cloud 


Imagine

无处不在的视频渗透、井喷式的流量增长、多元的场景技术需求、用户对视频体验的“不将就”……音视频行业的快速发展却伴随着“编码标准升级速度缓慢”、“硬件红利见底”、“编码复杂度带来的成本问题”等众多挑战。   视频编码还“卷”得动吗?   究竟怎样的视频编码技术,才能满足既要又要的体验与成本平衡?   面向机器视觉的视频编码、虚拟现实视频、智能化应用视频......前浪翻滚而来,视频编码的“未来式”如何展开?   本文由IMMENSE、「阿里云视频云」视频编码服务端负责人陈高星和LiveVideoStack策划、采访而成。


需求很多,矛盾更多

技术迭代速度凝固了吗?摩尔定律走到尽头了吗?

视频编解码技术约10年提升50%压缩率,但这“十年磨一剑”的升级速度,早就跟不上视频信息量膨胀的速度。   新编码标准带来的编码复杂度增加,远高于CPU处理能力的增强,随之面临编码技术难以“普惠”的难题。   随着视频在更多应用场景的扩展探索,单一编码标准已难覆盖多种视频应用需求……   显然,一边是AR、VR时代的到来,以及4K、8K的高分辨率,60-120fps高帧率,10-12bit宽色域,让视频本身的信息量数倍膨胀;一边,是资源堆叠置换压缩效率,和“摩尔定律”的进步已经走到了“尽头”。加之,视频的“超低延时”对编码速度的要求,这一切,让视频体验、带宽、计算成本、编码速度之间的“矛盾”越发明显。   于是,我们始终面临更高清、更实时、更高效的编码需求,也面临技术与需求之间的诸多“矛盾”。   在这些似乎难以平衡的“矛盾”背景下,也衍生出许多值得进一步探讨的问题:

➤ 现有的编码标准在哪些方面关注不够?

➤ 如何先用好现有的编码标准?

➤ 现有的视频编码技术覆盖不到的维度有哪些?

➤ 除了码率和质量,视频编码是否需要关注更多的目标?

➤ 如何打破资源堆叠置换视频压缩效率提升的技术思维惯性?

……

从需求、矛盾、问题中,可引出深一层的认知:编码优化的目标不再仅仅考虑传统的主客观质量、复杂度、时延等维度,还有与AI处理能力的友好性、多平台下性能的适配性等。   问题的提出总是伴随着解题思路和技术方向的选择。   于是,推动着编解码架构从传统向更智能、更兼容的方向演进。


终极目标,有些偏倚

在优化编解码时,我们究竟需要追求什么?

当2015年阿里云视频云向业界提出了“窄带高清”的概念,并在2016年正式推出窄带高清技术品牌并产品化,这种既“降低码率”又“提高清晰度”的兼顾之方,几乎成为了业界的通用解法。   但是,不断演化之下到当前,业内开始流行一种“内卷”,即,过度追求"某客观指标数据"的优化。   然而,以“人”为中心的视频化视角,在最终的用户体验上,视频都应是更关注主观体验的。相反的是,在实际研发过程中,特别是编码器的优化上,通常都是依赖如:PSNR、SSIM、VMAF-NEG这样的“有源客观指标”。   诚然,在大部分情况下,客观质量的提升都能一定程度反映到主观质量的提升上,特别是当样本数足够大,且客观质量提升较大时,客观指标和主观感受能呈现一致性。   不过在窄带高清的优化实践中,也存在一些主客观优化“不一致”的情况。   比如:H.265标准中的SAO工具,用于改善振铃效应,但随之会降低VMAF和VMAF-NEG分数;   X265编码器里的PSY工具,在主观质量上能增加高频细节,但是对于客观指标都是不友好的;   又比如:JND和ROI技术,在挖掘视觉失真冗余的过程中,也不可避免地会造成有源客观指标的下降;   阿里云自研的码控算法,会对容易出现“块效应”等主观问题的区域分配更多码率以保护主观质量,但这也会导致客观质量下降;   还有,前处理增强中的各种修复生成技术,会直接对源进行修改,这类技术对于旨在评价“与源差异大小”的有源客观指标,都是不太友好的。   此外,针对单一客观指标的“过度优化”,也有可能造成单一客观指标与主观体验相悖的情况......   因此,单项客观指标的数值或高或低,都不应是视频编码优化追求的“终极目标”。


细微之处,方见视界

我们的编解码视界里,可以有哪些精妙解法?

在上述技术理念和智能编码架构的支撑下,“窄带高清2.0”从人眼视觉模型出发,将编码器的优化目标从“保真度更高”调整为“主观体验更好”。   这可以从视觉编码和细节修复两个视角来看。   在视觉编码维度,“窄带高清2.0”采用基于场景和内容的帧类型决策和块级码率分配,模式决策采用面向主观友好的算法。   在内容自适应编码部分,考虑到人眼感知的视频空间域的亮度、对比度以及时域失真是不连续的,通过基于恰可察觉失真(JND)自适应编码技术,丢弃视觉冗余信息,在主观质量不发生明显降低的情况下,可以大幅节省带宽;同时,通过ROI码控技术调整码率分配策略,进一步提升人眼感兴趣区域的清晰度。   在细节修复维度,“窄带高清2.0”采用基于生成对抗网络(GAN)的细节修复生成技术,在修复因编码压缩引起的马赛克效应和边缘毛刺的同时,“脑补”生成一些自然的纹理细节,使得画面纹理细节更丰富、更自然、更有质感。   更关键的是,应对垂直细分场景,我们的模型会对场景特征会实现更为智能的纹理生成。   比如:对于演唱会场景,曾为百视TV专属打造了Idol人像定制模版,针对优化人像区域的细节修复生成效果,将Idol的“怼脸直拍”,通过直播清晰还原送到观众屏幕前。   再比如:在NBA篮球比赛场景,AI修复模型加强了篮球场地板纹理、球员近景特写、球场边界线、地面广告字母、球衣上数字、篮球网等篮球体育赛事特有元素的修复生成,大大提升画面清晰度和整体视觉生动力表现。   也正是,唯有细微之处,方能见技术之极。


绕不开的“成本、成本、成本”

成本和体验的“非零和博弈”,  编解码怎么摆平?

正如“清晰度”和“带宽”是“窄带高清”需要平衡的天平两端,在当前“降本增效”的大环境之下,“体验”和“成本”的“非零和博弈”,一定是绕不开的话题。   成本(计算复杂度),体验(质量),这两者虽然是“trade-off”的权衡关系,但在某种程度上,也可以单方面优化提升。   比如,通过算法优化,在复杂度不变的情况下,将编码器的R-D曲线朝着更有性价比的方向优化;同时,通过高性价比的自适应快速算法的设计,也可以将质量的提升转化为成本的收益;又或者,通过底层优化并与计算平台的充分结合,挖掘异构编码的潜力,可以进一步在质量不变的情况下降低计算成本。


  当然,在“让高压缩率算法和AI真正普惠”的路上,阿里云视频云所做的不仅于此。   与视频编码类似,在视频处理领域,深度学习从效果上已经远超传统方法,同时还在不断地快速进化,但深度学习对计算资源的高消耗,成为阻碍其在实际应用中广泛使用的主要原因。   阿里云视频云深度自研编码内核,包括s264、s265,落地100+算法,支持直播、点播、RTC场景,相对于开源,全场景20%+压缩率领先。   同时,我们引入AI辅助的编码决策,在码率分配和模式决策上提升内容自适应能力,极致挖掘视觉冗余,同等主观下,码率节省50%。


软硬结合,是破解编码天花板之技吗?

在算法层面和软件层面塑造的有限差异之上,要想塑造成本优势,必须将软件、算法与操作系统、硬件、乃至芯片,全线联动。   此基础上,基于自研倚天710芯片,视频云与倚天团队联合投入ARM视频编码优化,深度重构了视频编码数据结构、并行框架,重新调优了快速算法策略,从软件、汇编、硬件层面跨层深度优化,塑造极致性能。   同时,我们与平头哥深度合作,共建“软硬结合”自研芯片竞争力,通过算法、加速库、驱动、固件一体化设计,不断探索创新音视频技术,加强在更多视频应用、更多终端设备上的普适性,从而带来更节省、更低耗、更高清、更实时的硬核编码力,赋能千行百业的视频化需求。

没有想象,就没有进化

苹果的VisonPro,透射出编码的未来吗?

回顾文章开头的“矛盾”与问题,面对激增的海量视频数据、多元的视频内容形式,以及加速扩大的行业应用范围,视频编码如何“进化”的答案,也隐藏在行业的急速迭代之中。   如何实现更高压缩效率并匹配多样的细分场景?AI codec能实现比传统压缩标准更高的压缩效率,并能够在一些垂直场景有落地的机会,例如:业界已有基于深度学习的图像压缩,落地于卫星图像的压缩传输;   面对未来视频数据的消费场景不再单纯局限于人眼视觉,服务于机器视觉的视频编码也将迎来巨大应用市场。阿里云视频云团队已与高校深度合作,布局“面向人-机视觉的全新编码范例:高层语义与低层信号相结合的图像编码方案”;   而对于近期大热的苹果VisionPro的推出,作为视频行业工作者,十分乐见VR生态能在苹果的带领下,真正打出一片市场。因此,一些相关的沉浸式编码标准如MIV,点云编码,动态网格编码等技术,也将逐步投入研究……


关键字:摩尔定律  视频编解码技术 引用地址:摩尔定律走到尽头了吗?视频编解码技术未来如何卷?

上一篇:音圈马达的工作原理及行业应用
下一篇:全面解读摄像头结构和工作原理

推荐阅读最新更新时间:2024-11-07 12:15

“虚拟”摩尔定律时代来临?
台湾半导体产业协会的理事长卢超群预期“虚拟”摩尔定律时代即将来临,并将有机会为晶片产业再次迎来成长和盈利… 台湾半导体产业协会(TSIA)理事长卢超群(Nicky Lu)正期待“虚拟”摩尔定律(“virtual” Moore’s Law)时代的来临,因为它将有机会为晶片产业再次迎来成长和盈利。 “半导体产业即将出现另一个30年的成长期。”卢超群在接受《EE Times》采访时预测,“我们即将见证‘实质’的1nm制程技术出现。届时摩尔定律将以‘虚拟的’摩尔定律形式存在。” 半导体产业需要再次起飞。管理谘询机构麦肯锡(McKinsey)在2015年的一份报告中指出,从1995年到2008年,这个领域出现了7%的复合年成长率
[半导体设计/制造]
壮哉!“中国造”光量子计算机诞生
  计算机作为20世纪最伟大的发明之一,随着 摩尔定律 迈向终结,性能提升面临瓶颈。后 摩尔定律 时代,我们又要通过什么途径提高运算速度呢?答案是量子计算。 量子计算机 具有强大的计算能力,可以解决传统计算机难以或者不能解决的问题。下面就随嵌入式小编一起来了解一下相关内容吧。 壮哉!“中国造”光量子计算机诞生   就在今天,科技界迎来了一则重磅消息:世界上第一台超越早期经典计算机的光 量子计算机 诞生。中国科学院5月3日在上海举行新闻发布会,对外发布了这一消息,这个“世界首台”是货真价实的“中国造”,属中国科学技术大学潘建伟教授及其同事陆朝阳、朱晓波等,联合浙江大学王浩华教授研究组攻关突破的成果。    量子计算机 是指利
[嵌入式]
摩尔定律越来越慢,芯片架构工程师成香馍馍
无论摩尔定律是死是活...IC设计技术的生命力仍源源不绝…… 来自AMD、ARM与Intel的技术专家在一场于年度DesignCon大会的座谈中表示,无论摩尔定律(Moore’s Law)是死是活,半导体技术蓝图的发展会同时带来挑战与机会。 对于一个芯片的晶体管数量是否会像Intel共同创办人Gordon Moore在1965年做出的观察那般,继续每两年成长一倍,参与上述座谈的讲者们意见分歧。“至少有一点是,工艺节点转换的速度正在趋缓;”ARM院士继技术总监Rob Aitken指出,“16纳米与10纳米工艺的量产时程都延迟了三年,而在我们所处理的电路类型中,Denard微缩定律在90纳米节点已失效。” Intel平台工程事业群副总
[半导体设计/制造]
英特尔高级院士Mark Bohr:10年内看不到摩尔定律终点
英特尔高级院士Mark Bohr说“20年前,业内权威人士说,摩尔定律至少还可维持10年;10年前,业内权威人士又说,摩尔定律至少还可维持10年;今天,我仍要说,摩尔定律至少还可以维持10年。” 随着CMOS硅工艺尺寸越来越小,有关硅CMOS工艺什么时候接近物理极限,从而导致摩尔定律不再成立的争论最近在业内不绝于耳,10年前有业内权威人士说7nm将是CMOS硅工艺的物理极限,今天又有人说3nm是物理极限。在我们这些媒体记者眼里,CMOS硅工艺物理极限一直在不断被突破。 2017年9月19日,一直在业内低调不发声的英特尔终于开始发威了,在北京瑰丽酒店举办的“领先·无界”英特尔精尖制造日活动上,挟英特尔最新10nm工艺晶体管密
[半导体设计/制造]
阮华德:未来半导体发展已无法依循摩尔定律
近来在半导体制程微缩的进展速度逐渐趋缓下,观察未来的产业走势,明导国际(Mentor Graphics)董事兼执行总裁阮华德(Walden C. Rhines)表示,未来10年内,制程微缩将遇到经济效益上的考虑,半导体产业将不再完全依循摩尔定律(Moore’s Law)发展。他并指出,投入3D IC发展是延续半导体产业的成长动能。 阮华德认为,摩尔定律是一个从观察中并归纳成的产业趋势,并非不变的法则,而摩尔定律提出者的Gordon Moore近年来也已修正此定律。阮华德表示,摩尔定律为学习曲线,只要产品的生产规模持续放大,而成本就会下滑。过去10年,半导体产业所生产的晶体管数量每年成长49%,芯片的出货颗数每年也有1
[半导体设计/制造]
摩尔定律终结:英特尔宣布延长CPU发布周期
       大约十年前,英特尔宣布了著名的“嘀嗒”(Tick-Tock)战略模式。“嘀嗒”意为钟摆的一个周期,“嘀”代表芯片工艺提升、晶体管变小,而“嗒”代表工艺不变,芯片核心架构的升级。一个“嘀嗒”代表完整的芯片发展周期,耗时两年。   但是英特尔最近在公司文档中废止了“嘀嗒”的芯片发展周期,第三代Skylake架构处理器“Kaby Lake”CPU将在今年第三季度发布,彻底打破了“制程-架构”的钟摆节奏。从下一代10纳米制程CPU开始,英特尔会采用“制程-架构-优化”(PAO)的三步走战略。   由于受到CPU线程不断缩小的问题,英特尔从22纳米到14纳米都采用两步走,即所谓的“嘀嗒”战略。在“嗒”这一步,受限于工艺
[手机便携]
摩尔定律没有告诉我们的事情(之二)
既然现在我对摩尔定律的持续有效性产生了极大的质疑,那么就让我试着解释一下我们正在为物理学做着何种补偿。 首先,我曾经说过,在过去的大约十年里,时钟速度所体现的性能并没有按照摩尔定律所预测的那样发展。那我们是如何成功地让其不断加速呢?例如,在有了DSP的情况下,为了增强性能,你是会选择增加时钟还是增加乘法器? 对此,我们的回答始终是增加乘法器的数目。如果我们回过头看看C1X,每个时钟周期有一个乘法器。当我们发展到C64X的时候,每个时钟周期有四个乘法器。现在,依托新的DaVinci SoC技术,每个周期有八个乘法器。这样,我们就对由物理原因引起的性能下降进行了补偿。然而,摩尔定律并没有预言到这些。 在电
[嵌入式]
英特尔解答摩尔定律为何不会失效?
  9月19日首次在北京举办的“ 英特尔 精尖制造日”上, 英特尔 EVP兼制造、运营与销售集团总裁StacySmith表示,面对业界对 摩尔定律 是否会失效的质疑, 英特尔 的答案是:肯定不会!下面就随手机便携小编一起来了解一下相关内容吧。   按照戈登•摩尔的观察,芯片上的晶体管数量每隔24个月将增加一倍。这一观察已经成为科技行业发展的真理。它意味着在半导体行业我们产品的性能每两年会翻一倍,每个晶体管的成本也随之下降。从超级计算机到虚拟现实到其他的精尖技术, 摩尔定律 发挥了巨大的贡献。在 摩尔定律 的核心也反映了一个真理那就是经济学原理:按照特定节奏推动半导体制造能力的进步,我们就可以降低任何依赖于计算的商业模式的成本。其
[手机便携]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved