Mali-D71 与新一代显示解决方案

发布者:Alisallll最新更新时间:2017-11-15 来源: EEWORLD关键字:Mali  arm 手机看文章 扫描二维码
随时随地手机看文章

此前几个月,我们推出了新一代显示处理器特别的预览,代号为“Cetus”。当时,我们已经明确讨论过该款显示处理器可以为整体的图形流水线和Mali多媒体家族(包括图形,视频和显示处理器)所带来的改善,尤其我们的技术在该领域所取得的重大飞跃。随着Mali-D71显示处理器正式发布(即当时的 Cetus),我们现在可以详细介绍这款名为“Komeda”的全新架构,以及它为支持最新、最复杂用户场景所提供的令人惊叹的显示技术框架。

我们此前已经就相对上一代产品的技术创新所带来的惊人回报和相应的架构技术变革展开了深入讨论。此次,我们将讨论具体的性能提升以及为终端用户所带来的改善。

全新变化


图片.png


首先,Mali-D71 通过在固定功能硬件中进行迭加、旋转、高品质缩放、gamma/de-gamma和其他先进的图像处理任务,减少需要 GPU 处理的工作负载。这一切是在多媒体流水线最后阶段完成的,即在它向屏幕发送最后的输出内容之前, 这意味着GPU 根本不用参与这些操作。此外,完成这些运作只需经过内存一次,而不是来回多次,这样就大幅提升了系统的节电效能。举个更具体的例子,为了一台1440p 设备缩放4K视频层,将其与复杂的沉浸式UI图形层进行合成,对比利用GPU软件进行同样的操作,SoC 可节电30%。

与前代产品相比,Mali-D71以并行模式运转时可在同样的面积里事项两倍的性能。与前代产品不同的是,当Mali-D71驱动单块显示屏时,可以重复使用第二个显示核心的资源。这样一来,它可以迭加、旋转和缩放的图层数量加倍,但并不会增加整体面积。这就意味着在与前代产品相同的芯片面积内,Mali-D71可以提供新的增强功能,比如缩放拆分操作、未压缩层的AFBC编码、更快的AFBC解码和MMU优化。当Mali-D71显示处理器与同时发布的CoreLink MMU-600一起使用时,集成的转换缓冲单元(TBU)以及两者通过 DTI接口实现的紧密耦合大幅降低了MMU延迟。

此外,实现4倍的延迟容忍度。相较于前代产品Mali-DP650,Mali-D71 在实现同样的显示性能时,容许系统总线上4倍的延迟。Mali-D71 实现了内存子系统的大幅优化。它允许的待处理请求的数量加倍,从实时路径中移除了未经压缩的旋转,将未经压缩的线性层转换成AFBC1.2 tiled层,从而实现更高效的旋转。这对于必须将4K帧以60-120 fps的帧率输出的高性能显示处理来说十分重要。为了做到这一点,显示处理器需要最大程度地利用占有系统总线上的时间,在显示屏空白时以毫秒为单位预取像素,确保缓冲区一直保有足够的内容。如果显示屏没有及时接收到像素,它就会因缺乏内容出现丢帧的问题,导致屏幕上出现毛刺或明显伪差,影响画质。

最后,Mali-D71将像素吞吐量增加了一倍,以呈现极致的VR 4K120效果。它在全新的并行模式下驱动单块显示屏时可以做到这一点。当只需要为一个显示进行输出时,并行模式将图像一分为二,高效地利用两套资源各处理一半的图像。对于 4K60 及以下工作负载,并行模式可以将时钟频率降低一半,从而支持更低电压,实现节电效能。对于4K120 工作负载而言,并行模式是强制性要求,从而针对相同的目标频率实现了像素吞吐量的加倍。如果不采用并行模式,只可能达到4K60,所以通过并行处理将帧处理需求减半的能力意味着功耗减半或是性能加倍。

背后的重要意义


Arm实际上并不生产实体产品,我们的IP要变成芯片还得花点时间,更不必说真正的设备出产了。而这意味着我们必须始终领先趋势 (至少) 一步,并关注最新科技对现状所带来的颠覆性影响,才能使基于Arm的产品拥抱这些科技趋势。在显示行业涌现出来的具体趋势当中,有些会对我们打算利用全新的Komeda显示架构和已经推出的整体解决方案实现的性能和特性产生较大影响。针对这些趋势的讨论,你可以点击此处查看我的一位同事近期所做的更详细介绍,而我将主要讨论Arm全新显示解决方案是如何应对这些挑战的。

1.高动态范围


在显示领域,最先出现的必备要素就是高动态范围 (HDR)。HDR 内容在更广的动态范围里被编码,以呈现更加细腻的色彩和对比度。这就使得图像上的暗黑区域变得更暗、更加层次丰富,较亮的区域则变得更明快、更清晰、更饱和,避免它们像我们有时在亮光下在图像上看到的一样变得模糊。越来越多的内容创建者利用HDR提供极致的观看体验,可如果不能将它们恰当地显示出来,就是在浪费时间。Mali-D71搭配Assertive Display 5,从你较为青睐的内容供应商比如Netflix和亚马逊 Video那里获取HDR内容,之后在任何类型的面板上 (即便是SDR) 都可以以HDR画质进行显示。Mali-D71本身获取HDR视频和图形UI 的重叠区,将它们融入以标准伽马编码且带完整色域的单帧里,然后发送给Assertive Display 5转换成正确的色彩范围,用于SDR显示。

这意味着如果你用的只是一款普通的显示处理器,那么内容创建者在以HDR10格式设计作品时所花费的心血全部付诸东流。有了Mali-D71,你就可以重现同样令人叹为观止的HDR画质,在更低规格的显示器上也不例外,完整保留这些内容的艺术匠心。


图片.png


2.VR


正如我们之前多次讨论过的那样,移动VR提出又一项技术挑战。对显示处理器以及系统其他部分来说,仅仅满足实时延迟和数据吞吐量方面的要求就已经很困难了,更不必说显示设备在靠近眼睛时,对像素质量有更高的要求了。这里就要说一说我们之前提到过的延时容忍度,还有并行模式的节电及性能提升。但是,借助搭配全新的CoreLink MMU-600,Mali-D71能够真正物尽其用。MMU-600将内存子系统进行优化,使得 Mali-D71可以最大限度地利用经过优化的内存子系统去驱动最高性能的VR显示器达到4K120fps 的水平,从而在系统总线上能够容忍更长的延迟。

3.多窗口显示


由于人们使用手机的频率越来越高,那么我们对多任务处理的需求也就越来越高。目前的台式机已经可以帮我们实现坐在电脑前时,一半显示屏用来显示在线会议,另一边则显示电子邮件或是Facebook内容。现在,我们希望可以在移动设备上进行同等程度的多任务处理。这意味着显示子系统的功能需要更强大,以便同时开展这些不同的活动。前几代的显示处理器可以最多处理4层数据,Mali-D71则提升了一倍,可以在单一显示模式下处理8个Android迭加层。再加上拆分屏幕的功能,这就意味着 Mali-D71可以不费吹灰之力就可以处理你的UI、导航栏、状态信息以及几个完全不同的应用程序。


图片.png


4.屏幕,屏幕,屏幕


和科技行业里的许多事情一样,一致性才是王道。要想调整你的应用程序和游戏,让它们在多个平台上运行,这一点很难。显示面板也是如此,显示面板基础的技术、性能点是如此之多,要知道显示处理器可能需要从显示面板获取那些信息 (反之亦然) 以达到最佳工作状态真的很难,但这正是 Arm合作伙伴生态系统大显身手的地方。通过与行业里各式各样的专家合作,我们可以锁定各种面板供应商,确保我们的显示解决方案可以获取可用信息,优化内容,在各种面板上呈现最佳的观看体验。

显示生态系统给予我们前所未有的机会与专家合作,为用户创造最佳的体验。

VR和HDR使用场景需要WQHD+和4K分辨率以及90/120的帧率,这给消费电子产品市场在功耗、成本和上市时间等方面都提出了新的挑战。Arm的Mali-D71显示处理器和 Synopsys公司通过芯片验证且配置VESA DSC编码器的DesignWare MIPI DSI Host Controller IP和MIPI D-PHY IP提供了一个完整的显示解决方案,确保这些关键IP部件无缝集成到不同数据传输模式和显示面板特性的应用处理器上。


——Synopsys 公司高级产品营销经理Hezi Saar

Mali-D71可以为新一代基于显示屏的移动产品 (比如AR/VR头盔) 实现前所未有的 4K120像素吞吐量。利用Mali-D71和Hardent公司的VESA DSC组合解决方案,你可以在既定的移动功耗范围内,通过视觉无损压缩将传输带宽减少3倍,从而实现让用户觉得更加身临其境的VR体验。


——Hardent 公司 IP 产品副总裁Alain Legault

Arm和Analogix正在积极开展合作,为头戴式VR/AR应用的处理器和显示驱动IC制定一项协议,优化工作负载,终极目标就是提供一款整个AR/VR系统的性能、成本和功耗等方面都堪称最优的解决方案。


——Analogix 公司首席技术官朱宁

Arm 完整的显示解决方案


今天我们发布了第一套完整的Arm 显示解决方案,以支持在下一代高端设备上运行的所有最新的使用场景。虽然这些产品的功能都很出众,但是只有当这三样产品合力去达成我们之前讨论过的性能点,才能实现最大效益。全新的架构,再加上预先优化的软件栈和集成的CoreLink MMU-600和Assertive Display 5技术,未来设备上的显示效果必将大放异彩。

关键字:Mali  arm 引用地址:Mali-D71 与新一代显示解决方案

上一篇:恩智浦i.MX RT跨界处理器树立微控制器实时性能最高水准
下一篇:国内首款国科微双认证存储主控芯片GK2301发布 获众厂商采用

推荐阅读最新更新时间:2024-05-03 01:58

ARM、高通等相继投入研发 智能手机自体AI化时代即将启航
  不再依赖云端或服务器系统的智能手机,可以自己直接执行人工智能(AI)功能,未来也许不再是梦,因为一种“基于装置的机器学习”(on-device machine learning)时代正在开启。韩媒ChosunBiz引述业界消息,指出以2018年为起点,三星电子(Samsung Electronics)、华为与联发科等业者,预料将相继推出支持机器学习的移动应用处理器(AP)。下面就随嵌入式小编一起来了解一下相关内容吧。       过去一段时间以来,机器学习多透过高阶中央处理器(CPU)、图形处理器(GPU)等复杂硬件实现。然而, 高通 (Qualcomm)从2015年开始,透过一项名为Zeroth的研发计划,期望利用移动系统
[嵌入式]
ARM处理器简介
  在关注Android的时候,有一些CPU架构方面的术语知识需要给自己补充的。主要有ARM、X86/Atom、MIPS、PowerPC,其中ARM在智能手机上面一枝独秀:)   其中ARM/MIPS/PowerPC均是基于精简指令集机器处理器的架构;   X86则是基于复杂指令集的架构,Atom是x86或者是x86指令集的精简版。   根据各种新闻,Android在支持各种处理器的现状:   ARM+Android 最早发展、完善的支持,主要在手机市场、上网本、智能等市场;   X86+Android 有比较完善的发展。有ATOM+Android的上网本,且支持Atom+Android 和 Atom+Window7双系统;
[单片机]
<font color='red'>ARM</font>处理器简介
ARM Linux中断分析
简介:linux在初始化的时候已经把每个中断向量的地址准备好了!就是说添加中断服务程序的框架已经给出,当某个中断发生时,将会到确定的地址处去找指令,所以我们做驱动程序时,只需要经过request_irq来挂接自己编写的中断服务程序即可。 ARM体系结构中,把复位、中断、快速中断等都看作‘异常’,当这些‘异常’发生时,CPU会到固定地址处去找指令,他们对应的地址如下: 地址 异常类型 进入时的工作模式 0x00000000 Reset Supervisor 0x00000004 Und Undefined 0x00000008 Soft interupt Supervisor 0x0000000c Abort(prefetc
[单片机]
基于ARM9嵌入式的RS485总线接口设计
随着ARM处理器应用的范围的不断深入,根据需求的不同ARM提供的外设也越来越丰富,常用的通信接口有RS232、RS485、CAN、以太网等。RS485总线凭其传输距离远、抗干扰能力强、价格低廉等优点在各种工业场合得到广泛的应用。设计使用ARM9处理器S3C2440内部集成的UART外设和RSM485模块构建具有电源隔离、电气隔离、总线保护的RS485总线接口,通过对嵌入式Linux系统RS232驱动程序的修改,使的在通过该修改后的串口驱动程序发送数据时,自动控制IO来实现RS485通信的方向控制,从而简化了RS485通信的控制流程,Linux下RS485通信程序通过对该串口的读写,实现与RS485总线上的其他设备通信。 1.通
[单片机]
基于<font color='red'>ARM</font>9嵌入式的RS485总线接口设计
基于ARM的气门电镦成型电流控制
1、引言   发动机的进排气门是发动机的重要零件,广泛用于汽车,飞机,船舶等行业。对气门的质量影响最大的因素之一是毛坯成型时的加热电流。   电镦机的工作原理图如上图1所示,加热变压器的次级两端与砧子、夹持电极及毛坯构成回路,在低电压、大电流的作用下,毛坯和砧子间形成的接触电阻发热至成型温度,在砧子和镦粗缸的压力下逐渐成型为‘蒜头’状。其工艺过程可分为始镦和终镦两个过程:   1.始镦阶段:在此阶段,墩粗缸和砧子缸分别以速度V1和V2向上运动,砧子缸的后退运动用于控制毛坯的初始加热、变形长度,其中V1 V2。在此阶段毛坯通过大电流发热并逐渐变形为蒜头状。   2.终镦阶段:在始镦过程结束时,砧子缸运动暂停。墩粗缸继续向上
[单片机]
基于<font color='red'>ARM</font>的气门电镦成型电流控制
ARM编程注意事项总结
1.主函数中调用定时器汗水timer4init()进行初始化后,要进行适当的延时,以使其生效后,再进行其他操作。 2.编码时注意 ~ () 等符号 1 2 ---- 1 2 ~(1 2) --- (~1 2) 3.中断函数中用到的变量---volatile
[单片机]
ARM 常用的段分类及说明
一.ARM存储区各段分布 二.概念 .text段:代码段,用来放置代码(code),一般是只读。 .data段:数据段,用来存放经过初始化的全局变量和经过初始化的静态变量(static)一般是可读可写。 .bss段:全局变量数据段:用来存放未初始化的全局变量和未初始化的静态变量,一般是可读可写的,之所以把.bss与.data分开,是因为系统会为.bss段的变量初始值清零。 .rodata段:常量数据段,用来存放常量(const),一般是只读的,可以归类为代码段。 栈:存放局部变量和函数参数等数据,向下生长(向低地址增长)。 堆:给动态分配内存使用,向上生长(向高地址增长) 注:代码段和数据段之间有明确的分
[单片机]
一种基于ARM的新型智能化航迹仪的设计
航迹仪是舰船导航系统中的主要配套设备之一,它能根据陀螺罗经、计程仪提供的航向航程信息或其他导航设备提供的定位信息,在海图上自动连续地绘制出船舶航行的航迹与标记。航迹仪具备的绘制航线导航功能,可使航海人员非常直观的了解到己船位置、偏航程度及未来海域的安全程度。 随着计算机技术的发展,智能化航迹仪的发展趋势是进一步拓宽功能、缩小体积、降低功耗、减少成本、提高可靠性,而传统的航迹仪系统不完全具备上述功能,存在局限性。 1 航迹仪工作原理 航迹仪的工作过程是在计算机控制下进行的。首先,使键盘处于开放状态,通过移笔键和自检键简单检查绘图功能;然后,由综导显控台装海图并向航迹仪发出装海图命令,由此航迹仪自动进入跟踪状态。船舶航迹
[单片机]
一种基于<font color='red'>ARM</font>的新型智能化航迹仪的设计
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved