基于CUDA技术的视频显示系统的设计与开发

发布者:tau29最新更新时间:2014-01-13 来源: eefocus关键字:CUDA技术  大屏幕  C-S结构 手机看文章 扫描二维码
随时随地手机看文章

0 引言

近年来随着大屏幕显示技术在各领域应用的逐步深入,市场已经不满足单一的影片展示,更多的转向了对互动性更强的计算机桌面环境的融合显示上来。而目前市场上主流的桌面融合系统,多采用分屏器等硬件辅助设备,成本高,性能差。

统一计算架构(Compute Unified Device Architect-ure,CUDA)是英伟达(NVIDIA)公司近年来推出的通用并行计算架构,它以高性能显卡GPU为硬件依托,采用CPU+GPU的混合计算极大的提高了大规模的图形数据实时处理效率。本文设计的视频显示系统,采用CUDA开发方式实现了计算机桌面图片的分割计算、贝塞尔曲线拟合、以及融合图像计算等三方面处理。实时性高,画面数据计算理论上精确值14像素,精度好。

1 系统框架设计

图像处理的本质是大规模矩阵运算,特别适合并行处理。但CPU通用计算很难利用该特性。与此相反,GPU在并行数据运算上具有强大的计算能力,特别适合作运算符相同而运算数据不同的运算,当执行具有高运算密度的多数据元素时,内存访问的延迟可以被忽略。CUDA编程模型将CPU作为主机(Host),GPU作为协处理器(Coprocessor)或设备(Device),一个系统中可以存在多个设备。在这个模型中,CPU与GPU共同工作,CPU负责逻辑性强的事务处理和串行计算,GPU则专注于执行高度线程化的并行处理任务。

本系统以NVIDIA GeForce GTX470搭建的计算平台为运行环境,利用显卡的多头输出特性,连接多台投影仪组成拼接屏幕阵列,不需要额外增加其他硬件设备。由于桌面融合显示系统要处理的图像数据大、实时性高的特点,所以本系统的软件设计上则广泛使用了多CPU并行编程技术和CUDA并行计算技术,针对每一个投影设备的图像处理和显示,系统会分配一个专门的线程来处理。该线程会对应固定的CPU和固定的GPU计算核心,保证多投影设备完全并行处理,从而避免了其他系统由于显示设备增多,处理数据变大而造成的性能下降。CUDA架构如图1所示。

本系统在设计中,首先设置定时器。定期采集控制屏幕图像信息保存到公共存储空间,然后针对外设显示设备个数动态的开启数个线程完成图像的数据分割、图像的数据融合以及图像的显示等工作。其中在线程开启初始就与固定的GPU计算核心相关联,并把数据图形分割和融合部分采用CUDA技术进行实现,最后同样采用定时器技术同步各个线程中图像数据显示工作。

通常采用贝塞尔曲线拟合方法来完成图像数据的融合。该方法的一般做法是先由控制点得出目标图像每行的贝塞尔曲线,组成二维贝塞尔曲面,再将目标图像数据采用贴纹理的方法拟合到贝塞尔曲线上从而实现图像变形。Bezier曲线是一种用控制多边形定义曲线和曲面的方法。它的拟合插值公式为:


式中:Pi为构成该曲线的特征多边形;Bi,n(t)是Bezier基函数,是曲线上各点位置矢量的调和函数。Bezier曲线的始点、末点与其特征多边形端点重合,且始点、末点的切线方向与特征多边形的第一和最后一条边一致。[page]

该曲线具有凸包性、对称性等特性。贝塞尔曲线的优点是给定足够的控制点后,它能够拟合任意形状的曲线。

Bezier曲线的拟合插值公式中,函数的次数是与特征多边形的顶点数相应的,当特征多边形顶点数为4时,就构成三次Bezier曲线。三次Bezier曲线的拟合插值公式为:


OPenGL技术提供了易于操作的贝塞尔曲线生成函数和贴图函数,但却无法控制硬件运算,效率不高。本系统出于对时效性的考虑在实现过程中并未采用该方法,而是采用CUDA技术并行矩阵运算的方式来进行纹理贴图。根据CUDA程序的结构特点,本系统处理时,首先根据人机交互部分得到的控制点信息采用通常方法生成目标图像每行的贝塞尔曲线。开辟显存存入GPU,然后对应CUDA程序结构,针对目标图像上的每一个像素点,为其分配一个GPU thread来进行处理。

观察上面的计算公式发现,当获得了初始控制点坐标后,在得出每一条贝赛尔曲线上的点的过程中,彼此并不影响,具有多线程的粗粒度的特性,所以CUDA并行计算的时效性有很大的提高。

2 性能评估

在多媒体拼接系统中实时性是最基本、也是最重要的指标。我们观看到的大屏幕拼接动态效果是由一帧一帧图片快速显示而产生的。根据正常的人眼视觉残留水平系统要达到显示流畅的画面,1s要处理至少25张图片,也就是说整个程序一次图像处理流程不会超过40ms.下面本文将分析一下该系统的时效性。

由于图像采集部分和处理部分采用的是异步方式,时间复用,而显然处理部分的耗时又远远超过采集部分,所以只列出处理部分的时间消耗,又因为该部分效率主要受显卡GPU性能影响,所以之对比不同型号GPU的时间消耗情况。具体如表1所示。


由此我们看出采用GeForce8800GT显卡可以基本上完成显示功能,而采用GeForce GTX470则可以每秒钟显示35~40张图片,是用户完全感觉流畅的视频体验。

3 结语

今年来大屏幕对计算机操作演示的需求越来越多,而高性能显卡的发展又促使GPU计算逐渐成为大规模并行计算重要的解决途径。本系统采用了CUDA技术实现了视频拼接系统,目前本系统采用两个双头显卡组成显示功能模块最多实现四屏拼接,如果需要更多屏幕拼接显示时可以考虑使用网络C-S结构进行扩展。由于耗时的图像处理部分完全有GPU进行计算,屏幕越多需要计算的内容也随之增多,而同时系统显卡数量也会增多,所以该系统不会随着拼接屏幕增多而性能下降。由于系统总体采用并行技术,所以将来可以方便地为系统加入时下流行的人机互动模块、真实感渲染模块等部分,使之真正成为一款高性能多媒体展示系统,给用户一个全方位真实的体验。

关键字:CUDA技术  大屏幕  C-S结构 引用地址:基于CUDA技术的视频显示系统的设计与开发

上一篇:影像稳定方法比较暨安森美半导体光学影像稳定方案
下一篇:专业高清显示优化方案导读

推荐阅读最新更新时间:2024-05-02 22:55

LG或于17年实现可折叠大屏幕OLED技术
 7月18日,韩国政府日前公布了一个关于OLED显示技术的计划图,他们将选择LG公司领导开发可折叠的大屏幕OLED技术。预计最终的目标在2017年可以实现。   韩国政府此举的目的是为了增加出口、促进国内就业并且刺激下一代显示技术的快速应用。而可折叠弯曲的OLED显示屏有着巨大的应用空间,可以在户外广告、巴士车站等商用领域发挥不小的作用。
[家用电子]
Force Touch搬上大屏幕 苹果在盘算着什么
  苹果计划将在 Apple Watch 上使用的 Force Touch 投放到最新的 iPhone 6S 以及 iPhone 6S Plus 上,并且将其开放给开发者,让他们能够为自己的应用支持 Force Touch,采用与 Apple Watch 相同的交互方式,取代之前用一个并不适应屏幕的触控附加操作。   9to5Mac 在报道中 提到,在 Apple Watch 上使用 Force Touch,是因为 Apple Watch 的屏幕空间有限不能容纳和手机一样多的信息,使用 Force Touch 能够将需要点按的内容整合成一个网格,方便用户操作。比 Apple Watch 采用更大尺寸屏幕的
[手机便携]
内地大屏幕移动设备市场或有新一轮“搏杀”
    昨日,同方股份发布公告称,将通过发行股份及支付现金的方式购买壹人壹本100%股权。有业内人士表示,同方股份收购壹人壹本暂时不会对整个市场产生较大影响,但目前中国本土品牌平板电脑市场尚处于“群龙无首”的局面。而国产手机厂商不断推出大尺寸平板手机,平板厂商则推出拥有通话功能的7英寸平板,使此前毫无交集的手机厂商与平板电脑厂商或进入“直面竞争”。 同方股份收购分“两步” 不会参与壹人壹本日常经营 据悉,本次收购同方股份分两步,一是向杜国楹、启迪明德、融银资本、富安达投资等14名交易对象,以7.02元/股的价格发行股份,收购壹人壹本75.27%股权;另以不低于6.32元/股向不超过10名特定投资者募集配套资金,用于收购健坤投资和冯继
[手机便携]
平板电脑也能轻松玩转LED大屏幕
LED大屏幕产品设备怎么操控,怎么使用?这是选购LED大屏幕的用户一定要面临的一个问题。解决这个问题呢,厂家给出来的方案都是需要给用户那边使用LED屏的专职人员进行专门培训。 培训时间有多长呢?因人而异吧,要达到彻底熟悉,达到能够独立完成软件安装,参数设定,屏幕调试,功能实现,故障排查,这种熟练程度的还是需要花点时间的。 平时用来操控LED屏幕的专用电脑,还得妥妥的保护好。一个不留神被人打开软件,弄乱了参数,就得重新来过,调整参数,连接大屏。 还有一件事也是蛮痛苦的。技术人员不在,搞来了一部好电影,想弄到大屏幕上播放一下,体验一把私人电影院的感觉,这个还不是一般人能搞得定的。 老板有意见了,
[家用电子]
平板电脑也能轻松玩转LED<font color='red'>大屏幕</font>
单片机CCFL控制器改善大屏幕LCD TV的图像质量
虽然LCD背光有多种方式,例如LED、EL、CCFL等,但对于大尺寸LCD屏来说,由于CCFL发光效率高而成为主流背光光源。传统的LCD屏主要用于笔记本电脑或台式电脑,背光组件在有一定亮度的前提下,还要尺寸小和重量轻等,大多采用侧面背光方式(CCFL灯管安装在屏的二边或四周,通过导光板将光漫射到整个屏幕后面);而LCD TV特别是大尺寸LCD TV,由于对显示亮度(450cd/m2)、视角广角(170%26;#176;)、图像对比度(500:1)等有更高的要求,因而需要采用光源利用率更高的垂直背光技术。 1 垂直背光 垂直背光,顾名思义,是将CCFL灯管直接安装在LCD屏后面,并利用全反射膜将发散到其他方向的光线反射到屏幕
[单片机]
Samsung或推更大屏幕平板手机和弯曲屏幕手机
    大萤幕平板手机   新浪科技讯 香港时间9月26日早间消息,路透社报导称, Samsung 有可能将推出萤幕尺寸更大的“平板手机”(phablet),甚至采用弯曲萤幕,以应对大萤幕手机市场的激烈竞争。   平板手机是一类介于智能手机和平板电脑之间的设备。自2011年底以来,在亚洲市场的推动下,这类设备快速发展。相对于智能手机,平板手机更适合浏览网页和媒体内容。 Samsung 今年4月推出的旗舰手机Galaxy S4采用了5英寸萤幕,因此也被部分分析师归类为平板手机。   本周三, Samsung 在首尔宣布Galaxy Note 3将在全球范围内开售。这款手机采用5.7英寸萤幕,在韩国的无合约价为990美元。下月,这款手
[手机便携]
八位移位输出芯片在LED大屏幕显示中的应用
大屏幕显示以其显示清晰、更新方便等特点,在信息提示中广泛应用,如车站/机场、证券交易系统及生产车间的信息显示等。大屏幕显示方式分两种:点阵式和八段码方式,前者显示信息灵活,功能强大,但控制较为复杂,硬件成本较高;后者则应用八段码方式显示一些数值信息,方便简单,价格低,在数字显示中被广泛应用。 目前,一般的数字式LED显示屏普遍采用单片机的串行口或其它I/O口通过诸如串行输入并行输出芯片74LS164驱动。但是,这样有二点不足:一是单片机的串行口被显示电路占用,便不能实现多机通讯,只能实现单屏的显示;二是一般的串行输入并行输出芯片不带输出锁存功能,且移位脉冲频率低,输出驱动电流小,这使得显示屏有时会出现字符闪烁,显示不清,刷新速度较
[单片机]
八位移位输出芯片在LED<font color='red'>大屏幕</font>显示中的应用
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved