3D图形芯片及3D图像生成算法的原理分析-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

一、引言

　　3D芯片的处理对象是多边形表示的物体。用多边形表示物体有两个优点：首先是直接（尽管繁琐），多边形表示的物体其表面的分段线性特征除轮廓外可以通过明暗处理(shading)技术消除；其次是仅存储多边形顶点的几何信息，多边形内部每个象素的明暗颜色计算所需的信息由这些顶点信息插值而来，这正是易于用图形硬件支持的快速明暗处理技术。支持多边形绘制的图形硬件同样也可以绘制由双三次曲面片表示的物体，通过对这种物体的表面进行三角剖分，用逼近的三角形网格代替原物体的曲面表示就可以做到这一点。当然，用多边形表示物体也有其缺点，如增加了纹理映射和阴影生成的难度，当需要详细表示复杂物体时所需的三角形数量将变得非常庞大。

　　将多边形表示的物体显示到计算机屏幕上，这一过程涉及物体在计算机内部的表示方式即物体的数据结构，由物体组成的场景的组织结构，物体从场景到屏幕空间要经过的一系列变换，以及产生最终屏幕图象要经过的一系列光栅化处理。这些方面都涉及到特定的处理算法,相应的算法又有许多不同的变种。下面仅就3D芯片涉及的图形处理过程及相关算法做一简单分析介绍，这些是理解3D图形处理及图形硬件的基础。

二、3D物体的表示法

　　具有复杂外形的物体其表面可以由多边形面片来近似表示。以图1的圆柱为例，其柱面可以由2N个三角形近似，其两端可以由两个N边形来近似。多边形模型在其轮廓上的分段线性特征是这一表示法主要的视觉缺陷,改进的唯一途径是增加多边形的分辨率。对于一个复杂形体来说，为了充分表示其细节，常常要用到十万个以上的多边形。这将耗费许多数据库访问时间和绘制时间。当将多边形模型进行放大处理时，会产生连接问题。这就是所谓的“几何走样”。物体的多边形表示既可以通过交互设计人工提取，也可以通过激光扫描设备得到。总之，多边形表示的物体并不特别适合于交互操作或做自由的形状改变。当改变物体的形状时很难保证多边形表示的完整性得到保持。

　　对多边形明暗着色所需要的信息存储在一个分层的数据结构中，每一个物体表面由指向多边形表的指针定义，该多边形表包含了近似该表面的一组多边形，每一个多边形由指向顶点表的指针定义，顶点表包含了每个多边形的所有顶点。具体来说需要为每个多边形存储以下信息:

　　1)多边形的顶点表，每一个顶点是一个三维坐标，该坐标定义在创建该物体时的局部坐标系中。

　　2)顶点的法向量表，这是明暗处理算法所要求的信息。向量由同一局部坐标系中的三分量表示。

　　3)多边形的法向量，它是包含该多边形的平面的真正的几何法向量。这是背面删除操作所需要的信息。

　　绘制多边形物体的传统方法是将多边形作为独立的绘制实体，这样多边形之间的共享边就要被处理两次。为避免这种情况，可采用基于边的绘制方法，这时多边形的表示是基于多边形的边而不是多边形本身。基于边的方法意味着绘制过程的组织要采用基于扫描线的算法，基于扫描线的算法将同时处理与当前扫描线相交的所有多边形。这时存储器中能存储的可被同时处理的多边形的最大数目将成为可绘制的场景复杂度的上限。使用全屏Z-buffer并将扫描线算法局限在物体所包含的多边形上就可以解决这一问题。

三、坐标系统

　　绘制过程的几何处理部分可被看成应用一系列的坐标变换将物体数据库变换到一系列的坐标系下，这些坐标系对所有绘制系统都是公用的，是理解3D图形学的基础。用计算机生成图象的一系列基本操作与绘制过程要经历的一系列空间即坐标系有关。随着绘制过程的进行处理将从一个空间进入下一个空间。已完整地建立起描述这些变换的方法。在对物体实施变换时希望对顶点和顶点的法向量使用相同的变换矩阵。事实上，当变换在所有方向并不相同时，顶点法向量必须采用不同的变换矩阵。由于单位法向量经过变换之后其长度不一定仍保持不变，因而必须对其进行重新单位化处理(单位法向量是光照计算所要求的)。

　　1.局部坐标系（局部空间）

　　为了建模和进行局部变换的方便可选择被建模物体之内或附近的某一点作为局部坐标系的原点。例如可选择一个立方体的某一顶点作为坐标原点，三个坐标轴即是与该顶点相连的立方体的三条边。在局部坐标系选定之后，物体各顶点的局部坐标以及相对于该局部坐标系的各顶点的法向量和物体上多边形的法向量就可以被提取并存储起来。

　　2.世界坐标系（世界空间）

　　当每一个物体在其局部坐标系中被建立起来之后，就需要将其放置到将要绘制的场景之中。组成场景的每个物体都有自己独立的局部坐标系。整个场景的坐标系就是所谓的世界坐标系。场景中的所有物体都必须从自己的局部坐标系中变换到世界坐标系中以定义场景中物体之间的空间相对关系。如果一个物体在场景中被定义为运动的，则必须为该物体定义一个随时间变化的变换序列以便在每一帧将该物体变换到世界坐标系中的不同位置。场景中的光源也在世界坐标系中定义。如果光照计算是在世界空间中进行，则对物体法向量的变换到此为止。对物体表面属性如纹理、颜色等的定义和调整也在世界空间中进行。

　　3.眼睛坐标系、相机坐标系或观察坐标系（眼睛空间）

　　眼睛坐标系统是用来建立对世界空间进行观察时的观察参数和观察范围的。在图形学中通常用假想的相机来辅助对观察系统的理解。一个假想的相机可以以任意方向放置在世界空间的任何位置，胶片平面在图形学中就是观察平面，也就是场景将投影到其上的平面。建立一个普遍适用的观察空间相当繁琐，在多数情况下是对眼睛坐标空间做许多限制。一个最小的实用系统可以这样建立，首先要求眼睛坐标系的原点和投影中心是世界坐标系中的同一个坐标点；其次要求观察平面的法向量和观察方向在眼睛空间中与Z坐标轴重合；最后，观察方向必须是这样的，当相机朝着Z轴的正向时Z值的增加将远离眼睛的位置，同时在左手坐标系的前提下，X轴指向右，Y轴向上。满足这一要求的系统就可以使假想的相机以任何观察方向放置在世界坐标空间中的任何位置。图2 是有关坐标系之间的关系。

　　眼睛坐标系是最适宜做背面删除的空间。背面删除操作是将背对观察者的多边形全部剔除，在场景中这些多边形对于观察者来说是不可见的。如果对一个凸物体做背面删除，则可以完全解决其隐藏面问题。对于具有凹面的物体而言这一操作并不能解决隐藏面问题。背面删除操作是通过计算多边形所在平面的法向量与视线向量之间的夹角来决定该平面是否可见。如果这两个向量的点积大于0，意味着其夹角小于90o 即该多边形是可见的，否则为不可见。视线向量是从多边形指向视点的向量。多边形平面的法向量可通过其不共线的三个顶点计算而得。多边形的法向量必须指向物体的外部，为保证这一点，多边形的顶点必须以反时针方向（从多边形外部看时）顺序存储。如图3所示。

　　4.屏幕坐标系（屏幕空间）

　　屏幕空间是比较难于靠直觉理解的一种空间概念。它是描述如何观察场景的方法的过程，与透视几何有关，也可以理解为怎样定义场景中能够到达眼睛（或相机）的光线的过程。将场景中的一个点投影到距离视点为D的观察平面或屏幕要用到的基本变换是透视变换，屏幕或观察平面的法向与观察方向一致。从图4可以看到，运用相似三角形原理，点P在屏幕上的投影P’(Xs= Dxe/Ze, ys=Dye/Ze)。屏幕与观察平面略有不同，屏幕是观察平面上的一块矩形区域，在经过一个与设备有关的变换之后，可以从观察平面坐标求得屏幕坐标。屏幕空间的定义使得其只对一个封闭空间中所包围的场景进行绘制处理，这个封闭的空间称作视锥台。它可以这样来描述：设想在距离视点D处的观察平面上有一尺寸为2h的正方形窗口，且该窗口关于观察方向是对称的，则平面

xe=±hze/D ye=±hze/D
ze=D ze=F

将构成一个封闭的锥台。其中xe、ye 、ze是指眼睛坐标系中的坐标，而平面ze=D和平面ze=F分别称作近处和远处的裁剪平面，它们垂直于观察方向，在此我们假设观察平面与近处的裁剪平面重合。如图4所示。对于透视投影而言，通过连接窗口角与投影中心就形成所谓的视锥体。

　　有了这个视锥体，就可以用它对已变换到眼睛坐标系下的场景进行选择。这不外有三种情况，对于那些完全落在视椎台之内的物体，直接通过透视变换将其变换到屏幕坐标系下；对于那些完全落在视椎台之外的物体不作进一步的处理而直接抛弃；对于那些与视椎台的面相交的物体则应作裁剪处理，裁取其位于锥台内的部分并用透视变换将它们变换到屏幕坐标系下。在屏幕坐标系下，Z坐标将作为判断物体面之间相互遮挡的唯一判据。

注意，场景中的每个物体的每个三角形都要经过以上处理过程。

四、象素处理

　　经过以上一系列的变换之后，一个多边形已变换到屏幕坐标系下。将一个屏幕多边形在屏幕上绘制出来就是多边形的象素处理过程，它包括光栅化、隐藏面消除、明暗处理。光栅化、隐藏面消除、明暗处理是整个3D图形生成过程中最内层的处理。他们是三个二维插值过程。光栅化是用屏幕空间三角形的顶点坐标插值，以求得三角形的边所截取的三角形内扫描线段的端点坐标，并进而求得所截扫描线段上的象素坐标。隐藏面消除则是通过对屏幕空间三角形顶点的深度值（Z坐标）进行插值，从而获得三角形内扫描线段上每个象素的深度值。明暗处理是用同样的方法由顶点光强求得三角形内扫描段上每个象素的光强。这三种处理的算法具有相同的数学表示形式，只需将坐标、深度或光强代入该方程就可以得到相应的结果。总之，场景的绘制过程可概括为：

　　对场景中的每个物体的每个多边形做几何变换将其变换到屏幕空间；

对多边形内的每一个扫描段求出其端点及其上每个象素的坐标；

对扫描段上的每个象素做隐藏面消除处理及明暗处理。

　　1.光栅化

　　光栅化处理通过插值求得三角形内扫描段的x坐标的起点和终点。问题是何处是终点和起点？当使用实数坐标时在象素之内的何处进行采样，屏幕坐标是取整数还是保留小数精度？这些问题如果处理得不好，就会在多边形之间产生孔洞，产生重叠的多边形，这会在透明效果处理时产生严重问题。如果反走样处理不精确，则会在带有纹理的表面上产生纹理不连续现象。例如，如果对屏幕坐标取整，则屏幕多边形的顶点将延伸或缩回到离它最近的象素，这样多边形的大小将发生微小的变化，而且不能用密集采样进行反走样处理，动画中的“颤抖”现象便是由此而引起的。在象素内何处采样并不重要，重要的是对象素采样的处理必须一致。

　　2.隐藏面消除

　　全屏幕Z-Buffer（深度缓存器）算法已成为图形学事实上的标准隐藏面消除算法，他虽然简单但存储要求很高。Z-Buffer算法可看作是工作在三维屏幕空间。每一个象素有一个二维屏幕空间坐标( xs , ys )和由眼睛空间顶点的深度值插值而得到的z深度值。深度缓存器开始时被初始化为远处裁剪平面的深度，对每一个象素比较其插值得到的深度值与已存储在深度缓存中( xs , ys )处的值，如果该值小于存储值，则新计算的象素更靠近观察者。这时新计算的象素的明暗处理值将覆盖帧缓存中的旧值，深度存储器中的值也换成新计算的值。深度缓存器算法对场景数据库组织及场景复杂性没有限制。在处理复杂场景或物体时，应保证足够的深度精度。

　　3.明暗处理

　　首先计算多边形顶点的明暗参数，然后在多边形平面上进行插值。这样绘制出的物体不但具有很强的三维立体感，而且消除了用于近似曲面的多边形之间的公用边所形成的不连续特征。实现这一处理方式的算法有两种，一种称作Gouraud明暗处理，一种称作Phong明暗处理（均以发明者的名字命名）。这也是基于多边形的绘制日益受欢迎的一个重要原因。Gouraud明暗处理的速度快，但不能产生精确的高光效果，通常用在对速度要求高的场合，如飞行模拟、交互式CAD应用等。Phong明暗处理可以生成高质量的图像，但将耗费庞大的硬件资源。Gouraud明暗处理仅在多边形的顶点使用局部反射光照模型计算光强，然后使用顶点处的光强通过插值求出多边形内各象素的光强值。而Phong明暗处理则对顶点的法向量进行插值，并对多边形内的每一个象素用局部反射光照模型计算其光强。一般说来，多边形顶点的光强是顶点的法向量相对于光源和视点的方向的函数，这就是所谓的局部反射光照模型。顶点的法向量用来近似原物体表面在该点处的法向量，通过平均公用该顶点的所有多边形的法向量求得。

　　Gouraud明暗处理仅与局部光照模型中的漫反射分量一起使用，这是因为当高光点完全落在多边形之内时，其对多边形顶点处没有任何影响。该方法是目前3D图形硬件都支持的唯一的明暗处理方法。

　　4.特殊效果

纹理映射、透明以及雾化（大气效应）等真实感效果都是在象素处理阶段实现的。物体表面纹理的定义是在世界坐标系中进行的，通过预处理，每个带有纹理的多边形在其顶点数据中建立了与相应纹理图的映射关系。在绘制带有纹理的多边形时，其相应的纹理图也同时被加载到纹理存储器中，在求出物体上象素坐标的同时其相应的纹理坐标也被计算出来。用该纹理坐标从纹理存储器中读出相应纹理象素的值，将其与明暗处理的结果进行混合就得到要显示的象素值。雾化（大气效应）则是在计算出的象素值上乘上一个与深度有关的衰减因子。对落在同一屏幕位置的象素点的象素值按其所属物体的透明系数进行加权融合就可以产生透明效果。

五、结束语

　　3D图形应用对计算和存储资源的巨大需求以及3D图形生成算法与传统计算机体系结构的不相适应产生了3D图形硬件。PC机上的3D图形硬件的出现只是最近几年的事，它是技术进步和市场推动的结果。目前，3D图形硬件既有高端的专用图形工作站也有入门级的图形加速卡，任何更好更快的图形效果的获得都需要付出巨大的硬件代价。

关键字：图形处理 3D图形芯片图形硬件算法分析引用地址：3D图形芯片及3D图像生成算法的原理分析

上一篇：基于循环前缀ML估计的同步分析及FPGA实现
下一篇：基于TMS320F2812 DSP的激光打标控制器设计

推荐阅读最新更新时间：2024-05-02 21:12

壁仞科技启动新产品线，国产图形GPU赛道迎来“种子选手”

（9月6日消息）通用智能芯片初创企业壁仞科技今日宣布，在包括人工智能训练和推理的通用计算产品线之外，正式启动图形GPU新产品线研发，为更多的应用场景提供具有强大竞争力的国产通用算力产品。壁仞科技联合创始人焦国方（Golf Jiao），担任新的图形GPU产品线总经理。业内人士分析，以GPU为代表的通用计算处理器主要有两大应用领域：以人工智能训练及推理为代表的通用计算任务，以及以图形渲染为核心的图形处理任务。壁仞科技的首款通用计算产品即将流片，此次正式启动的图形GPU产品线，将进一步完善其产品矩阵、形成“AI+图形”市场全覆盖，对整个产业而言，这意味着国产图形GPU赛道迎来了“硬核”种子选手。（焦国方 Golf J

[网络通信]

壁仞科技启动新产品线，国产<font color='red'>图形</font>GPU赛道迎来“种子选手”

嵌入式PID算法分析

1.1 概述比例（Proportion）积分（Integral）微分（Differential）控制器（PID控制器或三项控制器）是一种采用反馈的控制回路机制，广泛应用于工业控制系统和需要连续调制控制的各种其他应用。 PID控制器连续计算误差值 e(t) 作为所需设定点(SP) 和测量过程变量(PV)之间的差值，并应用基于比例、积分和导数项（分别表示为P、I和D）的校正，因此得名。 r(t) 是期望的过程值或设定点(SP)，y(t) 是测量的过程值(PV)。 1.2 历史发展 1911年，第一个PID控制器是由Elmer Sperry开发的。 1922 年，俄裔美国工程师尼古拉斯·米诺斯基 ( Nicolas Mino

[嵌入式]

μC／OS-II定时器算法分析与测试

引言 μC／OS-II操作系统是建立在微内核基础上的实时操作系统，抢占式多任务、微内核、移植性好等特点，使其在诸多领域都有较好的应用。在μC／OS-II 2．83及其以后的版本中，一个较大的变化就是增加了对软件定时器的支持。这使得μC／OS实时操作系统的功能更加完善，在其上的应用程序开发与移植也更加方便。在实时操作系统中一个好的软件定时器实现要求有较高的精度、较小的处理器开销，且占用较少的存储器资源。本文在对μC／OS-II定时器算法分析的基础上，对定时精度和处理器占用情况进行了分析与测试，其结果在实时系统的设计与应用中具有借鉴意义。 1 定时器实现架构在μC／OS-II操作系统内部，任务的延时功能及软件定时器

[测试测量]

μC／OS-II定时器<font color='red'>算法分析</font>与测试

意法半导体发布电视系统级全新集成3D图形加速器芯片

　　机顶盒与数字电视芯片的领导厂商意法半导体发布一款全新集成3D图形加速器（符合OpenGL-ES 2.0和OpenVG 1.1标准）的电视系统级（SoC）芯片，可实现下一代网络电视服务以及激动人心的用户界面和休闲游戏。　　　　意法半导体的全新FLI7540属于‘Freeman Ultra’系列产品，专为以出色视频、音频以及用户界面为诉求的高性能电视研制。FLI7540 不仅具有出色的处理性能（内置256KB二级高速缓存的1700+ DMIPS CPU），还提供专为先进中间件/网络电视应用设计的安全加密功能，并兼容全球数字地面电视（DTT）标准。　　与此同时，意法半导体还推出一款全新高质量的 Faroudja视

[家用电子]

实时硬件级光线追踪：移动游戏图形的变革时刻

你最后一次在电脑或游戏机上玩电子游戏是什么时候？如果它是最受欢迎的游戏之一，你可能已经注意到其图形是多么的逼真。今天，最尖端的PC 和游戏机中的图形正接近我们在电影中看到的真实图片。在创建照片级真实感实时计算机生成图形时，最重要的元素之一是场景的照明。模拟真实的灯光和阴影时，传统的3D图形渲染方法——光栅化——并不是最有效的技术。这是因为光栅化的工作原理是将虚拟多边形网格化为3D模型，然后将其分解为必须单独着色的像素，这一过程需要极其繁重的工作和计算资源，并且通常需要复杂的开发技术。电影动画师早就知道这一点，是以他们使用光线追踪技术来创建全局照明、阴影和反射等效果。光线追踪是一种简单并准确地模拟光行为的方法，它可以使场

[家用电子]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~

■安世半导体理想二极管与负载开关，保障物联网应用的稳健高效运行

■免费申请 | 上百份MPS MIE模块，免费试用还有礼！

■PI 电源小课堂|无 DC-DC 变换实现多路高精度输出反激电源