引言
在传统的嵌入式系统上,三维图形处理通常由嵌入式CPU独自在软件上完成。但随着三维图形应用程序功能的不断强大,面对图形处理的巨额运算量,CPU变得不堪重负。此时,需要使用特定的硬件设备来为嵌入式CPU承担图形处理的任务。
具有三维图形硬件加速能力的ARM+FPGA架构嵌入式图形系统就是其中一种解决方案。其中,ARM处理器负责运行嵌入式操作系统、执行上层图形应用程序,而三维图形处理所需的大量运算则由FPGA实现的GPU(图形处理单元)进行。
图形API简介
在图形系统中预先定义了一组图形API,作为一个抽象层将图形应用程序和图形系统的具体实现隔离开来。具体的图形应用程序都将通过这些图形API来完成所有与绘制图形相关的工作。这样,同样的应用程序就可以在不同的目标图形系统上运行。
目前应用较为广泛的标准图形API主要有Direct3D和OpenGL。OpenGL定义了与具体硬件实现无关的软件接口,并且不受制于具体的窗体系统。
本文选用23条OpenGL中最常用的API作为本系统的图形API。在执行应用程序时,具体的图形API被转换成GPU可以处理的渲染列表数据格式,从而将计算任务转交由GPU完成,实现对三维图形处理的硬件加速。
系统硬件设计
系统硬件结构
本文设计的嵌入式图形系统由基于ARM处理器的最小系统、FPGA实现的图形加速、LCD控制器等功能模块,以及常用外设接口电路组成,如图1所示。
图1 系统硬件结构
基于ARM处理器的最小系统是本系统的核心模块,主要由嵌入式处理器、系统内存SDRAM和FLASH存储器组成。SDRAM为处理器运行操作系统和执行应用程序提供内存空间,FLASH用来存放系统引导代码、操作系统内核和应用程序。
图形加速模块是使用FPGA实现的嵌入式GPU,是系统能够实现硬件加速的关键部件。它通过内部图形处理流水线处理CPU生成的渲染列表,并最终形成像素数据写入帧缓冲SRAM中供LCD进行显示。该模块在三维图形处理中使用固定功能的图形处理流水线,如图2所示。
图2 图形处理流水线示意图
图形加速模块在一片SRAM中生成完整帧数据后将其控制权交给LCD控制器,并使用另一片SRAM继续下一帧数据的计算。在新的一帧数据完成后便再次与 LCD控制器交换控制权。LCD控制器通过SRAM仲裁模块从当前显示的帧缓存中读出帧数据,生成符合LCD显示屏要求的时序,完成三维数据的显示。
系统中存在两组LCD总线。一组是ARM处理器提供的LCD总线,用来显示嵌入式操作系统的图形用户界面;另一组是进行三维图像显示的LCD控制器的LCD总线。总线切换模块负责两类总线的切换,将合适的LCD总线挂接到LCD屏上进行显示。
系统硬件实现
本文选用S3C2410嵌入式处理器和Cyclone II系列FPGA实现图形加速以及其他功能模块,辅以LCD屏、串口等外围电路实现整个图形系统。硬件电路如图3所示。
图3 系统硬件电路
电源设计
本系统需要多个不同电压值的直流电源供电,包括5V、3.3V、1.8V和1.2V。其中5V电源从外部直流电源直接引入,而其他电压值则由5V电压变换得到。
S3C2410的内核电压为1.8V,外部I/O和存储器电压为3.3V。系统选用低压差稳压器AS1117实现这两种电压的转换,固定输出时只需三个引脚,如图4所示。
图4 1.8V电源电路
本文使用TPS70345为FPGA提供1.2V内核电压和3.3V IO电压。
ARM与FPGA接口电路
生成三维图形时,嵌入式微处理器上运行的图形应用程序生成三维图形的渲染列表,并将渲染列表写入到FPGA的渲染列表缓冲区中,等待图形加速模块的处理。 ARM与FPGA接口电路既要保证可以完成渲染列表的写操作,又要能够对FPGA中总线接口模块、图形加速模块、LCD控制器等的内部寄存器进行读写操作。接口电路如图5所示。
图5 ARM与FPGA接口电路
系统软件设计
系统软件架构
本文使用FPGA实现整个三维图形处理流水线,由硬件完成三维图形生成和处理。运行在操作系统上的图形应用程序通过调用图形API实现具体应用,而驱动程序将图形API的调用转换成渲染列表,从而将具体的三维图形处理任务交给硬件完成,如图6所示。
图6 系统软件架构
考虑到嵌入式图形系统除了进行三维图形处理之外,还应当能够为用户提供友好的用户图形操作界面,本文采用了Windows CE操作系统。
驱动程序设计
设备驱动程序在操作系统和硬件设备之间建立了一个桥梁,让操作系统能够识别设备并为应用程序提供设备服务。
本文中FPGA实现的图形加速模块作为一个设备挂接在系统中。系统在软件上只需要将渲染列表写到该设备的地址空间,因此本文使用了简单的流式接口驱动,所有的流接口驱动程序都使用相同的一组流接口函数。
渲染列表的传递是不需要反馈的,系统将渲染列表写入设备(GPU)后并不需要从设备中获取数据,因此流接口函数GPU_Read()并不需要实现具体功能,只在GPU_Write()中将渲染列表写入到设备中。另外,系统在普通图形界面和三维显示两种显示模式下使用的是不同的LCD控制器。前者使用 S3C2410中集成的LCD控制器,而后者使用的是FPGA模块中实现的LCD控制器,两种模式下通过LCD总线切换模块进行切换。
结语
本文设计了基于ARM和FPGA的嵌入式图形系统,使用FPGA在硬件上实现三维图形处理,缓解嵌入式CPU在处理三维图形时因计算量过大而导致系统效率降低的问题。图像显示符合人眼对图像连续性的要求。另外,作为嵌入式图形系统,本文选用通用的图形应用程序接口标准OpenGL作为图形API,使得系统具有较好的通用性和实用价值。
参考文献
1. 汪小澄,池诚. 基于S3C2410嵌入式系统的网络接口设计[J]. 微计算机信息,2007,23(5-2),131~133
2. 蔡弘,戴胜华. 基于ARM+FPGA的高速信号采集系统设计[J]. 仪器仪表标准化与计量,2007(6),38~40