基于FPGA+DSP技术的Bayer格式图像预处理-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

　　高分辨率图像实时处理在通信、医学、军事、航天航空、信息安全等领域有着广泛的应用和发展。在图像实时处理的过程中，下层图像预处理的数据量大，运算简单，但是要求运算速率高，可以用FPGA硬件来处理，上层所处理的数据量少，算法结构复杂，适于运算速度快，寻址灵活的DSP数字信号处理器进行处理。这里提出了一种FPGA+DSP相结合的实时图像处理系统，并应用于传像光线束传递图像。CMOS实际采集的是光线束的出端图像，FPGA将CMOS采集的Bayer格式的图像转换为RGB格式的亮度信号。由于光纤出、入端结构不同，需要DSP准确每根光纤的中心位置，重新排序才能输出正确的图像信息。该系统充分发挥了FPGA和DSP各自的优势，能更好地提高图像处理的实时性，降低成本。

1 Bayer图像格式

　　CMOS图像传感器作为一种基础器件可以实现信息的采集、转换以及视觉功能的扩展，并能直观真实地给出可视图像信息。系统中CMOS图像传感器输出2 592x1 944x12 bit的Bayer格式的图像(该格式的图像本身就是数字信号，因此无需对图像进行模数转换)，Bayer图像格式如图1所示。在图l中，每个方格代表一个像素，并且只含有R、G、B中的一种颜色分量，奇数行由G、R像素交替构成，偶数行由B、G像素交替进行，其中G像素分量占所有像素的一半，R像素和G像素占另一半。因为G像素分量是R、B像素分量的2倍，所以如果G像素分量采用好的插值方法，不仅可以提高G像素分量的质量，也能提高R和B像素分量的质量。由于TMS320DM642的video port capture接口的数据总线是8位或者16位(该系统采用了更适合DSP处理的8位数据)，所以为了后续的DSP能够更好的处理数据并减少DSP的运算量，需要使用FPGA先将输出的图像数据取高8位，然后依据每个像素点与相邻8个像素点之间的关系，使用双线性插值法将Bayer图像格式转换成24位的RGB图像格式和亮度信号，然后将处理后的数据发送给DSP。

2 图像数据处理的工作原理

　　2．1 Bayer图像的格式转换

　　双线性插值法具有算法计算量少，算法结构简单，易于实现，占硬件资源少等优点，本系统中更适合FPGA实现。双线性插值法的基本原理是将每个像素位置上缺少的另外两种色彩分量通过该像素本身为中心的领域内具有相同分量的像素平均获得，即将每个像素的RGB分量都以该点像素为中心的3x3像素矩阵进行线性插值而成。按照这种思路可以将图像中的3x3矩阵分成4类，如表1所示。

　　每种图像矩阵中间的像素点为待插值的数据源，设R(x,y)、G(x,y)、B(x,y)为插值计算后该点红、绿、蓝像素分量。当像素位于奇数行奇数列计算公式为：

　　由于系统中TMS320DM642的视频端口使用的是8位RAW采集方式从CMOS传感器中采集图像，为了减轻DSP的运算负担，FPGA还需要将图像数据转换成Y亮度信号。将得到的RGB图像信号，通过浮点算法公式转换成亮度信号，具体推导公式如下(GB代表取高8位数据)：

　　[page]

　　2．2 FPGA的硬件实现原理

　　由于双线性插值法需要将图像数据采集成3x3的图像矩阵，系统采用一种由FPGA硬件元器件构成的FD-FIFO模型取图像矩阵。电路如图2所示。

　　如图2所示，每个移位寄存器FD和先入先出寄存器FIFO左侧上端信号为时钟输入信号(上升沿有效)，左侧下端信号为8位的像素信号。图像矩阵的采集流程为：8位的图像信号送到第1个FD，然后经过移位操作从第3个FD存入左边第1个FIFO，存入一行图像数据后，等第2行图像数据送达时，第2行的图像数据经过移位操作从FD存入左边第1个FIFO，同时存储在第1个FIFO的数据开始读出到第4个FD，再经过移位操作存入第2个FIFO，等待两行图像数据都存储后，当第3行图像数据送达至第3个FD，同时后面2个FIFO分别读出前两行的前3个图像数据时，就可以从FD和FIFO的输出端口读取到1个3x3的图像数据矩阵：3x3矩阵第1行从左到右的数据为ABC，第2行的数据从左到右为DEF，第3行的数据从左到右为GHI。

　　CMOS图像传感器采集的图像大小固定为2 592x1 946x12 bit的Bayer图像，FPGA先用一个12位输入8位输出的移位寄存器取图像的高8位，再利用FD-FIFO得到3x3的图像矩阵，然后可以根据双线性插值法计算图像的RGB信号。双线性插值法虽然算法简单，且易于实现，但是存在边界效应。系统对边界效应做了如下的处理方法：对图像四周全部补零，即先将图像扩展成2 594x1 946大小，然后计算得到2592x1 944大小的图像，这样得到的图像仍是完整尺寸。只需在运算的时候，针对不同四周特殊的像素采用裁减的公式(系统中不产生零像素，只是对计算公式中相应边界元素补零)。过程如下：

　　第1行图像读入第1个FIF0后，第2行图像开始读入左边第1个FD的时候，开始计算第1行RGB数据，这时候第2个FIFO没有数据，相当于在第1行的数据前面补零。第1 944行图像读入第1个FIFO后，第1 943行图像读入第2个FIFO的时候，开始计算最后1行(第1 944行)，这时候第1个FD已经没有数据读入，相当于在第1 944行的数据后面补零。由于FD具有延时效应，所以在读写时，前1个FIFO开始读写时，再经过延时2个时钟周期，才到达后1个FIFO，所以相邻的FIFO读写使能信号要间隔2个时钟周期。

　　对列的操作也是如此，每一行的第1个元素读出到B、E、H位置时开始计算，这样每一列的第1个元素前相当于是零元素。每一行的最后一个元素读出到B，E，H位置时开始计算，这样每一列的最后一个元素后相当于是零元素。

3 图像预处理系统的硬件工作过程

　　图像预处理系统硬件框图如图3所示，整个系统在通电后，先由TMS320DM642通过I2C向500万像素的CMOS摄像头发出控制命令，调整摄像头输出的图像分辨率、焦距等，之后由摄像头将采集到的图像数据发送至FPGA。由于摄像头输出的图像格式为12位的Bayer图像，而DSP的vp-ort口支持为8位或者16位的RAW采集方式，本项目中采用了更适合于DSP处理的8位数据，所以需要FPGA对采集的图像数据取高8位以方便DSP获取图像数据。FPGA在Frame_Valid和Line_Valid同时为高电平的时，在Pixclk的上升沿采样图像数据，并将原来的12位图像数据取其高8位转换成8位Bayer图像数据，然后利用FPGA内部的FD-FIFO模型结构取图像的3x3矩阵并利用双线性插值算法将Bayer图像转换成24位的RGB图像格式。除此之外，FPGA还将Bayer图像数据转换成了Y亮度信号以达到DSP对运算数据的要求，使得DSP只工作在核心算法上。

　　转换好的亮度图像数据由FPGA通过TMS320DM642的VPort1口发送至DSP进行核心算法处理。为了更好地达到整个DSP算法处理的实时性，DSP采用了BIOS实时操作系统。经算法处理好的图像数据由TMS320DM642通过其VPortO口发送至FPGA。图像预处理过程是在Spartan-3系列的XC3S1500x中进行的。FPGA使用的设计方法是HDL设计输入法，常用的HDL语言有VHDL和VerilogDHL语言，在本系统中使用VHDL语言进行硬件设计。

　　系统采用的是通过FPGA固件支持高传输率USB2．0的CY7C68013芯片，采用Slave_FIFO模式接收FPGA输出的图像数据，再通过USB口输送给上位机。如图4所示，图4(a)为RAW图像，即每个像素点只含有单一颜色分量的Bayer格式图像，图4(b)为系统处理后的RGB格式的亮度信号图像。

4 结论

　　可见，本文所提出的基于FPGA+DSP的图像处理系统，能在FPGA硬件设备中高速、高质量地对CMOS传感器采集的Bayer图像进行预处理，为DSP数字信号处理器进行核心算法减少运算量，提高整个图像处理的实时性，缩短了开发周期，并且这种FPGA+DSP的组合模式也可以推广到处理各种数字视频信号。

关键字：图像预处理 FPGA DSP 引用地址：基于FPGA+DSP技术的Bayer格式图像预处理

上一篇：基于Sprite的手机移动视频监控系统设计
下一篇：移动视频智能防盗报警的应用特点及要求

推荐阅读最新更新时间：2024-03-16 10:55

基于FPGA的模拟信号波形的实现

1 引言波形发生器已经广泛的应用在通信、控制、测量等各个领域，如锯齿波、正弦波、方波等波形常用于电路的设计与调试。随着电子技术的迅猛发展，数字化正逐渐地成为电子产业的发展趋势，各公司都将自己的产品向数字化、集成化、小型化等方向进行拓展。众所周知，数字化的电子产品有其不可替代的优势，譬如体积小、集成程度高、抗干扰能力强等特点。但是，数字电路只能够较好地处理脉冲波形，即只对l和0形成的方波处理得很好．对于连续渐变的信号不能够很好地处理，而这恰恰正是模拟电路的优势所在。本文将数字电路与模拟电路相结合，即通过FPGA来产生所需各种模拟波形的控制信号，然后通过模拟电路来处理渐变信号，这样町以得到各种清晰的波形。 2 示波器显示原理

[嵌入式]

基于<font color='red'>FPGA</font>的模拟信号波形的实现

嵌入式系统让AI+IoT成为可能，专家们如何解读AIoT？

在半导体技术进步与 AI 朝专用化发展两大因素的加持下，人工智能得以与物联网中各种嵌入式系统(Embedded System)结合，形成AIoT(AI+IoT)。展望未来AI的发展可以透过很简单的接口或方式完成，比如功能的新增只要透过简单的拖拉就可以，而且AI的发展应该不是要取代人类而是协助人类。物联网(IoT)结合人工智能(AI)是今年产业界发展的重头戏。随着半导体业者大举投入，市面上出现不少专为人工智能所设计的芯片，像是英特尔的Intel Xeon Phi、NVIDIA的Tesla P100 GPU ，而许多专为嵌入式应用设计的芯片如现场可编程门阵列( FPGA )，也开始对AI提供更广泛的支持。另一方面，传统A

[嵌入式]

基于ARM+FPGA处理架构的高性能板卡

ARM+FPGA架构匠心之作，米尔MYC-JX8MMA7新品发布！关键词：米尔电子、NXP i.MX 8M Mini、核心板、ARM+FPGA、开发板近几年，工业智能化技术发展迅猛，嵌入式应用场景越来越丰富，对嵌入式技术开发硬件需求也越来越高。虽然ARM的功能越来越强大，但是在高端医疗器械、工业数据采集系统、能源电力等行业，其对高清显示、数据采集双重要求的场景下，ARM+FPGA架构的需求也应运而生，它不但具备了ARM的运算能力，还兼备了FPGA的对数据的高速采集能力。因此，米尔电子研发团队打造了匠心之作：米尔MYC-JX8MMA7核心板及开发板。米尔MYC-JX8MMA7核心板及开发板，采用ARM+FPGA的

[嵌入式]

基于ARM+<font color='red'>FPGA</font>处理架构的高性能板卡

通过FPGA实现一个以太网控制器MAC的实例

PWM有着非常广泛的应用，比如直流电机的无极调速，开关电源、逆变器等等，个人认为，要充分理解或掌握模拟电路、且有所突破，很有必要吃透这三个知识点： PWM 电感纹波 PWM是一种技术手段，PWM波是在这种技术手段控制下的脉冲波，如果你不理解是把握不住PWM波的！如图1所示，这种比喻很形象也很恰当，希望对学习的朋友有所帮助与启发。图1：形象的比喻 PWM全称Pulse Width ModulaTIon：脉冲宽度调制（简称脉宽调制，通俗的讲就是调节脉冲的宽度），是电子电力应用中非常重要的一种控制技术，在理解TA之前我们先来了解几个概念。理解PWM可以参考这些文章怎么把PWM信号转为模拟量浅析PWM控制电机

[嵌入式]

通过<font color='red'>FPGA</font>实现一个以太网控制器MAC的实例

BittWare扩展了基于Intel® Agilex™ FPGA的IA系列加速器产品线

BittWare扩展了基于Intel® Agilex™ FPGA的IA系列加速器产品线，以应对数据密集型计算、网络和存储工作负载新罕布什尔州康科德 – 2021年6月25日 –Molex莫仕公司旗下的BittWare是致力于边缘计算和云计算应用企业级加速器的领先供应商，宣布扩展其采用Intel® Agilex™ FPGA的IA-系列FPGA加速器。BittWare的IA系列FPGA加速器旨在帮助客户开发和部署下一代边缘和云计算应用，在降低风险的同时具有更大的灵活性和计算速度。新的IA-420F超薄PCIe卡和IA-220-U2计算存储处理器加入了IA-840F，提供了常见的三种尺寸供数据中心和网络基础设施选择。这三款产

[嵌入式]

BittWare扩展了基于Intel® Agilex™ <font color='red'>FPGA</font>的IA系列加速器产品线

双输出两相、无检测电阻同步控制器于 2.75V 输入电压工作

2006 年 10 月 17 日－北京－凌力尔特公司（ Linear Technology Corporation ）推出双输出两相、低输入电压电流模式同步降压型开关控制器 LTC3836 。用 2.75V 至 4.5V 的输入电压工作使该器件非常适用于 3.3V 单节锂离子、多节碱性或镍氢金属电池输入电源。它可以产生两个低至 0.6V 的独立输出电压，可为最新一代低压 DSP 和微控制器供电。 LTC3836 由两个同步降压型稳压器控制器组成，片上具有高端和低端同步整流器驱动器以驱动 N 沟道 MOSFET

[新品]

嵌入式DSP访问片外SDRAM的低功耗设计研究

DSP有限的片内存储器容量往往使得设计人员感到捉襟见肘，特别是在数字图像处理、语音处理等应用场合，需要有高速大容量存储空间的强力支持。因此，需要外接存储器来扩展DSP的存储空间。在基于DSP的嵌入式应用中，存储器系统逐渐成为功耗的主要来源。例如Micron公司的MT48LC2Mx32B2-5芯片，在读写时功耗最大可以到达924 mW，而大部分DSP的内核功耗远远小于这个数值。如TI的TMS320C55x系列的内核功耗仅仅为0.05 mW／MIPS。所以说，优化存储系统的功耗是嵌入式DSP极其重要的设计目标。本文主要以访问外部SDRAM为例来说明降低外部存储系统功耗的设计方法。 1 SDRAM功耗来源 SDRAM内部一般分为多个

[单片机]

嵌入式<font color='red'>DSP</font>访问片外SDRAM的低功耗设计研究

TI达芬奇技术与数字媒体处理器助力Connaught Electronics Limited 汽车视觉平台

2006 年 12 月 18 日，北京讯日前， Connaught Electronics Limited (CEL) 宣布在其新系列单、多摄像头汽车视觉系统中选用德州仪器 (TI) 达芬奇技术 (DaVinci) 与 TMS320DM64x 数字媒体处理器。　　TI 欧洲分部的 DSP 平台经理 Jean-Marc Charpentier 指出：“TI 基于达芬奇技术的 TMS320DM643x 处理器可降低功耗，实现出色的视频、影像与系统控制功能，从而能够满足驾驶辅助系统的严格要求。CEL 充分利用 TI 技术优势，面向全球汽车市场推出了一系列世界级的嵌入式视觉系统。” 　　CEL 董事兼总经理 Fe

[焦点新闻]

热门资源推荐
热门放大器推荐

小广播

添点儿料...

无论热点新闻、行业分析、技术干货……

发布文章

热门活动

换一批

■TI 有奖直播 | 使用基于 Arm 的 AM6xA 处理器设计智能化楼宇

■Follow me第二季第3期来啦！与得捷一起解锁高性能开发板【EK-RA6M5】超能力！

■报名直播赢【双肩包、京东卡、水杯】| 高可靠性IGBT的新选择——安世半导体650V IGBT

■30套RV1106 Linux开发板（带摄像头），邀您动手挑战边缘AI~