基于多DSP的在线可重构数字图像并行处理系统设计-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

　　随着多媒体图像处理应用的迅速发展，体积小、重量轻、结构灵活、处理能力强的嵌入式数字图像处理系统在工业、医学等方面都有越来越广泛的需求。实时性高、计算复杂、数据量大是图像处理系统面临的重大挑战。并行计算是提高处理速度最有效的技术之一，图像并行处理技术为提高图像处理效率提供了广阔的空间。图像并行处理包括并行算法和多处理器并行硬件系统，图像处理并行算法的执行效率依赖于多处理器系统的硬件结构。通常，一种并行结构只适合于一类并行算法的映射。

　　20世纪90年代至今，图像并行处理技术一直是图像处理领域研究的热点之一。参考文献分别对并行处理结构及其实现方法进行了探讨，提出了流水结构、分列并行等很有价值的硬件并行结构框架。目前，图像并行处理结构设计面临的主要问题可以概括为两个方面：

　　①图像并行处理硬件结构复杂，在实际应用中图像处理结构的开发周期长、成本高;

　　②面向图像处理算法的硬件结构针对性设计方法导致图像处理平台的可重用性差，调整、扩展和升级困难。

　　本文构建的可重构并行计算系统可以通过配置可重构处理单元来满足不同应用的计算要求。这样的系统使图像处理结构设计与图像处理的算法设计分离，具有很高的性能并且结构灵活，能大大提高图像处理并行算法的执行效率和加速比。

　　1 传统图像并行处理技术

　　1.1 图像并行处理系统概述

　　目前，用于嵌入式图像处理系统的高速器件主要是DSP和FPGA。处理核心的合理选用是影响并行系统处理能力的一个关键因素。

　　并行处理的目的是通过采用多个处理单元同时处理输入信息来缩短任务的执行时间。在任务和算法确定的情况下，Amdahl定律可表明：加速比与任务并行度和处理单元个数密切相关。在任务并行度一定的情况下，增加处理单元所获得的加速比有一个极限值，任务的并行度制约着并行处理机的性能。

　　在实际应用中，还必须考虑各个处理单元之间的数据交换和同步时间。由于比串行程序执行增加了数据通信和同步等待等开销，因此当加速比Sp

　　如图1所示，在增加处理单元和任务细粒度化的同时将带来总通信量的增加，影响了Sp的增加并导致Eff呈下降趋势。

　　1.2 并行计算硬件体系结构

　　并行计算处理单元之间的网络结构大致可分为2种：一种是共享总线或共享存储器系统，称为“紧耦合式并行系统”，如图2所示;另一种是各处理单元有独立的数据存储器而通过通信口相连的分布式并行系统，称为“松耦合式系统”，如图3所示。

　　两种并行计算体系结构的比较如表1所列。

　　1.3 并行算法到并行结构的映射

　　一个任务要在多处理机系统上得到处理，首先必须将其分解成一些子任务，再由多处理系统中的各处理机分别处理这些子任务，协同完成该任务。如图4所示，并行算法在并行硬件系统上的应用是一个映射过程。一类并行算法依赖于适合的并行网络结构才能高效率地运行。

　　导致并行算法与并行结构不匹配的原因主要有2个：一是欲把一个系统上开发的并行算法用于另一个系统上;二是由于问题内在的并行性，使并行算法与并行结构不匹配。

　　常用图像处理算法的特点及适用的并行处理结构分析如表2所列。

　　综上所述，传统的共享总线系统与分布式并行系统分别适用于不同的图像并行处理算法。分布式并行系统的不同连接方式之间也有较大的差异。并行算法的高效率运行依赖于并行硬件拓扑结构的支持，某种硬件结构只适合一类并行算法。一般情况，一个图像处理任务是多个算法的集合，并行系统单靠某种固定结构无法适应所有的并行算法，这就给图像处理系统带来了问题。当并行硬件拓扑结构不适合并行算法时，系统的性能和算法执行效率都会受到影响，需要对并行硬件结构做出改进和完善。

　　2 可重构数字图像并行处理系统

　　2.1 可重构处理系统的组成

　　可重构计算是指基于可改变(可动态改变)的硬件，以硬件适应算法(即可重构特性)、硬件定制和硬件并行的方式实现计算。可重构处理系统结合了可重构硬件处理单元和软件可编程处理器，系统允许对可重构处理单元进行配置以满足不同应用的具体计算要求。

　　如图5所示，可重构处理系统的组成基本相同，即通用处理器(阵列)、可重构资源(阵列)、存储器(阵列)、公用存储器、系统接口等。面向图像处理的可重构系统在器件选用上通用处理器可采用适合图像处理的高性能DSP阵列。

　　2.2 可重构数字图像并行处理系统的优点

　　可重构数字图像并行处理系统有以下优点：

　　①FPGA内部的逻辑功能可以在系统运行过程中动态重载，使系统可以实现多DSP之间拓扑的灵活改变以适应各种并行算法的需求，使算法执行效率达到最高。静态重构和动态重构使系统相比传统固定系统具有很强的通用性和适应性。

　　②系统的“多DSP+FPGA”结构能将系统任务划分成适合FPGA处理的低层信号处理和图像预处理部分及适合DSP处理的算法，便于发挥两者的优势;且FPGA可通过软件适应不同时序格式的数字图像，使得系统具有很高的性能和灵活性。

　　3 系统设计实例

　　3.1 系统硬件结构

　　基于TI公司C6000系列DSP和Xilinx公司Spartan一3系列FPGA，构建基于图像的点源目标识别系统，对在线可重构数字图像并行处理系统的可实现性和性能进行验证。

　　硬件结构如图6所示。图像输入FPGA—P，各DSP分别外扩一片双口RAM，且将总线EMIFA接到FPGA—P。FPGA—P可用来完成图像时序处理、图像数据的转换、图像滤波等预处理工作，且可以灵活地将处理后的图像数据保存到大容量公用数据存储器SRAM中，并将各DSP访问的仲裁逻辑或分配保存到各DSP外扩的双口RAM中。这种结构使系统可以轻松地适应多路图像输入。

　　DSP阵列可以并行完成各种图像处理算法。FPGA-C建立起DSP间的通信链路且暂存各DSP的处理结果。构建通信链路的方法有：用FPGA—C在两 DSP之间构造FIF0或小容量双口RAM，构建EMIF—HPI通路等。DSP-M可以根据算法需求通过McBSP在线配置FPGA—C，FPGA—C 的配置文件存放在DSP—M外扩的Flash中，这样就实现了DSP对FPGA的在线可重构。同时，DSP-M扩展了USB、PCI、McBSP等多种接口用来输出图像处理结果。

　　3.2 实验及结果分析

　　系统用于实现4路分辨率为256×256、帧频为50 Hz的8位图像(如图7所示)的移动点源目标识别。

　　处理过程包括图像时序采集、转换，图像滤波，去除噪声，姿态融合和目标识别等环节。图像分配和算法执行所需平均时间仅为9.5 ms。

　　若用共享总线系统来实现，则多路图像数据的存储和分配以及处理器之间的通信将消耗大量时间，大大降低系统效率。若用分布式并行系统来实现，则姿态和多路图像的综合处理会给某一个处理器带来很大的通信量和运算量。将实验中的图像处理任务在同等规模的3种系统上分别实现，执行时间如图8所示。

　　如图9所示，这些不同形式的计算系统是性能和通用性的不同折衷。可重构算系统代表了介于ASIC和通用处理器之间的计算途径，在通用性和性能上都优于传统的硬件系统。图像处理中数据量大、算法复杂，与其他计算技术相比，可重构计算能充分发挥出效率优势。可重构系统具有很多优点，但重构延迟和软硬件划分问题是应用中需要重点考虑的问题。

　　结语

　　传统固定结构并行图像处理系统不能适应多种图像处理并行算法。而可重构数字图像并行处理系统数据流和结构组织灵活，适于模块化设计，能大大提高并行算法的执行效率;有较强的通用性，同时其开发周期较短，易于维护和扩展。可重构数字图像并行处理系统为多媒体图像处理提供了一个非常有价值的发展方向。

关键字：DSP 图像处理 C6000 引用地址：基于多DSP的在线可重构数字图像并行处理系统设计

上一篇：基于DSP的机载智能电源设计
下一篇：基于FPGA+DSP的视频处理系统设计

推荐阅读最新更新时间：2024-05-02 23:06

嵌入式DSP上的视频编解码

　　随着数字多媒体的应用日渐广泛，视频解码在嵌入式系统设计中变成一个基本要素。视频标准有多种，依赖于产品可实施其中的一个或者多个标准。当然这不是全部，视频仅仅是多媒体码流的一部分，另外还有音频或者语音需要并行处理。因此，一个精确的处理存储或数据流的同步层是必需的。此外，视频解码本身对性能要求较高，需要不同于先前基于语音和信息应用的系统架构；这就对便携系统提出了特殊挑战，而桌面应用同样面临这些问题。　　通用视频标准和编解码器　　联合视频组(Joint Video Team, JVT)由ITU的视频编码专家组(Video Coding Experts Group, VCEG)和ISO/IEC运动图像专家组(Moving Pic

[家用电子]

探讨基于DSP数字摄像机技术发展

作为DSP领先者的美国德州仪器公司(TI)在数字照相机应用方面同样独占鳌头。首先基于TMS320C54x通用平台上实现影像压缩，然后将影像前端处理的分立器件集成为一个专用芯片，进而把两者合二为一并集成ARM7通用处理器，就是TMS320DSC2x系列通用数字相机平台。这是TI为业界首创的单片影像处理体系架构(SOC)，之后又不断提升该平台的性能和功能，并成功推进更新换代。　　与此同时，在通用DSP上实现数字网络摄像机的尝试始终没有停止，而真正的突破在与TI的DSP专家采用C6211实现的MJPEG实时处理系统。虽然外围还需要不少分立的期间，但是依赖于C6x高速并行处理能力，其视频性能在业界处于优异的水平。而其功能已经可以满足数

[嵌入式]

探讨基于<font color='red'>DSP</font>数字摄像机技术发展

STM32F4学习笔记1——如何使用DSP库

配置 1、安装DSP库文件 2、配置编译环境，上述添加是在project→options→C/C++→Define中添加，并且分割用逗号，即 __FPU_PRESENT=1,__FPU_USED=1,ARM_MATH_CM4,__CC_ARM 3、在需要调用DSP函数的文件中加上 #include arm_math.h 4、需要在project中添加用到的.c文件，看你用的是哪个函数，就添加哪个.c文件。.c文件目录为 XXX\Drivers\CMSIS\DSP_Lib\Source

[单片机]

STM32F4学习笔记1——如何使用<font color='red'>DSP</font>库

EDMA在实时图像处理系统中的应用

摘要：增强型直接内存存取(EDMA)是数字信号处理器(DSP)中用于快速数据交换的重要技术，具有独立于CPU的后台批量数据传输的能力，能够满足实时图像处理中高速数据传输的要求。以TI公司的TMS320DM642型DSP为例，介绍EDMA控制器的特点。结合实例给出EDMA在图像数据实时传输中的具体控制和实现方法。实验结果表明，通过灵活控制EDMA不仅能够提高图像数据的传输效率，而且能够充分发挥：DSP的高速性能。关键词：EDMA；实时图像处理；数字信号处理器；Sobel；TMS320DM642 中图分类号：TP274 文献标识码：A 文章编号：1006—6977(2006)01—0008—04 1 引言数字图像处理技术在科学

[嵌入式]

智能手表异军突起，成长速度居然这么快

智慧手表市场即将快速攀升至成长高峰，而日益成熟的智慧型手机市场则将逐渐转冷，这是分析师Linley Gwennap在日前举行「Linley行动与穿戴式装置研讨会」(Linley Mobile & Wearables Conference)时所发表的看法。另一方面，竞争的Ceva与Tensilica则利用这次会议的机会发表最新 DSP 核心。 Gwennap预测，智慧手表目前正以38%的复合年成长率(CAGR)成长，预计将在2020年占据大约3.8亿单位的穿戴式装置市场。去年，主导这一市场的是健身手环，其销售量达到4,900万，较销售2,400万单位的智慧手表更高。预测发生变化的原因在于估计苹果(Appl

[嵌入式]

基于DSP的光纤高温测量仪的软件设计

　　1 引言　　温度是表征物体冷热程度的物理量，是工业生产过程中测控的重要参数，温度过高或过低都会对产品的质量造成影响，甚至使产品报废、设备损坏。因此，温度的测量和控制具有十分重要的作用，在冶金、化工等领域，高温测量占有极其重要的地位。　　光纤传感技术是继光纤成功地用于通讯之后发展起来的一项高新技术，采用比色法原理进行测温的光纤高温测量仪，具有测量精度高、温度响应速度快、抗电磁干扰、信号损耗少、体积小等优点，能有效减小被测物体的发射率变化、环境干扰、器件老化等因素带来的测量误差，因此，在高温测量领域，光纤测温仪得到广泛的应用。　　目前，光纤高温测量仪通常采用单片机对数据进行处理，得到温度值。由于单片机数据处理能力不

[嵌入式]

基于DSP的视频检测和远程控制系统设计

摘要：提出一种视频测和远程控制的嵌入式设计方法，解决了采用具有高性能的数据处理功能的DSP作为视频检测处理器的设计总是；同时，提出在嵌入式操作系统中通信平台的设计方法，实现了在嵌入式操作系统中PCI总线的设备驱动以及通过PPP协议与Internet建立连接。关键词：视频检测 PCI总线 PPP协议引言随着计算机视觉技术以及图像处理技术的不断发展，计算机视觉和视频检测技术已经广泛应用于工业控制、智能交通、设备制造等很多领域。传统的视频检测往往采用工控机作为其视频处理器来实现其功能。这种方法往往由于工控机处理速度的问题，无法实现对各个不同方向同时进行视频检测，而且由于视频检测处理过程需要占用大量的处理时间，因而无法实现实时

[应用]

基于DSP技术的EAS系统设计

摘要：基于数字信号处理芯片设计的EAS系统的工作原理、组成以及实现实时监控应解决的技术难点。提出了运用数字信号处理的算法识别标签的软件实现方法。给出了系统的硬件原理图和软件流程图。关键词： EAS系统 DSP 离散付里叶变换相关函数现代商业经营模式逐渐由传统的基于框台的模式转变为开放的销售模式。这种新型的销售模式给消费者带来了便利，使之在更回自和宽松的购物环境下购物，但同时也增加了商品失窃的可靠性。商品电子防窃（Electronic Article Surveillance，简称EAS）系统能有效地抑制商场失窃现象，因而被广泛地使用。 1 EAS系统的结构 EAS系统由门

[传感技术]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■免费申请 | 上百份MPS MIE模块，免费试用还有礼！

■PI 电源小课堂|无 DC-DC 变换实现多路高精度输出反激电源

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■Follow me第二季第4期来啦！与得捷一起解锁蓝牙/Wi-Fi板【Arduino Nano RP2040 Connect】超能力！