双DSP柔性处理系统研究

最新更新时间:2013-09-22来源: 互联网关键字:DSP  柔性处理 手机看文章 扫描二维码
随时随地手机看文章

1 引言

  为了进一步提高现有机载光电跟踪系统在实战环境中,针对复杂场景下快速运动目标实施实时跟踪的鲁棒性与稳定性,笔者提出以双DSP和FPGA为核心来构建主从式超高速并行处理体系的设计思想,并研究开发了基于双DSP的新型柔性机载实时图像跟踪系统。一方面,采用双DSP体系结构实现系统任务的并行划分使本系统具备极高的运算处理速度;另一方面,现场可编程逻辑器件FPGA的引入使系统的灵活性也得到极大的提高。而将两者结合可使本系统充分体现新一代机载实时图像跟踪系统更快速、更精确、更灵活的特点。

  2 双DSP高速信号处理系统特点

  

双DSP高速信号处理系统

 

  美国德州仪器公司(TI)推出的新一代数字信号处理器TMS320C6414(以下简称C6414)的主频为400MHz~700MHz,其数据处理能力为3200MIPS~5760MIPS。该器件的结构框图如图1所示。其主要特点如下:

  (1)DSP内核采用超长指令字(VLIW)体系结构,有8个功能单元、64个32bit通用寄存器,一个时钟周期可同时执行8条指令,运算能力可以达到5760MIPS;

  (2)为了使数据能满足超高速DSP内核的需求,C6414采用了两级超高速缓冲存储器,即16k Byte的一级数据Cache、16k Byte的一级程序Cache和1024k Byte的数据和程序统一内存。

  (3)增加了直接处理打包数据指令,可建立无缝的数据流,以提高指令集的效率;

  (4)每个功能单元在硬件上都增加了附加功能,从而增强了指令集的正交性。

  3 系统硬件设计

  

 

  本光电成像跟踪系统硬件平台由六部分组成:图像采集与预处理模块、同步分离模块、FPGA逻辑控制模块、双DSP+双口RAM 图像处理模块、异步通信模块和图形显示模块。其系统原理框图如2所示。从图2可以知道:红外探测器及可见光摄像仪输出的模拟视频信号经多路信号选择芯片导入之后,经箝位、放大、滤波以及去同步头等预处理后,一路经A/D转换器将模拟视频转换为8bit数字信号并导入片外视频缓存1、2,而后等待FPGA时序控制DSP外部中断,以便将全部缓存数据搬移到DSP片内的2级缓存,再通过系统任务划分实现数据重组,然后分别在主从DSP进行同步并行数据处理,并将中间结果由主DSP综合,最后在完成后续运算后给出最终匹配结果。与此同时,主DSP则通过写图形显示缓存将目标匹配位置信息传递到外界;另一路模拟信号先导入同步分离器,然后提取行场同步信号送交FPGA作为时基,以产生系统各级时序控制信号;第三路模拟信号送给图形叠加电路作为输入叠加信号之一,当场正程来到时,FPGA中断控制并读出图形存储器数据,同时在FPGA片内实现读入数据的并/串转换后移位输出至图形叠加电路,此时两路信号将会合送入视频监视器,从而完成视频图像上图形的显示。整个系统工作期间,每隔80ms主DSP还通过异步收发器与外部上位机进行串行通信,以便系统能够实时接收外部命令与目标参数,进而调整跟踪系统的工作状态。

  3.1 图像采集与预处理模块

  本系统中的多路选择器件选用CD4052芯片。它能根据不同的工作场合来切换红外/可见光视频输入;视频预处理电路采用AD817进行视频信号的放大,以得到更清晰的信号来进行视频处理;A/D芯片选用AD公司的AD9225,输出的8bit数字视频信号送入74LS245进行数据锁存。

  3.2 同步分离模块

  系统采用一款专门的视频同步分离器LM1881来从标准的负同步NTSC(PAL或SECAM)视频信号中分离出有效的行/场同步信号,并将其送入FPGA以产生系统的各级逻辑控制输出。

  3.3 FPGA逻辑控制模块

  由于系统中各个芯片的功能相对独立,要协调这些芯片的运作就需要一片起控制逻辑作用的可编程芯片,为此,笔者选用了ALTERAL公司的EPF10K30A,该芯片有246个用户I/O口、30000个典型门、216个逻辑阵列块、1728个逻辑单元不仅能满足系统的控制要求,而且也可以为将来系统的功能扩展提供控制逻辑。在这个光电跟踪系统中,FPGA主要用来完成如下几方面的工作:

  (1)生成A/D采样控制时钟,实现模拟视频的正确采样;

  (2)提供字符图形存储器地址及片选/读控制信号,并在场正程到来时,控制图形数据的读出;

  (3)提供视频数据缓存器地址及片选/写控制信号,控制视频数据的连续写入;

  (4)产生外部中断4至双DSP,当数据写满视频图像高速缓存预定空间时,控制主从DSP以将数据块快速搬移至片内2级缓存;

  (5)产生外部中断7至主DSP,并在每个场逆程时刻来到时,控制主DSP擦、写字符图形存储器数据;

  (6)产生一并/串转换电路,以将并行读入的字符图形数据串行移位输出至图形叠加电路,从而实现“+”、“□”图形在视频图像上的叠加。

  其FPGA内部结构框图如图3所示。

  

FPGA内部结构框图

 

  图3 FPGA内部结构框图

  3.4 双DSP+双口RAM 图像处理模块

  高速并行数字信号处理电路以双DSP为并行运算处理核心单元,并辅以双口RAM来实现视频图像的高速缓存,从而完成大运算量的高速实时目标跟踪处理任务。该并行处理系统的组成与功能分述如下:

  a. 视频图像高速缓存子模块

  为了实现图像的实时采集与高速处理,本系统用两片双口RAM组成相互独立的视频缓存,分别对应主/从DSP处理器。设计时选用IDT公司的3.3V 异步双口PRAM IDT70V657,同时与DSP接口采用ASRAM方式。由于EMIF的ASRAM接口支持32Bit的数据接口,因此,利用IDT70V657构成不完全地址结构来存取数据能够更好地实现8Bit锁存数据与C6414的接口,而无须对DPRAM进行宽度扩展。同时亦可减少DSP读取外部数据的时间开销。

  IDT70V657的大小是32K×36Bit系统采用将两个DPRAM各划分为前后两个半场的方式来实现存取数据时的乒乓切换。即在系统工作的任一时刻,当对DPRAM前半场写入数据时,使DPRAM后半场向DSP读出数据。当前半场写满视频数据时,由FPGA给DSP发出中断信号,以通知DSP读出DPRAM前半场所写入数据,同时,将A/D转换器的数据写入DPRAM后半场缓冲空间,如此反复进行来实现数据的读出与写入同步操作。

b. 双DSP高速信号处理系统

  TMS320C6414-600型DSP的主频高达600MHz,在超高速实时图像处理领域有着非常出色的性能。本系统的双DSP高速实时信号处理系统就以2片C6414-600 DSP芯片为核心组成邻域图像并行处理机,并通过系统任务的划分与分解实现同步并行运算处理。其系统框图如图4所示。

  

双DSP高速信号处理系统

 

  在本系统中,主DSP完成的主要功能如下:

  (1) 实现外部缓存数据到片内的搬移,为DSP高速批处理开辟片内二级缓存;

  (2) 实现与外部上位机的即时通讯,接收外部命令与目标参数;

  (3) 实现与从DSP的即时通信,下传命令字与目标参数以及获取中间结果;

  (4) 运行系统跟踪算法,承担系统核心运算任务的一半;

  (5) 与FPGA建立即时通信,实现系统程序模块的调度与协调;

  从DSP完成的主要功能是:

  (1) 实现外部缓存数据到片内的搬移,为DSP高速批处理开辟片内二级缓存;

  (2)运行系统跟踪算法,承担系统核心运算任务的一半;

  (3)实现与主DSP的即时通信,上传匹配运算中间结果;

  (4)与FPGA建立即时通信,实现系统程序模块的调度与协调。

  双DSP处理系统的柔性特色体现在:可依据实时环境需要加载不同的跟踪算法来实现目标跟踪。算法运行之初,两片C6414-600都在FPGA的控制下,通过EMIFA口以EDMA方式,分若干次,依系统跟踪算法而定将外部视频缓存中的数据(一场图像)依次读入DSP的L2片内缓存中;算法运行之后,主从DSP则通过McBSP直接互接来实现双DSP间的高速同步通以便交换数据处理结果。

  系统设计中,Flash ROM选用AMD公司的AM29LV800(1M×8Bit)来把FLASH映射到DSP统一编址地址空间EMIFB口的CE1空间。当系统上电复位后,该地址空间为首先引导区域,这样即可将应用程序代码加载到片内高速执行,从而实现系统的脱机运行。

  3.5 异步通信模块

  本系统与外部上位机的异步通信主要通过主DSP的McBSP。C6000的McBSP是一个功能非常强大的标准串口,支持全双工串行通信,它的双缓冲数据寄存器允许连续的数据流,可与多达128个通道进行收发通信。通过对McBSP的SPCR、RCR、XCR、SRGR、PCR寄存器的配置可实现系统通信时收发数据的帧同步和时钟同步。

  由于外部上位机的通讯机制是RS422标准,而DSP与外部通信只提供RS232接口,故应采用一片MAX3074芯片来实现RS422到RS232的转换。MAX3074是MAXIM公司生产的一款专门用于RS422/485至RS232的转接芯片,采用3.3V供电,这与C6000 DSP 外围供电电压一致,连接非常方便,不再需要多余的电压适配器。另一方面,由于McBSP为同步串口,为了实现McBSP与RS232的无缝连接,可通过软件加入发送扩展算法与接收压缩算法,从而实现DSP与上位机异步串口通信协议的握手。

  3.6 图形显示模块

  该模块由图形存储器、图形叠加电路和视频监视器组成。图形存储器选择IDT公司的70V08(64K×8Bits)DPRAM来存储标识目标匹配位置的图形数据。图形叠加电路用于实现视频与图形的叠加,并最终由视频监视器显示叠加结果。

  4 系统工作流程

  本系统的软件工作模式包括复位和初始化模式、运行模式、系统维护模式,可由系统程序来控制三种模式的切换。

  在复位和初始化模式下,系统启动后将由主从DSP同步实现程序搬移,把程序代码搬移到片内并运行系统程序,从而初始化主从DSP的运行环境并设置相关参数。

  运行模式下,双DSP一方面独立响应并处理FPGA中断、运行核心跟踪算法并实现子系统内的进程调度;另一方面通过主从DSP串口间的互连响应中断以及主DSP串口与远程主机的通讯等功能来实现双DSP子系统间和双DSP系统与外部主机的进程调度。

  系统维护模式下,主从DSP在进行系统自检后,可由远程主机通过RS422接口与主DSP进行通讯,以实现程序的更新下载和参数修改等功能。图5为系统软件工作流程框图。

  

 

  5 结束语

  笔者对该系统的实时性进行了仿真测试,结果分析表明:

  (1)单DSP只能实现开窗搜索,高速场合下一旦目标逃逸搜索区,将导致目标丢失;而本系统能够实现基于整场搜索的大运算量高速处理,从而加大了被跟踪目标搜索区的动态范围,避免了目标丢失情况的发生,进一步提高了实时跟踪的可靠性。

  (2)传统单DSP系统一般只能实现基于一帧的匹配性能,而本系统可实现基于逐场的跟踪匹配,进一步提高了跟踪系统的实时性。

  (3)根据实际场合的需要,本系统可通过软件选择加载跟踪算法,从而极大的增强了系统的通用性和易维护性,体现出柔性处理系统的特色。

关键字:DSP  柔性处理 编辑:神话 引用地址:双DSP柔性处理系统研究

上一篇:NiosII+GPS/GSM实现汽车状态监控系统
下一篇:ADSP21160实现数字信号处理系统

推荐阅读最新更新时间:2023-10-12 20:48

基于DSP仿人机器人关节控制器电路设计
  仿人机器人具有可移动性,具有很多的自由度,包括双臂、颈部、腰部、双腿等,可以完成更复杂的任务,这些关节要连接在一起,进行统一的协调控制,就对控制系统的可靠性、实时性提出了更高的要求,以往采用的集中控制系统,控制功能高度集中。局部的故障就可能造成系统的整体失效,降低了系统的可靠性和稳定性,因此考虑采用分布式的控制系统来实现系统的控制功能。    电机驱动器的接口电路   驱动器的控制模式可以分为两种:速度控制模式和位置控制模式(通常用电位器作为电机的位置传感器)。这里采用它的速度控制模式,输入的指令信号是0~10 V的模拟量。因此需要用D/A转换电路,把DSP输出的数字量给定转变为模拟信号,电路图如图3所示。DAC7621为1
[嵌入式]
基于<font color='red'>DSP</font>仿人机器人关节控制器电路设计
嵌入式电网分析仪中双CPU间的通信
   1 引言   在我国目前电力紧缺的形势下,监控电力以确保安全用电非常重要。对电网分析仪的研究和改造一直是当前研究的热点。如果电网分析仪采用一个DSP,既采样计算电网参数,又负责控制部分的运转,由于在实际应用中要求DSP处理的信息可能很多,工作量很大,这样将会影响分析仪的处理速度,降低其工作效率。因此,这里提出一种新一代的电网分析仪,采用DSP和AVR单片机构成双CPU处理器平台,并充分利用DSP处理大容量数据和复杂算法的能力.以及单片机接口的控制能力。ATmegal28单片机负责外围电路控制,包括开关量输出报警与控制、监测输入开关量、模拟量的输出、与上位机的通信以及计时和存储参数,参数是由TMS320F2812 DSP
[嵌入式]
DSP系统中延迟电池寿命关键--DC/DC稳压器
引言 长期以来,MP3播放器、个人媒体播放器、数码相机以及其他便携式消费类应用的设计人员面临的一项挑战是实现产品的高性能和低功 耗。这些电池供电系统通常都使用嵌入式数字信号处理器(DSP),当系统处理多媒体应用任务时,DSP能达到最大处理能力,而当系统处于睡眠模式 时,DSP具有最小的功耗。电池寿命在手持式产品中是非常重要的指标,产品成功与否与供电系统的效率直接相关。 此类系统中的一个关键部件是降压式DC-DC开关稳压器,它能够高效地从较高电压获得较低的供电电压,如从 4.5 V获得1V的供电电压。作为稳压器,其必须保持恒定的电压,而且能够对输入电压的变化以及负载电流的变化迅速做出响应。本文将讨论的架构具有优良的稳压性 能以及高效
[电源管理]
<font color='red'>DSP</font>系统中延迟电池寿命关键--DC/DC稳压器
ARM和DSP设计的竹节纱控制系统伺服控制器方案
引 言 ARM微处理器具有体积小、低功耗、低成本、高性能的特点,基于ARM核的微控制器芯片不但占据了高端微控制器市场的大部分市场份额,同时也逐渐向低端微控制器应用领域扩展,ARM微控制器的低功耗、高性价比,向传统的8位/16位微控制器基。提出了挑战。ARM微处理器及技术应用到了许多不同的领域,如工业控制领域、无线电通讯领域、网譬络应用、消费类电子产品以及数字成象与安全产品当中,凭借其优点将来还会得到更加广泛的应用。显本文通过分析竹节纱装置的工艺要求,设计了具有竹独立控制结构的永磁同步电机伺服控制系统,由ARM和触摸屏构成控制器,并在ARM核中移植嵌入式操作系统Windows CE,使其具有图形化的人机丕界面操作功能,支持
[单片机]
ARM和<font color='red'>DSP</font>设计的竹节纱控制系统伺服控制器方案
用FIFO设计A/D与DSP之间的接口
1 前言 在使用CCD对非透明薄板厚度的测量系统设计中,笔者采用高速A/D和DSP等器件设计信号采集和处理电路来确定CCD的像点位置。其具体电路如图1所示,该信号采集和处理电路由CCD驱动电路、加法电路、滤波放大等信号预处理电路、A/D转换电路、FIFO、DSP电路、时序与逻辑控制产生电路、USB总线接口电路等组成。其中DSP芯片选用TI公司生产的TMS320C6211高速数字信号处理芯片它主要用于对A/D转换后的数据进行插值和重心算法处理,从而确定CCD上像元的位置,然后把处理后的数据通过USB总线传输到PC机进行厚度计算、结果显示、存储等后续处理。该电路所需的时钟信号和采样逻辑控制时序由一片FPGA芯片产生。 当模拟
[嵌入式]
利用 Virtex-5 SXT 的高性能 DSP 解决方案
  二十多年来,FPGA 为世人提供了最灵活、适应性极强、快速的设计环境。早期的 DSP 设计人员发现,可将一种可再编程的门海用于数字信号处理。如果把内置到 FPGA 架构中的乘法器、加法器和累加单元结合起来,就可以利用大规模并行计算实现有效的滤波器算法。   在未加工频率性能方面的损失,通过并行计算得到了弥补,而且得远大于失,可谓 失之东隅,收之桑榆 ;由此获得的 DSP 带宽完全可与替代方案媲美。随着时间的推移,乘法器和加法器的实施越来越高效。1998 年,Xilinx 顺理成章推出了第一个集成于 Virtex -II FPGA 系列产品中的嵌入式乘法器。Xilinx Virtex-II 和 Virtex-II
[嵌入式]
利用 Virtex-5 SXT 的高性能 <font color='red'>DSP</font> 解决方案
C2采用1个CPU+3个DSP架构实现网络化多媒体平
   如何搭建一种架构,能够高效地处理各种多媒体数据,并且专门针对音频、视频进行优化?    产品定义与芯片选型——搭建基于网络的 多媒体平台 ,但排除ASIC、X86和通用 DSP 编程方式   网络向我们提供日益丰富的内容(包括:文本、图像、视频和音频),这些内容的表现形式多种多样,仅视频和音频就有几十种格式。传统的ASIC芯片最大缺点是缺乏灵活性和通用性,例如DVD解码芯片通常只支持MPEG-2,MPGE-4和MP3标准,如果要处理更多的格式还需要设计新的芯片,因此ASIC类的芯片不适合网络功能的消费类电子产品应用。X86架构是针对数据处理而设计,可以高效的处理32位或64位整型数字流,但视频数据流的变长数据(不是
[嵌入式]
C2采用1个CPU+3个<font color='red'>DSP</font>架构实现网络化多媒体平
CEVA推CEVA-X1641 QUAD-MAC DSP
CEVA-X1641 与现有的 CEVA-X 系列产品指令集完全兼容 , 能够保护客户的软件投资、 加快产品上市以及降低多种应用的开发风险   专业向半导体行业提供数字信号处理器 (DSP) 内核、多媒体及存储平台知识产权的全球领先厂商 CEVA 公司宣布推出备受 业界 推崇 的 CEVA-X DSP 内核系列的最新成员 -- CEVA-X1641 , 与 CEVA-X 指令集架构 (ISA) 完全兼容 。   CEVA-X1641 是可扩展 CEVA-X 系列中首个 Quad-
[嵌入式]
小广播
最新模拟电子文章
换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved