高性能信号处理通用平台研究

最新更新时间:2014-03-10来源: 21IC关键字:高性能  信号处理 手机看文章 扫描二维码
随时随地手机看文章

当前信号处理领域内阵列信号处理技术正在迅速发展,各种新的算法及新的处理技术不断出现,要求信号处理系统具有快速适应各种新算法和新技术的能力,采用传统的基于专用硬件的设计方法所开发出来的信号处理系统无法满足这样的要求。开发具有通用性的计算平台,尽可能通过软件来实现信号处理功能,成为信号处理的新趋势,“软件雷达”、“软件无线电”等概念都是基于这一思想。

通过灵活的软件编程来适应算法的变化,通过简单的硬件扩展来适应规模的变化,使系统的灵活性大大提高,研制周期、费用大为减少。要支持这种设计思路,必须研制出组成通用计算平台的信号处理模块,该模块既能满足系统实时处理需求,又具备通用性、可扩展性。

本文提出了一种基于TMS320C6701信号处理器的高性能信号处理模块的设计方案,设计了具有一定通用性的并行信号处理模块,该模块具有高速互连接口,可以根据应用系统的需求构成不同的并行系统,完成各种信号处理任务。

1 系统结构

随着微电子技术的突飞猛进,处理器的速度不断得以提高,但实际应用对于计算能力的需求还是远远超出了单个处理器可以提供的范围,采用并行处理技术构成多处理器系统满足需要较强计算能力的应用是一种行之有效的技术途径。

并行处理的目的是通过采用多个处理单元同时对任务进行处理,加速整个计算的过程,从而减少任务的执行时间。整个任务可分解成一些小的任务,分别分配给并行处理系统中各个处理单元执行。一般而言,这些并行执行的任务都不能完全独立执行,一个任务中的计算可能需要用到另一个任务中的数据,各处理单元之间存在进行数据交换的要求。因为交换数据而必须等待的时间,反映了处理单元之间的同步开销。因此不难看出,并行处理额外增加了数据通信和同步等待等开销。

为使任务执行时间减少增加处理单元个数成为首要手段,同时要将任务进行更细粒度的划分以增加任务的并行度,但在增加处理单元和任务细粒度化的同时将带来总通信量的增加,再加上同步时间和任务分配不均所造成的空等待时间开销,增加处理单元的个数对增加系统处理能力得不偿失。这使得在设计并行处理系统时必须着重考虑以下两个方面:处理单元性能的提高以及处理单元间通信技术的改进。

1.1 处理单元的选择

在通信、语音、图像处理中信号的动态范围有限,一般采用定点运算就可以满足要求,雷达、声纳信号需要较大的数据动态范围和数据精度,若按定点处理会发生数据上溢出或下溢出,严重时处理将无法进行,如果使用移位定标或用定点模拟浮点运算,程序的执行速度将大大降低,为增强计算平台的适用性,该通用信号处理平台使用浮点处理器。

同样的任务量,用高性能的处理单元构成的“小”规模系统,其效率要高于用较低性能的处理单元构成的“大”规模系统。并行处理单元的性能相当重要,它不仅包括运算速度,还包括存储器带宽、数据通信速度等,美国TI公司的TMS320C6000系列DSP是业界最高性能的通用可编程DSP,TMS320C6701又是该系列中性能较高的浮点处理器。该款DSP完全满足设计的通用计算平台对信号处理单元性能的要求,因此选择TMS320C6701作为信号处理模块的处理单元。

1.2 通信网络的设计

阵列信号处理必然是多个信号处理单元并行工作,子任务分配在并行处理系统的各个处理单元中,子任务间数据通信速度和同步时间等不仅取决于处理单元本身的通信速度,还取决于连接处理单元的通信互连网络,通信链路丰富的复杂网络往往能提供较高的数据通信速度,然而其设计和维护的难度要高得多。针对不同的实际应用,采用不同形式的通信网络,可以降低通信网络的复杂度。

在互连结构设计中,把整个并行信号处理系统的互连结构分为两级:系统级互连结构、模块级互连结构。

系统级互连结构主要用于模块间的通信,该设计中系统级的控制网络和信号处理网络分别采用RaceWay 及VME实现。模块级互连结构主要指信号处理模块内的网络结构。信号处理模块系统结构如图1所示。

信号处理模块内包含4个DSP,可提供4GFLOPS的峰值处理能力。模块内采用共享总线互连结构。一般情况下,程序代码和运算数据应存放于各DSP 的片内RAM 或局部存储器中,这样可以减少共享存储器访问次数,减少总线争用,缩短存储访问延时。共享存储器通常用来支持模块内4个DSP之间交换数据,以及用来支持在模块之间交换数据。

为了减少模块内各个DSP争用总线带来的时延,提高DSP之间的通信能力,相邻的DSP之间还通过双向的FIFO连接,构成FIFO环。这种结构十分适合流水处理的应用,最大限度地减小了数据移动的开销,提高了处理器间的通信速度。

流水处理以其简单高效而被广泛采用,但因为它只利用了任务时间上的并行性,而忽视了空间上的并行性,所以并行度不高,加速比受到限制。当流水线中某一段任务负载量大于其他段时,就会形成处理瓶颈而降低系统效率。因此,流水线往往和并发操作结合起来,即在流水线处理的基础上,部分的利用空间并行性,称为局部并行全局串行网络。与之对应的是全局并行局部串行网络,即先利用空间并行性再利用时间并行性,设计出并行工作的多条流水线。

该并行信号处理系统的信号处理模块所采用的互连形式--共享总线和FIFO 环的结构,能够很好地适应流水处理的各种变形。

2 硬件设计

该信号处理模块符合VME标准,采用6U双高板结构,模块内部硬件实现上可划分为四级总线结构,分别是局部总线、全局总线、PCI总线以及VME总线。在局部总线上的资源有:SBRAM、SDRAM及双向FIFO;全局总线上的资源有:PCI总线接口、SRAM、FLASH;PCI总线上的资源有:RaceWay 接口、HOST?PCI 的桥、PCI?VME 的桥以及PCI?DSP 的桥;VME 总线上的资源有:

VME总线接口。

2.1 存储系统设计

信号处理模块的存储器空间包括:局部总线空间和全局总线空间。局部总线空间由局部控制寄存器空间、SBSRAM 空间、SDRAM 空间、FIFO 空间、内部程序存储器空间、内部数据存储器空间和内部外设空间构成。全局总线空间由全局FLASH空间、全局SRAM 空间、全局总线控制寄存器空间和PCI 接口空间构成。

EMIF 是外部存储器和TMS320C6701 片内各功能单元的接口,DSP 访问片外存储器时必须通过EMIF.

EMIF具有很强的接口能力,其数据总线宽度为32 b,可寻址空间为4 GB,可以与目前几乎所有类型的存储器直接接口,数据吞吐能力最高可达667 MB/s.EMIF 支持的器件类型包括:同步突发静态RAM(SBSRAM)、同步动态RAM(SDRAM)、异步器件(包括异步SRAM、ROM和FLASH等),异步接口速度、时序可编程,可以配合不同的器件。

EMIF处理的外总线请求有四种来源:片内程序存储器控制器发出的取指请求,片内数据存储器控制器发出的数据存取请求,片内DMA控制器的请求,外部共享存储器设备的控制器发出的请求。当同时有多个部分申请外总线时,由EMIF根据设置的优先级进行仲裁,然后响应各个申请。一旦某个申请者根据优先级获得了处理权,这一处理权会一直保留到该申请者放弃请求或者是有更高优先级的申请者提出申请,其间即便有新的申请出现,EMIF也不会受理。在新的申请开始得到处理之前,对于已经获得处理权的前一个申请者,其尚未完成的操作部分可以优先继续完成。

2.2 全局总线设计

模块内全局总线可由4 个DSP、PCI 接口芯片中的任何一个来占用,全局总线仲裁电路的设计是该模块设计中的一个要点。考虑到PCI接口是整个系统信息交换最重要的通道,它的利用率的高低直接决定了系统的性能,所以将其优先权定为高,将DSP的优先权定为低。DSP之间的仲裁采用轮转优先级仲裁算法。

DSP 通过异步接口空间访问全局总线,由于TMS320C6701的异步接口空间仅能够提供4 MB的地址空间,为了克服芯片的这个限制,采用页面的机制扩充异步接口空间,使该空间最大可访问的空间达到2 GB.把DSP的EMIF提供4 MB的异步接口空间分为两部分,低2 MB(即A21=0)用于访问全局资源,高2 MB用于访问每个DSP的局部资源。采用这种DSP异步接口空间的划分方法简化并加快了译码。当复位时每个DSP的页面寄存器都被置为0×0000 0000,它会自动通过异步接口空间指向FLASH,实现自举。当一个DSP 获得全局总线的访问权后,由该DSP的页面寄存器决定全局总线地址的高11 位(GA31:GA21),全局总线地址的低位(GA20:GA2)直接由该DSP 驱动,GA1 和GA0 由译码得到。

通过以下计算公式可以计算页面值和页内偏移量:

页面值=(全局总线上的地址& 0XFFE00000)》21;页内偏移量=( 全局总线上的地址&0X001FFFFF);软件通过以上计算公式给出当前全局地址访问的页面值和页内偏移量。页面值决定高位地址(GLA21~GLA31),页内偏移量决定于DSP 的低位地址线(EA2~EA20),这样就将全局总线地址映射到DSP的物理空间CE0的全局总线空间内。

2.3 调试接口

JTAG 是基于IEEE 1149.1 标准的一种边界扫描测试方式。TI公司为C6000系列DSP提供了JTAG端口支持,结合配套的仿真软件可以访问DSP的所有资源,包括片内寄存器以及所有的存储器,从而提供了一个实时的硬件仿真与调试环境,便于开发人员进行系统软件调试。

该信号处理模块提供两种方式的JTAG调试。一种方式是使用TI 的XDS?510 仿真器和JTAG 仿真协议给信号处理模块下载程序,在软件开发和调试时控制程序的执行。另一种方式是使用TI的代码编译开发环境和Pentek 的SwiftNet通信协议给信号处理模块下载程序和进行调试。这两种方式可通过一个选择器进行选择使用。

该信号处理板上有4片DSP,需要进行多处理器仿真调试,将DSP的JTAG端口和JTAG仿真器或JTAG控制器间以菊花链方式互连。JTAG调试接口电路如图2所示。

3 系统软件设计

随着嵌入式系统应用范围不断扩大,功能也越来越强。对于不同的系统应用需要采用定制信号处理算法。

在实时操作系统支持下开发DSP算法,方便快捷,程序思路清晰,便于代码调试和重用,但是目前大多数DSP实际应用中,仍然采用与早期单片机开发一样的开发方式,用汇编语言直接在硬件层上开发。开发模式的局限,已经严重影响了DSP以及嵌入式系统应用的发展。

并且随着对DSP系统性能要求的迅速提高,DSP软件将会日益复杂,特别是开发大规模并行系统的软件,处理机之间的通信与同步、资源管理、并行任务分配等都是相当繁重的工作。如果完全由程序员手工完成,将增加研发周期,软件质量也难以保证。因此,需要将这些底层的工作交给系统软件来处理,程序员的精力集中于信号处理算法的实现。

信号处理模块主要承担高速实时信号处理任务,使用DSP阵列。如上所述,并行DSP上使用操作系统,将会使复杂的并行程序开发变得相对容易并且效率高。

因此,可以考虑选择系统性能较好并且开发工具齐全的COTS 产品,在此基础上进行二次开发,将并行调试技术、负载平衡技术等融合进去。

VSPWorks 操作系统是WindRiver公司推出的用于DSP 的内存占用量小的高性能实时操作系统。VSP?

Works RTOS能够与VxWorks RTOS进行通信,这样开发者就可以很容易设计出DSP与通用处理器组合在一起的系统。因此,在实现信号处理模块的操作系统时,选用VSPWorks操作系统为基础,扩充并行调试和负载平衡等功能。另外,还要考虑系统的容错和重构等问题。

作为通用的信号处理平台,是否受用户欢迎,很大程度并不在于技术的先进性,而在于其开发工具是否友好,开发环境是否完备。该信号处理模块为了方便用户应用,提供良好的集成开发环境(IDE),在IDE中不但包括编辑、编译、连接等一般工具,另外还针对并行系统开发的要求提供了任务加载工具、并行调试工具和负载平衡分析工具等。该开发环境在宿主机上运行,通过调试口(如RS232、JTAG)与目标系统连接。

该信号处理模块软件开发环境包含三个高度集成的部分:运行在宿主机和目标机上的强有力的交叉开发工具和实用程序;运行在目标机上的高性能、可裁剪的实时操作系统;连接宿主机和目标机的多种通信方式,如:以太网、串口线、仿真器等。信号处理模块软件开发环境如图3所示。

4 结语

本文通过对信号处理实时性、通用性需求的深入研究,提出了基于TMS320C6701 处理器的高性能通用信号处理平台系统结构,重点论述了该平台的通信网络、存储器系统、调试电路等的设计,实现了支持信号处理器的实时操作系统VSPWorks配置,完善了信号处理平台软件开发环境。通过把不同分辨率的合成孔径雷达成像的计算过程映射到不同规模的信号处理模块组成的并行信号处理系统上,处理能力、存储容量、通信带宽等均能满足系统需求,证明了该信号处理平台的通用性、可扩展性及应对大规模浮点处理的有效性。

关键字:高性能  信号处理 编辑:探路者 引用地址:高性能信号处理通用平台研究

上一篇:声纳浮标对空中声源干扰的抑制方法研究
下一篇:基于红外光通信电路的设计方案

推荐阅读最新更新时间:2023-10-12 22:36

艾迈斯新款高性能读取IC助医疗和数字化X射线设备降本增效
艾迈斯半导体推出新款高性能读取IC,推动医疗和工业数字化X射线设备制造商降本增效 • 新型AS585xB产品与X射线影像设备中的标准连接器兼容,组装起来更简便; • 平板探测仪制造商可以从三种产品选项中,选择更快、更低功耗的读出IC; • 超低噪声AS5850B与最新的IGZO探测器技术、传统的TFT探测器类型都兼容。 中国,2021年4月26日——全球领先的光学解决方案供应商艾迈斯半导体(ams AG,瑞士股票交易所股票代码:AMS)今天宣布,为其适用于数字X射线平板式探测仪(FPD)的一流读取IC家族推出了新产品--- AS585xB系列,该系列器件为客户提供了全新的灵活连接器选项,更
[医疗电子]
艾迈斯新款<font color='red'>高性能</font>读取IC助医疗和数字化X射线设备降本增效
NI最新推出高性能FlexRay和CAN接口
  美国国家仪器有限公司(National Instruments,简称NI)近日最新推出NI-XNET CAN和FlexRay嵌入式网络接口,这将有助于汽车、航空航天等领域的工程师快速完成原型化、模拟和测试下一代FlexRay和控制器局域网(CAN)设备和网络。NI -XNET嵌入式网络平台由14块新型高性能的、基于PCI和PXI总线的FlexRay和CAN接口卡以及一个用于快速应用开发的通用API组成。该平台是专为高要求的应用所设计,如硬件在环( HIL )和终端测试等需要几百路信号源和亚微秒级延迟的应用。   CAN和FlexRay的总线主要应用于汽车行业中,用于车载电子控制单元(ECU)间的通信。CAN总线
[测试测量]
NI最新推出<font color='red'>高性能</font>FlexRay和CAN接口
是德科技互联测试解决方案助力中国一汽实现可靠和高性能的车载通信
是德科技公司(NYSE:KEYS)日前宣布, 中国第一汽车集团有限公司 (FAW)选用该公司的 互联汽车测试解决方案 ,推进车内外通信技术的性能和可靠性,包括以太网、紧急呼救、蜂窝车联网,以及即将升级为5G的4G通信技术。是德科技是一家领先的技术公司,致力于帮助企业、服务提供商和政府客户加速创新,创造一个安全互联的世界。 中国一汽主要面向中国市场设计、研发和生产乘用车及商用货车。该公司选择采用是德科技的互联汽车测试解决方案来验证其设计是否符合最新的 4G 、 C-V2X 和 eCall 标准,并检验车辆在整个协议栈(从物理层到应用层)的性能,包括射频(RF)参数的验证。 是德科技首席技术官 Jay Alexander 表示
[汽车电子]
基于32位ARM和μC/OS-II的心电信号处理系统
据统计,我国目前有县及县级以上医院1.3万家,医疗机械总数达17.5万台,加上一些专业心脏疾病治疗机构,我国目前每年心脏疾病的门诊量约在一千万人次以上。根据国家卫生部《全国卫生信息化发展规划纲要》的目标,在2010年要基本实现医院的数字化和信息化。所以未来医疗器械市场对新型医疗设备的市场空间巨大,特别是拥有数字化和信息化特征的心电信号处理系统具有广阔的应用前景和实用价值。本文就是介绍的一种基于ARM的心电信号处理系统设计。 系统总体设计 本文所介绍的系统的主要功能是对心电信号进行实时的处理和传输,系统原理框图如图1所示。 心电信号通过电极提取进入模拟处理模块,在模拟处理部分经过放大和滤波处理后,提高了信号的强度和信噪比。信号
[单片机]
基于32位ARM和μC/OS-II的心电<font color='red'>信号处理</font>系统
高端示波器中的数字信号处理技术
图1. 90000-X示波器捕获板 图1是90000-X示波器的捕获板。90000-X示波器使用磷化铟技术,其硬件带宽可达33GHz,实时采样率可达80GSa/s,存储深度可达2GB。这些指标都达到了业界顶尖的水平。但是随着采样速率和存储深度的提升,数字信号处理能力成为一大挑战,传统的使用内置计算机的Matlab软件处理方式已经不能满足测试速度的要求。现在,90000和90000-X示波器采用FPGA硬件进行数字信号的处理,代表了示波器数字信号处理技术发展的方向。 90000和90000-X示波器的FPGA执行了如下处理,大幅度提升了示波器响应的速度;其FPGA也集成了嵌入去嵌入和精密探头校准算法,也大幅度提升了
[测试测量]
高端示波器中的数字<font color='red'>信号处理</font>技术
一种基于FPGA的复数浮点协方差矩阵实现
   O 引言   协方差矩阵的计算是信号处理领域的典型运算,是实现多级嵌套维纳滤波器、空间谱估计、相干源个数估计以及仿射不变量模式识别的关键部分,广泛应用于雷达、声呐、数字图像处理等领域。采用FPGA(Field Programmable Gate Array)可以提高该类数字信号处理运算的实时性,是算法工程化的重要环节。但是FPGA不适宜对浮点数的处理,对复杂的不规则计算开发起来也比较困难。故目前国内外协方差运算的FPGA实现都是采用定点运算方式。   在所有运算都是定点运算的情况下,每次乘法之后数据位宽都要扩大一倍。若相乘后的数据继续做加减运算,为了保证数据不溢出,还必须将数据位宽扩展一位,而协方差矩阵的运算核心
[嵌入式]
一种基于FPGA的复数浮点协方差矩阵实现
基于数字信号处理器的新一代车载娱乐系统解决方案
1. 引言   车载娱乐系统中的技术发展趋势正在变得日益复杂。通过铜缆发送音频数据的简单音频系统已经成为过去。为了满足多通道音频处理和分布式视频的要求,复杂的网络处理变得越来越流行。特别是与数字传输内容保护(DTCP)加密和解密方法相关的媒体定向系统传输(MOST)光网络正在被许多高挡和中挡汽车采用。这种趋势以及车载音频系统通常必须以变化的采样频率适应多种输入源(调幅和调频、CD、DVD驱动、蜂窝电话、导航系统输入)这个事实给DSP供应商增加了压力,要求他们提供改进性能和提高集成度的处理器。 2. 通用基于MOST总线的车载高端娱乐系统   MOST总线专门用于满足要求严格的车载环境的要求。这种新的基于光纤的网络
[汽车电子]
RFID读写器接收机基带数字信号处理研究
      1 引言       超高频RFID系统空中接口标准包括ISO/IEC系列,F2C系列,以及中国正在研究制定的国家标准,数字接收机可实现软件升级和多协议支持,相比模拟接收机具备易于调试、应用灵活的优势,因而在超高频姗读写器中得到了广泛应用.提高超高频RFID读写器的读取效果一直是近年来的研究重点.在经过详尽分析和实验验证后,本文给出相关问题的解决办法。       超高频RFID读写器是与标签之间采用反向散射原理完成通信,根据当前主要的UHF频段空中接口标准ISO/IEC 18000-6C,标签在无源状态下以同频半双工方式通讯.基本的通信过程是,读写器采用幅移键控(ASK)等方式来调制载波,在特定频率的信道上将
[网络通信]
小广播
502 Bad Gateway

502 Bad Gateway


openresty
502 Bad Gateway

502 Bad Gateway


openresty
502 Bad Gateway

502 Bad Gateway


openresty
502 Bad Gateway

502 Bad Gateway


openresty
502 Bad Gateway

502 Bad Gateway


openresty
502 Bad Gateway

502 Bad Gateway


openresty
随便看看
    502 Bad Gateway

    502 Bad Gateway


    openresty
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved
502 Bad Gateway

502 Bad Gateway


openresty