基于高性能多DSP互连技术

发布者:tnzph488最新更新时间:2010-03-08 关键字:DSP  互连技术  sRIO  PCI  UTOPIA  DSI 手机看文章 扫描二维码
随时随地手机看文章

  可以看出,在越来越高的传输速率需求的推动下,高性能DSP互连接口在物理层技术的主要发展趋势是:从高电压摆幅→低电压摆幅,从单端信号→差分信号;从并行总线→串行信号线;从收发异步→收发外同步→源同步→串行码流中嵌入时钟的串行器/解串行器(SerDes);从半双工→全双工;从多点分时共享总线→点-点的专用互连;最终使接口传输速率从几十Mbps发展到目前的10Gbps。

  数据的串行化意味着数据必须以分组方式传输。而由于信号完整性问题,高速串行差分线一般不允许多点负载,因此基于SerDes的互连一般是点到点的直接互连。当DSP数量较少时,可以采用DSP间两两的直接互连;当DSP数量较多时,须要采用中间DSP或用于数据传输的中间器件—交换机。

  因此,物理层技术的发展推动着高性能DSP的主要互连技术从多点并行总线转向高速串行直连和分组传输交换。例如TI在2008年10月发布的3核DSP TMS320C6474、Freescale在2008年11月发布的6核DSP MSC8156,都已经取消传统意义上的数据、地址和控制三总线接口而代之以sRIO、GE之类的标准分组交换网络接口以及AIF这样的高速直连接口。

  根据传输特性对互连技术的分类

  互连的目的满足接口及算法链路的数据传输需要,因此互连特性往往与传输特性紧密相关。各种互连技术虽各有不同,但可以根据互连与传输的共性进行统一分类,有助于理解并选择合适的互连技术。表3是根据互连与传输的特性对现有主要DSP互连技术的分类总结。图1~图4是对典型互连技术实例的图示。

  对表3补充说明如下:多点总线为多DSP共享并分时占用,不能多数据流并发传输。多点主从总线可能有主总线的桥接转换,例如PCI-HPI的PCI2040(TI)、PCI-Local总线的PCI9054(PLX)。传统互连中的数据传输过程一般都需要源、中间或目的处理器的显性或隐性(例如TDM中的时隙分配)地直接参与。而基于交换机的网络互连则一般不需要。间接传输中的中介器件、DSP或交换机可以根据需要级联。接口转换桥方式连接标准网络的实例有:专用于ADI公司SHARC及TigerSHARC的SharcFin和FINe(Bittware)、通用的TSI620(Tundra)。高端FPGA由于其丰富的接口、对几乎所有互连标准的有效支持、使用的灵活性和高性能的计算处理能力,也会在多DSP的互连中发挥重要作用。

  在2003年RapidIO成为ISO/IEC 18372标准之前,还没有规范的多DSP互连网络标准,各厂商推出了多种非标准DSP互连网络、接口和交换芯片,例如:Solano(Spectrum Signal)、StarFabric(StarGen)、FPDP/sFPDP(ICS/VITA)、RaceWay(Mercury)、SKYChannel(SKY Computer)。RapidIO是在这些技术的基础上发展起来的,特别针对高性能DSP或嵌入式系统互连优化,其产业链已经基本成熟,并开始逐步取代这些非标准互连技术。

                                              图1 典型直接互连:链式、星型、阵列

                                                 图2 典型多点总线直接互连:对等总线、主从总线

                                    图3 典型非网络间接互连:存储器中介(双口、FIFO、共享)、FPGA

  总结高性能DSP间的数据传输及控制,可以看出,其主要发展趋势是:从DSP间的直接互连传输→通过中介DSP的间接传输→通过分组交换互连网络的间接传输;源DSP和目的DSP的关系从主从关系→对等关系;从DSP软件主动参与传输控制→硬件独立自主控制传输过程,例如sRIO由硬件完成检错和重传;从专有互连传输技术→标准互连传输技术。

                                        图4 交换网络互连:直接接入及需要适配器接口转换

  系统级设计考虑

  构建多DSP并行DSP系统时,需要决策解决的系统级问题有:为主数据路径选用哪些互连技术与整体拓扑?统一互连还是混合互连技术?直接还是间接互连?如果直接互连采用何种DSP接口?如果间接互连是采用存储器、FPGA、交换机还是其他器件扩展?是否需要连接外部网络?如何处理控制、程序配置、管理等的传输需求?是否需要区分数据平面、控制/配置平面、管理平面?在控制/配置/管理平面内,又应采用何种互连技术与互连拓扑?

  如何选择合适的互连技术,设计合理的互连体系结构,应当根据数字信号处理算法及其在各DSP上的分解、解耦与适配结果,考虑数据传递链路在速率、延迟、并发数等方面的性能需求,针对已有DSP接口的互连与传输特性,满足系统在控制、配置和管理方面的数据传递需要,满足系统在成本、硬软件开发复杂度、调试测试方便性、构建使用灵活性与可扩展性等使用特性上的需要。在工程中设计实际并行处理系统时,一般需要混合使用多种互连传输技术与互连拓扑架构。

  经验总结

  在信号处理平面:当多DSP间整体流量不大或需要共享内存且器件支持时,可以使用对等并行总线;当处理过程需要主处理器参与转移、分配、汇聚或控制时,可以选用主从并行总线;当多DSP异构、具有非对等总线接口、需要分发汇聚或需要FPGA参与处理时,可以用缓存或FPGA做中介的间接互连;当需要高性能且链路为直接点—点时,可以选用高速直接互连链路或多点总线蜕化的直接互连;当需要并发的多个高速数据流、路径需要动态变化或需要扩展性,可以采用高性能分组交换网络互连;如果DSP不具有网络接口或网络为非标准,则需要桥接器件。语音、定时特性明显的中小数据量传输可以采用McASP、TDM、McBSP等同步串行总线;对网络数据可以采用FE、GE的标准网络。

  在配置、控制和管理数据平面,对低速数据可以采用串行总线如UART、I2C、CAN、UART扩展的RS485等;对于高速传输可以采用主从并行总线如PCI、HPI、DSI、UTOPIA等,或采用FE/GE、PCIe、sRIO等网络互连技术;如果需要通过外部以太网管理系统内部则需要使用FE、GE等通用网络技术。

  对于系统的整体互连拓扑,当整体算法链路固定且主要为顺序传递或逐级分解/汇聚或DSP数量较少时,可以采用两DSP间点—点直接互连组成的链/环式、树/星型、二/三维规则拓扑、Mesh等拓扑结构;当需要中、低性能的多DSP间相互传输,可以采用多点总线、FPGA星型、FE/GE的星型网络拓扑;当需要较多DSP间的高性能互连、算法灵活或需要性能与规模的线性扩展时,可以使用FPGA或分组交换网络形成的星型拓扑。

  结语

  现代高性能多DSP并行DSP系统一般将采用分平面的混合互连与传输技术。高性能多DSP的互连和数据传输将主要是基于低压差分SerDes的全双工互连和分组数据传输。当DSP数量较少时系统级互连将以DSP间的直接互连为主,当DSP数量较多时将以交换机及交换网络为中心。多DSP互连的整体发展趋势是从局部的差异化互连→全局统一的网络互连;从直接互连/传输→通过中介的间接传输→通过互连网络的间接传输;从非标准互连→标准互连;从通用以太网→面向信号处理优化的高性能嵌入互连网络sRIO。

关键字:DSP  互连技术  sRIO  PCI  UTOPIA  DSI 引用地址:基于高性能多DSP互连技术

上一篇:基于ADSP-BF533的数字通信信号发生器设计与实现
下一篇:基于DSP的PCI总线CAN适配器设计

推荐阅读最新更新时间:2024-05-02 21:01

音频信号采集与AGC算法的DSP设计方案
过去,对大音频信号采用限幅方式,即对大信号进行限幅输出,小信号不予处理。这样,仍然存在音频信号过小时,用户自行调节音量,也会影响用户的收听效果。随着电子技术,计算机技术和通信技术的迅猛发展,数字信号处理技术已广泛地深入到人们生活等各个领域。其中语音处理是数字信号处理最活跃的研究方向之一,在IP电话和多媒体通信中得到广泛应用。   语音处理可采用通用数字信号处理器DSP和现场可编程门阵列(FPGA) 实现,其中DSP实现方法具有实现简便、程序可移植行强、处理速度快等优点,特别是TI公司TMS320C54X系列在音频处理方面有很好的性价比,能够解决复杂的算法设计和满足系统的实时性要求,在许多领域得到广泛应用。在DSP的基础上对
[嵌入式]
基于定点DSP的CMOS数字视频监控终端设计
引 言 CMOS图像传感器与CCD相比,由于能将时序处理电路和图像信号的前端放大与数字化部分集成于一个芯片内,因此,它的发展一直受到业界的高度重视。现在,随着技术与工艺的发展,CMOS图像传感器不仅在噪声上得到了有效改善,而且分辨率也已得到了明显提高。一般的彩色CMOS图像传感器都能达到100万像素。好的CMOS图像传感器甚至能达到300万像素以上。因此,CMOS图像传感器将以其低廉的价格、实用的图像质量、高集成度和相对较少的功耗,在视频监控领域得到更加广泛的应用。 TI公司的TMS320C54X系列DSP是一款性能价格比很高的16位定点DSP。以TMS320C5402为例,它的运行速度可以达到100MIPS,而且内部集成有
[嵌入式]
视频监控中ARM与DSP的HPI接口设计
  1 引言   随着网络技术、图像处理技术及嵌入式技术日趋成熟,视频监控技术得到广泛的应用。银行、工厂、政府、学校等部门,都设置有监控系统。尤其是在国际上一系列恐怖事件后,人们更感到监控系统的重要。而且要求视频监控设备有高清晰的视频效果的同时,还能对现场进行实时控制。所以,此类设备不但要有更高的数据处理能力和处理精度,还要有强大的系统控制、管理能力以及高速的网络数据传输速率。   目前,市面上主流的视频监控设备,大致可以分成两类,一是基于通用微处理器,二是基于数字信号处理器DSP。两种芯片在功能上有各自的特点,通用芯片适用于系统控制、管理和信息通讯等,DSP芯片则更适合执行复杂的数字计算、音视频数据处理等。若两种芯片协同工作,
[单片机]
视频监控中ARM与<font color='red'>DSP</font>的HPI接口设计
​通过仔细规划来成功实现实时声学处理
低延时时、实时声学处理是许多嵌入式处理应用的关键因素,其中包括语音预处理、语音识别和主动降噪(ANC)。随着这些应用领域对实时性能的要求稳步提高,开发人员需要以战略思维来妥善应对这些要求。由于许多大型系统都由芯片提供可观的性能,因此我们往往会将出现的任何额外任务都加载到这些设备上,但我们需要知道,延时时和其确定性是非常关键的因素,如果未仔细考虑,很容易引发重大的实时系统问题。本文将探讨设计人员在选择SoC和专用音频DSP时应考虑的问题,以避免实时声学系统出现令人不快的意外。 低延时声学系统的应用非常广泛。例如,单单是在汽车领域,低延时对于个人音频区域、路噪降噪和车内通讯系统等都至关重要。 随着汽车电气化趋势涌现,路噪降噪变
[汽车电子]
​通过仔细规划来成功实现实时声学处理
一种基于DSP和无线传输技术的实时监测系统设计
1引言 随着工业的发展,易燃、易爆、有毒气体及液体的种类和应用范围都得到了增加。在化工、石油、染料以及其他行业中就有许多有害物质,如液化石油气、氨、氯、硫化氢、二氧化硫及酒精等,如果在生产或运输过程中由于操作失误或其他原因,致使这些危险性物质泄漏出来,由于气体本身存在的扩散性,发生泄漏后,在外部风力和内部浓度梯度的作用下,气体会沿地表扩散,在事故现场形成燃烧爆炸或毒害危险区。为了增强运输安全性,同内外对危险化学品运输车辆实行监管,主要针对车辆行驶状态的监测。在圈外也有针对危险化学品运输的基于GIS平台的危险性评估研究,以此作为运输路径的选择依据。目前,国内中集集团应用的基于MEMS传感器的集装箱监测系统很好地监测了运输过程中气体
[嵌入式]
一种基于<font color='red'>DSP</font>和无线传输<font color='red'>技术</font>的实时监测系统设计
基于DSP控制的数字式双向DC/DC变换器的实现
摘要:总结了电力电子领域数字控制的发展历程,并对其现状和前景作了分析。基于对全桥隔离型的双向DC/DC变换器工作原理的分析,从简化硬件电路的角度出发,设计了数字控制的双向DC/DC变换器。试验控制功能全部由软件实现,电压可调性和稳压输出都得到满足。同时也由软件实现电路的双向运行,对蓄电池可以进行恒流充电。 关键词:双向DC/DC变换器;数字信号处理器;数字脉宽调制(DPWM) 引言 数字化技术随着信息技术的发展而飞速发展,同时,也对电力电子技术的发展起到了巨大的推动作用。随着电力电子技术和数字控制技术的发展,越来越多的数字控制开关变换器投入使用。但是,在高频PWM变换器中还存在一些需要解决的问题。 随着数字信号处理技术的
[嵌入式]
IEEE1394视频视觉系统中DSP控制处理器的软硬件设计
摘要:介绍了用数字信号处理器实现视频流控制处理功能的软硬件设计方案。重点论述了如何设计DSP的软件及外围硬件,完成IEEE1394设备自标识及数据传输的详细过程。同时还提出了一种用于运动目标检测的变加权背景恢复算法及其DSP实现方案。这种用DSP实现数字视觉算法的成功尝试,对于实现其他视觉功能具有一定的借鉴意义。 关键词:DSP IEEE1394a 视频采集 运动目标检测 本文介绍了一种以DSP为核心、基于IEEE1394总线的图像实时采集处理系统的软硬件设计。此外还提出了一种易于用DSP实现且存储器资源占用率小的运动目标检测算法。据了解,目前国内外大多数的计算机视觉研究都是用计算机软件处理实现的,因此在实时性和成本方面受计算
[网络通信]
TMS320F206定点DSP芯片开发实践
    摘要: 以TMS320F206为例,阐述了DSP芯片的调试方法与调试技巧。着重探讨了DSP系统开发过程中的硬件设计与调试、软件设计的流水线冲突和等待状态设置以及如何利用闪速存储器等相关问题,具有较强的参考价值。     关键词: TMS320F206 流水线 等待状态 闪速存储器 高速数字信号处理器是当前信息产业的热点技术之一,采用最先进的DSP无疑会使所开发的产品具有更强的市场竞争力。与普通的单睡机相比,DSP芯片放弃了冯·诺依曼结构,代之以程序和数据分开的哈佛结构,从而大大提高了处理速度,指令周期多为ns级,比普通单片机(多为 μs 级)快了3个数量级。因此,在硬件设计中要考虑高频干扰问题。同时,D
[嵌入式]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved