采用集成 DSP 与微处理器内核的嵌入式应用-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

嵌入式应用包括信号处理算法与控制算法，在多种实时嵌入式系统中这两种算法共同执行必需的功能，因此我们应了解控制算法与数字信号处理器 (DSP) 算法是如何实现互操作性的。在手机和 MP3 播放器等应用中，要解决上述互操作性问题，传统做法是分别用 RISC 处理器和DSP来处理控制算法与信号处理算法。例如，在手机中，信号处理功能负责处理音视频应用中的回声消除与编解码工作。由于DSP 架构是专门设计用于执行信号处理算法的，因此信号处理算法在 DSP 上的运行效率很高；而手机中的控制软件则负责执行状态机，即控制用户界面、键盘及其它非信号处理功能。

开发包括信号处理与控制算法且要求这两种算法间实现互操作性的嵌入式应用时，我们要面临几大挑战。举例来说，当我们将桌面应用或其它复杂应用连接到嵌入式设备上时，让该嵌入式设备的DSP/RISC 内核实时工作并适当地进行代码分组(code partitioning)会相当困难，因为要这两种不同内核实现同步操作需要进行大量的工作。视频或协议处理等众多高级嵌入式应用会增加多内核上代码分组的难度，而且大多数代码分组工作都要由编程人员完成。以采用德州仪器 (TI)TMS320C55x DSP 与 ARM RISC 处理器的双内核架构为例来说，DSP 执行信号处理任务，而 ARM 9 则执行控制功能（如图 1 所示）。

图 1. 传统的双内核 DSP/RISC 处理架构

另一种方法是在单个设备中集成 DSP 与微处理器，我们可向 RISC 内核添加类似于 DSP 的指令（如乘法或累加指令）或向 DSP 内核添加类似的控制指令（如执行特定寻址任务的指令），从而实现上述目的。凭借相关工具的支持，这种“集成化”技术具有一定的优势，如在操作系统上仅运行唯一的原生应用，这样就能简化设计方案，便于集成，并加快产品上市进程。

在传统嵌入式应用中，分别采用通用微处理器（或微控制器）和DSP内核来执行通用功能与信号处理算法。上述方法的合理性在于：

DSP 内核专门运行信号处理算法，效率较高；
DSP 架构共享一系列常见功能，如并行计算与移动、快速乘法累加 (MAC) 运算以及Harvard 架构等，支持多个运算的同时存取；
DSP处理器通常不采用RISC设计原理；
DSP架构是在电信及多媒体领域的视频、影像与语音处理等应用以及数据压缩与解压缩功能的驱动下应运而生的；
DSP 指令集以存储器为导向并针对过滤与转换等信号处理算法的执行进行了精心优化。为了支持上述运算，DSP 采用专用寄存器、地址单元、乘法累加单元及片上存储器等。

系统应用分组的最大挑战在于，每个内核都需要自己的外部存储器子系统，这会增加功耗。除了控制独立存储器子系统所需的功耗之外，通常每个内核还要控制自己的一套外设，以实现处理内核数据的存取（如图1所示，DSP 及 ARM 与各自可能互不相同的一套外设及存储器子系统相连），这也会增加功耗，而且还会加大整体系统通信开销。

向 RISC 内核添加 DSP 指令

在 RISC 架构中集成 DSP 单元不仅能够实现更多并行操作，而且还更有效地共享资源（如外设及存储器等）。因此，采用速度更快的 RISC 架构，DSP算法的执行速度也相应地提高了。

不过，RISC 架构采用负载／存储原理，指令集的通用性较强，因此会对性能造成负面影响。有关设备的高速缓存技术比较复杂且大量使用管线处理，从而需要较高的时钟频率。基于 RISC 的微处理器添加增强型 DSP 功能与特性后，可支持乘法累加指令等 DSP 算法，也能支持图像或影像处理等专门单元。

由于带 RISC/DSP 双内核的处理器能够完成两个单核处理器的工作，因此不存在处理器间通信的问题。利用集成内核，我们可在 DSP 与控制器上动态进行代码分组，以适应系统要求或环境的变化。这种模式不仅能够加快环境转换，而且由于无需两套外设或存储器，因此进一步降低了资源占用。此外，这种方法还提高了系统的集成度，这不仅有助于降低功耗，而且还能通过在单个设备上集成更多功能而实现成本降低、性能提高及芯片尺寸缩减等其它多种优势。

如前所述，现代 DSP 处理器本身具备一些通用特性，如配置用于 DSP 运算的专用数据路径、以DSP 为中心的运算所需的专用指令集、满足多个时序存储器存取所需的多个存储体与总线，以及DSP 的专用外设等。

另一方面，通用处理器也在自身内核中集成了类似 DSP 的功能。我们可采用多种方法来为通用处理器添加 DSP 功能。设计人员可添加专用的单指令、多数据指令以及诸如多媒体扩展指令集 (MMX)指令等，也可为多个取操作数在现有 CPU内核（如 Hitachi SH-DSP）上集成类似于定点 DSP 处理器的数据路径及其它相关资源。与ARM 公司的 NEON 架构类似，我们还可向 CPU 添加 DSP协处理器。设计人员也可创建三内核处理器等混合架构。

带有集成 DSP 功能与特性的架构

NEON SIMD 指令能并行处理 16 个元件，这加速了媒体及 DSP 应用。有关指令与内核密切配合（如图 2 所示），这种集成技术使我们能统一查看与 ARM 内核共享的存储器的情况，从而能使用统一的指令流，明确统一的平台目标，进而加速整体应用开发进程。

这种架构对 3G 手机等特定应用而言非常适用。就这种应用来说，DSP 数据引擎可用于视频编码等专门的处理工作，而集成了NEON DSP 功能的 ARM 内核则可用于音视频解码，RISC 处理引擎则可用于用户界面及协议栈处理等。

图 2. ARM NEON 架构

三内核架构（如图 3 所示）将类似于 MCU 的 RISC 负载／存储型架构与类似 DSP 的 Harvard 存储器架构结合在一起，地址总线均为 32 位宽。程序与数据存储器总线为 64 位宽。内核本身不包含任何存储器，不过可由设计人员定制。超标量架构包括 32 位定点数据通路、负载／存储单元及程序控制单元等。该设备每个循环能执行多达三个指令（数据通路指令、负载／存储指令以及指定回路的指令），这适合高性能DSP应用的需求。

图 3. 三内核架构

有关设备还支持各种 DSP 寻址模式，其中包括带前后增量的寄存器间接寻址、索引寻址、循环（自动模数）寻址及位翻转寻址等。位翻转技术对译出FFT算法的输入输出很有用，这是常见的DSP操作。此外还支持零开销硬件循环。

总之，采用集成 RISC/DSP 处理器支持实时嵌入式系统的优势在于：

在不影响DSP与微控制器性能的条件下，单个架构完美集成了 DSP与微控制器的功能与特性；
快速任务切换功能使集成内核能像虚拟处理器一样工作，并在DSP 与微控制器任务间实现快速切换，有时仅需几个时钟周期；
较大的片上存储器块（RAM 与 ROM）有助于提高系统性能并降低功耗；
集成架构无需额外的粘接逻辑便可直接控制片上外设。

关键字：DSP 微处理器 RISC 引用地址：采用集成 DSP 与微处理器内核的嵌入式应用

上一篇：基于S3C44B0的嵌入式系统在电子警察中设计与应用
下一篇：基于LM3S615的电脑鼠走迷宫的设计

推荐阅读最新更新时间：2024-03-16 13:44

基于DSP的自动对焦系统

摘要：介绍了一种基于DSP芯片TMS320F206进行数值计算和实施控制的自动对焦系统。给出了系统的硬件构成和软件设计。该系统不仅充分发挥了DSP芯片的数值计算优势，而且拓展了其在人机对话和电机控制等输入输出方面的应用。关键词：自动对焦DSP爬山搜索算法现代社会是一个高度信息化的社会，多媒体技术的发展使图像信息的获取及其传输手段倍受瞩目。自动对焦技术是计算机视觉和各类成像系统的关键技术之一，在照相机、摄像机、显微镜、内窥镜等成像系统中有着广泛的用途。传统的自动对焦技术较多采用测距法，即通过测出物距，由镜头方程求出系统的像距或焦距，来调整系统使之处于准确对焦的状态。随着现代计算技术的发展和数字图像处理理论的日益成熟，自

[应用]

基于DSP的双电动机同步控制平台设计

　　1　双电动机同步控制系统　　控制对象为两台三相直流无刷电动机，额定功率为3 kW，额定转速为1 500 r/min，主要用在需要同步行走的场合，控制两台电动机同步行走。　　直流无刷电动机的控制系统主要由控制部分、驱动及逆变电路部分、转子位置检测及电流采样电路构成。其中，以TMS320F28335为核心的控制部分负责控制运算、模拟采样等任务;驱动电路将控制电路输出的弱电信号进行功率放大，输出具有一定驱动能力的强电信号去控制逆变电路的开关管工作，实现将直流电逆变转换供给电动机，达到对电动机的控制目的;位置检测部分检测电动机转子信号，并送给控制部分处理;电流采样部分完成对直流电源母线电流的检测。整个系统外围器件少，减小了设计难

[嵌入式]

带屏幕显示输出的电视专用微处理器ST6388

　　 1．概述电视专用微处理器 ST6388 是意法半导体有限公司（ STMicroelectronics ）新推出的低成本电视专用微处理器，它是 ST638X 系列 8 位 HCMOS 微处理器中的一种（如表 1 所列）。该系列的 MCU 都在一个共同的核周围集成了定时器、脉宽调制（ PWM ）输出、串行外设接口（ SPI ）、屏幕显示（ OSC ）控制及 ROM 、 RAM 和片内 EEPROM 等，因而具有类似的结构，可多种配置以获得最佳的成本控制。 2.ST6388简介 ST6388 为 42 脚 SDIP 封装，其引脚排列如图

[手机便携]

基于DSP和FPGA的电视观瞄系统设计

电视观瞄系统以FPGA为处理核心，实现红外数字视频信号的实时图像处理，DSP实现了部分的图像处理算法和FPGA的控制逻辑，并响应中断，实现数据通信和存储引言许多光学观瞄系统都增加了电视、红外辅助(周视)观瞄系统，称之为光电观瞄系统。在该系统中，需要用电视或红外成像来精确瞄准目标，但光电系统所在的平台总是处于运动状态，成像器件产生的图像也就随之运动，通过CCD成像器件或红外成像器件得到的图像不能保证观瞄精度。因此，克服平台运动造成的成图像旋转是解决观瞄精度的关键技术之一。目前的常用方法是机械消像旋，很多要求较高的光学系统仍然采用该方案，随DSP及FPGA的广泛应用，电子消像旋也应用到了光学观瞄系统上。这两种方案各有优缺点：

[应用]

使用FPGA解决DSP设计难题

由于DSP能够迅速测量、过滤或压缩实时模拟信号，因此DSP在电子系统设计中非常重要。这样，DSP有助于实现数字世界与真实(模拟)世界的通信。但是随着电子系统变得越来越精细，需要处理多个模拟信号源，工程师们不得不作出艰难的决策。是使用多个DSP并使其功能与系统的其余部分同步，还是使用一个能够实现多个功能的带精细软件的高性能DSP更具优势？由于现在的系统很复杂，在许多情况下，单DSP的实现方案的往往没有足够的处理能力。同时，系统架构也不能满足多芯片系统的成本、复杂性和功耗要求。 FPGA现已成为需要高性能DSP功能的系统的绝佳选择。事实上，与独立的数字信号处理器相比，FPGA技术一般可以为DSP难题提供更加简单的解决方案。要

[嵌入式]

使用FPGA解决<font color='red'>DSP</font>设计难题

RISC-V距离主流还有多远？

RISC-V 内核开始出现在异构 SoC 中，这标志着其从独立设计转向主流应用，在主流应用中它们被用于从加速器和处理器到安全应用的一切场景。这些变化微妙但意义重大，越来越多的人接受基于开源指令集架构的芯片或Chiplet可以与 Arm、Synopsys (ARC) 和 Cadence (Tensilica Xtensa) 等经过硅验证的内核相结合，以创建相对便宜和灵活的定制选项。虽然 RISC-V 尚未在大型应用中取得进展，但 Ventana Micro Systems 等公司正在试水基于 RISC-V 的高性能计算芯片，用于数据中心。 RISC-V 不太可能很快取代现有的芯片架构，但随着它从单片、单一供应商 SoC

[嵌入式]

车规应用，RISC-V架构如何发力？

“选X86还是选ARM？”这是芯片在设计之初的首要问题之一。近些年，这个选项中还增加了一匹黑马— RISC-V 。从商业模式来说，X86是封闭的指令架构，适合PC端的高性能计算，功耗最高，供应商主要为英特尔和AMD，基于架构开发芯片并且售卖； Arm 架构是由Arm公司研发，适用于移动通讯领域，扩展性不及X86但能耗居中，基于架构再开发处理器核出售给芯片设计公司。 RISC-V是目前市面上主流架构中，并不由某一家公司所主导的芯片架构，多用于智能穿戴设备，指令精简，没有历史包袱，功耗也最低。近几年来，有越来越多半导体业界的头部公司和产业人士开始参与RISC-V建设。比如今年8月，博世、高通

[汽车电子]

车规应用，<font color='red'>RISC</font>-V架构如何发力？

开关电源功率因数校正的DSP实现

1 引言　　随着对高功率因数的变换器的需求不断增长，功率因数为1（unity Power factor）的电源供给越来越受到欢迎。在计算机或其它一些设备上，电源要求鲁棒性好、可靠、抗干扰能力强。而数字控制正提供了这方面的保障。　　和传统模拟控制器相比，数字控制器具有以下这些优点:可以实现非线性的精细的控制算法，减少元器件数量,提高可靠性,不易老化,很小的控制偏差和热漂移。但同时,数字控制也意味着相对较高的费用和一定的控制带宽限制。过去,这些不足在很大程度上限制了数字控制在电源方面的应用。而现在，由于高效廉价的DSP的出现，数字控制不仅在交流驱动（ACdrives）和三相变换方面应用越来越广泛，而且在DC/DC变换领域

[电源管理]