DSP与ARM存储器架构和指令集有哪些差异-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

DSP

DSP(digital singnal processor)是一种独特的微处理器，有自己的完整指令系统，是以数字信号来处理大量信息的器件。一个数字信号处理器在一块不大的芯片内包括有控制单元、运算单元、各种寄存器以及一定数量的存储单元等等，在其外围还可以连接若干存储器，并可以与一定数量的外部设备互相通信，有软、硬件的全面功能，本身就是一个微型计算机。DSP采用的是哈佛设计，即数据总线和地址总线分开，使程序和数据分别存储在两个分开的空间，允许取指令和执行指令完全重叠。也就是说在执行上一条指令的同时就可取出下一条指令，并进行译码，这大大的提高了微处理器的速度。另外还允许在程序空间和数据空间之间进行传输，因为增加了器件的灵活性。

其工作原理是接收模拟信号，转换为0或1的数字信号，再对数字信号进行修改、删除、强化，并在其他系统芯片中把数字数据解译回模拟数据或实际环境格式。它不仅具有可编程性，而且其实时运行速度可达每秒数以千万条复杂指令程序，源源超过通用微处理器，是数字化电子世界中日益重要的电脑芯片。它的强大数据处理能力和高运行速度，是最值得称道的两大特色。

DSP芯片，由于它运算能力很强，速度很快，体积很小，而且采用软件编程具有高度的灵活性，因此为从事各种复杂的应用提供了一条有效途径。其主要应用是实时快速地实现各种数字信号处理算法。

根据数字信号处理的要求，DSP芯片一般具有如下主要特点：

(1)在一个指令周期内可完成一次乘法和一次加法;(2)程序和数据空间分开，可以同时访问指令和数据;(3)片内具有快速RAM，通常可通过独立的数据总线在两块中同时访问;(4)具有低开销或无开销循环及跳转的硬件支持;(5)快速的中断处理和硬件I/O支持;(6)具有在单周期内操作的多个硬件地址产生器;(7)可以并行执行多个操作;(8)支持流水线操作，使取指、译码和执行等操作可以重叠执行。

当然，与通用微处理器相比，DSP芯片的其他通用功能相对较弱些。

DSP优势在于其有独特乘法器，一个指令就可以完成乘加运算，但GPP(通用处理器)处理一般是用加法代替乘法，要n多cpu周期，尽管cpu主频很快，但还是要相当时间，这一点现在的GPP已经基本上可以做到内部单周期运算乘加指令了。

数字信号处理是一种通过使用数学技巧执行转换或提取信息，来处理现实信号的方法，这些信号由数字序列表示。在过去的二十多年时间里，数字信号处理已经在通信等领域得到极为广泛的应用。

ARM：

ARM ( Advanced RISC Machines )，既可以认为是一个公司的名字，也可以认为是对一类微处理器的通称，还可以认为是一种技术的名字。1991 年 ARM 公司成立于英国剑桥，主要出售芯片设计技术的授权。目前，采用 ARM技术知识产权( IP )核的微处理器，即我们通常所说的 ARM 微处理器，已遍及工业控制、消费类电子产品、通信系统、网络系统、无线系统等各类产品市场，基于 ARM 技术的微处理器应用约占据了 32 位 RISC 微处理器 75 %以上的市场份额， ARM 技术正在逐步渗入到我们生活的各个方面。 ARM 公司是专门从事基于 RISC 技术芯片设计开发的公司，作为知识产权供应商，本身不直接从事芯片生产，而是转让设计许可由合作公司生产各具特色的芯片，世界各大半导体生产商从ARM公司购买其设计的 ARM 微处理器核，根据各自不同的应用领域，加入适当的外围电路，从而形成自己的 ARM 微处理器芯片进入市场。目前，全世界有几十家大的半导体公司都使用 ARM 公司的授权，因此既使得 ARM 技术获得更多的第三方工具、制造、软件的支持，又使整个系统成本降低，使产品更容易进入市场被消费者所接受，更具有竞争力。

ARM最大的优势在于速度快、低功耗、芯片集成度高，多数ARM芯片都可以算作SOC，基本上外围加上电源和驱动接口就可以做成一个小系统了。

基于ARM核心处理器的嵌入式系统以其自身资源丰富、功耗低、价格低廉、支持厂商众多的缘故，越来越多地应用在各种需要复杂控制和通信功能的嵌入式系统中。

ARM与DSP的比较：

区别：

由于两大处理器在各自领域的飞速发展，如今两者中的高端或比较先进的系列产品中，都在弥补自身缺点、且扩大自身优势，从而使得两者之间的一些明显不同已不再那么明显了，甚至出现两者部分结合的趋势(如ARM的AMBA总线，可以把DSP或其他处理器集成在一块芯片中;又如DSP中的两个系列OMAP和达芬奇系列，就是直接针对两者的广泛应用而将两者结合在一起，从而最大发挥各自优势)，另外，两者各自不同系列的产品侧重点也不尽相同，所以这里讨论的是一些传统意义上比较。

总的来说主要区别有：

ARM具有比较强的事务管理功能，可以用来跑界面以及应用程序等，其优势主要体现在控制方面，它的速度和数据处理能力一般，但是外围接口比较丰富，标准化和通用性做的很好，而且在功耗等方面做得也比较好，所以适合用在一些消费电子品方面;

而DSP主要是用来计算的，比如进行加密解密、调制解调等，优势是强大的数据处理能力和较高的运行速度。由于其在控制算法等方面很擅长，所以适合用在对控制要求比较高的场合，比如军用导航、电机伺服驱动等方面。

如果只是着眼于嵌入式应用的话，嵌入式CPU和DSP的区别应该只在于一个偏重控制一个偏重运算了。

另外：

内核源码开放的Linux与ARM体系处理器相结合，可以发挥Linux系统支持各种协议及存在多进程调度机制的优点，从而使开发周期缩短，扩展性增强。

详细来说：

DSP的优势主要是速度，它可以在一个指令周期中同时完成一次乘法和一次加法，这非常适合快速傅立叶变换的需求。DSP有专门的指令集,主要是专门针对通讯和多媒体处理的;而ARM使用的是RISC指令集(当然ARM的E系列也支持DSP指令集)是通用处理用的。

存储器架构和指令集特点不一样

单片机为了存储器管理的方便(便于支持操作系统)，一般采用指令、数据空间统一编码的冯·诺依曼结构。 DSP为了提高数据吞吐的速度，基本上都是指令、数据空间独立的哈佛结构。

单片机对于数字计算方面的指令少得多，DSP为了进行快速的数字计算，提高常用的信号处理算法的效率，加入了很多指令，比如单周期乘加指令、逆序加减指令(FFT时特别有用，不是ARM的那种逆序)，块重复指令(减少跳转延时)等等，甚至将很多常用的由几个操作组成的一个序列专门设计一个指令可以一周期完成(比如一指令作一个乘法，把结果累加，同时将操作数地址逆序加1)，极大的提高了信号处理的速度。由于数字处理的读数、回写量非常大，为了提高速度，采用指令、数据空间分开的方式，以两条总线来分别访问两个空间，同时，一般在DSP内部有高速RAM，数据和程序要先加载到高速片内ram中才能运行。DSP为提高数字计算效率，牺牲了存储器管理的方便性，对多任务的支持要差的多，所以DSP不适合于作多任务控制作用。

1 对密集的乘法运算的支持

GPP不是设计来做密集乘法任务的，即使是一些现代的GPP，也要求多个指令周期来做一次乘法。而DSP处理器使用专门的硬件来实现单周期乘法。DSP处理器还增加了累加器寄存器来处理多个乘积的和。累加器寄存器通常比其他寄存器宽，增加称为结果bits的额外bits来避免溢出。同时，为了充分体现专门的乘法-累加硬件的好处，几乎所有的DSP的指令集都包含有显式的MAC指令。

2 存储器结构

传统上，GPP使用冯.诺依曼存储器结构。这种结构中，只有一个存储器空间通过一组总线(一个地址总线和一个数据总线)连接到处理器核。通常，做一次乘法会发生4次存储器访问，用掉至少四个指令周期。

大多数DSP采用了哈佛结构，将存储器空间划分成两个，分别存储程序和数据。它们有两组总线连接到处理器核，允许同时对它们进行访问。这种安排将处理器存贮器的带宽加倍，更重要的是同时为处理器核提供数据与指令。在这种布局下，DSP得以实现单周期的MAC指令。

还有一个问题，即现在典型的高性能GPP实际上已包含两个片内高速缓存，一个是数据，一个是指令，它们直接连接到处理器核，以加快运行时的访问速度。从物理上说，这种片内的双存储器和总线的结构几乎与哈佛结构的一样了。然而从逻辑上说，两者还是有重要的区别。

GPP使用控制逻辑来决定哪些数据和指令字存储在片内的高速缓存里，其程序员并不加以指定(也可能根本不知道)。与此相反，DSP使用多个片内存储器和多组总线来保证每个指令周期内存储器的多次访问。在使用DSP时，程序员要明确地控制哪些数据和指令要存储在片内存储器中(CMD文件的编写)。程序员在写程序时，必须保证处理器能够有效地使用其双总线。

此外，DSP处理器几乎都不具备数据高速缓存。这是因为DSP的典型数据是数据流。也就是说，DSP处理器对每个数据样本做计算后，就丢弃了，几乎不再重复使用。

3 零开销循环

如果了解到DSP算法的一个共同的特点，即大多数的处理时间是花在执行较小的循环上，也就容易理解，为什么大多数的DSP都有专门的硬件，用于零开销循环。所谓零开销循环是指处理器在执行循环时，不用花时间去检查循环计数器的值、条件转移到循环的顶部、将循环计数器减1(逆序加减指令)。

与此相反，GPP的循环使用软件来实现。某些高性能的GPP使用转移预报硬件，几乎达到与硬件支持的零开销循环同样的效果。

4 定点计算

大多数DSP使用定点计算，而不是使用浮点。虽然DSP的应用必须十分注意数字的精确，用浮点来做应该容易的多，但是对DSP来说，廉价也是非常重要的。定点机器比起相应的浮点机器来要便宜(而且更快)。为了不使用浮点机器而又保证数字的准确，DSP处理器在指令集和硬件方面都支持饱和计算、舍入和移位。

发展趋势：

DSP是否将作为手机的心脏生存下去，目前的争论非常激烈。今天的手机生产采用的是双核方式：DSP芯片处理通信，如调制解调器功能和语音处理等;一块通用处理器(通常是ARM设计的RISC处理器)负责处理手机上运行的各种程序，如用户界面和控制协议堆栈等。随这两种处理器的功能日益强大，或许它们中的一方将会接管另一方目前执行的功能。但问题在于：是ARM取代DSP，还是DSP挤掉ARM?

如果将这三者结合起来，即由DSP结合采样电路采集并处理信号，由ARM处理器作为平台，运行Linux操作系统，将经过DSP运算的结果发送给用户程序进行进一步处理，然后提供给图形化友好的人机交互环境完成数据分析和网络传输等功能，就会最大限度的发挥三者所长。

关键字：DSP ARM 存储器架构指令集引用地址：DSP与ARM存储器架构和指令集有哪些差异

上一篇：三星以白金会员加入Linux基金会网络基金
下一篇：基于嵌入式软件开发的裸跑与RTOS的选用时机分析

推荐阅读最新更新时间：2024-05-03 02:22

Credo推出Seagull 452系列高性能光DSP芯片——八通道/四通道/双通道DSP

Credo推出Seagull 452系列高性能光DSP芯片——八通道/四通道/双通道DSP 功耗、性能和成本经过优化，契合日益增长的AI需求加州圣何塞和中国深圳，2023年9月5日—— Credo Technology是一家提供安全、高速连接解决方案的创新企业。Credo致力于为数据基础设施市场提供其所必须的高能效、高速率解决方案，以满足其不断增长的带宽需求。Credo今日发布Seagull 452系列高性能、低功耗光DSP新品。该系列包括三款光DSP产品：Seagull 452（八通道），Seagull 252（四通道）以及Seagull 152（双通道）。三款产品均集成VCSEL、EML和SiPho驱动。 Cre

[嵌入式]

Alif推出Ensemble和Crescendo两大物联网融合MCU系列

由Alif Semiconductor开发的Ensemble和Crescendo产品系列代表了最新的安全连接、人工智能支持和高功率的MCU和融合处理器，旨在实现始终连接的物联网产品。这两个系列满足了对可扩展设备的需求，这些设备集成了AI/ML加速、多层安全、LTE Cat-M1和NB-IoT连接，以及GNSS定位。这些部件还集成了足够的内存，以支持当今的物联网产品的设计，无论处理需要在本地还是在云端进行。电源效率得益于Alif的自主智能电源管理（aiPM）技术，该技术允许对芯片中的资源何时被供电进行精细控制。其结果就是人们所期望的一类电池供电的物联网设备。 Ensemble系列的处理器内核从单核Arm Cortex

[单片机]

μC／OS-III在Cortex-M3处理器上的移植

引言 μC／OS-III是一款基于优先级调度的抢占式实时内核，Micrium公司于2011年8月公开了μC／OS-III的源码，其源码遵循ANSIC标准，因而具有良好的移植性，相信其将会被移植到越来越多的处理器体系上。本文主要完成基于Cortex-M3处理器的μC／OS-III移植，通过本次移植，加深对嵌入式操作系统原理的理解。此外，在μC／OS-III移植成功的基础上进行嵌入式应用程序开发，可以把主要精力集中到应用程序上，而硬件资源交由μC／OS-III管理，从而使得嵌入式应用程序更易开发和维护，在嵌入式软硬件结构变得越来越复杂的今天具有现实意义。 1 μC／OS-III和Cortex-M3特点相对以前的版本，μC／O

[单片机]

利用ISA总线实现对DSP芯片VC5402的软配置

摘要：以PC机作为主机，通过PC的ISA总线与DSP的HPI主机并口连接作为传输通道，实现对PC机ISA插卡上的DSP芯片TMS320VC5402进行实时在线程序装载。关键词：DSP HPI主机并口 ISA总线软配置一、引言目前，随着微电子技术的飞速发展，在基于工业测控和数据采集领域的PC机板卡产品中，高速DSP芯片的使用已经是越来越普及。众多厂家生产的DSP芯片中以美国TI公司（德州仪器）生产的DSP芯片的应用最为普遍。同传统的诸如单片机的程序装载过程相比，DSP厂家为芯片提供了更多、更灵活的程序装载方法。电子工程师在设计DSP系统中究竟采用那种程序装载方法，应视产品类型的不同而有所选择。当前许多厂家所生产的DS

[应用]

发挥ARM Cortex-M3和M4微控制器最大作用的要诀

引言许多嵌入式开发人员对ARMCortex处理器架构颇为熟悉，但很少有人能够对这种流行架构了如指掌，从而可以充分发挥它独特的特性和性能。新型ARM Cortex-M4处理器尤为如此，它拥有引以为豪的增强架构、天生的数字信号处理(DSP)能力和可选的浮点加速器，使精于此道的程序设计人员或硬件工程师可以充分发挥它的优势。本文接下来将就Cortex-M3/M4微控制器(MCU)的一些更有趣的(但经常遭到忽视的)特性展开详细的论述。大部分采用Cortex-M3/M4 MCU的目标应用是便携式的，并且供电电源来自电池或能源收集系统，因此我们所探讨的大部分概念涉及如何减少系统整体能耗的技术。然而，在许多情况下，这些节能技术也是处理

[单片机]

发挥<font color='red'>ARM</font> Cortex-M3和M4微控制器最大作用的要诀

基于DSP在线式UPS不间断电源控制系统的研究

　　引言　　随着计算机的普及和信息处理技术的广泛应用，不间断电源UPS在关键负载连接至公共电网方面扮演着重要角色。它们旨在为处于任何正常或异常实用电源条件下的负载提供清洁、持续的电源。德州仪器(TI)TMS320F28335 DSP为在线UPS设计提供增强的、经济高效的解决方案，可以高速执行多种控制算法，从而使实现高采样速率成为可能。　　本文实现了基于TMS320F28335的不间断电源控制系统的设计，该系统能够在单芯片中实现在线UPS的多控制环路，从而提高集成度并降低系统成本。数字控制还为每个控制器带来可编程性、抗噪声干扰和避免冗余电压及电流传感器的使用等优点。DSP可编程性意味着可以使用增强的算法更新系统以提高可靠性。

[单片机]

基于<font color='red'>DSP</font>在线式UPS不间断电源控制系统的研究

Xilinx 在 ARM TechCon展示其实现产业大趋势发展的强大实力

赛灵思于 2015 年 11 月 10 日至 12 日在加利福尼亚州圣克拉拉会议中心举行的 ARM TechCon 2015 大会上通过一系列演讲与演示展示了其业界首款 16nm All Programmable MPSoC（即 UltraScale+ MPSoC）。赛灵思推出的解决方案突出展现了其实现产业大趋势发展的强大实力。赛灵思的演讲主题包括：解密采用可编程 SoC 的汽车 ADAS 防撞系统采用可编程 SoC 的新型入侵检测技术可确保 IoT 网络安全采用 All Programmable SoC 的自我性能建模与分析用指纹和网络安全技术检测不易发现的威胁赛灵思演示

[嵌入式]

谷歌推新款ARM架构CPU用于AI，声称性能比顶级ARM对手高30%

4月10日消息，美国当地时间周二，谷歌推出了名为Axion的新型芯片，这款芯片功能强大，能够胜任从YouTube广告精准推送到大数据分析等复杂任务，旨在帮助谷歌应对不断增长的人工智能成本。 Axion的问世标志着谷歌在自主研发芯片道路上的重要突破，标志着其在大数据中心常用芯片领域迈出了关键一步。多年来，谷歌持续探索新的计算资源，尤其是针对人工智能领域的专用芯片。自从OpenAI在2022年底发布ChatGPT并掀起人工智能新竞赛以来，谷歌加快了自主研发芯片的步伐，旨在在互联网领域的竞争中占据有利位置。业界分析人士普遍认为，谷歌在芯片领域的努力有助于减少对外部供应商的依赖，同时使其能够与英特尔、英伟达等芯片制造巨头形成竞争。然而，

[嵌入式]

热门资源推荐
热门放大器推荐

小广播

热门活动

换一批

■免费申请 | 上百份MPS MIE模块，免费试用还有礼！

■PI 电源小课堂|无 DC-DC 变换实现多路高精度输出反激电源

■有奖直播报名:大联大世平集团&恩智浦 | AI 无所不在，单板电脑也可以

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中