换个角度解读DSP芯片

发布者:CreativeDreamer最新更新时间:2014-06-07 来源: 21IC关键字:解读  DSP芯片 手机看文章 扫描二维码
随时随地手机看文章

  让你说出知道的芯片的名称,你可能会一时想不起,也不能一一罗列DSP芯片都有哪些。或许是对DSP芯片深刻的了解才了然于心,由于种种原因的忘却;或许是因为大家在说DSP芯片好,既然大家都说好,那才是真的好,至于怎样好,可能是似懂非懂。那好吧,不管是懂还是不懂,现在让我们从新的视角来读懂这个芯片的世界,让你发现不曾明白的细节。

  DSP芯片,也称数字信号处理器,采用特殊的软硬件结构,是一种专注于进行数字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理,是数字信号处理理论实用化过程的重要技术工具。在语音处理、图像处理等技术领域得到了广泛的应用。那根据对DSP芯片的理解来对比与其他芯片的最要的区别是什么?杭州海康威视数字技术股份有限公司的高级嵌入式开发经理黄田认为,DSP芯片与其它芯片的最大区别在于它拥有针对各种算法设计的大量专用指令,比如各种向量运算。另外DSP芯片在设计时更多地考虑到数据总线的带宽以及吞吐量,避免数据访问成为影响算法性能的瓶颈。

  芯片的基本结构

  为了快速地实现数字信号处理运算,DSP芯片一般都采用特殊的软硬件结构。下面简单介绍DSP芯片的基本结构。

  (1)哈佛结构

  主要特点是将程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编址,独立访问。与两个存储器相对应的是系统中设置了程序总线和数据总线,从而使数据的吞吐率提高了一倍。由于程序和数据在两个分开的空间,因此取指和执行能完全重叠。

  (2)流水线操作

  流水线与哈佛结构相关,DSP芯片广泛采用流水线以减少指令执行时间,从而增强了处理器的处理能力。处理器可以并行处理二到四条指令,每条指令处于流水线的不同阶段。下面所列是一个三级流水线操作的例子:

  CLLOUT1

  取指NN-1N-2;

  译码N-1NN-2;

  执行N-2N-1N,

  (3)专用的硬件乘法器

  专用的硬件乘法器,乘法速度越快,DSP处理器的性能越高。由于具有专用的应用乘法器,乘法可在一个指令周期内完成。

  (4)特殊的DSP指令

  DSP是采用特殊的指令。

  (5)快速的指令周期

  特殊的DSP指令,DSP芯片是采用特殊的指令。快速的指令周期、哈佛结构、流水线操作、专用的硬件乘法器、特殊的DSP指令,再加上集成电路的优化设计可使DSP芯片的指令周期在200ns以下。

  DSP系统的特点

  数字信号处理有别于普通的科学计算与分析,它强调运算处理的实时性,因此DSP除了具备普通微处理器所强调的高速运算和控制功能外,针对实时数字信号处理,在处理器结构、指令系统、指令流程上具有许多新的特征,其特点如下:

  算术单元

  具有硬件乘法器和多功能运算单元,硬件乘法器可以在单个指令周期内完成乘法操作,这是DSP区别于通用的微处理器的一个重要标志。多功能运算单元可以完成加减、逻辑、移位、数据传送等操作。新一代DSP内部甚至还包含多个并行的运算单元,以提高其处理能力。针对滤波、相关、矩阵运算等需要大量乘和累加运算的特点,DSP的算术单元的乘法器和加法器,可以在一个时钟周期内完成相乘、累加两个运算。近年出现的一些DSP如ADSP2106X、DSP96000系列DSP可以同时进行乘、加、减运算,大大加快了FFT的蝶形运算速度。

  总线结构

  传统的通用处理器采用统一的程序和数据空间、共享的程序和数据总线结构,即所谓的冯.诺依曼结构。DSP普遍采用了数据总线和程序总线分离的哈佛结构或者改进的哈佛结构,极大地提高了指令执行速度。片内的多套总线可以同时进行取指令和多个数据存取操作,许多DSP片内嵌有DMA控制器,配合片内多总线结构,使数据块传送速度大大提高。

  专用寻址单元

  DSP面向数据密集型应用,伴随着频繁的数据访问,数据地址的计算也需要大量时间。DSP内部配置了专用的寻址单元,用于地址的修改和更新,它们可以在寻址访问前或访问后自动修改内容,以指向下一个要访问的地址。地址的修改和更新与算术单元并行工作,不需要额外的时间。DSP的地址产生器支持直接寻址、间接寻址操作,大部分DSP还支持位反转寻址(用于FFT算法)和循环寻址(用于数字滤波算法)。

  片内存储器

  针对数字信号处理的数据密集运算的需要,DSP对程序和数据访问的时间要求很高,为了减小指令和数据的传送时间,许多DSP内部集成了高速程序存储器和数据存储器,以提高程序和数据访问存储器的速度。

  流水处理技术

  DSP大多采用流水技术,即将一条指令的执行过程分解成取指、译码、取数、执行等若干个阶段,每个阶段称为一级流水。每条指令都由片内多个功能单元分别完成取指、译码、取数、执行等操作,从而在不提高时钟频率的条件下减少了每条指令的执行时间。

  DSP与其它处理器的差别

  数字信号处理器(DSP)、通用微处理器(MPU)、微控制器(MCU)三者的区别在于:DSP面向高性能、重复性、数值运算密集型的实时处理;MPU大量应用于计算机;MCU则适用于以控制为主的处理过程。

  DSP芯片的优点

  DSP的运算速度比其它处理器要高得多,以FFT为例,高性能DSP不仅处理速度是MPU的4~10倍,而且可以连续不断地完成数据的实时输入/输出。DSP结构相对单一,普遍采用汇编语言编程,其任务完成时间的可预测性相对于结构和指令复杂(超标量指令)、严重依赖于编译系统的MPU强得多。以一个FIR滤波器实现为例,每输入一个数据,对应每阶滤波器系数需要一次乘、一次加、一次取指、二次取数,还需要专门的数据移动操作,DSP可以单周期完成乘加并行操作以及3~4次数据存取操作,而普通MPU完成同样的操作至少需要4个指令周期。因此,在相同的指令周期和片内指令缓存条件下,DSP的运算速度可以超过MPU运算速度的4倍以上。

  DSP芯片的浮点与定点之分

  在选择DSP器件的时候,是采用浮点还是采用定点,如果用定点是16位还是32位?其实这个问题和你的算法所要求的信号的动态范围有关。

  浮点运算DSP比定点运算DSP的动态范围(动态范围:如音响系统重放时最大不失真输出功率与静态时系统噪声输出功率之比的对数值,又如一个多媒体硬盘播放器输出图像的最亮和最暗部分之间的相对比值)要大很多。定点DSP的字长每增加1bit,动态范围扩大6dB,16bit字长的动态范围为96dB。程序员必须时刻关注溢出的发生。例如:在做图像处理时,图像做旋转、移动等,就很容易产生溢出。这时,要么不断地移位定标,要么作截尾。前者要耗费大量的程序空间和执行时间,后者则很快带来图像质量的劣化。总之,是使整个系统的性能下降。在处理低信噪比信号的场合,例如进行语音识别、雷达和声纳信号处理时,也会发生类似的问题。而32bit浮点运算DSP的动态范围可以作到1536dB,这不仅大大扩大了动态范围,提高了运算精度,还大大节省了运算时间和存储空间,因为大大减少了定标,移位和溢出检查。

  由于浮点DSP的浮点运算用硬件来实现,可以在单周期内完成,因而其处理速度大大高于定点DSP,这一优点在实现高精度复杂算法时尤为突出。

  定点的计算不过是把一个数据当作整数来处理,通常AD采样来的都是整数,这个数相对于真实的模拟信号有一个刻度因子,大家都知道用一个16位的AD去采样一个0到5V的信号,那么AD输出的整数除以2^16再乘以5V就是对应的电压。在定点DSP中是直接对这个16位的采样进行处理,并不将它转换成以小数表示的电压,因为定点DSP无法以足够的精度表示一个小数,它只能对整数进行计算。而浮点DSP的优势在于它可以把这个采样得到的整数转换成小数表示的电压,并不损失精度(这个小数用科学记数法来表示),原因在于科学记数法可以表示很大的动态范围的一个信号,以IEEE754浮点数为例,单精度浮点格式:[31]1位符号[30-23]8位指数[22-00]23位小数。这样的能表示的最小的数是+-2^-149,最大的数是+-(2-2^23)*2^127,动态范围为20*log(最大的数/最小的数)=1667.6dB这样大的动态范围使得在编程的时候几乎不必考虑乘法和累加的溢出,而如果使用定点处理器编程,对计算结果进行舍入和移位则是家常便饭,这在一定程度上会损失精度。

        原因在于定点处理的信号的动态范围有限,比如16位定点DSP,可以表示整数范围为1-65536,其动态范围为20*log(65536/1)=96dB.对于32定点DSP,动态范围为20*log(2^32/1)=192dB,远小于32位ieee浮点数的1667.6dB,但是实际上192dB对绝大多数应用所处理的信号已经足够了。由于AD转换器的位数限制,一般输入信号的动态范围都比较小,但在DSP的信号处理中,由于点积运算会使中间节点信号的动态范围增加,所以主要考虑信号处理流程中中间结果的动态范围,以及算法对中间结果的精度要求,来选择相应的DSP。另外就是浮点的DSP更易于编程,定点DSP编程中程序员要不断调整中间结果的PQ值,实际就是不断对中间结果进行移位调整和舍入。

  实数运算可直接透过代码加入硬件运算中,而定点元件必须透过软件才能间接执行实数运算,这就增加了运算法指令并延长了开发时间。

  整体上说,定点DSP在成本上具有优势而浮点DSP在易用上较优。

  DSP芯片的发展现状与应用

  自从DSP芯片诞生以来,DSP芯片得到了飞速的发展。一方面得益于集成电路的发展,另一方面也得益于巨大的市场。在短短的十多年时间,DSP芯片已经在信号处理、通信等许多领域得到了广泛的应用。

  对于DSP芯片的发展现状和DSP如何与其他产品搭配应用解决方案海康威视的黄田作出了如下这样的看法:DSP芯片已经在向专业化、多元化方向发展,各厂家的市场划分越来越细,差异性也越来越大。另外,单纯的DSP芯片已经不多见,更多的是DSP芯片与其它处理核心集成在一起,形成一个集成度高、针对性强的SOC,不仅极大地降低了板级空间,也带来了功耗、成本以及开发周期的全面优势,从而推动了行业的发展和产品性能的提高。

  DSP的优势在于灵活的算法集成,可以给产品提供强大的性能以及灵活的定制,同一产品针对各类客户不同的需求实现不同的解决方案。为了提高产品的竞争力,厂商都会在算法上做足文章,算法变得越来越复杂,但是算法的稳定性、产品的功耗、开发周期等都会成为难以驾驭的风险。DSP算法不是一大堆理论公式的堆砌,而是与所使用DSP芯片的具体特点紧密结合的精致软件。这些因素在产品设计时就需要予以充分考虑,不要为了一些噱头功能而盲目采用所谓的先进算法和高性能DSP,而是要从用户需求出发,寻找算法与DSP的最佳组合。在产品方案中,算法和DSP是核心,这个组合确定了,再去搭配其它的处理芯片和外围设备,才能形成一套高效的产品解决方案。

  目前DSP技术应用从军用到民用,从航空航天到生产生活,都越来越多地使用DSP。DSP技术在航空航天方面,主要用于雷达和声纳信号处理;在通信方面,主要用于移动电话、IP电话(voiceoverIP)、ADSL和HFC的信号传输;在控制方面,主要用于电机控制、光驱和硬盘驱动器;在测试/测量方面,主要用于虚拟仪器、自动测试系统、医疗诊断等;在电子娱乐方面,主要用于高清晰度电视(HDTV)、机顶盒(STB)、AC-3、家庭影院、DVD等应用;在图像/图形上,主要用于二维和三维图形处理、图像压缩与传输、图像增强、动画等;还有数字相机、网络相机等等都应用了DSP技术。同时,SOC芯片系统、无线应用、嵌入式DSP都是未来DSP的发展方向和趋势。可以说,没有DSP就没有对互联网的访问,也不会有多媒体,也没有无线通信。因此,DSP仍将是整个半导体工业的技术驱动力。现在,DSP应用领域不断拓宽,其函盖面包括宽带Internet接入业务、下一代无线通信系统的发展、数字消费电子市场、汽车电子市场的发展等诸多方面。

  DSP芯片的分类

  为不同算法而专门设计的DSP芯片可以分为基础特性、数据格式和按用途分三大类。

  按基础特性分,根据DSP芯片的工作时钟和指令类型来分类的。如果DSP芯片在某时钟频率范围内的任何频率上能正常工作,除计算速度有变化外,没有性能的下降,这类DSP芯片一般称之为静态DSP芯片。如果有两种或两种以上的DSP芯片,它们的指令集和相应的机器代码机管脚结构相互兼容,则这类DSP芯片称之为一致性的DSP芯片。

  按数据格式分,这是根据DSP芯片工作的数据格式来分类的。数据以定点格式工作的DSP芯片称之为定点DSP芯片。以浮点格式工作的称为DSP芯片。不同的浮点DSP芯片所采用的浮点格式不完全一样,有的DSP芯片采用自定义的浮点格式,有的DSP芯片则采用IEEE的标准浮点格式。

  按用途分,可分为通用型DSP芯片和专用型的DSP芯片。通用型DSP芯片适合普通的DSP应用,如TI公司的一系列DSP芯片。专用型DSP芯片是为特定的DSP运算而设计,更适合特殊的运算,如数字滤波,卷积和FFT等。

  结语

  随着安防行业的高速发展,特别是高清和智能化需求的井喷,整个行业已经全面进入数字化时代,而作为数字化安防产品的核心,安防芯片已经成为一个巨大的产业,所以需要更多不同的算法。对于不断涌现的算法需求来说,DSP的处理能力永远是不够的,算法开发人员需要不断在性能指标和DSP的处理能力之间做平衡,是少做一次循环,还是允许偶尔丢帧,类似这样,如果无法做取舍,则需要进一步对算法进行优化,可能是算法架构上的,也可能是汇编代码级的。片内缓存是影响算法性能的一个重要因素,DDR带宽则往往是系统级的。由于DSP精于计算,而不善于逻辑处理,特别是网络协议、数据库管理方面,因此DSP往往与其它芯片配合使用。在安防领域的各种开发方案中,DSP+ARM最为主流,ARM负责网络、存储、外设管理,DSP负责图像、音频处理及编解码。目前DSP+ARM基本上都集成到一个SOC中,尽管如此,对于软件开发来说,DSP和ARM还都是分开的。在需要更高处理性能的领域,往往采用多片DSP共同处理的方式。这些也是海康威视黄田,具多年行业资深技术人的深刻体会。

关键字:解读  DSP芯片 引用地址:换个角度解读DSP芯片

上一篇:DSP+FPGA在高速高精运动控制器中的应用
下一篇:基于DSP的双通道数字语音监录器设计

推荐阅读最新更新时间:2024-05-02 23:05

解读中国云计算市场的玩家们:战略、基因、技术与新规则
  最近欧洲GPDR开始实施,引发了全球的关注,数据隐私及数据产权必然影响 云计算 市场的发展,野蛮生长的 云计算 需要调整新规则,而谁能够在未来严格遵守商业规则,保护好客户的数字产权,谁将赢得市场。下面就随网络通信小编一起来了解一下相关内容吧。    分析的结构   中国的 云计算 市场是兵家必争之地,在未来很长一段时间内可以预期的高增长态势吸引了很多云计算玩家,他们依靠自己的资源禀赋和结构性优势,从不同的角度进击这个市场。   大玩家既有本土的阿里巴巴、华为、腾讯,也有国外的亚马逊,中小玩家主要是本土的百度、紫光、浪潮。   一般来说,市场的生态和游戏规则一般都是有大玩家们决定的,他们彼此竞争和妥协,形成云计算生态的基本游
[网络通信]
新能源汽车电驱系统标准解读与拓展: 馈电特性
导语:文章封面是MINI Cooper SE电动汽车,去年秋季在纽北赛道进行了一场别开生面的表演,然而本次的重点并不是速度,而是其优秀的制动能量回收表现,在没有踩踏制动踏板的前提下,完成了整个赛道的驾驶。这得益于其灵活多变的能量回收策略,驾驶员可以根据需求选择能量回收模式,调节回收程度和对应的减速效果,一旦驾驶员将脚从踏板上移开,汽车行驶的动能带动电机将汽车动能转化为的电能并储存在储能设备中。作为动力总成服务商,如何稳定、高效的提供制动能量,是我们关注的重点。 我们已经讨论过电驱动扭矩控制和转速控制的相关标准和应用(转矩响应时间、转矩控制精度、转速控制),标准中测试都是在电机电动状态下进行的的,电动汽车节能不仅仅是因为行
[汽车电子]
新能源汽车电驱系统标准<font color='red'>解读</font>与拓展: 馈电特性
全面解读LED背光电视技术优势
2010年的下半年,风光无限的 CCFL 发光 LCD 显示 器逐渐被 led 取代,而LED的普及已经是板上钉钉的事实,2011年初,随着春节促销的到来,多款 LED显示 器纷纷上市,消费者对于LED的接受程度也水涨船高。 目前LED发光技术的优势已经深入人心,节能、低温、无辐射、长寿命等特性使得LED发光技术被大量应用于 液晶 显示器的制造,一线显示器厂商纷纷推出多款色彩表现优异、 亮度 均衡、低能耗的LED显示器产品,展开了自LCD之后又一轮新的竞争。   LED发光优势 LED发光技术的色彩优势显著,所以在显示器制造方面备受青睐。目前已过时的CCFL(冷阴极背光灯)技术由于本身频谱限制, 色域 范围受到较
[电源管理]
全面<font color='red'>解读</font>LED背光电视技术优势
小米手机系统软件部总监张国全解读GMS
昨天小米手机系统软件部总监张国全发表长文向广大网友详解GMS,并集中解答大家关心的几个问题,我们一起来看看。 1、GMS究竟是什么? GMS是谷歌开发的一款常驻后台的服务,谷歌自己的大部分应用,启动和安装时会依赖GMS, 非谷歌类应用,完全不受影响 (目测70%以上的用户没搞明白)。 2、为什么谷歌认为自行安装不安全? 预装GMS会放在super分区(只读),这样三方软件不可修改;如果用户自行安装,会放在user分区(可读写) ,所以存在被hack的机会。所以谷歌要求所有厂商关掉自行安装的入口,即使自行安装,谷歌也会在将来从服务端禁止使用,当然预装的都不影响。 有发烧友说,如果root呢,首先强烈不建议root,root后自然
[手机便携]
解读Arm架构数据中心联合实验室未来发展规划
2017年11月17日,龙岗区委书记张勇、贵州 华芯通 半导体技术有限公司(以下简称: 华芯通 半导体)董事长欧阳武、创新科存储技术(深圳)有限公司(以下简称:UIT创新科)董事长陈凯以及Arm公司全球执行副总裁兼大中华区总裁吴雄昂在以“集聚高端创新资源,打造东部创新中心”为主题的深圳市龙岗区重大项目签约仪式,暨“千人计划”专家创新创业交流会在2017深圳高交会上共同见证了来自四方代表签署的战略合作框架协议,四方约定在深圳市龙岗区成立“Arm架构数据中心联合实验室”,共同开发和建设基于高性能、低功耗的Arm架构处理器的自主、安全、可控的云计算和大数据应用数据中心示范工程。下面就随手机便携小编一起来了解一下相关内容吧。 为何A
[手机便携]
Windows 8跨平台战略解读:多方下注摊薄风险
    美国《沃顿知识在线》上周撰文称,虽 然微软Windows 8初期并未获得市场广泛认可,但在当前的市场环境中,微软这种多管齐下的战略不无道理:倘若无法在平板电脑和智能手机市场取得进展,该公司的霸主地位就将 被动摇。在被逼无奈下,微软被迫推出了一款横跨多种设备的系统,希望能够通过摊薄赌注来赢得市场。    大幅改版   当微软CEO史蒂夫·鲍尔默(Steve Ballmer)10月25日正式发布Windows 8时,他吹嘘微软将通过触摸屏、崭新的用户界面和抛弃传统开始菜单的使用模式,“重新想象Windows”。   然而,分析师却质疑微软的这款全新操作系统,以及包括宏碁、戴尔、惠普和三星在内的众多合作伙伴
[手机便携]
从Roadster到Model 3,解读特斯拉电动汽车历史
特斯拉 电动汽车 公司本周五(7月28日)将为首批30名客户举办交接派对,向他们交付其首款量产的大众版电动汽车 Model 3 。随后,特斯拉Model 3的量产会进入加速阶段,9月份生产目标为1500辆轿,12月份达到20000辆。美国主流网络媒体BI近日以图说的方式,回顾了特斯拉汽车的前世今生,包括这些年发生的巨大变化。   01.2008年推出首款电动汽车——超级性感的Roadster时,特斯拉获得了很多关注。Roadster Sport的续航里程为394公里,只需3.7秒时速就可以从0加速到96公里。《Car and Driver》报道称,2008年这款汽车的基准价为98000美元。特斯拉网站上称,这款汽车在30多个
[嵌入式]
三相异步电动机铭牌上各个数据的含义解读
电动机是把电能转换成机械能的设备,要正确使用电动机,必须先能看懂其铭牌。三相异步电动机铭牌上各个数据的含义如下: 一、型号 电动机型号通常由产品代号、规格代号、特殊环境代号组成。 1、产品代号 电动机产品代号通常由类型代号、特点代号、设计序号组成。 1)类型代号 类型代号表示电动机的类型,用汉语拼音字母表示。 异步电动机代号Y,Y系列电动机全称为全封闭自扇冷式三相鼠笼型异步电动机。 2)特点代号 特点代号表示电动机的性能、结构,用字母表示。 (1)性能 YB是隔爆型防爆电机;YBX3是最新设计的高效节能隔爆电机;YBF是粉尘防爆电机;YBP是隔爆变频电机;YBS是输送机专用防爆电机。 (2)结构 B3为机座带底脚、端盖上无凸缘
[嵌入式]
三相异步电动机铭牌上各个数据的含义<font color='red'>解读</font>
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved