自从MCU(微控制器)导入了DSP(数位讯号处理器)与FPU(Floating Point Unit;浮点运算单元)功能后,MCU可以拓展的应用范围便大幅增加,这几年来,诸多MCU大厂都纷纷导入,使得MCU市场战局变得更加诡谲多变。各家大厂就MCU的产品策略也不尽相同。
关键字:DSP FPU MCU
编辑:刘燚 引用地址:谈DSP、FPU加入后MCU市场战局的变化
然而,尽管应用面大幅增加,但DSP与FPU在功能上要如何区分?彼此的关系是什么?这在ARM推出了Cortex-M4后,这类的议题才开始渐渐被市场所重视。
DSP、FPU不再高不可攀
瑞萨电子营业行销事业部第一营业行销部副理黎柏均表示,其实FPU的导入,还是要考量成本的问题,若不需要,其实采用定点运算的MCU来因应系统需求即可。一般来说,SOC(系统单晶片)才会有所谓的DSP与FPU这类硬体加速器,其主要的功能大多负责影像或是音讯处理的工作,但随着制程的进步,MCU在32位元架构也日趋成熟,所以MCU就开始能沿用SOC的部份功能,并进一步拓展MCU的应用范围。黎柏均更直言,在早期,SOC与MCU之间有不小的价格差距。
不过,黎柏均认为,在现有市场所存在的MCU产品,即便主要供应商都能提供FPU的功能,但事实上,各家大厂的产品之间并没有什么距离,关键最多就是在程式的执行效率上,能否形成差异。在过去,若要由定点运算架构的MCU来处理FPU的工作,会多出不少时间出来,而且也需要大量的记忆体资源,但有了FPU的导入后,其目标程式码就能够缩小,记忆体容量也能减少10%。换言之,若没有时间上的考量,MCU是否要导入FPU,严格来看,并没有太大的差别存在。TI(德州仪器)亚洲区市场开发经理陈俊宏也同意,利用定点运算的MCU来处理FPU要处理的工作,也并非不行,但就是需要耗费大量的记忆体资源与长时间的等待,来取得所要的运算结果,FPU的存在,就是要避免这样的情况出现。
不论是从ARM或是TI,这些大厂对于DSP与FPU的看法,
仍然有一些差异存在,但也因此,让MCU市场形成了多元并陈的景象。
在过去,传统的8位元架构,在资料处理上仍然有其极限存在,陈俊宏指出,传统的定点运算MCU在进行所谓的分数或是小数点计算,因为MCU本身的位元数有限,在面临无法除尽而形成无穷数值(如1/3或是3/7等)的计算上,就必须有所取舍,在位元数有限而采取的有限数值,势必与现实计算上而形成的数值产生一定的误差,这种情形我们称为:截断误差。在这种情况下,若要利用传统MCU的处理器核心来处理分数运算,只会造成截断误差的不断扩大。为了有效处理截断误差不断扩大的问题,便有了FPU的出现。
回顾MCU的发展历程,从传统的8位元架构一路发展至今,已经进入到可以采用FPU与DSP等功能。之所以会有如此的进化,主因来自于从类比端撷取资料后,转换成数位化,将“连续型”资料转为“离散型”资料”以利于处理器进行运算。
陈俊宏谈到,FPU并不能完全解决截断误差不断扩大的现象,精确地说,只能将该现象尽可能地减少。陈俊宏进一步指出,从TI的角度来看,DSP要处理运算种类相当多种,所以需要更多的工具来处理不同需求。
延续陈俊宏的论述,Imagination MIPS业务开发资深经理Ian Anderton也指出,DSP可利用乘法/累加(MAC)指令、饱和、舍入和位元操作来执行多种数学运算 ─ 这些都是快速傅立叶转换(FFT)和有限脉冲响应(FIR)等高效过滤器开发所需的基本功能。DSP同时也能支援并执行多种应用中所使用的8、16和32位元整数与分数资料长度。透过单周期MAC指令、SIMD(单一指令多重资料)和特殊的位元操作,DSP效能还可获得进一步的增强。
FPU与DSP的相辅相成
ST(意法半导体)资深产品行销经理杨正廉则是谈到,针对讯号处理、数值运算与对应到各种应用的演算法,DSP与FPU某程度上,是相辅相成的角色,很难被加以拆分。当然,他也表示,ARM所推出的Cortex-M4核心,也有仅搭载DSP而没有FPU的版本,但若要让客户能发挥更多的创意,那么就架构上就一次到位,也能省去不少不必要的麻烦。
呼应杨正廉的说法,ARM台湾应用工程经理徐达勇指出,从应用面来说,杨正廉的看法并没有问题。当然,FPU与DSP各自也有其定位。徐达勇举例:0.8+0.5=1.3,这种运算工作就是由FPU来负责,但是如果要同时计算:“0.8+0.5=?与1.3+0.9=?”的话,就必须借重DSP的运算功能,所以FPU与DSP的密不可分,的确有其道理。杨正廉表示,广义来看,让MCU具备DSP与FPU功能,主要的目的在于能让MCU的客户群能够享受到DSP与FPU带来的功能与便利性,而过往采用DSP架构的客户群,也能有机会转移到MCU平台。
Ian Anderton也从应用面出发,并以感测器融合(Sensor Fusion)为例,感测器融合是指把多个感测器结合在单一系统中共同运作。它需要高阶的讯号处理功能,才能把讯号从嘈杂的环境中区隔出来。感测器融合可提供即时校正与调整控制,这是一种有限时间(time-limited)的应用,仅能透过利用DSP和FPU的协同处理功能来实现高效、高精密度的计算。此外,包括加速器、陀螺仪、压力/温度/触控等各种感测器,以及其他拥有个别控制/管理演算法的感测器也增加了更多的挑战,必须采用DSP/FPU才能设计出高效的系统。
黎柏均指出,导入FPU的另一个好处在于,可以利用FPU的运算能力,以数位方式进行滤波,以进一步提升SNR值,所以像是工业电表、量测与生理讯号等,都是十分适合的终端应用。黎柏均强调,过去的确在讯号链上,的确有用放大器与滤波器等类比元件来处理杂讯的问题,但这种作法,多少还是会有失真的问题存在,因此采用数位滤波的方式,亦不失为一种作法,此外还有可能可以省去一些不必要的系统成本。
然而,黎柏均也透露,让MCU搭载FPU之后,系统业者为了能提升整体系统的效能或是解析度,在ADC的采用上,可能就会更加大胆,一口气进入16位元甚至是24位元的规格,原因在于这类ADC所面临的杂讯现象会更加严重,透过FPU来处理,不失为一种作法。
FPU仍有局限? TI提供其他硬体加速单元
不过,如同陈俊宏所提到的,如果DSP要处理的工作十分多元,意味着需要更多元的工具来加以因应,单靠FPU这样的硬体加速单元仍有不足之处。
陈俊宏透露,延续TI的C2000架构,TI进一步推出了如TMU与VMU硬体加速单元,前者专职于三角函数运算(偏重马达应用),后者则负责复数运算(对应通讯与软体定义无线电),既有的FPU就负责分数与小数点的运算工作,透过分工合作的方式,来因应客户不同的运算工作需求。他更举例,就算是马达所需要的运算工作,因应不同的马达类型,TI也能给予不同的DSP架构来对应。
架构异曲同工 MCU仍有市场区隔
就Cortex-M4 MCU而言,ST所提供的产品线相当广泛,核心时脉从最低的72MHz到最高的180MHz,中间亦有84MHz、100MHz、168MHz的版本,这些不同核心时脉的产品,自然也对应到不同应用。STMF3(核心时脉为72MHz)系列,就是要因应既有的Cortex-M3的升级而推出的版本,其他如STMF401(核心时脉为84MHz)与STMF411(核心时脉为100MHz),是为了因应穿戴式与高C/P应用为主。而ST的STMF479,其核心时脉高达180MHz,也搭载绘图引擎,专攻人机介面应用。
不过,撇除应用面不谈,英飞凌在尚未导入Cortex-M4前,就已有FPU(浮点运算单元)与DSP(数位讯号处理器)的MCU产品线:TriCore系列。该系列产品线,早在1999年就已经面世。
英飞凌电源管理与多元电子事业处亚太区市场部资深经理黄志鸿表示,当初英飞凌设计TriCode,本身就具备了DSP与FPU的功能,就应用面而言,就聚焦在汽车领域。而谈到先前就引进Cortex-M4的原由,黄志鸿也直言,所锁定的应用就是工业自动化领域,再加上ARM架构在全球市场中,本来就有其普遍性,并进一步取得过去由传统的DSP业者所垄断的市场。Cortex-M4在先天上,本身就具备即时性的特性,像是近期英飞凌所聚焦的工业乙太网路与工业标准SIL3、SIL4等,都十分适合。
所以英飞凌的产品区隔相当明显,拥有FPU与DSP的MCU产品线,延续TriCode架构,进而一脉相承的AURIX,聚焦车用应用,取得ARM授权的Cortex-M4,就扛下工业自动化市场的责任。当然,英飞凌对于Cortex-M4也还有其他的期待,像是数位电源与马达控制领域,英飞凌也开始尝试利用Cortex-M4 MCU打入其应用。他也不讳言,DSP也的确存在相当长的一段时间,产业界有不少工程师对于DSP本来就有相当高的熟悉度,MCU约莫是在三年前左右,才开始导入DSP功能。
而黄志鸿也强调,Cortex-M4还是有其局限性在,像是视讯系统的设计,还是要透过DSP来处理会较为适当。像是高速铁路或是风力发电系统等应用,普遍来看还是传统的DSP业者主导。但如果是电动机车、一般风扇、家电与智慧家庭等,就有FPU功能的MCU的发挥空间。
谈到数位电源,同样也有类似的情况,黄志鸿表示,从功率大小来区分,从500瓦以上的系统设计,如伺服器或是电信设备的AC/DC电源,市场上还是以传统DSP架构为主,但也的确有不少拥有Cortex-M4 MCU的业者对于该市场,有相当高的兴趣。
MCU多元架构并陈 定位仍有不同
徐达勇表示,将DSP与FPU加以整合,无需外挂的好处在于,系统工程师可以用同一套的侦错与编译器等工具,进行系统开发,简单说,简化开发环境对于系统开发而言,可以提升不少效率。在过去,采用DSP设计,会有些设计方法必须动用组合语言的作法才能完成,但是,MCU的开发,最终还是要回归到C语言的撰写。若把DSP导入与MCU一同合作,ARM在作法上,就是统一采用C语言的方式,来统一DSP、FPU的撰写方式,解决了过去组合语言所造成的困扰。然而,陈俊宏也强调,事实上组合语言是更为细腻的程式语法,对于工作执行上能更有效率,TI近年来也不断努力,让C语言与组合语言两者之间的差异缩小,以让使用者能有更多的选择。
徐达勇也同意,目前MCU市场除了ARM架构外,的确也存在其他不同的架构,让DSP与FPU形成多元共存的局面。他也坦言,在架构上,各家其实并没有太大的差异,唯一能形成区别的,大概就是在效能与开发工具能分出高低而已。
而近年来,如英飞凌与瑞萨科技等,先后导入Cortex-M4核心,也使得MCU战场显得更诡谲多变。徐达勇强调,近年来产业界不断地在谈物联网,这意味着需要用更为开放的架构来因应物联网的设计需求,而这必须透过完整的生态系统才能作到,毕竟可能还会有第三方演算法设计或是设计工具业者,能够提供比MCU业者更具竞争力的开发工具也不一定,此时就会让客户有了更多不同的选择。他不讳言,有些较为封闭特性的应用,或许采用其他架构的MCU来进行设计,也许就能满足客户的需求。
上一篇:氮化镓“钱”景可期 TI芯片样本抢先推出
下一篇:美军投巨资研制光子芯片 将成战争“最强大脑”
推荐阅读最新更新时间:2023-10-12 23:37
36-基于51单片机的LED彩灯控制器设计
具体实现功能 具体功能: (1)至少10个发光管4种花样自动变换,循环往复; (2)彩灯花样变换的快慢节拍可以手动和自动方式控制,手动控制按钮按一次转换一次;自动控制方式每15秒变换一次,1分钟循环一遍; (3)系统复位清零开关。 单片机介绍 51单片是一种低功耗、高性能CMOS8位微控制器,具有 8K 在系统可编程Flash 存储器。在单芯片上,拥有灵巧的8 位CPU 和在系统可编程Flash,使得STC89C51为众多嵌入式控制应用系统提供高灵活、超有效的解决方案。具有以下标准功能:8k字节Flash,512字节RAM,32 位I/O 口线,看门狗定时器,内置4KB EEPROM,MAX810复位电路,三个16
[单片机]
STC单片机之PCA/PWM
2路PCA的捕获、高速输出、16bit定时器、PWM模块
PCA.c
* 文 件 名:PCA.c
* 芯 片:STC12C5A60S2
* 晶 振:12MHz
* 创 建 者:冷月
* 创建日期:2010.8.18
* 修 改 者:
* 修改日期:2010.9.3 修改设置波特率参数为x%,增加定时器0作为PCA时钟源
* 功能描述:2路PCA的捕获、高速输出、16bit定时器、PWM实现
*/
#include STC12C5A.H
#include PCA.h
#define uchar unsigned char
[单片机]
基于单片机的遥控探照灯系统实现
在舞台上,有时为了营造某种特殊效果,需要关闭除探照灯以外的所有现场灯。探照灯必须照在演员身上。由于探照灯高高悬挂在天花板上,当演员移动时,依靠人工来完成探照灯方向调节非常不方便,而通过遥控调节则很方便,有时演员的位置又是固定的,这可能需要多台探照灯透视照射一个固定位置(例如舞台的中央)。如果探照灯能够将这些位置以及灯的亮度预存到某个频道,需要时再直接调则会方便很多。
针对此应用,本文设计了一种支持频道存储的遥控探照灯系统来实现上述功能。该系统还可应用在监狱、各种高空作业和旷野、海面等工作场所,对远距离巡查、追踪、搜索、拯救和作业施工进行全方位、多角度照明。
因为照射点的位置不定,要求探照灯可以上下左右
[单片机]
一种新型低功耗低成本检测单相接地系统
摘要:低成本低功耗测试单相接地系统主要是根据目前10kV输电线路的单相接地研究的成果,利用单片机的低成本低功耗优势,开发出来的判断线路是否发生单相接地的系统。本文主要论述该系统的合理性和可推广性,阐述了该系统的开发理论依据以及软硬件的处理方案。 关键词:单相接地;单片机;低功耗;低成本 0 引言 目前全国普遍在变电所采用小电流接地选线装置,现有的小电流接地选线装置的传感环节仅仅是零序电流,选线的特征量很小,测量数值不稳定,所选用的处理器为DSP,硬件成本高、功耗大。本系统分布在各条线路上,以各条线路上的零序电流作为启动值,再通过测量各条线路上的零序功率方向,进行单相接地保护,选用低成本低功耗单片机作为主处理单元,较好地完成
[电源管理]
IEEE1394视频视觉系统中DSP软硬件设计
介绍了用数字信号处理器实现视频流控制处理功能的软硬件设计方案。重点论述了如何设计DSP的软件及外围硬件,完成IEEE1394设备自标识及数据传输的详细过程。同时还提出了一种用于运动目标检测的变加权背景恢复算法及其DSP实现方案。这种用DSP实现数字视觉算法的成功尝试,对于实现其他视觉功能具有一定的借鉴意义。
本文介绍了一种以DSP为核心、基于IEEE1394总线的图像实时采集处理系统的软硬件设计。此外还提出了一种易于用DSP实现且存储器资源占用率小的运动目标检测算法。据了解,目前国内外大多数的计算机视觉研究都是用计算机软件处理实现的,因此在实时性和成本方面受计算机平台的制约。本文讨论了一种计算机视觉系统的硬件平台设计
[嵌入式]
基于AT89C51单片机的贪吃蛇电子游戏
该项目设计硬件平台选择了简单易用的AT89C51单片机,显示屏选择的是AMPIRE128X64液晶屏幕显示器,按照一定顺序连接后,如下图: 软件方面采用了C51编写代码,代码编写模块如下图: 除去网上已有的图形驱动代码外,其核心代码主要为游戏处理、信息处理和按键处理。 编写游戏的功能代码,先定义游戏的数据结构和常量。 #define uchar unsigned char #define uint unsigned int sbit P00 = P0 ^ 0; // 右 sbit P01 = P0 ^ 1; // 左 sbit P02 = P0 ^ 2;
[单片机]
汽车无钥门禁系统单片机实现方案
引言:
在当今社会,汽车特别是私人汽车的使用已经非常的普及。汽车门禁系统在保护汽车个人财产安全、展示用户个性及所有权方面起着至关重要的地位。当今,汽车工业引进的RF RKE门禁系统,大大改善车主开门的便利程度,即使在天黑或冬天寒冷的天气条件下,用户也可以方便的打开车门。
但是另一方面,RF RKE门禁系统同时也有很大的不足之处。在原装钥匙或PEG钥匙卡缺失的情况下,车主将面临窘境。如果PEG钥匙卡丢失,车主的财产安全更是面临威胁。
本方案就是在这样的现实背景下,试图通过单片机实现一种新的方式的门禁系统,以克服上面所述RF RKE门禁系统的天然缺陷。
系统框图:
系统框架如下图所示:
1. GPRS无线
[嵌入式]
Credo推出业界首款单片集成CMOS VCSEL驱动器的800G光DSP芯片
针对AOC及短距(SR)光模块优化的新型Credo DSP,适用于下一代超大规模数据中心/AI应用 加州圣何塞和中国深圳,2023年9月6日—— Credo Technology(纳斯达克股票代码:CRDO)今日发布两款新品:集成VCSEL驱动的 Dove 800D及Dove 410D PAM4 光DSP芯片 。该两款芯片可加速客户产品的上市进度,为解决超大数据中心、AI后端集群以及通用计算网络日益增长的带宽需求而设计。Dove 800D (8x100G)及Dove 410D(4x100G)使用了Credo第四代DSP技术,是经过优化的、高性能、体积小巧的产品,可以满足超级数据中心日益严格的能耗要求。Dove 800D和
[嵌入式]
小广播
热门活动
换一批
更多
最新半导体设计/制造文章
- 英特尔中国正式发布2023-2024企业社会责任报告
- 贸泽电子与Analog Devices联手推出新电子书
- AMD 推出第二代 Versal Premium 系列:FPGA 行业首发支持 CXL 3.1 和 PCIe Gen 6
- SEMI:2024Q3 全球硅晶圆出货面积同比增长 6.8%、环比增长 5.9%
- 台积电5nm和3nm供应达到"100%利用率" 显示其对市场的主导地位
- LG Display 成功开发出全球首款可扩展 50% 的可拉伸显示屏
- 英飞凌2024财年第四季度营收和利润均有增长; 2025财年市场疲软,预期有所降低
- 光刻胶巨头 JSR 韩国 EUV 用 MOR 光刻胶生产基地开建,预计 2026 年投产
- Imagination DXS GPU 已获得ASIL-B官方认证
更多精选电路图
更多热门文章
更多每日新闻
更多往期活动
11月13日历史上的今天
厂商技术中心