现实标准和32位MCU-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

当为下一代控制应用选择32位MCU时，必须考虑一点，就是面对某一实际的应用，不同供应商的处理器虽然在数据手册上看起来或多或少有些相似，但实际上是非常不同的。虽然数据手册中的规范和Dhrystone（处理器整型数计算能力）MIPS处理能力给出了一个粗略的评估标准，但必须考虑得更深入以保证MCU有足够的吞吐量和过载余量来满足当前和未来的应用需求。

运行编译EEMBC汽车标准代码的测试结果显示：看起来类似的三款MCU实际性能差别很大

例如，价格低廉、基于ARM的MCU一般具有很多资源，虽然它们中的许多是基于相同的CPU核，通常是没有高速缓存的ARM7TDMI处理器，但不同供应商的产品整体性能差别非常大。这主要是由于实现片上存储子系统、片上总线结构和I/O功能所采用的方法不同。因此，为了确定哪一款处理器最有价值，就必须考察整个处理器子系统。

　　实时嵌入式应用

当在实时嵌入式应用中使用MCU时，MCU必须对所有操作做出确定性的响应，以保证任务在被分配的时间内完成，响应延迟对于实时系统来说也必须很短。为了达到这个目标，MCU必须具有有效的硬件中断管理子系统，用于处理优先权、向量和返回机制。此外，存储子系统不应该成为处理器的制约，它应该能够及时的向处理器提供指令和数据，以实现在指令执行流中插入最少的等待状态。

处理器也应该有一个有效的上下文切换机制，来保证当中断改变指令流时损失的时间最短。内部系统总线应该有确定的响应时间，用于支持对时间要求严格的操作。

基于ARM的众多MCU提供了针对不同系统解决方案的广泛选择，这些方案的区别在于时钟速率、集成外设、高容量闪存和静态RAM等。由于内部存储子系统和系统总线效率，以及CPU对片上设备操作处理程度的差别，即使在相同时钟频率下，MCU的性能也存在着极大的差别。影响性能的一个关键问题就是片上闪存的访问时间过长。

　　现实标准

为了更好地评估处理器的性能，一些现实标准已经开发出来了，例如由EEMBC（嵌入式微处理器基准联盟），一个独立的非营利组织正在开发的标准，可以对各种外部看起来相似的MCU之间的差别进行更深入的分析。

EEMBC在开发其评估标准套件时也面临了巨大的挑战。首先面对的就是开发测试软件，它用于产生在一个应用中能够代表实际性能的结果。这就表示要抛弃Dhrystone MIPS这一普遍采用的方法，该方法支持创建针对应用的测试，用于测试在汽车、网络、电信、娱乐，以及其他嵌入式系统中处理器的工作。第二个挑战就是起草标准，它需能够非常容易地移植到使用不同处理器的各种开发板中，并且在这些开发板中都能够正常地运行，以评估每个MCU或MPU的性能。

逐个比较的理想基础是每个MCU周围的硬件环境都尽可能地一致，并使用同样的编译器。最近，采用EEMBC系列汽车/工业标准，在同样的条件下测试ARM MCU的比例正在上升。

三款MCU进行测试的结果数据显示其吞吐率存在极大的差别，如图所示。在比较过程中，结果数据根据它们的工作频率进行了归一化处理，并且所有的软件都是在片外闪存中运行的。比较的结果表明：基于ARM的MCU普遍具有很好的性能，部分的性能差别在于MCU中实现片上闪存接口的优化方法不同。

　　改善CPU指令执行的吞吐量

由于闪存的访问时间通常是CPU时钟周期的3～4倍，找到一种从存储器中快速传输数据，而不需要在昂贵的片内RAM中映射数据的方法，会极大地改善执行的吞吐量。对于测试结果中最快的那颗MCU，设计者通过展宽存储器数据总线到128位，以允许4个32位字在一个周期中被传输到数据锁存器，然后再传输到预取缓冲，从而解决了速度不匹配的问题。

由于CPU使用缓冲中的数据，当它执行第4个字时，另一个128位的字就被传输到了锁存器中，而同时该第4个字被移出了缓冲，锁存器中的新字也被传输到了缓冲。只要发起一个对闪存的数据读访问（装入操作），辅助的支持电路就建立一个数据通路将128位数据存储在缓冲中。这允许代码获取的历史被保留，从而避免了需要重新获取4个指令字的情况。

如果一个存储器阵列（bank）可以在存储器访问中极大地提高速率，那么设置两个存储器阵列会怎样呢？通过采用锁存器将存储器分成两个阵列的结构，对于每个阵列所有的支持逻辑都相同，并可以具有两倍的指令历史，短循环就可以在所有的锁存器中被完整捕获，循环的执行得以加速。另外一点，双阵列也可以对嵌套循环和寻找分支目标地址提供更好的支持。

　　内部总线支持

正如EEMBC的标准测试所揭示的那样，CPU吞吐量只是衡量高性能的指标之一。对集成外设功能提供支持的MCU内部总线也可能有很大的不同。内部总线通常被连接到总线上的慢速设备所拖累，因此，更高速设备的数据传输就受到了限制。然而，通过采用总线分离的方法，将高速设备（例如10/100Mb/s以太网控制器或高速DMA控制器）连接到一段总线，而将低速设备（串行端口、定时器、脉宽调制器等）连接到另一段总线，就可以使每组设备发挥最好的性能。

通过在芯片内建立分层的总线，CPU可以具有对片上RAM和闪存进行无约束访问的局部总线。这就避免了CPU发出不必要的总线仲裁、总线批准延迟，以及总线等待状态等，从而改善了整体性能。

对于要求高性能的功能，如向量式中断控制器、以太网控制器、DMA控制器等，ARM高速总线（AHB）提供了对CPU的快速接口。慢速设备可以连接到ARM设备总线（APB）上，而且可以桥接到AHB，以使数据和指令从CPU和存储器不被影响地传输到低速总线。

当CPU增加更多的片上资源时，对这种分层总线结构的需求就更高。在许多实时控制应用中，采用单一总线拓扑结构的处理器无法获得有效的高性能I/O支持。

大量的集成外设也增加了CPU的工作量，CPU必须持续处理中断和响应所有的外设操作。通过使用高性能、向量式中断控制器，许多过量的操作会得到卸载，从而缩短了CPU的响应时间。EEMBC正在探索一种通用的方法，测试MCU的集成外设并开发检测处理器运行情况的标准。

关键字：处理器计算缓存引用地址：现实标准和32位MCU

上一篇：基于Windows CE的物流车载终端设计
下一篇：自动跟踪太阳光伏发电设备控制器的设计

推荐阅读最新更新时间：2024-03-30 21:23

骁龙810处理器三星Note 4 LTE-A发布

三星于今年9月初正式发布了Galaxy Note 4这款新机，该机的国行版本搭载了骁龙805处理器。而日前三星在韩国地区正式发布了Note 4的高配版本Galaxy Note 4 LTE-A。三星Galaxy Note 4 LTE-A发布　　Note 4 LTE-A与Note 4相比，处理器由骁龙805升级为64位的骁龙810八核处理器，成为三星首款搭载骁龙810处理器的手机产品。除此之外，Note 4 LTE-A还是全球首款支持商用LTE-Advanced三频载波聚合技术的智能手机。　　三频LTE-A峰值理论下载速度能够达到300Mbps，4倍于目前4G LTE网络。消息称，Galaxy Note 4 LT

[手机便携]

2017 TI汽车应用处理器系统方案展示会顺利举行

北京2017年4月21日电 /美通社/ -- 德州仪器（TI）（NASDAQ: TXN）2017汽车应用处理器系统方案展示会日前正式在上海落下帷幕。在上海、重庆、北京、长春、惠州、广州及深圳等七个城市的巡回展示中，TI凭借来自2017国际消费电子产品展（CES）中最新的汽车电子解决方案，为参展者呈现了一场汽车娱乐导航，数字化仪表和先进辅助驾驶系统解决方案的视觉盛宴。此外，德州仪器中国区嵌入式产品系统与应用总监蒋宏也亲临会场，与参会者们一同介绍了TI在汽车领域的创新产品和领先技术解决方案，并针对汽车电子的未来发展进行了深入的交流与讨论。汽车信息娱乐系统（Infotainment）和高级驾驶员辅助系统（ADAS）的蓬勃发展

[汽车电子]

聚焦人工智能、机器视觉和边缘计算，安富利将重磅亮相中国国际工业博览会

2023年9月14日，中国上海—— 全球领先的技术分销商和解决方案提供商安富利将于9月19日至23日在第二十三届中国国际工业博览会（以下简称“工博会”）上重磅亮相，集中展示安富利及其生态合作伙伴在人工智能、机器视觉和边缘计算等多个领域的创新技术、产品和解决方案，全面赋能智慧交通、智慧城市、智能制造、智慧能源以及智能零售等工业级应用。安富利在人工智能、机器视觉和边缘计算领域深耕多年、拥有完整的布局，能够面向未来智能社会为本土客户提供涵盖设计链、供应链及贯穿产品全生命周期的一站式服务，助力本土企业加速创新，实现技术的变革。安富利亚洲销售及供应商管理副总裁钟侨海先生表示：“人工智能、机器视觉和边缘计算是科技创新的热点，该领域蓬勃

[工业控制]

美研究者在微处理器中融入光子元件

新华社旧金山１月１日电美国研究人员日前首次在微处理器集成电路芯片内融入光子元件，为创制高速低功耗计算机处理器探索途经。　　这一处理器采用简化指令组计算机（ＲＩＳＣ－Ｖ）架构，包含超过７０００万个晶体管和８５０个光子元件，而且是在一座现有芯片工厂内制作，显示出相关工艺与现有生产程序可以兼容。　　这项研究由加利福尼亚大学伯克利分校、麻省理工学院和科罗拉多大学博尔德分校的研究人员合作实施。项目专家介绍说，上述微处理器芯片呈长方形，各边尺寸分别为３毫米和６毫米，其中光子元件充当输入／输出端口。　　“这是一个里程碑，”加利福尼亚大学伯克利分校电气工程和计算机系副教授弗拉迪米尔·斯托亚诺维奇说，因为“这是第一个用光线实

[手机便携]

苹果推出8微处理器的电脑最低售价3.2万

4月6日，据外电报道，苹果公司(Apple Inc.)已开始销售配置有8个微处理器的电脑。苹果网站信息显示，该公司已推出安装有两个英特尔(Intel)四核Xeon芯片的Mac Pro电脑，该系列产品内配置的微处理器数量由此增至8个。而苹果公司其他电脑型号则继续配置两个双核Xeon芯片，每个芯片包含有两个微处理器。苹果公司发言人林恩.福克斯(Lynn Fox)称，这种8核电脑产品应会有效支持三维(3D)建模等任务，对程序设计的支持力度更大。该网站称，Mac Pro用户在升级到两个四核芯片配置时，需要在原价（起价为2,499美元）基础上增加支出1,498美元。这也就意味着，最便宜的八核Mac Pro电脑的售价是3,997

[焦点新闻]

下一代网络设备核心单元——网络处理器应用研究

摘要：网络处理器的设计、应用被认为是推动下一代网络向高性能、灵活性方向发展的核心技术。本文从网络设备研制角度，对网络协议处理基本操作、网络处理器产生技术需求、基本功能、体系结构特点、产品现状、应用前景、未来发展进行研究。关键词：网络处理器体系结构网络设备数据分组网络协议网络高速发展，对下一代网络设备提出以下要求：具有优异性能，支持高速分组处理；具有高度灵活性，支持不断变换高层网络服务。传统的基于ＧＰＰ（ＧｅｎｅｒａｌＰｕｒｐｏｓｅＰｒｏｃｅｓｓｏｒ）的网络设备只满足灵活性要求；基于ＡＳＩＣ(ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ)的网络设备只满足高性能要求；网络处理器能够

[网络通信]

电源设计中不计算95%的参数也可以？

　　一位真正的电源工程师要设计出一款优质电源，需要具备哪些基本功力？一个真正的电源工程师是如何工作的呢？把电源板看成一个统一体，然后用所需用常用电路相拼，这样就能得出一款好的产品吗？对于新产品，要用什么样的电路才有把握？　　电源用通常理解的话说：是一种可以为电子电器提供合适电压，电流，波形与频率的转换装置!比如：直流电源，可以理解为频率为零，波形为直线的电源。交流电源，可以理解为电压交替变换(正负在两电极间转换)，有频率，波形的电源！不管哪一种电源，都可以用微分积分数学把它在任一点时间内的值求解，且有唯一解，比如：方波，是有无数量级的正弦波组成，因此，方波可以分解为奇次谐波与牛次谐波，我们一般取值3次谐波就可以满足要求

[电源管理]

凌华科技发布高性价比的3U与6U单板计算机

　　为适应市场对于双独立显示功能与图像性能需求逐渐攀升的趋势，凌华科技发布最新3U与6U CompactPCI®单板计算机新品cPCI-3965及cPCI-6965，这两款产品同时具备双核计算能力、3D图像显示与VGA/DVI端口双独立显示功能，为工厂自动化、交通运输设施与医疗设备整合商提供具高性价比的极佳选择。　　凌华科技cPCI-3965与cPCI-6965搭载移动技术英特尔GME965高速芯片组、低功耗的英特尔Core™2 Duo 2.2GHz处理器与最高容量达4GB的高带宽双通道DDR2-667内存。在图像性能表现上，较前一代的945GME芯片组高出1.5倍，RGB分辨率最高达2048x1536像素。cPCI-396

[嵌入式]

热门资源推荐
热门放大器推荐

小广播

添点儿料...

无论热点新闻、行业分析、技术干货……

发布文章

热门活动

换一批

■2024 瑞萨电子MCU/MPU工业技术研讨会——深圳、上海站，火热报名中

■罗姆有奖直播 | 重点解析双极型晶体管的实用选型方法和使用方法

■STM32N6终于要发布了，ST首款带有NPU的MCU到底怎么样，欢迎小伙们来STM32全球线上峰会寻找答案！

■免费下载 | 安森美电动汽车充电白皮书，看碳化硅如何缓解“里程焦虑”！