具有硬件矢量浮点运算单元的MCU在医疗电子中的应用

发布者:岭南布衣最新更新时间:2014-10-27 来源: 21ic关键字:浮点运算  MCU  医疗电子  ARM926EJ-S  LPC3000 手机看文章 扫描二维码
随时随地手机看文章

微控制器是将微型计算机的主要部分集成在一个芯片上的单芯片微型计算机。微控制器诞生于20世纪70年代中期,经过20多年的发展,其成本越来越低,而性能越来越强大,这使其应用已经无处不在,遍及各个领域。例如电机控制、条码阅读器/扫描器、消费类电子、游戏设备、电话、HVAC、楼宇安全与门禁控制、工业控制与自动化和白色家电(洗衣机、微波炉)等。

现今的嵌入式工业及汽车系统中,有许多是基于8位或16位微控制器架构来设计的。随着新的低功耗32位架构的面市,这些应用有可能获得更高的性能、准确度和功效。此外,处理能力的提高也有助于实现新产品的差异性功能,包括先进的控制算法,GUI显示器、语音控制,以及电容式触摸感测等下一代接口。8 bit/16 bit微控制器通常需要消耗很多计算资源来做这些工作。今天,内置浮点运算的强大微控制器开始出现,32 bit微控制器有足够的能力来实现其中的许多功能。

评估微控制器的性能

相比于专业的DSP处理器,微控制器用于信号处理具有如下优势:

(1)有效的循环控制;(2)丰富的外设;(3)单一的处理器结构、指令集和开发工具链;(4)统一的中断和任务切换环境,同类存储器;(5)同样的操作系统同时管理控制和信号处理任务,基于MMU;(6)由于大大地简化了开发过程,所以上市时间较短;(7)流行的微控制器容易获得,开发工具成本低。

如何评估微控制器的性能是否满足应用需求,是工程师在项目设计的早期阶段需要考虑的问题。评价和汇总来自数据手册的信息是一种有效方法,另一种方法是使用某一类型的评估板来进行特定性能测试和功耗测试的方法。这两类方法都有各自的缺点。

32位与8/16位系统的效率差异相当大,在16位处理器上,一次普通的32位乘/累加操作需要4次乘法与4次加法运算。由于需要访问存储器以存储中间结果或释放多个寄存器,执行效率会进一步降低,并可能减慢其他操作的速度。因此,在16处理器上,一次32位乘法可能需要20~40个周期。而32位UC3C处理器只需要单个周期即可。此外,32位管线较宽,故从存储器检索数据及指令的速度更快。

在评估过程中,使用了三个步骤:(1)通过运行各种系统测试基准,并改变不同的系统参数,抽象出系统特征;(2)解释收集的特征数据来确立系统的行为;(3)通过系统的行为决定怎样设定控制参数,从而使系统表现达到预想的效果。

特征化

从理论上来说,性能测试是对运作系统式样的质化或量化评估。在实际应用中,系统的式样可能不够详细,不足以定义完整的质量测试,创建测试也许太昂贵,不能保证其开发。一个比较好的得到系统特征的折衷方法是,使用测试基准作为一个或一系列以软件执行的测试,提供量化的数据,这些数据可以用来比较不同系统的特性。

为得到微控制器的特性,从EEMBC的Auto-Bench组选择一套性能测试基准。这些基准帮助预测微控制器在汽车电子,工业和一般应用中的性能。运行每一个基准测试都通过多次反复循环以消除一些启动代码在每次测试开始时只运行一次的影响。使用这一工业标准基准组件的一个优势就是可以将结果数据与其他类似架构微控制器的测试数据进行比较,以评判总体系统性能。

这里所测试的微控制器是基于ARM926EJ-S内核,带硬件矢量浮点协处理器和一个32 KB的指令缓存(I-cache)。该测试衡量浮点协处理器和指令缓存的性能。在微控制器不同的工作频率时运行Auto-Bench测试基准,使用Energy-Bench测量每一基准执行中消耗的能量。Energy-Bench是另一个EEMBC工具,可以测量基准负载运行时处理器消耗的能量。从Energy-Bench收集的数据可以观察到微控制器在各种不同负载下的能量效率。选择了这些工具来评估微控制器,下一步就是确定微控制器在不同运行条件下的性能。

性能分析

为了分析微控制器的性能,需要决定在不同条件下的整体系统响应。在测试项目中,需要评估恩智浦微控制器上浮点协处理器和指令缓存的性能。

运行Auto-bench基准测试组,改变4个参数:运行频率、CPU核的电压、指令缓存的状态和浮点协处理器的状态。

Auto-Bench/Energy-Bench测试环境系统由三部分组成:数据获取系统(DAC)、软件开发环境和测试目标。美国国家仪器公司的DAC连接到PC机上,PC机运行Energy-Bench这一功耗和能耗测试软件。软件测试环境使用KeilTM集成开发工具来编译,下载和运行Auto-Bench测试基准。把供给微处理器的三个电源电压隔离开,Energy-Bench可以测量Auto-Bench基准测试中消耗的能量,并计算在每一测试中消耗的总能量。

在4种不同的频率下运行Auto-Bench(13 MHz、52 MHz、104 MHz和208 MHz),并组合其他测试条件,包括打开或关闭浮点协处理器,打开或关闭指令缓存。浮点协处理器默认为不使能的,使得编译器对任何需要浮点运算的情况使用软件浮点。

实际收集到的数据远比本文中所能呈现的多,这里只介绍两个有代表性的案例以表现收集的特征数据怎样决定系统的性能。图1以图形方式表示了EEMBC的有限脉冲响应滤波(FIR)的测试数据结果。在13 MHz运行两个不同的基准测试,在0.9 V~1.2 V之间改变CPU核的电压。当测试基准运行在CPU时钟设置为208 MHz时,AHB的时钟设置为其极限104 MHz.在所有其他测试频率中,CPU时钟和AHB时钟是相同的。

图1EEMBC的有限脉冲响应滤波(FIR)测试数据结果

浮点运算就是实数运算,因为计算机只能存储整数,所以实数都是约数,这样浮点运算是很慢的而且会有误差。现在大多数机器都是32位的,也就是说32位都用来表示整数的话,那么对于无符号整数就是0 到 2^32-1,对于有符号的话就是-2^31 到 2^31-1.

首先来看指令缓存的性能,观察图1标示着循环次数/s的图。数据表明,在所有频率下,当指令缓存使能时,微控制器的绝对性能都更好。第二,当CPU时钟频率增加时,即使指令缓存提供了更好的绝对性能,其提高的相对幅度不是线性的。通过观察标示着循环次数/s/MHz的图,读者可以验证这一特性。图2表明,对于几乎所有的CPU时钟频率性能都线性增加大约100次/s/MHz,而除了运行在208 MHz时,根据指令缓存使能与否,性能降至60或80次/s/MHz。

很明显,当指令缓存使能时,系统运行更快。因为当CPU从指令缓存执行指令时,对AHB RAM进行读写的次数减少。

非线性性能特征是由于AHB时钟具有最高104 MHz的上限的结果。当AHB时钟慢于CPU时钟时,CPU必须等待较长的时间以从AHB总线的RAM上读取指令,其结果是每MHz相对性能的增加较小。

下面分析一下指令缓存对能耗的影响。如果只考虑图2中功率(Power)的绝对功耗,也许会得出关闭指令缓存可以节省整个系统能量的结论。然而,Energy-Bench数据表明,当指令缓存被使能时,每一个基准循环消耗的能量实际上是低于指令缓存被关闭时的。

更详细地对能量(Energy)图进行观察表明,当指令缓存使能,在208 MHz,1.2 V时每个循环消耗的能量甚至低于其他运行频率。实际上,有10%~12%的提高。换句话说,在使能指令缓存的情况下执行同样的基准,高速(208 MHz)运行较短的一段时间比低速(52 MHz或104 MHz)运行较长时间具有更好的能量效率。

从循环次数/s的图可以看到使用浮点协处理器的运行效率和能耗。这张图相当生动地表明了集成的浮点协处理器的性能效果。在频率为208 MHz时,使能指令缓存,使用软件浮点运算,微控制器运行在大约8 500次/s;而使用浮点协处理器,这一值越至超过32 500次/s,性能提高超过280 %.

检验浮点协处理器的能耗效果参见图3中的能量图。当指令缓存使能、使用软件浮点运算时,每个基准负载在208 MHz的能量表明微控制器消耗每次循环大约16 J; 而使用浮点协处理器时,这一值小于4 J/循环-节省超过75%的能量,而工作量是相同的。

图1循环次数/s图表明,在频率为13 MHz、供电电压为0.9 V和1.2 V时,性能基准数据是相等的。

然而,功率图表示,在1.2 V时的功耗比0.9 V时的功耗要高大约75%.

系统控制参数

在测试例子中,使用的EEMBC特性工具决定目标测试系统中指令缓存和浮点协处理器的性能。根据这一性能,可以选择通用的配置参数,以提供具有低能耗的系统性能的最好条件。

下面是一些参数选择,在类似那些EEMBC Auto-Bench基准测试组的环境下,可以控制系统的功率利用率和性能:

(1)使能指令缓存能使性能更好;

(2)使用硬件浮点协处理器比软件浮点的运算性能明显提高且能耗明显降低;

(3)在208 MHz时,指令缓存使能,其能耗比低频率时要好;

(4)对于13 MHz低功耗运行,内核电压在0.9 V时比1.2 V时要好得多。

除以上这些总体概要外,更重要的事实是,根据工业标准的性能和能量基准测试得到的数据,确定了系统的性能。而这些基准可以公开得到,并可得到独立权威的验证。

使用EEMBC Auto-Bench基准和Energy-Bench基准,可以得到一致的性能分析,很容易演示给其他人。而且,可以被重复、验证。

设计嵌入式系统通常是一项很有挑战性的任务,几乎每一个嵌入式系统都有相对唯一的硬件配置。对于特定的嵌入式操作系统,经常需要重写特定的代码。对此通常还有非常严格的能耗限制。本文给出了量化的科学测试方法以帮助嵌入式工程师考虑如何选择适合于特定应用的控制器来构建系统。即使所测试的嵌入式系统差异很大,确凿的数据仍可以帮助系统评估者比较相同的性能特征。

在本文的测试设置中,使用了EEMBC的特性工具来决定恩智浦微控制器的性能。然后使用这些性能信息为特定的运行环境选择最好的控制参数。该测试例程量化了评估系统中使用微控制器的指令缓存和浮点协处理器的系统性能。收集到的特征数据方便定义系统行为,并提供一种方法学来选择运行参数以控制系统性能和能量消耗。

测试结果表明,硬件向量浮点运算单元的使用可以使系统性能提高5倍左右,并可减少代码量,降低功耗。

硬件浮点协处理器VFP9是NXP基于ARM926EJ-S内核的LPC3000系列的特征,NXP低功耗的90 nm工艺技术可以以非常小的芯片面积和极小的功耗实现这一功能,使得LPC3000 ARM9微控制器非常适合需要进行信号处理的医疗电子等行业应用。

关键字:浮点运算  MCU  医疗电子  ARM926EJ-S  LPC3000 引用地址:具有硬件矢量浮点运算单元的MCU在医疗电子中的应用

上一篇:基于ARM7处理器uC/OS系统的Nos-Wlan移植
下一篇:一种基于WinCE6.0的数字调频收音机的设计

推荐阅读最新更新时间:2024-03-16 13:44

单片机实现分时计费智能电度表
  引言   分时计费智能电度表正是适应分时计费用电制度的一种新颖的单片机化智能电能计量产品。它既保留了原有三相/单相 电度表 的主要功能,又增加了分时计算用电量和电费的功能。该方法对于解决用电负荷量不平衡问题,充分发挥现有的发电能力,可以起到相当重要的作用。   1 智能分时计费电度表的结构原理   本智能电度表在保持现行三相/单相电度表作为电量计量标准的基础上,仅仅通过在表盘上打一个很小的光电检测孔,从而使表盘每转一圈都给出一个脉冲信号,然后经过放大和整形后,将此脉冲信号作为单片机外部计数脉冲的输入信号。   一般情况下,该智能分时计费电度表可以由两部分组成。第一部分是原有的三相/单相电度表,该部分仍可单独作为电量
[单片机]
学习单片机的日记
经历了大一上学期我觉得大学其实好坏不在于学校而是在于个人,学校之间的差距只是在于可利用的教学资源以及环境,最重要的还是自己。个人觉得我大一要学的课程真正有用的不多,现在我是电子信息工程的一名大学生,大一所学课程有高数,大学物理,英语,体育,近代史,思修,大学物理实验,电路分析,C语言。呵呵,只有C语言,电路,高数,英语有用。其他科目我只是应付下考试,不会真心去学,因为没有兴趣。兴趣是最好的老师,没有它我觉得做什么事情都毫无意义,这就是我这个人的怪癖。利用所有闲下来的时间我准备学习单片机,单片机虽然是大二下学期的内容但我觉得它至关重要。 为什么我们要学习单片机呢?他是个什么东西呢?单片机就是一块集成芯片,但这块集成芯片具有一些
[单片机]
学习<font color='red'>单片机</font>的日记
Proteus仿真单片机:PIC18单片机的仿真
Windows 10 20H2 Proteus 8 Frofessional v8.9 SP2 MPLAB X IDE v5.45 新建工程 Proteus 下一步 下一步 选择芯片、编译器 搭建实验电路 MPLAB X IDE MPLAB X IDE 新建工程 选择独有项目 选择芯片 选择编译器 配置工程名称、路径和编码 添加main.c文件 编译测试程序 #include xc.h void main(void) { TRISD &= ~0x01; while(1) { _delay(1000); PORTD &= ~0x01; _
[单片机]
Proteus仿真<font color='red'>单片机</font>:PIC18<font color='red'>单片机</font>的仿真
单片机中的结构体运用
结构体: 在单片机开发中,经常会遇到要初始化一个外设,比如串口,它的初始化状态是由几个属性来决定的,比如串口号,波特率,极性及模式。对于这种情况,在我们没有学习结构体时,我们一般的方法是: void USART_Init( u8 usartx , u32 BandRate , u8 parity , u8 mode ); 这种方式是有效的同时在一定场合是可取的。但是试想,如果有一天,我们希望往这个函数里再传入一个参数,那么势必我们需要修改这个函数的定义,重新加入字长这个入口参数。于是我们的定义被修改为: void USART_Init( u8 usartx , u32 BandRate , u8 parity
[单片机]
基于单片机的直流电机PWM调速设计
电机pwm调速程序 /**************************************************** ========= 直流电机控制+速度显示 ========== ****************************************************/ #include reg52.h //头文件 #define uchar unsigned char //宏定义 #define uint unsigned int #define CYCLE 10 //定义PWM的周期T为10ms
[单片机]
基于<font color='red'>单片机</font>的直流电机PWM调速设计
便携式医疗装置纳米机器人研究浅析
纳米机器人的定义 纳米生物机器人急救系统是一种以纳米、微米尺寸的生物机器人为核心构建的便携式医疗装置,它由数种细胞机器人、病毒机器人、机电式微机器人以及微型聚变反应堆、大容量步兵用电池,核心计算机、变频半导体激光器阵列组成。 各个子系统的功能分别为:生物机器人获取伤患处信息、计算机控制生物机器人协调行动、微型聚变堆和电池提供能量消耗、半导体激光器阵列远距离提供能量。 系统的核心是纳米、微米级生物机器人。类比救护伤员的步骤,当医护兵确认是友军的紧急求救信息时,计算机会自动将生物机器人向友军源源不断地发射。生物机器人群到达伤口后: ·第一步是凝胶型生物机器人进入断裂的血管和流出组织液的地方,启动凝胶反应止血。 ·第二步,一种长有
[医疗电子]
便携式医疗装置纳米机器人研究浅析
51单片机的四种工作模式怎么去设置
学51单片机需要专门把C语言学透吗 大家是不是看了很多网上的视频或者文章,他们的建议是不是教你拿一本C语言书看几个月,当真正开始给单片机编程时你会发现单片机编程语言只用到了c语言的百分之十都不到,浪费了自己的青春,消磨了对电子方面的兴趣!真正学习单片机需要一定的动手能力,不误人子弟的教程,理论和实践相结合的教学模式并没有刚开始教大家一堆C语言知识。 所以建议从一块开发板和教程开始学起,起初的知识对C语言的要求很低。之后发现自己的C语言功底不足以使你的程序如鱼得水的时候再回头认认真真学习C语言。 51单片机的四种工作模式怎么去设置,既然它有四种工作模式,像定时计数器一样,要想使用定时计数器它也有四种工作方式,那必然的要有
[单片机]
51<font color='red'>单片机</font>的四种工作模式怎么去设置
基于MSP430 单片机的便携式气象仪设计
设计了一种低功耗便携式气象仪,该气象检测系统以低功耗MSP430单片机为主控,利用温度传感器.湿度传感器.气压传感器.风速和风向测量模块,进行温度.湿度.气压.风速.风向的测量;通过时钟芯片和12864液晶实现数据的实时显示;通过E2PROM进行数据的实时存储和查询.该气象仪具有小型化.实时化.低功耗和便携式等特点,测试结果表明该气象仪的测量精度可达普通气象测量要求,稳定性好,特别适用于小区域的气候监测. 0 引言 温度.湿度.气压.风速.风向等气象参数的测量在日常生活.农业.渔业.工业.林业.航海等领域中起着十分重要的作用,很多地区气象参数的测量大多依靠当地天气预报,可是,天气预报地域范围较广,无法精确到小区域的气候测量
[单片机]
基于MSP430 <font color='red'>单片机</font>的便携式气象仪设计
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved