Cortex—M3的异常处理机制研究

发布者:温馨阳光最新更新时间:2012-09-07 关键字:Cortex-M3  异常处理机制  ARM 手机看文章 扫描二维码
随时随地手机看文章
  引 言

  Cortex—M3是ARM公司第一款基于ARMv7一M的微控制器内核,在指令执行、异常控制、时钟管理、跟踪调试和存储保护等方面相对于ARM7有很大的区别。尤其在异常处理机制方面有很大的改进,其异常响应只需要12个时钟周期。NVIC(Nested Vectored Inteirupt Contmller,嵌套向量中断控制器)是Cortex—M3处理器的一个紧耦合部件,可以配置1~240个带有256个优先级、8级抢占优先权的物理中断,为处理器提供出色的异常处理能力。同时,抢占(pre-emption)、尾链(tail—chaining)、迟到(1ate—arriving)技术的使用,大大缩短了异常事件的响应时间。

  异常或者中断是处理器响应系统中突发事件的一种机制。当异常发生时,Cortex—M3通过硬件自动将编程计数器(PC)、编程状态寄存器(XPSR)、链接寄存器(LR)和R0~R3、R12等寄存器压进堆栈。在Dbus(数据总线)保存处理器状态的同时,处理器通过Ibus(指令总线)从一个可以重新定位的向量表中识别出异常向量,并获取ISR函数的地址,也就是保护现场与取异常向量是并行处理的。一旦压栈和取指令完成,中断服务程序或故障处理程序就开始执行。执行完ISR,硬件进行出栈操作,中断前的程序恢复正常执行。图1为Cortex—M3处理器的异常处理流程。

Cortex 

  1 Cortex—M3异常类型

  同ARM7相比,Cortex—M3在异常的分类和优先级上有很大的差异,如表1所列。

Cortex 

  Cortex—M3将异常分为复位、不可屏蔽中断、硬故障、存储管理、总线故障和应用故障、SVcall、调试监视异常、PendSV、SysTick以及外部中断等。Cortex—M3采用向量表来确定异常的入口地址。与大多数其他ARM内核不同,Cortex—M3向量表中包含异常处理程序和ISR的地址,而不是指令。复位处理程序的初始堆栈指针和地址必须分别位于0xO和Ox4。这些值在随后的复位中被加载到适当的CPU寄存器中。向量表偏移控制寄存器将向量表定位在CODE(Flash)或SRAM中。复位时,默认情况下为CODE模式,但可以重新定位。异常被接受后,处理器通过Ibus查表获取地址,执行异常处理程序。

  在Cortex—M3的优先级分配中,较低的优先级值具有较高的优先级。NVIC将异常的优先级分成两部分:抢占优先级(pre—emption priority)部分和子优先级(sub—priority)部分,可以通过中断申请/复位控制寄存器来确定两个部分所占的比例。抢占优先级和子优先级共同作用确定了异常的优先级。抢占优先级用于决定是否发生抢占,一个异常只有在抢占优先级高于另一个异常的抢占优先级时才能发生抢占。当多个挂起异常具有相同的抢占优先级时,子优先级起作用。通过NVIC设置的优先级权限高于硬件默认优先级。当有多个异常具有相同的优先级时,则比较异常号的大小,异常号小的被优先激活。

  2 Cortex—M3异常处理

  2.1 异常的进入

  当一个异常出现以后,Cortex一M3处理器由硬件通过Dbus保存处理器状态,同时通过Ibus读取向量表中的SP,更新PC和LR,执行中断服务子程序。

  为了应对堆栈操作阶段到来后的更高优先级异常,Cortex—M3支持迟到和抢占机制,以便对各种可能事件做出确定性的响应。

  抢占是一种对更高优先级异常的响应机制。Cortex—M3异常抢占的处理过程如图2所示。当新的更高优先级异常到来时,处理器打断当前的流程,执行更高优先级的异常操作,这样就发生了异常嵌套。迟到是处理器用来加速抢占的一种机制。如果一个具有更高优先级的异常在上一个异常执行压栈期间到达,则处理器保存状态的操作继续执行,因为被保存的状态对于两个异常都是一样的。但是,NVIC马上获取的是更高优先级的异常向量地址。这样在处理器状态保存完成后,开始执行高优先级异常的ISR。

Cortex

  2.2 异常的返回

  Cortex-M3异常返回的操作如图3所示。当从异常中返回时,处理器可能会处于以下情况之一:

  ◆尾链到一个已挂起的异常,该异常比栈中所有异常的优先级都高;

  ◆如果没有挂起的异常,或是栈中最高优先级的异常比挂起的最高优先级异常具有更高的优先级,则返回到最近一个已压栈的ISR;

  ◆如果没有异常已经挂起或位于栈中,则返回到Tread模式。[page]

Cortex-M3异常返回的操作 

  为了应对异常返回阶段可能遇到的新的更高优先级异常,Cortex—M3支持完全基于硬件的尾链机制,简化了激活的和未决的异常之问的移动,能够在两个异常之间没有多余的状态保存和恢复指令的情况下实现back—to—back处理。尾链发生的2个条件:异常返回时产生了新的异常;挂起的异常的优先级比所有被压栈的异常的优先级都高。

  尾链发生后,Cortex—M3处理过程如图3中尾链分支所示。这时,Cortex—M3处理器终止正在进行的出栈操作并跳过新异常进入时的压栈操作,同时通过Ibus立即取出挂起异常的向量。在退出前一个ISR返回操作6个周期后,开始执行尾链的ISR。

 

  3 Cortex—M3和ARM7中断控制器比较

  在过去的十年中,基于ARMv4的ARM7系列微控制器广泛应用在各个领域。在ARM7系列中,并没有对中断进行独立的服务,而是通过牺牲处理器一定的性能来换取有效的中断响应和中断处理机制。Cortex—M3高度耦合的NVIC可以实现硬件中断处理,同时支持迟到和尾链机制,加快了异常响应的速度,充分发挥了处理器的性能。图4为Corex—M3和ARM7在中断控制器结构方面的差异。

Corex 

  比较可知,NVIC是直接作为Cortex—M3处理器的一部分,集成在处理器核内部;而VIC只是游离在ARM7内核的外围,这样就必然占用内核资源,影响了处理速度。Cortex—M3和ARM7中断控制器在功能和实现方式上的差异如表2所列。

Cortex 

  3.1 处理器响应单个异常

  Cortex一M3和ARM7异常处理过程如图5所示。

Cortex一M3和ARM7异常处理过程 

  ARM7处理器的异常开销:

公式 

  其中,TARM7为ARM7处理异常的时间开销;TARM2_PUSH和TARM7_POP为ARM7进行压栈和出栈的操作时间;TCoretx-M3为Cortex一M3处理异常的时间开销;TM3_PUSH和TM3_POP为Cortex—M3进行压栈和出栈的操作时间。[page]

  可见,由于采用处理器状态硬件保存,Cortex—M3处理器少用了18周期,节省了42.8%的异常开销。

  3.2 处理器响应迟到异常

  Cortex—M3和ARM7在处理迟到高优先级异常时的差异如图6所示。

Cortex 

  当IRQ2正在为执行ISR2保存处理器状态时,迟到了一个优先级更高的异常IRQl。这时ARM7继续进行压栈操作。在压栈操作完成后,ARM7继续为执行ISRl进行压栈操作,然后执行ISRl。其实,两次压栈操作所保存的内容是一样的。因此,Cortex—M3对这个阶段的操作进行了优化,引进了迟到异常技术,只进行一次的压栈操作。并且在ISRl执行完成之后,Cortex—M3没有进行出栈操作,而是通过一个6周期的尾链,直接进入ISR2的执行。

  在上面的例子中,ARM7处理器的异常开销:

公式 

  其中,TARM7_later和TM3_later分别为ARM7和Cortex—M3处理迟到异常所用的时间开销;Ttail-chaining为Cortex—M3处理尾链所用的时间。

  通过计算可以看出,Cortex—M3少用了44周期,节省65%的异常开销。

  3.3 处理器处理back-to-back异常

  若一个新的异常在上一个异常寄存器出栈时到来,ARM7和Cortex—M3的处理方式也有很大不同。Cortex—M3和ARM7在处理back—to—back异常时的差异如图7所示。ARM7继续当前的出栈操作,在出栈操作完成后,处理器为执行ISR2进行压栈操作,然后执行ISR2。其实,这时候处理器出栈和压栈的内容是一致的。Cortex—M3同样优化了这个阶段的操作,引进了尾链机制。当IRQ2到来时,Cortex—M3立即中止已经进行了8个周期的出栈操作,转而进行尾链操作,然后执行ISR2。

Cortex 

  在处理back—to—back异常时,ARM7处理器用在ISRl到ISR2转换的异常开销:

  TARM_btb=TARM7_POP+TARM7_PUSH=16+26=42周期Cortex-M3处理器用在ISRl到ISR2转换的异常开销:

  TM3_btb=Tcancel+Ttail-chaining=8+6=14周期

  其中,TARM_btb和TM3_btb分别为ARM7和Cortex—M3处理back—to—back异常转换所用的时间开销;Tcancel为发生尾链时Cortex—M3已用于状态恢复的时间。

  通过计算可以看出,Cortex—M3少用了28周期。其实,Cortex—M3处理器用在ISRl到ISR2转换的异常开销最低可以优化到只用6个周期,这样就极大地提高了back—to—back异常的响应能力。

  结 语

  本文阐述了Cortex—M3处理器的异常处理机制。通过和ARM7进行比较,量化分析了Cortex一M3在异常处理方面的优势,对工程师使用Cortex—M3的异常处理会有一定参考和帮助。

关键字:Cortex-M3  异常处理机制  ARM 引用地址:Cortex—M3的异常处理机制研究

上一篇:基于Cortex一M3的MP3播放器设计
下一篇:基于M D K RTX的COrtex—M3多任务应用设计

推荐阅读最新更新时间:2024-03-16 13:07

ARM的SWI异常中断处理程序设计
本节主要介绍编写SWI处理程序时需要注意的几个问题,包括判断SWI中断号,使用汇编语言编写SWI异常处理函数,使用C语言编写SWI异常处理函数,在特权模式下使用SWI异常中断处理,从应用程序中调用SWI。 1.判断SWI中断号 当发生SWI异常,进入异常处理程序时,异常处理程序必须提取SWI中断号,从而得到用户请求的特定SWI功能。 在SWI指令的编码格式中,后24位称为指令的 comment field 。该域保存的24位数,即为SWI指令的中断号,如图7-4所示。 第一级的SWI处理函数通过LR寄存器内容得到SWI指令地址,并从存储器中得到SWI指令编码。通常这些工作通过汇编语言、内嵌汇编来完成。下面的例子显示了
[单片机]
<font color='red'>ARM</font>的SWI<font color='red'>异常</font>中断<font color='red'>处理</font>程序设计
ARM-Linux 内核移植--基于FL2440开发板(修改为Linux单系统)
硬件平台:FL2440开发板 内核版本:2.6.28 主机:ubuntu 11.04 内核版本:2.6.39 本来以为fl2440的nand flash大小为128M,问了客服才知道,现在FL2440使用的是现代的flash,现在都换成256M的了,只是飞凌的bootloader没有相应的修改,它使用的既不是u-boot,也不是vivi,而是自己的bootloader。现在修改bootloader源码中的nand.c 修改如下: //可更改删除分区,分区名字不可改 static struct Partition NandPart = { {0, 0x00020000, boot },
[单片机]
<font color='red'>ARM</font>-Linux 内核移植--基于FL2440开发板(修改为Linux单系统)
uboot之ARM位置无关代码设计
前言: 所谓位置无关代码是指:可执行镜像test.bin 我将它拷贝至内存0x30000000,然后pc = 0x30000000、它可以顺利执行; 我将它拷贝至内存0x38000000,然后pc = 0x38000000、它仍可以顺利执行。 1.程序的编译及运行流程 源码经过编译、汇编(生成相对地址符号表)和连接(提供绝对首地址、进而确定绝对地址符号表)后编程可执行镜像; 特别指出地是:在连接时,对各个目标文件进行重定位、建立符号引用规则;进而为变量和函数分配了绝对的运行地址; 程序执行时,系统必须把可执行镜像加载到连接阶段指定的地址空间,这样程序执行中才能对变量、函数等符号做正确引用,程序才能正常运行。 在有操作系
[单片机]
基于嵌入式ARM的LCD图像显示系统设计
0 引 言 随着嵌入式技术迅猛发展和Linux在信息行业中广泛应用,利用嵌入式Linux系统实现图像采集处理已有可能。实时获得图像数据是实现这些应用的重要环节。本文使用的系统硬件平台采用Samsung公司的处理器S3C2410,并以此为基础,在基于嵌入式Linux系统平台上设计了建立图像视频的一种方法。 1 系统硬件电路设计 S3C2410芯片处理器内部集成了ARM公司ARM920T处理器核的32位微控制器,资源丰富,带独立的16 kB的指令Cache和16 kB数据Cache、LCD(液晶显示器)控制器、RAM控制器、NAND闪存控制器、3路UART、4路DMA、4路带PWM的定时器、并行I/O口、8路10位ADC、Tou
[嵌入式]
Arm新推Mali-C55 ISP,三大特性助力嵌入式视觉系统发展
Arm 日前宣布推出全新 Arm Mali-C55 图像信号处理器 (ISP),这是 Arm 迄今为止面积最小且可配置性最高的 ISP 产品,并已获得合作伙伴的青睐,包括首家公开授权许可客户瑞萨电子 (Renesas)。Mali-C55 提供更卓越的图像质量功能,可在各种不同的照明和天气条件下运作,专为在面积和功率受限的应用中实现最佳性能和功能而打造,是智能摄像头和边缘人工智能 (AI) 视觉用例的理想之选。 Arm 物联网兼嵌入式事业部副总裁 Mohamed Awad 表示:“ISP 仍是最重要的信息生成设备之一,可支持商用、工业或家用智能摄像头及无人机等众多物联网视觉系统应用。随着对未来设备中更多、更高质量图像处理需求的不
[半导体设计/制造]
<font color='red'>Arm</font>新推Mali-C55 ISP,三大特性助力嵌入式视觉系统发展
linux驱动系列之arm汇编
在arm平台学习linux时,会遇到arm汇编指令,arm汇编指令与8086汇编指令很多地方都不同,在此记下来以免后面忘了,同时在学习了汇编指令之后分析一些汇编指令编写的代码。 一、相对跳转指令b、bl b、bl指令都实现短跳转,bl指令执行后会在链接寄存器r14中保存下一条指令的地址。 二、数据传送指令mov   mov指令会把一个寄存器的数赋值给另一个寄存器,或者把一个常数传递给另一个寄存器。   如:mov r0,r1 //将r1中的值传递给r0,mov r0,#0xff //将常数0xff传递给r0寄存器。   mov指令传递的常数必须能够用立即数表示,当不知道一个数是否能够用“立即数传递”时,可以用ldr指令
[单片机]
linux驱动系列之<font color='red'>arm</font>汇编
ARM CPU S3C44B0X与C54X DSP的接口设计
摘要:以SAMSUNG公司的ARM SOC芯片S3C44B0X和TI公司的TMS320C5416 DSP为例,讲述了ARM与DSP的数据接口技术,并结出了硬件连接图和软件代码。 关键词:ARM S3C44B0X 主机接口(HPI) TMS320C5416 后PC时代,嵌入式产品逐渐占领市场。而这些嵌入式产品的核心——处理器决定了产品的市场和性能。高性能、低功耗、低成本是嵌入式处理器的主要特点。在32位嵌入式处理器市场中,ARM占有78.6%的份额。而TI而占有DSP市场的绝大部分份额。通常的嵌入式系统设计中,由微控制器实现整个系统的控制,由DSP来执行计算密集型操作,然后通过一定的手段实现微控制器与DSP之间的通信和数据交换。因此,
[嵌入式]
基于eCos在基于ARM7硬件平台上的应用
  eCos(Embedded Configurable Operating System)最初是由Cygnus Solutions公司为面向嵌入式领域而开发的源码公开、具有很强的可移植性和可配置性的,适合于深度嵌入式开发的实时操作系统。现在eCos主要由eCosCentric公司和eCos开源社区共同开发维护。eCos的特性,特别是它的可配置性,能有效缩短嵌入式产品的开发周期并降低成本。   1  eCos的体系结构及可配置性   1.1  eCos体系结构   eCos采用模块化设计,将不同功能的软件分成不同的组件,使其分别位于系统的不同层次。这种层次结构实现了eCos的可配置性、可移植性、兼容性和可扩展性。图1是
[单片机]
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved