ARM处理器结构

发布者:reaper2009最新更新时间:2016-07-01 来源: eefocus关键字:ARM  处理器结构 手机看文章 扫描二维码
随时随地手机看文章
ARM处理器结构 

ARM和Thumb状态 
RISC技术 
流水线技术 
超标量技术

 

ARM和Thumb状态 
V4版以后有: 
(1)32位ARM指令集 
(2)16位Thumb指令集,功能是ARM指令集的功能子集。 
ARM7TDMI核以后,T变种的ARM微处理器有两种工作状态: 
(1)ARM状态 
(2)Thumb状态。 
当ARM微处理器执行32位的ARM指令集时,工作在ARM状态; 
当ARM微处理器执行16位的Thumb指令集时,工作在Thumb状态

 

Thumb技术介绍 
ARM7体系结构被广泛应用的时候,嵌入式控制器的市场仍然由8位、16位处理器占领。这些产品不能满足高端应用。这些应用需要32位RISC处理器的性能和更优于16位CISC处理器的代码密度。 
为了解决代码密度的问题,ARM增加了T变种。 
Thumb从32位ARM指令集中抽出来的36条指令格式,可重新编成16位的操作码。 
在运行时,16位的Thumb指令又由处理器解压成32位指令。 
Thumb核有2套独立的指令集,它使设计者得到ARM32位指令性能的同时,又能享有Thumb指令集产生的代码方面的优势,在性能和代码大小之间取得平衡。


和ARM指令集相比,Thumb指令集具有以下的局限: 
完成相同的操作,Thumb指令通常需要更多的指令,因此在对系统运行时间要求苛刻的场合,ARM指令集更为合适。 
Thumb指令集没有包含进行异常处理时需要的一些指令,因此在异常中断时,还是需要使用ARM指令,这种限制决定了Thumb指令需要与ARM指令配合使用。

 

ARM与Thumb状态转换 
在程序的执行过程中,微处理器可以随时在两种工作状态之间切换,并且该转变不影响处理器的工作模式和相应寄存器中的内容。 
进入Thumb状态:当操作数寄存器的状态位(位[0])为1时,执行BX指令。 
进入ARM状态:当操作数寄存器的状态位(位[0])为0时,执行BX指令。

 

RISC技术 
嵌入式微处理器可以分为两类:CISC和RISC; 
CISC(Complex Instruction Set Computer):复杂指令系统计算机;随着计算机技术的发展而不断引入新的复杂的指令集,计算机的体系结构会越来越复杂。 
大约有20%的指令会被反复使用,占整个程序代码的80%,而余下的80%的指令却不经常使用,在程序设计中只占20% 。 
RISC(Reduced Instruction Set Computer):精简指令系统计算机;- 采用固定长度的指令格式 
- 使用单周期指令 
- 大量使用寄存器 
- 可用加载/存储指令批量传输数据 
- 在循环处理中使用地址的自动增减

 

RISC技术与CISC技术比较

ARM处理器结构


RISC技术 
ARM处理器采用加载/存储(Load/Store)体系结构是典型的RISC处理器,即只有Load/Store的存/取指令可以访问存储器,其余指令都不允许进行存储器操作。 
RISC体系结构基本特点: 
(1)大多数指令只需要执行简单和基本的功能,其执行过程在一个机器周期内完成。 
(2)只保留加载/存储指令。操作数由加载/存储指令从存储器取出放寄存器内操作。 
(3)芯片逻辑不采用或少采用微码技术,而采用硬布线逻辑。 
(4)减少指令数和寻址方式。 
(5)指令格式固定,指令译码简化。 
(6)优化编译。

 

RISC技术 
ARM体系结构还采用了一些特别的技术: 
所有的指令都可根据前面的执行结果决定是否被执行,提高了指令的执行效率。 
可用Load/Store指令批量传输数据,以提高数据的传输效率。 
可在一条数据处理指令中同时完成逻辑处理和移位处理。 
RISC和CISC各有优势,界限并不那么明显。 
现代的CPU往往采用CISC的外围,内部加入了RISC的特性,如超常指令集CPU就是融合了RISC和CISC的优势,成为未来的CPU发展方向之一。

 

流水线技术 
是一种将每条指令分解为多步,并让各步操作重叠,从而实现几条指令并行处理的技术; 
程序中的指令仍是一条条顺序执行,但可以预先取若干条指令,并在当前指令尚未执行完时,提前启动后续指令的另一些操作步骤,从而可加快程序的运行速度;

 

 

ARM处理器结构

ARM处理器结构

 

开发和设计嵌入式系统的过程中,CPU的性能是一个非常重要的考虑因素。 
流水线技术是在本质上影响程序执行速度的因素。 
由于计算机中一条指令的各个执行阶段相对独立,因此,现代CPU大多设计成流水线型的机器,在这种类型机器中几个指令可以并行执行。采用流水线的重叠技术大大提高了CPU的运行效率。 
当流水线内部的信息通畅流动时,CPU流水线能够工作得最好。 
但实际应用中,指令各执行阶段的操作时间长短不同,有一些指令序列可能会打断流水线内的信息流,所以有时流水线操作不十分通畅,会暂时降低CPU的执行速度。

 

单周期指令的执行过程

 

ARM处理器结构

ARM的3级流水线 
ARM7架构采用了一个3段的流水线: 
(1)取指:将指令从内存中取出来。 
(2)译码:操作码和操作数被译码以决定执行什么功能。为下一周期准备数据路径需要的控制信号。这一级指令”占有“译码逻辑,而不是”占有”数据路径 
(3)执行:执行已译码的指令。指令占有数据路径,寄存器堆栈被读取,操作数在桶行移位器中被移位。ALU产生运算结果并回写到目的寄存器中,ALU结果根据指令需求更改状态寄存器的条件位。

 

流水线模式下PC的更改过程

 

ARM处理器结构


多周期ARM指令的3级流水线操作 
数据路径涉及到所有执行周期、地址计算和数据传送。译码逻辑总是产生数据路径在下一个周期使用的控制信号,因此除译码周期以外,在STR地址计算周期也产生数据传送所需的控制信号。 
取指的存储器访问和执行的数据路径占用都是不可同时共享的资源,对于多周期指令来说,如果指令复杂以至于不能在单个时钟周期内完成执行阶段,就会产生流水线阻塞。

 


ARM的流水线设计问题 
1)缩短程序执行时间:

 

 

Tprog:执行一个程序所需时间; 
Ninst:执行该程序的指令条数; 
CPI:执行每条指令的平均时钟周期数; 
Fclk:处理器的时钟频率。 
措施: 
提高时钟频率fclk(导致流水线的级数增加 )。 
减少每条指令的平均时钟周期数CPI(需要解决流水线的相关问题 ) 
2)解决流水线相关: 
结构相关:某些指令在流水线中重叠执行时,产生资源冲突 。 
措施:1)采用分离式指令Cache和数据Cache。2)ALU中采用单独加法器来完成地址计算。 
数据相关:当一条指令需要前面指令的执行结果,而这些指令均在流水线中重叠执行时,就可能引起流水线的数据相关。 
数据相关有“写后读”、“写后写”和“读后写”等。 
措施:1)旁路技术。2)流水线互锁技术。 
控制相关:当流水线遇到分支指令和其他会改变PC值的指令时,就会发生控制相关。 
措施:1)引入延时分支。2)尽早计算出分支转移成功时的PC值(即分支的目标地址)。

 

ARM的5级流水线 
ARM9和StrongARM架构都采用了5级流水线. 
增加了I-Cache和D-Cache,把存储器的取指与数据存取分开; 
增加了数据写回的专门通路和寄存器; 
把指令的执行过程分割为5部分: 
取指:将指令从指令存储器中取出,放入指令流水线中。 
指令译码:对指令进行译码,从寄存器堆中读取寄存器操作数。 
执行:把一个操作数移位,产生ALU结果。如果指令是Load或Store,在ALU中计算存储器的地址。 
数据缓存:如果需要,访问数据存储器;否则,ALU的结果只是简单地缓冲一个时钟周期,以便使所有指令具有同样地流水线流程。 
写回 :将指令产生地结果写回到寄存器堆。

流水线对比

超标量执行 

通过重复设置多套指令执行部件,同时处理并完成多条指令,实现并行操作,来达到提高处理速度的目的。 
所有ARM内核,包括流行的ARM7、ARM9和ARM11等,都是单周期指令机。 
ARM公司下一代处理器将是每周期能处理多重指令的超标量机。 
超标量处理机:一个时钟周期内同时执行多条指令的处理机。

超标量处理器中的多指令单元 
超标量与流水线技术是兼容的,为了能够在一个时钟周期内同时发射多条指令,超标量处理机必须有两条或两条以上能够同时工作的指令流水线。但与此同时,也带来了多流水线的调度问题和操作部件的资源冲突问题。 
超标量处理器在执行的过程中必须动态地检查指令相关性。 
如果代码中有分支指令,必须将分支被执行和分支不被执行这两种情况分开考虑。 
计算执行时间几乎是不可能的。

关键字:ARM  处理器结构 引用地址:ARM处理器结构

上一篇:ARM平台的地址对齐问题
下一篇:基于Android的ARM汇编语言系列之四:ARM处理器的寻址方式

推荐阅读最新更新时间:2024-03-16 14:59

基于WinCE的ARM视频监控系统解析
设计一种嵌入式系统,以WinCE操作系统和ARM硬件平台为核心实现对现场的实时监控;通过无线网络把视频图像传输到主机端,以实现分析、存储及显示等功能。 数字视频监控系统是以计算机或嵌入式系统为中心、视频处理技术为基础组建的的一种新型监控系统,系统采用符合图像数据压缩的国际标准,综合利用图像传感器、计算机网络、自动控制和人工智能等技术。由于数字视频监控系统对视频图像进行了数字化,所以与传统的模拟监控系统相比,数字监控具有许多优点。数字化的视频系统可以充分利用计算机的快速处理能力,对其进行压缩、分析、存储和显示。 数字化视频处理技术提高了图像的质量与监控效率,使系统易于管理和维护。整个系统是模块化结构,体积小,易于安装、使用和维护
[单片机]
基于WinCE的<font color='red'>ARM</font>视频监控系统解析
arm构架分析
  一、 引 言   随着近两年各种智能手机、平板电脑、车载电子等各种消 费品的蓬勃发展,ARM体系结构的处理器,作为这些消费品的处理核心,也得到了长足的进步,甚至击败了Intel,在移动嵌入式领域独占鳌头。本文将首先介绍ARM体系结构的发展历程,然后将着重梳理其最先进的Cortex系列处理器的体系结构,以及这些结构对于各种软件平台如JAVA、.NET的支持等。   二、 ARM体系结构的历史即其新进展   2.1 ARM体系结构市场前景   来自英国的ARM(Acorn RISC Machine)公司虽然以ARM处理器著称,但是它独特的商业模式却决定了ARM公司本身并不生产处理器,这点与从研发到生产到出货垂直整合的Intel
[单片机]
<font color='red'>arm</font>构架分析
jz2440裸机开发与分析:ARM芯片时钟体系1
ARM芯片时钟体系分析 OM开关
[单片机]
jz2440裸机开发与分析:<font color='red'>ARM</font>芯片时钟体系1
Arm将自动化导入物联网连接管理
全球IP授权领导厂商Arm 宣布推出拥有全新自动化引擎的Pelion Connectivity Management 2.0,并与葡萄牙移动网络运营领导厂商NOS合作导入该平台,进一步发掘物联网连接管理的商机并扩大物联网规模。 随着企业进行数字化转型,自动化将是提升生产力、降低成本与创造全新机会的核心。从物联网的角度来看,全球需要连接并管理数十亿、甚至是数万亿设备,目前的人工处理将难以满足全球设备连接和管理需求。 移动网络运营商们(MNO)不断给我们传达这样一种信息,在物联网规模的扩张过程中,自动化对于消除连接障碍来说十分关键。针对此,Arm推出Pelion Connectivity Management 2.0,其中包括
[物联网]
<font color='red'>Arm</font>将自动化导入物联网连接管理
英伟达宣布以400亿美元收购Arm
9月14日,日本软银集团(SoftBank)正式发布公告称,软银集团已经和英伟达(NVIDIA)、Arm董事会达成收购意向,英伟达将以400亿美元现金+股票的形式打包收购Arm公司,但是在软银主力投资下组建的IoT物联网服务部门将不在此次交易之列,不会随着Arm被打包出售。 一旦交易完成,这不仅是软银史上最大规模的资产出售,也将是全球芯片行业史上规模最大的收购案。孙正义这笔四年前的投资,有望收获80亿美元的回报,不过后面还需要等待部分国家反垄断审查。 强强联合,布局未来 据英伟达公布的信息显示,英伟达还将通过建立世界一流的AI研究和教育中心,并打造一台由Arm/英伟达驱动的AI超级计算机来进行突破性的研究,扩大Arm在英国剑桥
[机器人]
基于ARM处理器的异常处理分析
内容摘要:嵌入式系统要求对异常及中断处理器能快速响应。文中分析了ARM体系结构下异常处理特点,提出一种基于ARM处理器的高效异常处理解决方案,以LPC3250硬件平台为基础,对该方案进行了设计与实现。测试结果表明,该方案的异常处理更为高效。 在航空航天、工业控制及医疗等领域中,嵌入式系统的安全性、可靠性以及高效性作用显著,而异常是系统在运行过程中的突发事件,异常处理是否高效将直接影响整个系统的工作效率。为了确保嵌入式系统高效安全的运行,对处理器非正常模式下高效的异常处理机制的研究具有重要意义。 1 异常概述 嵌入式系统中异常/中断是指由处理器内部或外部源产生并引起系统处理的一个事件。根据事件源的不同将异常分为“
[单片机]
基于<font color='red'>ARM</font><font color='red'>处理器</font>的异常处理分析
CES2013:x86大军压境 ARM将何去何从?
在CES上,x86领域的Intel和AMD不约而同的展示了自家将在2013年推出的新款处理器,而ARM领域的三星、高通以及NVIDIA则纸面发布了旗下的新款移动处理器。从这几家处理器巨头的动作中我们不难看出 移动市场将成为2013年处理器的主战场,ARM处理器势必会在2013年中大放异彩;而x86处理器在稳固自己桌面平台地位的同时开始将产品向移动领域延伸,意图动摇ARM在移动领域的统治地位。 下面我们就来盘点一下CES上亮相的那些新款处理器,同时对2013年的处理器市场做一个简要的分析。 Intel Intel在本次CES上 展示了自家即将发布的Haswell处理器 ,在保证性能的同时尽可能的降低了功耗,数款TDP仅为10
[半导体设计/制造]
CES2013:x86大军压境 <font color='red'>ARM</font>将何去何从?
基于ARM7支持触摸屏和实时操作系统的开发与应用
  概述   随着信息技术的发展,支持图形界面的触摸操作和实时操作系统相结合的应用系统已经越来越广泛地应用到航空航天、军事、消费类电子、通讯设备等领域。mC/OS-II操作系统是一种占先式、实时操作系统(RTOS),由于其内核可拆减、可剥离性,使得它在实时控制领域中有着广泛的应用。它不仅减小了因为系统硬件设计缺陷带来的不可靠因素,而且增强了系统的控制实时性,从软件方面进一步增强了ARM控制系统的性能。另外,新版本的mC/OS-II已经通过了FAA认证,很适合应用于对实时性要求很高的嵌入式工业控制领域,如目前应用较广泛的军用战斗机、攻击机和火控系统等。   支持图形界面操作(mC/GUI)是一种较为流行的人机交互系统,它能够提供
[单片机]
基于<font color='red'>ARM</font>7支持触摸屏和实时操作系统的开发与应用
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved