认识ARM体系结构的发展

发布者:Shuxiang最新更新时间:2013-12-05 来源: chinaitlab关键字:ARM  体系结构  多处理器 手机看文章 扫描二维码
随时随地手机看文章

  处理器的体系结构定义了指令集(ISA)和基于这一体系结构下处理器的程序员模型。尽管每个处理器性能不同,所面向的应用不同,每个处理器的实现都要遵循这一体系结构。arm体系结构为嵌入系统发展商提供很高的系统性能,同时保持优异的功耗和面积效率。

arm体系结构的发展

  ARM体系结构为满足ARM合作者以及设计领域的一般需求正稳步发展。每一次arm体系结构的重大修改,都会添加极为关键的技术。在体系结构作重大修改的期间,会添加新的性能作为体系结构的变体。下面的名字表明了系统结构上的提升,后面附加的关键字表明了体系结构的变体。

V3结构 32位地址。

Thumb状态:16位指令。

长乘法支持(32*32=>64或者32*32+64=>64)。这一性质已经变成V4结构的标准配

置。

V4结构 加入了半字存储操作。

对调试的支持(Debug)

嵌入的ICE(In Circuit Emulation)

  属于V4体系结构的处理器(核)有ARM7,ARM7100(ARM7核的处理器),ARM7500(ARM7核的处理器)。 属于V4T(支持Thumb指令)体系结构的处理器(核)有 ARM7TDMI,ARM7TDMI-S(ARM7TDMI可综合版本),ARM710T(ARM7TDMI核的处理器),ARM720T(ARM7TDMI核的处理器),ARM740T(ARM7TDMI核的处理器),ARM9TDMI,ARM910T(ARM9TDMI核的处理器),ARM920T(ARM9TDMI核的处理器),ARM940T(ARM9TDMI核的处理器),Strongarm(Intel公司的产品)。

V5结构 提升了arm和Thumb指令的交互工作能力。

E DSP指令支持。

J Java指令支持。

  属于V5T(支持Thumb指令)体系结构的处理器(核)有ARM10TDMI,ARM1020T(arm10TDMI核处理器)。
 
  属于V5TE(支持Thumb,DSP指令)体系结构的处理器(核)有ARM9E,ARM9E-S(ARM9E可综合版本),ARM946(ARM9E核的处理器),ARM966(ARM9E核的处理器),ARM10E,ARM1020E(ARM10E核处理器),ARM1022E(arm10E核的处理器), Xscale(Intel公司产品)。
 
  属于V5TEJ(支持Thumb,DSP指令,Java指令)体系结构的处理器(核)有ARM9EJ,ARM9EJ-S(ARM9EJ可综合版本),ARM926EJ(ARM9EJ核的处理器),ARM10EJ. V6结构 增加了媒体指令属于V6体系结构的处理器核有ARM11.ARM体系结构中有四种特殊指令集:Thumb指令(T),DSP指令(E),Java指令(J),Media指令,V6体系结构包含全部四种特殊指令集。为满足向后兼容,ARMv6也包括了armv5的存储器管理和例外处理。这将使众多的第三方发展商能够利用现有的成果,支持软件和设计的复用。
 
  新的体系结构并不是想取代现存的体系结构,使它们变得多余。新的CPU核和衍生产品将建立在这些结构之上,同时不断与制造工艺保持同步。例如基于V4T体系结构的arm7TDMI核还在广泛被新产品所使用。
 
  新体系结构的发展动力下一代体系结构的发展是由不断涌现的新产品和变化的市场来推动的。关键的设计约束是显而易见的,功能,性能,速度,功耗,面积和成本必须与每一种应用的需求相平衡。保证领先的性能/功耗(MIPS/Watt)在过去是ARM成功的基石,在将来的应用中它也是一个重要衡量标准。随着计算和通讯持续覆盖许多消费领域,功能也变得愈来愈复杂,消费者期望有高级的用户界面,多媒体以及增强的产品性能。armv6将更有效的对这些新性质和技术进行有效的支持。

  驱动RMv6体系结构发展的市场主要有无线,网络,自动化和消费娱乐市场。ARM在过去与体系结构的受权者和主要合作者像Intel,Microsoft,Symbian和TI共同定义了armv6体系结构的需求。
 
  ARMv6体系结构的提升发展ARMv6体系结构的过程中,精力主要集中在五个方面:存储器管理存储器管理方式严重影响系统设计和性能。存储器结构的提升将大大提高处理器的整体性能-尤其是对于面向平台的应用。armv6体系结构可以提高取指(数据)效能。处理器将花费更少的时间在等待指令和缓存未命中数据重装载上面。存储器管理的提升将使系统性能提升30%.而且,存储器管理的提升也会提高总线的使用效率。更少的总线活动意味着功耗方面的节省。[page]
 
多处理器

应用覆盖驱动系统实现向多处理器方向发展。无线平台,尤其是2。5G和3G,都是典型的需要整合多个ARM处理器或ARM与DSP的应用。多处理器材通过共享内存来有效的共享数据。新的armv6在数据共享和同步方面的能力将使它更容易实现多处理器,以及提高它们的性能。新的指令使能复杂的同步策略,更大的提升了系统效能。

多媒体支持

单指令流多数据流(SIMD)能力使得软件更有效地完成高性能的媒体应用像声音和图像编码器。armv6指令集合中加入了超过60个SIMD指令。加入SIMD指令将使性能提高2倍到4倍。SIMD能力使发展商可以完成高端的像图象编码

,语音识别,3D图象,尤其是与下一代无线应用相关的。

数据处理

  数据的大小端问题是指数据以何种方式在存储器中被存储和引用。
 
  随着更多的SOC集成,单芯片不仅包含小端的OS环境和界面(像USB,PCI),也包含大端的数据(TCP/IP包,MPEG流)。ARMv6体系结构,支持混合。结果,数据处理问题在armv6体系结构中更为有效。
 
  未对齐数据是指数据未与自然边界对齐。例如,在DSP应用中有时需要将字数据半字对齐。处理器更有效处理这种情形需要能够装载字到任何半字边界。
 
  当前版本的体系结构需要大量指令处理未对齐数据。ARMv6兼容结构处理未对齐数据更有效。对于严重依赖未对齐数据的DSP算法,ARMv6体系结构将有性能的提高以及代码数量的缩减。未对齐数据支持将使ARM处理器在仿真其它处理器像Motorola的68000系列方面更有效。与ARMv5的实现像ARM10和Xscale,ARMv6是基于32位处理器。armv6可以实现64位或64位以上的总线宽度。这使得总线等于甚至超过64位处理器,但功耗和面积却比64位CPU要低。
 例外(EXCEPTION)与中断

  对于实时系统来说,对于中断的效率是要求严格的。像硬盘控制器,引擎管理应用,这些应用中如果中断没有及时得到响应,那后果将是严重的。更有效的处理中断与例外也能提高系统整体表现。在降低系统时尤为重要。在armv6体系结构中,新的指令被加入了指令集合来提升中断与例外的实现。这些将有效提升特权模式下例外处理。

arm11主要性能

ARM11是ARMv6体系结构的第一个实现,ARM11微结构的设计目的是为了高性能,而实现这一目的流水线是关键。ARM11微结构的流水线与以前的arm核不同,它包含8级流水,使贯通率比以前的核提高40%。

单指令发射

  arm11微结构的流水线是标量的(SCALAR),即每次只发射一条指令(单发射)。有些流水线结构可以同时发射多条指令,例如,可以同时向ALU和MAC流水线发射指令。
 
  理论上,多发射微结构会有更高的效能,但实践上,多发射微结构无疑会增加前段指令译码级的复杂程度,因为需要更多的逻辑来处理指令相关(DEPENDENCY),这将使处理器的面积和功耗变得更大。
 
分支预测

  分支指令通常是条件指令,它们在跳到新指令前需要进行一些条件的测试。由于条件指令译码需要的条件码要三四个周期后才可能有结果,分支有可能引起流水线的延迟。
 
  但分支预测将会有助于避免这种延迟。arm11微结构使用两种技术来预测分支。首先,动态的预测器使用历史记录来判断分支是最频繁发生,还是最不频繁发生。动态预测器是一个64个分录,4状态(StronglyTaken,WeaklyTaken,Strongly notTaken,Weakly notTaken)的分支目标地址缓存(BTAC)。表格大小足够保持最近的分支情况,分支预测就基于以前的结果。其次,如果动态的分支预测器没有发现记录,就使用静态的分支算法。很简单,静态预测检查分支是向前跳转还是向后跳转。假如是向后跳转,就假定它是一个循环,预测该分支发生,假如是向前跳转,就预测该分支不发生。
 
  通过使用动态和静态的分支预测,arm11微结构中分支指令中的85%被正确预测。
 
  存储器访问ARM11微结构存储器系统的提高之一就是非阻塞(NON-BLOCKING)和缺失命中(HIT-UNDER-MISS)操作。当指令取的数据不在缓存中时,一般处理器的流水线会停止下来,但arm11则进行非阻塞操作,缓存开始读取缺失的数据,而流水线可以继续执行下一指令(NON-BLOCKING),并且允许该指令读取缓存中的数据(HIT-UNDER-MISS)。
 
并行流水线

  尽管流水线是单发射的,在流水线的后端还是使用了三个并行部件结构,ALU,MAC(乘加),LS(存取)。LS流水线是专门用于处理存取操作指令。把数据的存取操作与数据算术操作的藕合性分隔开来可以更有效的处理执行指令。在流水线中包含LS部件的ARM11微结构中,ALU或者MAC指令不会由于LS指令的等待而停止下来。这也使得编译工具有更大的自由度通过重新安排代码来提高性能。为使并行流水线获得更大的效能,arm11微结构使用了乱序完成(OUT-OF-ORDER COMPLETION)。
 
64位数据路径

  对于目前的许多应用来说,由于成本与功耗的问题,真64位处理器并不十分必要。ARM1 1微结构在局部合理使用64位结构,通过32位的成本来实现64位的性能。ARM11微结构在处理器整数部件与缓存之间,整数部件与协处理器之间使用了64位数据总线。64位的路径可以在一个周期内从缓存中读取两条指令,允许每周期传送两个arm寄存器的数据。这使得许多数据移动操作与数据加工操作变得更为高性能。
 
浮点处理

  ARM11微结构支持浮点处理。arm11微结构产品线将浮点处理单元作为一个选项。这可以方便发展商根据需求需用合适的产品。

关键字:ARM  体系结构  多处理器 引用地址:认识ARM体系结构的发展

上一篇:基于ARM的电子系统设计
下一篇:ARM7嵌入式系统中启动程序的实现

推荐阅读最新更新时间:2024-03-16 13:31

ARM挑战英特尔服务器芯片霸主地位 软银购并添助力
软件银行(SoftBank)决定大手笔以320亿美元收购英国芯片架构授权大厂ARM,震撼全球科技业界,对此外界分析除了可能牵动全球移动芯片产业布局外,借此收购案也可望有助ARM在获得软银支援下,加速扩大进军至全球数据中心(Data Center)服务器市场。 目前这块市场仍由英特尔(Intel)所盘据,因此未来ARM是否可能对英特尔在数据中心服务器市场形成威胁,将值得观察。据日经新闻(Nikkei)网站报导,虽然当前全球高达95%的智能型手机均搭载基于ARM架构的芯片,不过在服务器芯片市场上ARM市占率却不到1%,由英特尔掌控该市场逾99%市占率。 业界人士指出,但在软银购并后,ARM将可在无需忧心市场投资人
[网络通信]
MSP430多处理器之间的通信方式及协议
摘 要:MSP430的功能已经非常强大,其片内外设丰富,适合众多的场合使用;但是在大型复杂的场合或者实时性要求较高的场合,使用一个处理器处理所有的业务,总是显得有些不足。引入多处理器协作工作的模式,可提高系统的实时性、可靠性和适用性;利用MSP430固有的特点,选择UART模式,采用.ModBus的通信协议,可进行不同处理器之间的数据交换。 关键词:多处理器 UART M0dBus MSP430 在单片机系统中,多处理器是指多个相同类型或者不同类型的单片机协作处理同一个系统的不同工作。它们之间必须具备一定的数据交换和协作处理能力,共同完成一个系统化的工作。不同处理器之间可以采用数据交换方式、并行总线方式、串行总线方式进行通信。
[工业控制]
ARM汇编,MCR和MRC
MRC 传送一个协处理器寄存器到一个 ARM 寄存器, MCR 做反方向传送(字母看起来象是写反了,记住在 ARM 汇编器中目的通常写在左边)。 MCR 传送 ARM 寄存器 Rd 的内容到协处理器。协处理器基于 ooo、dddd、qqq 和 MMMM 字段的值自由的做它想做的任何事情,尽管有一个 标准的 解释: 把它写到协处理器寄存器 CRN,使用操作 ooo,用 CRM 和 qqq 提供可能的补充控制。汇编语法是: MCR p,o,Rd,CRN,CRM,q给 MCR 指令的 Rd 不应该是 R15。 MRC 从协处理器传送一个单一的字并把它放置到 ARM 寄存器 Rd 中。协处理器使用与 MCR 相同的字段自由的以任何方式生成这
[单片机]
<font color='red'>ARM</font>汇编,MCR和MRC
ARM·移位指令
[单片机]
英伟达收购ARM,道路曲折
去年9月,英伟达宣布将以400亿美元收购ARM,如果这笔交易达成,将创下半导体行业单笔并购交易金额的记录。不过,这一交易从宣布之初就备受关注和争议。 英伟达创始人兼首席执行官黄仁勋说收购ARM是一生仅有一次的机会。ARM联合创始人Hermann Hauser却说这笔收购会是一场灾难,还建立了“Save ARM(拯救ARM)”的网站,呼吁更多人参与阻止ARM卖给英伟达。 这笔交易能否最终达成的关键是各国监管机构,Seeking Alpha网站的作者Paulo Santos对于几个重要国家和地区是否会通过这笔并购进行了分析,雷锋网进行了不改变愿意的编译。 尽管交易价格高昂,但英伟达从软银收购ARM看起来十分有趣,因
[嵌入式]
英伟达收购<font color='red'>ARM</font>,道路曲折
ARM LPC2101的无刷直流电机控制方案
  LPC2101是基于16/32位 ARM7 CPU嵌入高速Flash闪存的微控制器,具备高性能,小体积封装,低功耗,片上可选择多种外设等优点,应用范围很广。   其具备的多种32位和16位定时器、10位A/D转换器和每个定时器上PWM匹配输出特性,尤其适用于工业控制。   无刷直流电机是一种易驱动电机,适用于变速和启动转矩很高的应用,它的使用范围从大规模的工业模具到调光控制的小型电机(12V直流电机),外形和尺寸也是各种各样。   1 无刷直流电机的基本原理   无刷直流电机一般由定子、转子和金属壳体等组成,如图1所示,通过反向极性的吸引产生扭矩使电机运转。一旦转子开始运转,固定的刷子和转子部分将不断反复地连接、断开,电
[单片机]
<font color='red'>ARM</font> LPC2101的无刷直流电机控制方案
TQ210 —— LCD
一、LCD控制器 1、S5PV210 LCD控制器 要使一块LCD正常的显示文字或图像,不仅需要LCD驱动器,而且还需要相应的LCD控制器。在通常情况下,生产厂商把LCD驱动器会以COF/COG的形式与LCD玻璃基板制作在一起,而LCD控制器则是由外部的电路来实现,现在很多的MCU内部都集成了LCD控制器,如S5PV210等。通过LCD控制器就可以产生LCD驱动器所需要的控制信号来控制STN/TFT屏了。 LCD控制器可以通过编程支持不同LCD屏的要求,例如行和列像素数,数据总线宽度,接口时序和刷新频率等。 LCD控制器的主要作用,是将定位在系统存储器中的显示缓冲区中的LCD图像数据传送到外部LCD驱动器,并产生必要的控制信号
[单片机]
TQ210 —— LCD
3D集成电路的热问题和解决方案
翻译自—semiwiki 在DesignCon 2020大会上,ANSYS举办了一系列赞助演讲。我参加了其中的几场。这些活动都是由才华横溢、精力充沛的演讲者用他们的材料进行精彩的展示。DesignCon技术方案具有超前的纬度。其中一个是由乔治亚理工学院电子与计算机工程学院的Sung-Kyu Lim教授提出的——这个演示涉及到3D集成电路。 Lim教授的研究由DARPA、Arm和ANSYS资助。该讨论集中在用Arm A7和A53处理器构建的3D集成电路的热分析、IR-drop和PPA分析上。因为3D IC可以代表很多东西,所以Lim教授的重点是光模堆积。他用这些技术审查了来自GLOBALFOUNDRIES、英特尔(Intel)和
[半导体设计/制造]
3D集成电路的热问题和解决方案
小广播
添点儿料...
无论热点新闻、行业分析、技术干货……
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved