ARM芯片的核心,即CPU内核(ARM720T)由一个ARMTTDMI 32位RISC处理器、一个单一的高速缓冲8KB Cache和一个存储空间管理单元(MMU)所构成。8KB的高速缓冲有一个四路相连寄存器,并被组织成52线四字(4×52×4字节)。高速缓冲直接与ARMTTDMI相连,因而高速缓冲来自CPU的虚拟地址。当所需的虚拟地址不在高速缓冲中时,由MMU将虚拟地址转换为物理地址。一个64项的转换旁路缓冲器(TLB)用来加速地址转换过程,并减少页表读取所需的总线传送。通过转换高速缓冲中未存储的地址,MMU就能够节约功率。通过内部数据总线和扩展并行总线,ARM可以和存储器(SRAM/Flash/Nand-Flash等)、用户接口(LCD控制器/键盘/GPIO等)、串行口(UARTs/红外IrDA等)相连。
一个ARM720T内核基本由以下四部分组成:
(1)ARMTTDMI CPU核。该CPU核支持Thumb指令集、核调试、增强的乘法器、JTAG以及嵌入式ICE。它的时钟频率可编程为18MHz、36MHz、49MHz、74MHz。
(2)存储空间管理单元(MMU)与ARM710核兼容,并增加了对Windows CE的支持。该存储空间管理单元提供了地址转换和一个有64项的转换旁路缓冲器。
(3)8KB单一指令和数据高速缓冲存储器以及一个四路相联高速缓冲存储器控制器。
(4)写缓冲器Write Buffer。
ARM内核
ARM7 系列
ARM7TDMI是ARM7系列中使用最广泛的,它是从最早实现32位地址空间编程模式的ARM6内核发展而来的,并增加了64位乘法指令,支持片上调试、16位Thumb指令集和EmbeddedICE观察点硬件。ARM7TDMI属于ARM v4体系结构,采用冯诺伊曼结构,3级流水处理,平均0.9DMIPs/Mhz性能。不过ARM7TDMI没有MMU(Memory Management Unit)和Cache,所以仅支持那些不需要MMU和Cahce的小型实时操作系统,如VxWorks、uC/OS-II和uLinux等RTOS。其他的ARM7系列内核还有ARM720T和ARM7E-S等。
ARM9 系列
ARM9TDMI相比ARM7TDMI,将流水级数提高到5级从而增加了处理器的时钟频率,并使用指令和数据存储器分开的哈佛结构以改善CPI和提高处理器性能,平均可达1.1DMIPs/Mhz,但是ARM9TDMI仍属于ARM v4T体系结构。在ARM9TDMI基础上又有ARM920T、ARM940T和ARM922T,其中ARM940T增加了MPU(Memory Protect Unit)和Cache;ARM920T和ARM922T加入了MMU、Cache和ETM9(方便进行CPU实时trace),从而更好的支持象Linux和WinCE这样的多线程、多任务操作系统。
ARM9E 系列
ARM9E系列属于ARM v5TE,在ARM9TDMI的基础上增加了DSP扩展指令,是可综合内核,主要有ARM968E-S、ARM966E-S、ARM946E-S和ARM926EJ-S(v5TEJ指令体系,增加了Java指令扩展),其中ARM926EJ-S是最具代表性的。通过DSP和Java的指令扩展,可获得70%的DSP处理能力和8x的Java处理性能提升。另外分开的指令和数据Cache结构进一步提升了软件性能;指令和数据TCM(Tightly Couple Memory:紧耦合存储器)接口支持零等待访问存储器;双AMBA AHB总线接口等。ARM926EJ-S可达250Mhz以上的处理速度,很好地支持Symbian OS、Linux、Windows CE和Palm OS等主流操作系统。
ARM11 系列
ARM11系列主要有ARM1136、ARM1156、ARM1176和ARM11 MP-Core等,它们都是v6体系结构,相比v5系列增加了SIMD多媒体指令,获得1.75x多媒体处理能力的提升。另外,除了ARM1136外,其他的处理器都支持AMBA3.0-AXI总线。ARM11系列内核最高的处理速度可达500Mhz以上(其中90nm工艺下,ARM1176可达到750Mhz)以及600DMIPS的性能,请参考和图3相关描述。
基于ARMv6架构的ARM11系列处理器是根据下一代的消费类电子、无线设备、网络应用和汽车电子产品等需求而制定的。其的媒体处理能力和低功耗特点使它特别适合于无线和消费类电子产品;其高数据吞吐量和高性能的结合非常适合网络处理应用;另外,在实时性能和浮点处理等方面ARM11可以满足汽车电子应用的需求。
ARM Cotex 系列
Cortex系列是ARM公司目前最新内核系列,属于v7架构,主要有Cortex-A8、Cortex-R4、Cortex-M3和
Cortex-M1等处理器,其中A8是面向高性能的应用处理器,最高可达1Ghz的处理速度,更好的支持多媒体及其他高性能要求,最高可达2000DMIPS;R4主要面向嵌入式实时应用领域(Real-Time),7级流水结构,相对于上代ARM1156内核,R4在性能、功耗和面积(PPA:Performance,Power and Area)取得更好的平衡,>1.5DMIPS/Mhz和高于400Mhz的处理速度。而M3主要是面向低成本和高性能的MCU应用领域,相比ARM7TDMI,M3面积更小,功耗更低,性能更高。Cortex-M3处理器的核心是基于哈佛架构的3级流水线内核,该内核集成了分支预测,单周期乘法,硬件除法等众多功能强大的特性,使其在Dhrystone benchmark上具有出色的表现(1.25 DMIPS/MHz)。根据Dhrystone benchmark的测评结果,采用新的Thumb.-2指令集架构的Cortex-M3处理器,与执行Thumb指令的ARM7TDMI-S.处理器相比,每兆赫的效率提高了70%,与执行ARM指令的ARM7TDMI-S处理器相比,效率提高了35%。
上一篇:基于S3C6410的ARM11学习(十六) 外部中断
下一篇:为你介绍ARM异常中断返回的几种情况
推荐阅读最新更新时间:2024-11-05 14:19
设计资源 培训 开发板 精华推荐
- LT2940IDD 宽输入范围 10W PWM 热源的典型应用电路
- ne555_cd4017
- 使用 Intel 的 82801GB ICH7 的参考设计
- 使用 NXP Semiconductors 的 MAX3232CP 的参考设计
- DC1322A,演示电路是一种高电流电容充电电路,采用 LT3751EUFD DC/DC 反激式转换器
- LF50CDT-TR 5V低压灯泡典型应用
- LTC3588IMSE-1 3.3V 压电能量收集器的典型应用电路为具有无线发送器和 50mA 负载阶跃响应的微处理器供电
- 具有集成电感器的 EP53A8LQA 1A PowerSoC 电压模式同步 PWM 降压的典型应用
- 具有延迟启动的 TS2596SCP550 RO 2A、5V、150KHz 降压 DC-DC 转换器的典型(可调输出电压版本)应用
- AM6TW-2405DH35Z ±5V 6 瓦单路输出 DC-DC 转换器的典型应用