ARMv7-A 的 MMU 浅析

发布者:不见南师久最新更新时间:2021-10-26 来源: eefocus关键字:MMU  物理地址 手机看文章 扫描二维码
随时随地手机看文章

MMU 是硬件对内存管理的支持,具体的,每个处理器之间或多或少有一些差异,而每个处理器的不同架构之间的实现也有差别,技术不断在进步,而实际的需求,性能的提升,使用场景的复杂化,都促使其不断的发展。


MMU 主要功能之一是虚拟地址到物理地址的转换,这个需要软件和硬件配合完成,软件需要针对不同的硬件进行策略。这里主要分析 ARMv7-A 体系架构下的 MMU 的基本原理。


ARM 官方的 datasheet 的下载链接 :


ARMv7-A_and_R_Architecture_Reference_Manual:


https://developer.arm.com/docs/ddi0406/latest


在这篇 Datasheet 中,


B3 Virtual Memory System Architecture (VMSA)


章节介绍了虚拟内存系统相关的内容


VMSA 是针对 ARMv7-A 架构的虚拟内存系统架构,与 VMSA 对应的还有 PMSA,这个是 ARMv7-R 系列的处理器支持的内存保护系统架构,这里不做研究,仅仅初探 ARMv7-A 系列相关的内容。


1. 简介

ARMv7 的 VMSA 包含安全扩展,多核处理器扩展、大物理地址扩展、TrustZone扩展、虚拟化扩展。若支持大的物理地址,则必须支持多核处理器;若支持虚拟化,则必须支持大的物理地址、多核处理器、TrustZone。加入这些扩展后,相应的MMU(虚拟地址到物理地址的隐射功能)结构也改变了许多。本文首先分析加入扩展后MMU的整体结构,然后详细介绍地址转换中用到短描述符格式(32位)和长描述符格式(64位),以及如何实现虚拟地址到物理地址的查询。


在 ARMv7 的 VMSA 中,MMU 控制了地址转换(虚拟到物理),权限控制。MMU 的控制是通过系统控制寄存器来进行配置(system control registers),当然,也支持关闭 MMU 功能。


ARMv7-R 结构的 VMSAv7 根据处理器的实现和具体场景,支持的情况不一样,分为几种情况,而每种情况又分为不同的 stage:


对于扩展的 VMSAv7 来说分为 Secure 和 non-Secure:


Secure state 下 对于 memory system control 只有一个 stage

Non-Secure state 下,对于 memory system control :

当处理器在 PL2 的时候,只有一个 stage

当处理器在 PL0 或者 PL1 的时候,有两个 stage

所以展开来说,分为:


Secure PL1&0 stage 1 MMU

Non-secure PL2 stage 1 MMU

Non-secure PL1&0 stage 1 MMU

Non-secure PL1&0 stage 2 MMU.

同时,一个 CPU 的实现中,如果没有包含 Virtualization Extensions 的话,那么


不支持在 PL2 执行

在 Non-Secure 下,仅仅支持 Non-Secure PL1 & 0 stage 1 的 MMU

先扯一些题外话,关于 ARMv7 架构的一些东东:


在 ARMv7 架构上,比较突出的特性是支持了:包括大内存(Large Memory)、虚拟化(Virtualization)和安全(Security)。


1. 大内存(Large Memory):


由于处理器性能越来越强,运行于其上的软件也来越复杂,复杂到单一应用对内存的需求可能超出32-bit架构所能支持的最大内存(4G),这就是Large memory需求的起因。不过,后来的Cortex-A15(ARMv7架构)通过 Large Physical Address Extensions (LPAE) 技术,可以支持高达40bits的物理地址空间。但受限于32-bit的指令集,虚拟地址空间依旧只有32bits(4G),如果有应用需要更大的虚拟内存,怎么办?只能定义一个新的架构,使用64-bit的指令集(也即我们常说的ARM64)。


2. 虚拟化(Virtualization)和安全(Security):


ARM v6引入了security extension,把硬件资源划分成了两个部分secure world和normal world。当 CPU 运行在 secure world 的时候,它可以访问所以的硬件资源,但当CPU运行在normal world的时候,它只能访问normal world的资源。


ARM v7引入了virtualization extension,在 normal world 里面加入了一个新的CPUmode:HYP mode。


这样CPU 在normal world运行的时候就有三种模式:USR mode, SVC mode和 HYP mode,分别对应 PL0, PL1, PL2 (PL:privilege level),number越大,权限越高。


我对这里所说的权限的理解是:寄存器的访问和指令的执行。比如说一些特殊的寄存器(HVBAR)只能再HYP mode里面才能访问,一些特殊的指令(HVC)只能再SVC 或者 HYP mode执行。而CPU处于哪个模式是由CPSR这个寄存器决定的。


PL0进PL1通过SWI指令(system call),PL1回PL0通过复原CPSR。


类似的,hypervisor也是由HYP exception vector和handler。一个最简单的hypervisor就是HVBAR寄存器定义vector的位置,在offset 0x14的地方放一个eret指令。这样的hypervisor可以处理kernel发起的HVC call


与 PL0、PL1、PL2 对应的是 CPU mode


usr,只在PL0中使用,可以是安全或者非安全的,一般情况下,用户软件处于非安全态的usr下,而secure的应用程序则处于安全的usr下

sys, und, fiq, irq, svc, abt,只在PL1中,可以是安全或者非安全的,一般情况下,非安全的os或者虚拟扩展下的guest os位于非安全的mode下,而secure os位于安全的mode下

hyp, 只能在非安全态的PL2中,一般情况下,虚拟扩展的hypervisor实现在这个模式

2.  ARMv7-A MMU 特性

2.1 权限控制

对于指令和数据,支持:


no access

read-only

write-only

read/write

 

2.2 地址翻译

地址翻译单元的输入是虚拟地址,输出是物理地址,由于存在几种不同的配置,所以 MMU 的地址转换分为如下几种情况:

而这几种模式下,修改的寄存器也不一样:

所以最后对应的图为:

安全模式的PL1&0隐射,页表控制寄存器TTBCR,页表基址寄存器TTBR0/TTBR1,这些寄存器需要在S模式的PL1设置;


非安全模式的PL2隐射,页表控制寄存器HTCR,页表基址寄存器HTTBR,需要在NS的PL2设置;


非安全模式的PL1&0的一级映射,页表控制寄存器TTBCR,页表基址寄存器TTBR0/TTBR1,需要在NS模式的PL1设置;


非安全模式的PL1&0的二级映射,页表控制寄存器VTCR,页表基址寄存器VTTBR,需要在NS的PL2设置;


2.2.1 地址描述符

地址描述符分为两种:


短描述符和长描述符,长描述符是针对大物理地址扩展,这里仅仅简单分析短描述符


短描述符


在 datasheet 的 B3.5 章节有比较详细的描述,主要讲了短描述符的分类,寄存器的配置,以及怎么去进行 table walk 的


短描述符的分类:


(1) SuperSection:24位。16MB 的 blocks,可选的,主要是支持大物理地址扩展必须支持


(2) Section: 20位。1MB 的 blocks


(3) Large pages : 16位。64KB 的 blocks


(4) Small pages : 12位。4KB 的 blocks (Linux 用这种)


当使用短描述符的时候(short-descriptor)的 translation table format 的时候,硬件支持两级页表,主要描述这个的有几个寄存器:


TTBCR


TTBR0


TTBR1


如果 SuperSection 或者 Section 的话,只需要一级页表即可,如果支持 4KB 或者 64KB 的页面,需要用到二级页表。以 4KB 的页映射为例:

当 TLB Miss 的时候,处理器进行 table walk:


1. 根据 TTBCR 寄存器和虚拟地址来判断使用哪个页表基地址寄存器(TTBR0 或者 TTBR1)。其中放置了一级页表的基地址


2. 处理器根据虚拟地址的 bit[31:20]作为索引,在一级页表中查找页表项,一级页表一共有 4096 个 页表项(4K 个 entry)


3. 一级页表的表象中存放了二级页表的基地址,处理器根据虚拟地址的 bit[19:12]作为索引值,在二级页表中找到对应的表,二级页表一个 256 个表项


4. 二级页表的页表项里面存放了又 4KB 页的物理基地址,加上最后的 bit[11:0] 的offset,寻找到最终的物理内存


4KB 映射的一级页表表项和二级页表的表项其实也是 32bits 的,只不过其他的一些 bit 被硬件用作其他作用:


一级表项:

二级页表项是:

TTBR0 或者 TTBR1 的选取:


根据 TTBCR.N 中的这个 N 的值来进行选取:


如果 N = 0 的话,则一直使用 TTBR0


如果 N > 0 的话,则 bits [31:31-N] 的虚拟地址部分,如果全部等于 0,则使用 TTBR0 ,否则使用 TTBR1


官方文档上的虚拟地址到物理地址的转换过程如下(这里仅仅分析 Small page 也就是 4K 的情况,其他的情况请自行阅读文档):

参考文献:


https://blog.csdn.net/zzk315/article/details/53075073


http://www.cnblogs.com/fozu/p/4601291.html


https://zhuanlan.zhihu.com/p/21300203


http://www.wowotech.net/armv8a_arch/armv8-a_overview.html

关键字:MMU  物理地址 引用地址:ARMv7-A 的 MMU 浅析

上一篇:ARMv7-A 处理器窥探(2) —— CP15 协处理器
下一篇:一文看懂ARM Cortex-M处理器

小广播
设计资源 培训 开发板 精华推荐

最新单片机文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved