本开发板SDRAM的物理地址范围处于0x30000000 - 0x33FFFFFF,S3C2410/S3C2440的寄存器地址范围都处于0x48000000 - 0x5FFFFFFF。在第5章中,通过往GPBCON和GPBDAT这两个寄存器的物理地址0x56000010、0x56000014写入特定数据来驱动4个LED。
本章的实例中,将开启MMU,并将虚拟地址空间0xA0000000 - 0xA0100000映射到物理地址空间0x56000000 - 0x56100000上,这样,就可以通过操作地址0xA0000010、0xA0000014来达到驱动这4个LED的同样的效果。
另外,将虚拟地址空间0xB0000000 - 0xB3FFFFFF映射到物理地址空间0x30000000 - 0x33FFFFFF上,并在连接程序时将一部分代码的运行地址指定为0xB0004000(这个数值有些奇怪,看下去就会明白),看看能否使程序跳转到0xB0004000处执行。
本章程序只使用一级页表,以段的方式进行地址映射。32位CPU的虚拟地址空间达到4GB,一级页表中使用4096个描述符来表示这4GB空间(每个描述符对应1MB的虚拟地址),每个描述符占用4字节,所以一级页表占16KB。本实例使用SDRAM的开始16KB来存放一级页表,所以剩下的内存开始物理地址为0x30004000。
将程序代码分为两部分:第一部分的运行地址设为0,它用来初始化SDRAM、复制第二部分代码到SDRAM中(存放在0x30004000开始处)、设置页表、启动MMU,最后跳到SDRAM中(地址0xB0004000)去继续执行;第二部分的运行地址设为0xB0004000,它用来驱动LED。
程序源代码有3个文件:head.S、init.c、leds.c
(1)、head.S代码详解
head.S文件如下:
@*************************************************************************
@ File:head.S
@ 功能:设置SDRAM,将第二部分代码复制到SDRAM,设置页表,启动MMU,
@ 然后跳到SDRAM继续执行
@*************************************************************************
.text
.global _start
_start:
ldr sp, =4096 @ 设置栈指针,以下都是C函数,调用前需要 @ 设好栈
bl disable_watch_dog @ 关闭WATCHDOG,否则CPU会不断重启
bl memsetup @ 设置存储控制器以使用SDRAM
bl copy_2th_to_sdram @ 将第二部分代码复制到SDRAM
bl create_page_table @ 设置页表
bl mmu_init @ 启动MMU
ldr sp, =0xB4000000 @ 重设栈指针,指向SDRAM顶端(使用虚拟地址)
ldr pc, =0xB0004000 @ 跳到SDRAM中继续执行第二部分代码
halt_loop:
b halt_loop
head.S中调用的函数都在init.c中实现。
值得注意的是,在第15行开启MMU后,无论是CPU取指还是CPU读写数据,使用的都是虚拟地址。
在第14行设置页表时,在create_page_table函数中令head.S、init.c程序所在内存的虚拟地址和物理地址一样,这使得head.S和init.c中的代码在开启MMU后能够没有任何障碍地继续运行。
(2)init.c代码详解。
init.c中的disable_watch_dog、memsetup函数实现的功能在前面两章已经讨论过,不再重复,下面列出代码方便阅读。
/*
* init.c: 进行一些初始化,在Steppingstone中运行
* 它和head.S同属第一部分程序,此时MMU未开启,使用物理地址
*/
/* WATCHDOG寄存器 */
#define WTCON (*(volatile unsigned long *)0x53000000)
/* 存储控制器的寄存器起始地址 */
#define MEM_CTL_BASE 0x48000000
/*
* 关闭WATCHDOG,否则CPU会不断重启
*/
void disable_watch_dog(void)
{
WTCON = 0; // 关闭WATCHDOG很简单,往这个寄存器写0即可
}
/*
* 设置存储控制器以使用SDRAM
*/
void memsetup(void)
{
/* SDRAM 13个寄存器的值 */
unsigned long const mem_cfg_val[]={ 0x22011110, //BWSCON
0x00000700, //BANKCON0
0x00000700, //BANKCON1
0x00000700, //BANKCON2
0x00000700, //BANKCON3
0x00000700, //BANKCON4
0x00000700, //BANKCON5
0x00018005, //BANKCON6
0x00018005, //BANKCON7
0x008C07A3, //REFRESH
0x000000B1, //BANKSIZE
0x00000030, //MRSRB6
0x00000030, //MRSRB7
};
int i = 0;
volatile unsigned long *p = (volatile unsigned long *)MEM_CTL_BASE;
for(; i < 13; i++)
p[i] = mem_cfg_val[i];
}
copy_2th_to_sdram函数用来将第二部分代码(即由leds.c编译得来的代码)从Steppingstone中复制到SDRAM中,在连接程序时,第二部分代码的加载地址被指定为2048,重定位地址为0xB0004000,所以系统从NAND Flash启动后,第二部分代码就存储在Steppingstone中地址2048之后,需要把它复制到0x30004000处(此时尚未开启MMU,虚拟地址0xB0004000对应的物理地址在后面设为0x30004000)。Steppingstone总大小为4KB,不妨把地址2048之后的所有数据复制到SDRAM中,所以源数据的结束地址为4096。
copy_2th_to_sdram函数的代码如下:
/*
* 将第二部分代码复制到SDRAM
*/
void copy_2th_to_sdram(void)
{
unsigned int *pdwSrc = (unsigned int *)2048;
unsigned int *pdwDest = (unsigned int *)0x30004000;
while (pdwSrc < (unsigned int *)4096)
{
*pdwDest = *pdwSrc;
pdwDest++;
pdwSrc++;
}
}
剩下的create_page_table、mmu_init就是本章的重点了,前者用来设置页表,后者用来开启MMU。
先看看create_page_table函数。它用于设置3个区域的地址映射关系。
(1)将虚拟地址0 - (1M - 1)映射到同样的物理地址去,Steppingstone(从0地址开始的4KB内存)就处于这个范围中。使虚拟地址等于物理地址,可以让Steppingstone中的程序(head.s和init.c)在开启MMU前后不需要考虑太多的事情。
(2)GPIO寄存器的起始物理地址范围为0x56000000,将虚拟地址0xA0000000 - (0xA0000000 + 1M - 1)映射到物理地址0x56000000 - (0x56000000 + 1M - 1)。
(3)本开发板中SDRAM的物理地址范围为0x30000000 - 0x33FFFFFF,将虚拟地址0xB0000000 - 0xB3FFFFFF映射到物理地址0x30000000 - 0x33FFFFFF。
create_page_table函数代码如下:
/*
* 设置页表
*/
void create_page_table(void)
{
/*
* 用于段描述符的一些宏定义
*/
#define MMU_FULL_ACCESS (3 << 10) /* 访问权限 */
#define MMU_DOMAIN (0 << 5) /* 属于哪个域 */
#define MMU_SPECIAL (1 << 4) /* 必须是1 */
#define MMU_CACHEABLE (1 << 3) /* cacheable */
#define MMU_BUFFERABLE (1 << 2) /* bufferable */
#define MMU_SECTION (2) /* 表示这是段描述符 */
#define MMU_SECDESC (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
MMU_SECTION)
#define MMU_SECDESC_WB (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)
#define MMU_SECTION_SIZE 0x00100000
unsigned long virtuladdr, physicaladdr;
unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;
/*
* Steppingstone的起始物理地址为0,第一部分程序的起始运行地址也是0,
* 为了在开启MMU后仍能运行第一部分的程序,
* 将0~1M的虚拟地址映射到同样的物理地址
*/
virtuladdr = 0;
physicaladdr = 0;
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC_WB;
/*
* 0x56000000是GPIO寄存器的起始物理地址,
* GPBCON和GPBDAT这两个寄存器的物理地址0x56000010、0x56000014,
* 为了在第二部分程序中能以地址0xA0000010、0xA0000014来操作GPBCON、GPBDAT,
* 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间
*/
virtuladdr = 0xA0000000;
physicaladdr = 0x56000000;
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC;
/*
* SDRAM的物理地址范围是0x30000000~0x33FFFFFF,
* 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上,
* 总共64M,涉及64个段描述符
*/
virtuladdr = 0xB0000000;
physicaladdr = 0x30000000;
while (virtuladdr < 0xB4000000)
{
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC_WB;
virtuladdr += 0x100000;
physicaladdr += 0x100000;
}
}
mmu_tlb_base被定义为unsigned long指针,所指向的内存为4字节,刚好是一个描述符的大小。在SDRAM的开始存放页表——第84行令mmu_tlb_base指向SDRAM的起始地址0x30000000。其中最能体现页表结构的代码是第93、104、116行。
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC_WB;
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC;
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC_WB;
虚拟地址的位[31:20]用于索引一级页表,找到它所对应的描述符,对应于“(virtuladdr >> 20)”。
如图7.13所示,段描述符中位[31:20]中保存段的物理地址,对应于“physicaladdr & 0xFFF00000”。
位[11:0]中用来设置段的访问权限,包括所属的域、AP位、C位(是否可Cache)、B位(是否使用Write buffer)——这对应于“MMU_SECDESC”或“MMU_SECDESC_WB”,它们的域都被设置为0,AP位被设为0b11(根据表7.2可知,它所在的域进行权限检查,则读写操作都被允许)。“MMU_SECDESC”中C/B位都没有设置,表示不使用Cache和Write buffer,所以映射寄存器空间时使用“MMU_SECDESC”。“MMU_SECDESC_WB”中C/B位都设置了,表示使用Cache和Write buffer,即所谓回写式,在映射Steppingstone和SDRAM等内存时使用“MMU_SECDESC_WB”。
现在来看看mmu_init函数。create_page_table函数设置好了页表,还需要把页表地址告诉CPU,并且在开启MMU之前做好一些准备工作,比如使无效ICache和DCache,设置域访问控制寄存器等。代码的注释就可以帮助读者很好的理解mmu_init函数,不再重复。代码如下:
/*
* 启动MMU
*/
void mmu_init(void)
{
unsigned long ttb = 0x30000000;
__asm__(
"mov r0, #0\n"
"mcr p15, 0, r0, c7, c7, 0\n" /* 使无效ICaches和DCaches */
"mcr p15, 0, r0, c7, c10, 4\n" /* drain write buffer on v4 */
"mcr p15, 0, r0, c8, c7, 0\n" /* 使无效指令、数据TLB */
"mov r4, %0\n" /* r4 = 页表基址 */
"mcr p15, 0, r4, c2, c0, 0\n" /* 设置页表基址寄存器 */
"mvn r0, #0\n"
"mcr p15, 0, r0, c3, c0, 0\n" /* 域访问控制寄存器设为0xFFFFFFFF,
* 不进行权限检查
*/
/*
* 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位,
* 然后再写入
*/
"mrc p15, 0, r0, c1, c0, 0\n" /* 读出控制寄存器的值 */
/* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM
* R : 表示换出Cache中的条目时使用的算法,
* 0 = Random replacement;1 = Round robin replacement
* V : 表示异常向量表所在的位置,
* 0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000
* I : 0 = 关闭ICaches;1 = 开启ICaches
* R、S : 用来与页表中的描述符一起确定内存的访问权限
* B : 0 = CPU为小字节序;1 = CPU为大字节序
* C : 0 = 关闭DCaches;1 = 开启DCaches
* A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查
* M : 0 = 关闭MMU;1 = 开启MMU
*/
/*
* 先清除不需要的位,往下若需要则重新设置它们
*/
/* .RVI ..RS B... .CAM */
"bic r0, r0, #0x3000\n" /* ..11 .... .... .... 清除V、I位 */
"bic r0, r0, #0x0300\n" /* .... ..11 .... .... 清除R、S位 */
"bic r0, r0, #0x0087\n" /* .... .... 1... .111 清除B/C/A/M */
/*
* 设置需要的位
*/
"orr r0, r0, #0x0002\n" /* .... .... .... ..1. 开启对齐检查 */
"orr r0, r0, #0x0004\n" /* .... .... .... .1.. 开启DCaches */
"orr r0, r0, #0x1000\n" /* ...1 .... .... .... 开启ICaches */
"orr r0, r0, #0x0001\n" /* .... .... .... ...1 使能MMU */
"mcr p15, 0, r0, c1, c0, 0\n" /* 将修改的值写入控制寄存器 */
: /* 无输出 */
: "r" (ttb) );
}
mmu_init函数在C语言中嵌入了汇编指令。
第二部分代码leds.c中只有两个函数:wait和main。wait函数用来延迟时间,main函数用来循环点亮4个LED。与前面两章所用的leds.c有两点不同。
(1)操作GPBCON、GPBDAT两个寄存器时使用虚拟地址0xA0000010、0xA0000014,在init.c中已经把虚拟地址0xA0000000 - (0xA0000000 + 1M - 1)映射到物理地址0x56000000 - (0x56000000 + 1M -1);
(2)在定义wait函数时使用了一点小技巧,将它定义成”static inline”类型,原因在源码的第15行给出。
leds.c代码如下:
/*
* leds.c: 循环点亮4个LED
* 属于第二部分程序,此时MMU已开启,使用虚拟地址
*/
#define GPBCON (*(volatile unsigned long *)0xA0000010) // 物理地址0x56000010
#define GPBDAT (*(volatile unsigned long *)0xA0000014) // 物理地址0x56000014
#define GPB5_out (1<<(5*2))
#define GPB6_out (1<<(6*2))
#define GPB7_out (1<<(7*2))
#define GPB8_out (1<<(8*2))
/*
* wait函数加上“static inline”是有原因的,
* 这样可以使得编译leds.c时,wait嵌入main中,编译结果中只有main一个函数。
* 于是在连接时,main函数的地址就是由连接文件指定的运行时装载地址。
* 而连接文件mmu.lds中,指定了leds.o的运行时装载地址为0xB4004000,
* 这样,head.S中的“ldr pc, =0xB4004000”就是跳去执行main函数。
*/
static inline void wait(unsigned long dly)
{
for(; dly > 0; dly--);
}
int main(void)
{
unsigned long i = 0;
// 将LED1-4对应的GPB5/6/7/8四个引脚设为输出
GPBCON = GPB5_out|GPB6_out|GPB7_out|GPB8_out;
while(1){
wait(30000);
GPBDAT = (~(i<<5)); // 根据i的值,点亮LED1-4
if(++i == 16)
i = 0;
}
return 0;
}
Makefile内容如下:
objs := head.o init.o leds.o
mmu.bin : $(objs)
arm-linux-ld -Tmmu.lds -o mmu_elf $^
arm-linux-objcopy -O binary -S mmu_elf $@
arm-linux-objdump -D -m arm mmu_elf > mmu.dis
%.o:%.c
arm-linux-gcc -Wall -O2 -c -o $@ $<
%.o:%.S
arm-linux-gcc -Wall -O2 -c -o $@ $<
clean:
rm -f mmu.bin mmu_elf mmu.dis *.o
Makefile中第4行命令用来连接程序,它使用连接脚本mmu.lds来控制连接器的行为。文件mmu.lds内容如下:
SECTIONS {
firtst 0x00000000 : { head.o init.o }
second 0xB0004000 : AT(2048) { leds.o }
}
连接脚本mmu.lds将程序分为两个段:first和second。前者由head.o和init.o组成,它的加载地址和运行地址都是0,所以运行前不需要重新移动代码。后者由leds.o组成,它的加载地址为2048,重定位地址为0xB0004000,这表明段second存放在编译所得映像文件地址2048处,在运行前需要将它复制到地址0xB0004000处,这由init.c中的copy_2th_to_sdram函数完成(注意,此函数将代码复制开始地址为0x30004000的内存中,这是开启MMU后的虚拟地址0xB0004000对应的物理地址)。
上一篇:用ARM编写的4*4键盘
下一篇:关于S3C2440时钟设置的理解
推荐阅读最新更新时间:2024-03-16 15:04