ARM体系的嵌入式系统BSP的程序设计

发布者:Yinyue1314最新更新时间:2011-01-19 关键字:ARM  嵌入式系统  BSP 手机看文章 扫描二维码
随时随地手机看文章

  arm公司在32位RISC的CPU开发领域不断取得突破,其结构已经从V3发展到V6。

  BSP(Board Support Package)板级支持包介于主板硬件和操作系统之间,其功能与PC机上的BIOS相类似,主要完成硬件初始化并切换到相应的操作系统。BSP是相对于操作系统而言的,不同的操作系统对应于不同定义形式的BSP,例如VxWorks的BSP和Linux的BSP相对于某一CPU来说,尽管实现的功能一样,可是写法和接口定义是完全不同的。另外,仔细研究所用的芯片资料也十分重要,例如尽管arm在内核上兼容,但每家芯片都有自己的特色。所以这就要求BSP程序员对硬件、软件和操作系统都要有一定的了解。

  本文介绍基于arm体系的嵌入式应用系统初始化部分BSP的程序设计。本文引用的源码全部是基于HMS320C7202芯片设计,并已成功运行。

  1 初始化过程

  尽管各种嵌入式应用系统的结构及功能差别很大,但其系统初始化部分完成的操作有很大一部分是相似的。嵌入式系统的启动流程如图1所示。

  1.1 设置入口指针

  启动程序首先必须定义指针,而且整个应用程序只有一个入口指针。一般地,程序在编译链接时将异常中断向量表链接在0地址处,并且作为整个程序入口点。入口点代码如下:

  ENTRY(_start) ;开始

  1.2 设置异常中断向量表

  arm要求中断向量表必须放置在从0开始、连续8×4字节的空间内。各异常中断向量地址以及中断的算是优先级如表1:

中断向量地址 异常中断类型 异常中断模式 优先级(6最低)
0x0 复位 特权模式(SVC) 1
0x4 未定义中断 未定义指令中止模式(Undef) 6
0x8 软件中断(SWI) 特权模式(SVC) 6
0x0c 指令预取中止 中止模式 5
0x10 数据访问中止 中止模式 2
0x14 保留 未使用 未使用
0x18 外部中断请求(IRQ) 外部中断(IRQ)模式 4
0x1c 快速中断请求(FIQ) 快速中断(FIQ)模式 3

                                             表1 各异常中断的中断向量地址以及中断的处理优先级 

  中断向量地址 异常中断类型 异常中断模式 优先级(6最低)

  0x0 复位 特权模式(SVC) 1

  0x4 未定义中断 未定义指令中止模式(Undef) 6

  0x8 软件中断(SWI) 特权模式(SVC) 6

  0x0c 指令预取中止 中止模式 5

  0x10 数据访问中止 中止模式 2

  0x14 保留 未使用 未使用

  0x18 外部中断请求(IRQ) 外部中断(IRQ)模式 4

  0x1c 快速中断请求(FIQ) 快速中断(FIQ)模式 3

  每当一个中断发生后,ARM处理器便强制把程序计数器(PC)指针置为向量表中对应中断类型的地址值。因为每个中断向量仅占据放置1条arm指令的空间,所以通常放置1条跳转指令或向程序计数器(PC)寄存器赋值的数据访问指令,使程序跳转到相应的异常中断处理程序执行。如果异常中断处理程序起始地址小于32MB,使用B跳转指令;如果跳转范围大于32MB,使用LDR指令。

  另外,对于各未用中断,可使其指向一个只含返回指令的哑函数,以防止错误中断引起系统的混乱。

  1.3 初始化存储系统

  初始化存储系统的编程对象是系统的存储器控制器,一个系统可能存在多种存储器类型的接口,不同的存储系统的设计不尽相同。Flash和SRAM同属于静态存储器类型,可以合用一个存储器端口;而DRAM因为有动态刷新和地址线复用等特性,通常配有专用的存储器端口。其中,SDRAM必须在初始化阶段进行设置,因为大部分的程序代码和数据都要在SDRAM中运行。

  在HMS30C7202中,与SDRAM配置有关的寄存器有4个:配置寄存器、刷新定时寄存器、写缓冲写回寄存器和等待驱动寄存器,需要根据实际的系统设计对此分别加以正确配置。

  SDRAM的初始化过程如下:加电→延迟10ms(各具体SDRAM器件延时时间可能不同)→设置配置寄存器参数→延时→写刷新定时寄存器,设置刷新周期→延时→使能自动刷新→延时→设置模式寄存器(位于SDRAM内部)。

  1.4 存储器地址分布重映射(remap)和MMU

  系统一上电,程序将自动从0地址处开始执行。因此,必须保证在0地址处存在正确的代码,即要求0地址开始入是非易失性的ROM或Flash等。但是因为ROM或Flash的访问速度相对较慢,每次中断响应发生后,都要从读取ROM或Flash上面的向量表开始,影响了中断响应速度。一般程序执行后将SDRAM映射为地址0,并把系统程序加载到SDRAM中运行,其具体步骤可以采用以下的方案:

  (1)上电后,从0地址的ROM开始往下执行;

  (2)根据映射前的地址,对SDRAM进行必要的代码和数据拷贝;

  (3)拷贝完成后,进行重映射操作;

  (4)因为RAM在重映射前准备好了内容,使得PC指针能继续在RAM里取得正确的指令。

  在这种地址映射的变化过程中,程序员需要仔细考虑的是:程序的执行流程不能被这种变化所打断,注意保证程序流程在重映射前后的承接关系。

  存储器的地址分配是很灵活的,可以将I/O操作映射成内存操作,也可以通过映射对某些不可访问的地址空间进行保护等。进行存储器初始化设计时,一定要根据应用程序的具体要求来完成地址分配。对地址管理通过MMU即存储器管理单元实现。

  在arm系统中,MMU通过页式虚拟存储管理,将虚拟空间和物理空间分别分成一个个固定大小的页,并建立两者之间的映射关系,从而实现虚拟地址到物理地址的转换。MMU还可完成存储器访问权限的控制和虚拟存储器空间缓冲特性的设置。

  以下是实现MMU的部分代码:

  for=(i=1;i<0x1000;i++){pagetable[i]=(i<<20)|MMU_SECDESC;} //建立页表,每页大小为1MB,页表偏移序号是物理地址的高12位;

  for(addr=SDRAM_BASE;addr<(SDRAM_BASE+SDRAM_SIZE/2);addr+=SIZE_1M)

  pagetable[addr>>20]=addr|MMU_SECDESE|MMU_CACHEABLE|MMU_BUFFERABLE;

  //将SDRAM_BASE至(SDRAM_BASE+SDRAM_SIZE/2)空间的设置为不可CACHE和不可BUFFER的for

  (addr=SDRAM_BASE+SDRAM_SIZE/2;addr<    (SDRAM_BASE+SDRAM_SIZE);addr+=SIZE_1M)

  pagetable[addr>>20]=(addr+0x1000000)|MMU_SECDESC|MMU_CACHEABLE|MMU_BUFFERABLE;

  //将这段空间的地址映射关系设置为VA(虚拟地址)=PA(物理地址)+0x1000000pagetable[0]=(0x42f00000)|MMU_SECDESC|MMU_CACHEABLE|MMU_BUFFERABLE;

  //将SDRAM的虚拟地址0x42f00000映射到0处

  1.5 初始化各模式下的堆栈指针

  因为arm处理器有7种执行状态,每一种状态的堆栈指针寄存器(SP)都是独立的(System和User三项式使用相同SP寄存器)。因此,对程序中需要用到的每一种模式都要给SP寄存器定义一个堆栈地址。

  方法是改变状态寄存器(CPSR)内的状态位,使处理器切换到不同的状态,然后给SP赋值。这里列出的代码定义了三种模式的SP指针,其中,I_Bit表示IRQ的中断禁止位;F_Bit表示FIQ的中断禁止位:

  @;Set up SVC stack to be 4K on top of zero-init data

  LDR r1,=installStack

  ADDsp,r1,#2048

  @;Set up IRQ and FIQ stacks

  MOV r0,#(Mode_IRQ32|I_Bit)

  MSRcpsr,r0

  MOV r0,r0

  ADDsp,r1,#2048*2

  MOV r0,#(Mode_FIQ32|I_Bit |F_Bit)

  MSR cpsr,r0

  MOV r0,r0

  ADDsp,r1,#2048*3

  一般堆栈的大小要根据需要而定,但是要尽可能给堆栈分配快速和高带宽的存储器。堆栈性能的提高对系统性能的影响是非常明显的。

  1.6 初始化有特殊要求的端口、设备

  有些关键的I/O部件必须在使能IRQ和FIQ之前进行初始化。因为如果在使能IRQ和FIQ之前没有进行初始化,可以产生假的异常中断信号。程序中初始化了HMS30C7202的串口1用来调试程序与其它设备通信。串口1是一个通用全双工异步接收/发送器(UART),它支持16C550的大部分功能。UART有接收缓冲/发送保持寄存器、波特率除数锁存器、中断允许寄存器等9个寄存器。对串口1的初始化主要是对各寄存器的设置,其实现代码如下所示:

  _outb(ser_base+0x30,1);

  _outw(0x8002301c,0xffff9f9f) ;GPIO PORT A Enable

  Register

  _outw(0x800230A4,0x6060) ;GPIO PORT A MultiFunction elect-Register

  serial_outb(SERIAL_LCR,0x80);

  serial_outb(SERIAL_LCR,0x80);

  serial_outb(SERIAL_DLL,baud_data[cur_baud]);

  serial_outb(SERIAL_DLM,0x0);

  serial_outb(SERIAL_LCR,0x03);

  seial_outb(SERIAL_FCR,0x01);

  serial_outb(SERIAL_IER,0x00);

  serial_outb(SERIAL_MCR,0x03);

  1.7 切换处理器模式,开中断

  最后转换到应用程序运行所需的最终模式,一般是User模式。不要过早切换到User模式进行User模式的堆栈设备。因为进入User模式后就不能再操作CPRS回到别的模式了,可能会对接下去的程序执行造成影响。

  这时才使能异常中断,通过清除CPRS寄存器中的中断禁止位实现。如果过早地开中断,在系统初始化之前就触发了有效中断,会导致系统的死机。

  1.8 呼叫主应用程序

  当所有的系统初始化工作完成后,就需要把程序流程转入主应用程序。

  2 技术难点分析

  2.1 多种语言的混合编程

  ARM有两种汇编指令集:16位THUMB指令集和32位ARM指令集。使用16位的寄存器可以降低成本,而且16位THUMB指令集整体执行速度比ARM 32位指令集快,提高了代码密度。为了满足arm子程序和Thumb子程序互相调用,必须保证编写的代码遵循ATPCS。ATPCS规定了子程序调用的基本规则。

  arm系统结构也支持C、C++以及汇编语言的混合编程。汇编语言和C/C++语言的混合编程,在一个追求效率的程序中比较常见。许多人认为像BSP这样底层的程序应该用纯汇编语言编写,其实不然。用汇编语言编写的程序可读性不高,而且不宜维护,不便于向其它类型的CPU移植,而这些方面却是C语言程序的优势。BSP能否用纯C语言去写呢?也不行。因为某些操作是用C实现不了的。例如操作特殊寄存器的指令、CP15寄存器的指令、中断使能及堆栈地址的设定等。在汇编和C/C++之间的函数调用时,也要遵循ATPCS的定义,还要注意的是用C语言编写嵌入式程序时,要避免使用不能被固化到ROM中的库函数。

  混合编程情况下的程序编译及链接后的输出代码与没有混合编程时是不同的。所以当多个源文件如果使用了不同的设置进行编译,相互之间的调用可能产生兼容性问题,对此一定要加以仔细考虑。编译时,要告诉编译器和链接器足够的信息,一方面,让编译器能够使用正确的指令码进行编译;另一方面,在不同的状态之间发生函数调用时,链接器将插入一段链接代码(veneers)来实现状态转换。

  2.2 MMU的实现过程

  页表是实现MMU的重要手段。页表存放在内存中,从虚拟地址到物理地址的变换过程其实就是查询页表的过程。大小为1MB的存储块通常被称为段,图2说明了如何查表进行段式寻址的全过程:32位的虚拟地址可分为12位的一级页表序号和20位的段内地址偏移。12位的一级页表序号和CP15寄存器的C2中的18位变换表基址合并成一级描述符地址查表找出相应的一级描述符;然后,段对应的物理基地址与段内地址偏移量合并成为真正的存储器存取地址即物理地址,读出相应数据。

  本文介绍的BSP程序已经在以HMS30C7202为主芯片的开发系统上运行并测试通过,并且成功地引导了Linux内核,文中引用代码可以直接使用。今后可以在此基础上添加命令行解释程序,在引导操作系统前进行存存储器的读写等,扩展开发系统的功能。

关键字:ARM  嵌入式系统  BSP 引用地址:ARM体系的嵌入式系统BSP的程序设计

上一篇:基于S3C2440嵌入式系统主板的电磁兼容性设计
下一篇:硬件实时操作系统信号量管理的设计与实现

推荐阅读最新更新时间:2024-05-02 21:15

AMD:ARM服务器2019年可望拿下20%到25%的服务器市场
AMD全球副总裁暨伺服器事业群总经理Suresh Gopalakrishnan表示,ARM架构将改变目前x86主导伺服器市场的现况,2019年可望抢下20%到25%市场。 AMD今年初发表Opteron A1100,期望以 这款ARM架构处理器开拓新的伺服器市场。看好ARM伺服器发展,AMD预估2019年将取得20%到25%市场。 Opteron A1100采用ARM 64位元的Cortex-A57处理器,内建4或8个核心4MB的 L2快取记忆体与8MB的L3,除了支援DDR3外,还首度支援DDR4记忆体,系统记忆体最大支援到128GB。其效能为x86架构低功耗Opteron X处理器的2到4倍。 AMD全球副总裁暨伺服器事
[手机便携]
ARM9学习---虚拟机中LINUX与主XP系统数据通信
我在XP系统中安装了虚拟机,VMwave,安装了redhat 的Linux系统,但是有些需要在Linux系统中安装软件等,所以需要从XP系统中把文件传输到Linux系统中。我接触 Linux系统时间不长,所以也不是特别的熟悉,所以先学了一种方法,就是利用FTP传输的方法,就是在主XP系统中安装一个FTP软件(我用的是G6 FTP Server V2.0软件)安装很简单,只要设置好IP地址和路径就可以了。我主要是用XP传输给Linux系统,所以很简单。在Linux系统终端中进入你所需要下载文件的文件夹,然后键入:ftp 192.168.50.103(我主机的IP地址) ,如果有用户名和密码,那就键入相应的用户名和密码,如果显示conn
[单片机]
采用USB接口的心电图热敏打印机系统设计
  心电图机是描记心脏组织活动所产生的生物电信号以及现代医学科学研究和l临床诊断中使用非常广泛的一种精密电子医疗仪器。由于它诊断可靠,操作简便,对病人无损伤,故在临床上得到广泛的应用,而作为心电图检测结果直观的输出方式和手段,心电图机微型打印机是必不可少的。 目前,医院中使用的多为传统机械式心电打印机,存在着打印效率低、噪声污染严重、心电波形失真等缺点。近年来uSB技术有了飞速的发展,很多台式打印机已经应用了该技术。但是采用USB接口技术的心电图机热敏打印机却很少。本系统就采用了USB接口与心电图机相连,同时也可以与PC心电图机进行连接打印。 1 心电图热敏打印机的硬件设计 1.1 系统的总体结构 硬件系统
[医疗电子]
采用USB接口的心电图热敏打印机系统设计
ARM7S3C44b0看门狗作延时函数
static int delayLoopCount=400; void Delay(int time) { int i,adjust=0; if(time==0)//校准 { time=200; adjust=1; delayLoopCount=400; rWTCON=((MCLK/1000000-1) 8)|(2 3); //MCLK/1M,Watch-dog disable,1/64,interrupt disable,reset disable rWTDAT=0xffff;//for first update rWTCNT=0xffff;//resolution=64us
[单片机]
内嵌ARM核的FPGA芯片EPXA10
  随着亚微米技术的发展,FPGA芯片密度不断增加,并以强大的并行计算能力和方便灵活的动态可重构性,被广泛地应用于各个领域。但是在复杂复法的实现上,FPGA却远没有32位RISC处理器灵活方便,所以在设计具有复杂算法和控制逻辑的系统时,往往需要RISC和FPGA结合使用。这样,电路设计的难度也就相应大大增加。随着第四代EDA开发工具的使用,特别是在IP核产业的迅猛发展下产生的SOPC技术的发展,使嵌入式RISC的通用及标准的FPGA器件呼之欲出。单片集成的RISC处理器和FPGA大大减小了硬件电路复杂性和体积,同时也降低了功耗、提高了系统可靠性。Altera公司的EPXA10芯片就是应用SOPC技术,集高密度逻辑(FPGA)、
[嵌入式]
内嵌<font color='red'>ARM</font>核的FPGA芯片EPXA10
ARM笔记: U-Boot移植
U-Boot移植: 系统:Ubuntu 12.04 开发板:JZ2440 虚拟机:VM10.04 U-Boot:U-BOOT-1.1.6 步骤: 1、解压U-BOOT-1.1.6 tar jxvf U-BOOT-1.1.6.tar.bz2 2、同时支持S3C2410和S3C2440: (1)、新建一个开发板的相应目录和文件 在board目录下将smdk2410复制为100ask24x0,并将board/100ask24x0/smdk2410.c改名为100ask24x0.c,再将include/configs/smdk2410.h复制为100ask24x0.h 修改两个Makefile: 1)、在顶层Makefile中增加如个两行
[单片机]
基于嵌入式Linux和Arm的远程监控模块的设计
引言 嵌入式系统是以应用为中心、以计算机技术为基础、软件硬件可裁剪、适应应用系统对功能、可靠性、成本、体积、功耗严格要求的专用计算机系统。其中基于嵌入式Linux的远程配置模块的设计越来越得到人们的关注。通过基于嵌入式Linux的远程配置模块设计,远程专家和相关技术人员可以从Internet网上任意节点对服务器端所连接的设备的运行状态进行监控.并执行操作的修改。 系统的主要功能是通过计算机可使远程专家和相关技术人员在异地通过系统的客户器端监控多台设备的运行状态。系统在设备端的服务器端不仅仅承担一些实时检测系统状态的任务.而且需要把这些记录信息进行保存,并对客户端软件发出的请求进行相应的处理,系统在硬件上扩展了网卡模块、输入
[单片机]
基于嵌入式Linux和<font color='red'>Arm</font>的远程监控模块的设计
SA:高通、苹果和联发科占据Arm移动计算芯片市场收益份额前三名
6月23日消息,Strategy Analytics手机元件技术(HCT)服务近期发布的研究报告指出,基于Arm的移动计算芯片市场(智能手机、平板电脑和笔记本电脑)收益在2021年增长了27%,达到351亿美元。基于Arm的移动计算芯片(AP)市场上,高通、苹果、联发科占据了收益份额前三名。 在基于Arm的移动计算芯片市场中,高通以34%的收益份额领先,其次是苹果和联发科,分别占31%和24%。 2021年,智能手机、平板电脑和笔记本电脑处理器分别占基于Arm的移动计算芯片总营收的88%、9%和3%。 基于Arm的移动计算市场在营收和出货量上都超过基于x86的移动计算市场。根据我们的估计,2021年,基于Arm的移动
[半导体设计/制造]
SA:高通、苹果和联发科占据<font color='red'>Arm</font>移动计算芯片市场收益份额前三名
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved