ARM基础：ARM 伪指令详解-电子工程世界

分享到: 微博; QQ; 微信; LinkedIn

4.1 ARM汇编器所支持的伪指令

在ARM汇编语言程序里，有一些特殊指令助记符，这些助记符与指令系统的助记符不同，没有相对应的操作码，通常称这些特殊指令助记符为伪指令，他们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程序作各种准备工作的，这些伪指令仅在汇编过程中起作用，一旦汇编结束，伪指令的使命就完成。

在ARM的汇编程序中，有如下几种伪指令：符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令以及其他伪指令。

4.1.1 符号定义（Symbol Definition）伪指令

符号定义伪指令用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。常见的符号定义伪指令有如下几种：

— 用于定义全局变量的GBLA、GBLL和GBLS。

— 用于定义局部变量的LCLA、LCLL和LCLS。

— 用于对变量赋值的SETA、SETL、SETS。

— 为通用寄存器列表定义名称的RLIST。

1、 GBLA、GBLL和GBLS

语法格式：

GBLA（GBLL或GBLS）全局变量名

GBLA、GBLL和GBLS伪指令用于定义一个ARM程序中的全局变量，并将其初始化。其中：

GBLA伪指令用于定义一个全局的数字变量，并初始化为0；

GBLL伪指令用于定义一个全局的逻辑变量，并初始化为F（假）；

GBLS伪指令用于定义一个全局的字符串变量，并初始化为空；

由于以上三条伪指令用于定义全局变量，因此在整个程序范围内变量名必须唯一。

使用示例：

GBLA Test1 ；定义一个全局的数字变量，变量名为Test1

Test1 SETA 0xaa ；将该变量赋值为0xaa

GBLL Test2 ；定义一个全局的逻辑变量，变量名为Test2

Test2 SETL {TRUE} ；将该变量赋值为真

GBLS Test3 ；定义一个全局的字符串变量，变量名为Test3

Test3 SETS “Testing” ；将该变量赋值为“Testing”

2、 LCLA、LCLL和LCLS

语法格式：

LCLA（LCLL或LCLS）局部变量名

LCLA、LCLL和LCLS伪指令用于定义一个ARM程序中的局部变量，并将其初始化。其中：

LCLA伪指令用于定义一个局部的数字变量，并初始化为0；

LCLL伪指令用于定义一个局部的逻辑变量，并初始化为F（假）；

LCLS伪指令用于定义一个局部的字符串变量，并初始化为空；

以上三条伪指令用于声明局部变量，在其作用范围内变量名必须唯一。

使用示例：

LCLA Test4 ；声明一个局部的数字变量，变量名为Test4

Test3 SETA 0xaa ；将该变量赋值为0xaa

LCLL Test5 ；声明一个局部的逻辑变量，变量名为Test5

Test4 SETL {TRUE} ；将该变量赋值为真

LCLS Test6 ；定义一个局部的字符串变量，变量名为Test6

Test6 SETS “Testing” ；将该变量赋值为“Testing”

3、 SETA、SETL和SETS

语法格式：

变量名 SETA（SETL或SETS）表达式

伪指令SETA、SETL、SETS用于给一个已经定义的全局变量或局部变量赋值。

SETA伪指令用于给一个数学变量赋值；

SETL伪指令用于给一个逻辑变量赋值；

SETS伪指令用于给一个字符串变量赋值；

其中，变量名为已经定义过的全局变量或局部变量，表达式为将要赋给变量的值。

使用示例：

LCLA Test3 ；声明一个局部的数字变量，变量名为Test3

Test3 SETA 0xaa ；将该变量赋值为0xaa

LCLL Test4 ；声明一个局部的逻辑变量，变量名为Test4

Test4 SETL {TRUE} ；将该变量赋值为真

4、 RLIST

语法格式：

名称 RLIST {寄存器列表}

RLIST伪指令可用于对一个通用寄存器列表定义名称，使用该伪指令定义的名称可在ARM指令LDM/STM中使用。在LDM/STM指令中，列表中的寄存器访问次序为根据寄存器的编号由低到高，而与列表中的寄存器排列次序无关。

使用示例：

RegList RLIST {R0-R5，R8，R10} ；将寄存器列表名称定义为RegList，可在ARM指令LDM/STM中通过该名称访问寄存器列表。

4.1.2 数据定义（Data Definition）伪指令

数据定义伪指令一般用于为特定的数据分配存储单元，同时可完成已分配存储单元的初始化。常见的数据定义伪指令有如下几种：

— DCB 用于分配一片连续的字节存储单元并用指定的数据初始化。

— DCW（DCWU）用于分配一片连续的半字存储单元并用指定的数据初始化。

— DCD（DCDU）用于分配一片连续的字存储单元并用指定的数据初始化。

— DCFD（DCFDU）用于为双精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。

— DCFS（DCFSU）用于为单精度的浮点数分配一片连续的字存储单元并用指定的数据初始化。

— DCQ（DCQU）用于分配一片以8字节为单位的连续的存储单元并用指定的数据初始化。

— SPACE 用于分配一片连续的存储单元

— MAP 用于定义一个结构化的内存表首地址

— FIELD 用于定义一个结构化的内存表的数据域

1、 DCB

语法格式：

标号 DCB 表达式

DCB伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。其中，表达式可以为0～255的数字或字符串。DCB也可用“=”代替。

使用示例：

Str DCB “This is a test！” ；分配一片连续的字节存储单元并初始化。

2、 DCW（或DCWU）

语法格式：

标号 DCW（或DCWU）表达式

DCW（或DCWU）伪指令用于分配一片连续的半字存储单元并用伪指令中指定的表达式初始化。其中，表达式可以为程序标号或数字表达式。。

用DCW分配的字存储单元是半字对齐的，而用DCWU分配的字存储单元并不严格半字对齐。

使用示例：

DataTest DCW 1，2，3 ；分配一片连续的半字存储单元并初始化。

3、 DCD（或DCDU）

语法格式：

标号 DCD（或DCDU）表达式

DCD（或DCDU）伪指令用于分配一片连续的字存储单元并用伪指令中指定的表达式初始化。其中，表达式可以为程序标号或数字表达式。DCD也可用“&”代替。

用DCD分配的字存储单元是字对齐的，而用DCDU分配的字存储单元并不严格字对齐。

使用示例：

DataTest DCD 4，5，6 ；分配一片连续的字存储单元并初始化。

4、 DCFD（或DCFDU）

语法格式：

标号 DCFD（或DCFDU）表达式

DCFD（或DCFDU）伪指令用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。每个双精度的浮点数占据两个字单元。

用DCFD分配的字存储单元是字对齐的，而用DCFDU分配的字存储单元并不严格字对齐。

使用示例：

FDataTest DCFD 2E115，-5E7 ；分配一片连续的字存储单元并初始化为指定的双精度数。

5、 DCFS（或DCFSU）

语法格式：

标号 DCFS（或DCFSU）表达式

DCFS（或DCFSU）伪指令用于为单精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。每个单精度的浮点数占据一个字单元。

用DCFS分配的字存储单元是字对齐的，而用DCFSU分配的字存储单元并不严格字对齐。

使用示例：

FDataTest DCFS 2E5，-5E－7 ；分配一片连续的字存储单元并初始化为指定的单精度数。

6、 DCQ(或DCQU）

语法格式：

标号 DCQ（或DCQU）表达式

DCQ（或DCQU）伪指令用于分配一片以8个字节为单位的连续存储区域并用伪指令中指定的表达式初始化。

用DCQ分配的存储单元是字对齐的，而用DCQU分配的存储单元并不严格字对齐。

使用示例：

DataTest DCQ 100 ；分配一片连续的存储单元并初始化为指定的值。

7、 SPACE

语法格式：

标号 SPACE 表达式

SPACE伪指令用于分配一片连续的存储区域并初始化为0。其中，表达式为要分配的字节数。SPACE也可用“％”代替。

使用示例：

DataSpace SPACE 100 ；分配连续100字节的存储单元并初始化为0。

8、 MAP

语法格式：

MAP 表达式{，基址寄存器}

MAP伪指令用于定义一个结构化的内存表的首地址。MAP也可用“＾”代替。

表达式可以为程序中的标号或数学表达式，基址寄存器为可选项，当基址寄存器选项不存在时，表达式的值即为内存表的首地址，当该选项存在时，内存表的首地址为表达式的值与基址寄存器的和。

MAP伪指令通常与FIELD伪指令配合使用来定义结构化的内存表。

使用示例：

MAP 0x100，R0 ；定义结构化内存表首地址的值为0x100＋R0。

9、 FILED

语法格式：

标号 FIELD 表达式

FIELD伪指令用于定义一个结构化内存表中的数据域。FILED也可用“#”代替。

表达式的值为当前数据域在内存表中所占的字节数。

FIELD伪指令常与MAP伪指令配合使用来定义结构化的内存表。MAP伪指令定义内存表的首地址，FIELD伪指令定义内存表中的各个数据域，并可以为每个数据域指定一个标号供其他的指令引用。

注意MAP和FIELD伪指令仅用于定义数据结构，并不实际分配存储单元。

使用示例：

MAP 0x100 ；定义结构化内存表首地址的值为0x100。

A FIELD 16 ；定义A的长度为16字节，位置为0x100

B FIELD 32 ；定义B的长度为32字节，位置为0x110

S FIELD 256 ；定义S的长度为256字节，位置为0x130

4.1.3 汇编控制（Assembly Control）伪指令

汇编控制伪指令用于控制汇编程序的执行流程，常用的汇编控制伪指令包括以下几条：

— IF、ELSE、ENDIF

— WHILE、WEND

— MACRO、MEND

— MEXIT

1、 IF、ELSE、ENDIF

语法格式：

IF 逻辑表达式

指令序列1

ELSE

指令序列2

ENDIF

IF、ELSE、ENDIF伪指令能根据条件的成立与否决定是否执行某个指令序列。当IF后面的逻辑表达式为真，则执行指令序列1，否则执行指令序列2。其中，ELSE及指令序列2可以没有，此时，当IF后面的逻辑表达式为真，则执行指令序列1，否则继续执行后面的指令。

IF、ELSE、ENDIF伪指令可以嵌套使用。

使用示例：

GBLL Test ；声明一个全局的逻辑变量，变量名为Test

……

IF Test = TRUE

指令序列1

ELSE

指令序列2

ENDIF

2、 WHILE、WEND

语法格式：

WHILE 逻辑表达式

指令序列

WEND

WHILE、WEND伪指令能根据条件的成立与否决定是否循环执行某个指令序列。当WHILE后面的逻辑表达式为真，则执行指令序列，该指令序列执行完毕后，再判断逻辑表达式的值，若为真则继续执行，一直到逻辑表达式的值为假。

WHILE、WEND伪指令可以嵌套使用。

使用示例：

GBLA Counter ；声明一个全局的数学变量，变量名为Counter

Counter SETA 3 ；由变量Counter控制循环次数

……

WHILE Counter < 10

指令序列

WEND

3、 MACRO、MEND

语法格式：

$标号宏名 $参数1，$参数2，……

指令序列

MEND

MACRO、MEND伪指令可以将一段代码定义为一个整体，称为宏指令，然后就可以在程序中通过宏指令多次调用该段代码。其中，$标号在宏指令被展开时，标号会被替换为用户定义的符号，

宏指令可以使用一个或多个参数，当宏指令被展开时，这些参数被相应的值替换。

宏指令的使用方式和功能与子程序有些相似，子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。但在使用子程序结构时需要保护现场，从而增加了系统的开销，因此，在代码较短且需要传递的参数较多时，可以使用宏指令代替子程序。

包含在MACRO和MEND之间的指令序列称为宏定义体，在宏定义体的第一行应声明宏的原型（包含宏名、所需的参数），然后就可以在汇编程序中通过宏名来调用该指令序列。在源程序被编译时，汇编器将宏调用展开，用宏定义中的指令序列代替程序中的宏调用，并将实际参数的值传递给宏定义中的形式参数。

MACRO、MEND伪指令可以嵌套使用。

4、 MEXIT

语法格式：

MEXIT

MEXIT用于从宏定义中跳转出去。

4.1.4 其他常用的伪指令

还有一些其他的伪指令，在汇编程序中经常会被使用，包括以下几条：

— AREA

— ALIGN

— CODE16、CODE32

— ENTRY

— END

— EQU

— EXPORT（或GLOBAL）

— IMPORT

— EXTERN

— GET（或INCLUDE）

— INCBIN

— RN

— ROUT

1、 AREA

语法格式：

AREA 段名属性1，属性2，……

AREA伪指令用于定义一个代码段或数据段。其中，段名若以数字开头，则该段名需用“|”括起来，如|1_test|。

属性字段表示该代码段（或数据段）的相关属性，多个属性用逗号分隔。常用的属性如下：

— CODE属性：用于定义代码段，默认为READONLY。

— DATA属性：用于定义数据段，默认为READWRITE。

— READONLY属性：指定本段为只读，代码段默认为READONLY。

— READWRITE属性：指定本段为可读可写，数据段的默认属性为READWRITE。

— ALIGN属性：使用方式为ALIGN 表达式。在默认时，ELF（可执行连接文件）的代码段和数据段是按字对齐的，表达式的取值范围为0～31，相应的对齐方式为2表达式次方。

— COMMON属性：该属性定义一个通用的段，不包含任何的用户代码和数据。各源文件中同名的COMMON段共享同一段存储单元。

一个汇编语言程序至少要包含一个段，当程序太长时，也可以将程序分为多个代码段和数据段。

使用示例：

AREA Init，CODE，READONLY

指令序列

；该伪指令定义了一个代码段，段名为Init，属性为只读

2、 ALIGN

语法格式：

ALIGN {表达式{，偏移量}}

ALIGN伪指令可通过添加填充字节的方式，使当前位置满足一定的对其方式|。其中，表达式的值用于指定对齐方式，可能的取值为2的幂，如1、2、4、8、16等。若未指定表达式，则将当前位置对齐到下一个字的位置。偏移量也为一个数字表达式，若使用该字段，则当前位置的对齐方式为：2的表达式次幂＋偏移量。

使用示例：

AREA Init，CODE，READONLY，ALIEN＝3 ；指定后面的指令为8字节对齐。

指令序列

END

3、 CODE16、CODE32

语法格式：

CODE16（或CODE32）

CODE16伪指令通知编译器，其后的指令序列为16位的Thumb指令。

CODE32伪指令通知编译器，其后的指令序列为32位的ARM指令。

若在汇编源程序中同时包含ARM指令和Thumb指令时，可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令，CODE32伪指令通知编译器其后的指令序列为32位的ARM指令。因此，在使用ARM指令和Thumb指令混合编程的代码里，可用这两条伪指令进行切换，但注意他们只通知编译器其后指令的类型，并不能对处理器进行状态的切换。

使用示例：

AREA Init，CODE，READONLY

……

CODE32 ；通知编译器其后的指令为32位的ARM指令

LDR R0，＝NEXT＋1 ；将跳转地址放入寄存器R0

BX R0 ；程序跳转到新的位置执行，并将处理器切换到Thumb工作状态

……

CODE16 ；通知编译器其后的指令为16位的Thumb指令

NEXT LDR R3，＝0x3FF

……

END ；程序结束

4、 ENTRY

语法格式：

ENTRY

ENTRY伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个ENTRY（也可以有多个，当有多个ENTRY时，程序的真正入口点由链接器指定），但在一个源文件里最多只能有一个ENTRY（可以没有）。

使用示例：

AREA Init，CODE，READONLY

ENTRY ；指定应用程序的入口点

……

5、 END

语法格式：

END

END伪指令用于通知编译器已经到了源程序的结尾。

使用示例：

AREA Init，CODE，READONLY

……

END ；指定应用程序的结尾

6、 EQU

语法格式：

名称 EQU 表达式{，类型}

EQU伪指令用于为程序中的常量、标号等定义一个等效的字符名称，类似于C语言中的＃define。其中EQU可用“*”代替。

名称为EQU伪指令定义的字符名称，当表达式为32位的常量时，可以指定表达式的数据类型，可以有以下三种类型：

CODE16、CODE32和DATA

使用示例：

Test EQU 50 ；定义标号Test的值为50

Addr EQU 0x55，CODE32 ；定义Addr的值为0x55，且该处为32位的ARM指令。

7、 EXPORT（或GLOBAL）

语法格式：

EXPORT 标号{[WEAK]}

EXPORT伪指令用于在程序中声明一个全局的标号，该标号可在其他的文件中引用。EXPORT可用GLOBAL代替。标号在程序中区分大小写，[WEAK]选项声明其他的同名标号优先于该标号被引用。

使用示例：

AREA Init，CODE，READONLY

EXPORT Stest ；声明一个可全局引用的标号Stest

……

END

8、 IMPORT

语法格式：

IMPORT 标号{[WEAK]}

IMPORT伪指令用于通知编译器要使用的标号在其他的源文件中定义，但要在当前源文件中引用，而且无论当前源文件是否引用该标号，该标号均会被加入到当前源文件的符号表中。

标号在程序中区分大小写，[WEAK]选项表示当所有的源文件都没有定义这样一个标号时，编译器也不给出错误信息，在多数情况下将该标号置为0，若该标号为B或BL指令引用，则将B或BL指令置为NOP操作。

使用示例：

AREA Init，CODE，READONLY

IMPORT Main ；通知编译器当前文件要引用标号Main，但Main在其他源文件中定义

……

END

9、 EXTERN

语法格式：

EXTERN 标号{[WEAK]}

EXTERN伪指令用于通知编译器要使用的标号在其他的源文件中定义，但要在当前源文件中引用，如果当前源文件实际并未引用该标号，该标号就不会被加入到当前源文件的符号表中。

使用示例：

AREA Init，CODE，READONLY

EXTERN Main ；通知编译器当前文件要引用标号Main，但Main在其他源文件中定义

……

END

10、 GET（或INCLUDE）

语法格式：

GET 文件名

GET伪指令用于将一个源文件包含到当前的源文件中，并将被包含的源文件在当前位置进行汇编处理。可以使用INCLUDE代替GET。

汇编程序中常用的方法是在某源文件中定义一些宏指令，用EQU定义常量的符号名称，用MAP和FIELD定义结构化的数据类型，然后用GET伪指令将这个源文件包含到其他的源文件中。使用方法与C语言中的“include”相似。

GET伪指令只能用于包含源文件，包含目标文件需要使用INCBIN伪指令

使用示例：

AREA Init，CODE，READONLY

GET a1.s ；通知编译器当前源文件包含源文件a1.s

GE T C：a2.s ；通知编译器当前源文件包含源文件C： a2.s

……

END

11、 INCBIN

语法格式：

INCBIN 文件名

INCBIN伪指令用于将一个目标文件或数据文件包含到当前的源文件中，被包含的文件不作任何变动的存放在当前文件中，编译器从其后开始继续处理。

使用示例：

AREA Init，CODE，READONLY

INCBIN a1.dat ；通知编译器当前源文件包含文件a1.dat

INCBIN C：a2.txt ；通知编译器当前源文件包含文件C：a2.txt

……

END

12、 RN

语法格式：

名称 RN 表达式

RN伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。其中，名称为给寄存器定义的别名，表达式为寄存器的编码。

使用示例：

Temp RN R0 ；将R0定义一个别名Temp

13、 ROUT

语法格式：

{名称} ROUT

ROUT伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时，局部变量的作用范围为所在的AREA，而使用ROUT后，局部变量的作为范围为当前ROUT和下一个ROUT之间。

4.2 汇编语言的语句格式

ARM（Thumb）汇编语言的语句格式为：

{标号} {指令或伪指令} {；注释}

在汇编语言程序设计中，每一条指令的助记符可以全部用大写、或全部用小写，但不用许在一条指令中大、小写混用。

同时，如果一条语句太长，可将该长语句分为若干行来书写，在行的末尾用“”表示下一行与本行为同一条语句。

4.2.1 在汇编语言程序中常用的符号

在汇编语言程序设计中，经常使用各种符号代替地址、变量和常量等，以增加程序的可读性。尽管符号的命名由编程者决定，但并不是任意的，必须遵循以下的约定：

— 符号区分大小写，同名的大、小写符号会被编译器认为是两个不同的符号。

— 符号在其作用范围内必须唯一。

— 自定义的符号名不能与系统的保留字相同。

— 符号名不应与指令或伪指令同名。

1、程序中的变量

程序中的变量是指其值在程序的运行过程中可以改变的量。ARM（Thumb）汇编程序所支持的变量有数字变量、逻辑变量和字符串变量。

数字变量用于在程序的运行中保存数字值，但注意数字值的大小不应超出数字变量所能表示的范围。

逻辑变量用于在程序的运行中保存逻辑值，逻辑值只有两种取值情况：真或假。

字符串变量用于在程序的运行中保存一个字符串，但注意字符串的长度不应超出字符串变量所能表示的范围。

在ARM（Thumb）汇编语言程序设计中，可使用GBLA、GBLL、GBLS伪指令声明全局变量，使用LCLA、LCLL、LCLS伪指令声明局部变量，并可使用SETA、SETL和SETS对其进行初始化。

2、程序中的常量

程序中的常量是指其值在程序的运行过程中不能被改变的量。ARM（Thumb）汇编程序所支持的常量有数字常量、逻辑常量和字符串常量。

数字常量一般为32位的整数，当作为无符号数时，其取值范围为0～232-1，当作为有符号数时，其取值范围为-231～231-1。

逻辑常量只有两种取值情况：真或假。

字符串常量为一个固定的字符串，一般用于程序运行时的信息提示。

3、程序中的变量代换

程序中的变量可通过代换操作取得一个常量。代换操作符为“$”。

如果在数字变量前面有一个代换操作符“$”，编译器会将该数字变量的值转换为十六进制的字符串，并将该十六进制的字符串代换“$”后的数字变量。

如果在逻辑变量前面有一个代换操作符“$”，编译器会将该逻辑变量代换为它的取值（真或假）。

如果在字符串变量前面有一个代换操作符“$”，编译器会将该字符串变量的值代换“$”后的字符串变量。

使用示例：

LCLS S1 ；定义局部字符串变量S1和S2

LCLS S2

S1 SETS “Test！”

S2 SETS “This is a $S1” ；字符串变量S2的值为“This is a Test！”

4.2.2 汇编语言程序中的表达式和运算符

在汇编语言程序设计中，也经常使用各种表达式，表达式一般由变量、常量、运算符和括号构成。常用的表达式有数字表达式、逻辑表达式和字符串表达式，其运算次序遵循如下的优先级：

— 优先级相同的双目运算符的运算顺序为从左到右。

— 相邻的单目运算符的运算顺序为从右到左，且单目运算符的优先级高于其他运算符。

— 括号运算符的优先级最高。

1、数字表达式及运算符

数字表达式一般由数字常量、数字变量、数字运算符和括号构成。与数字表达式相关的运算符如下：

— “＋”、“－”、“×”、“/” 及“MOD”算术运算符

以上的算术运算符分别代表加、减、乘、除和取余数运算。例如，以X和Y表示两个数字表达式，则：

X＋Y 表示X与Y的和。

X－Y 表示X与Y的差。

X×Y 表示X与Y的乘积。

X/Y 表示X除以Y的商。

X：MOD：Y 表示X除以Y的余数。

— “ROL”、“ROR”、“SHL”及“SHR”移位运算符

以X和Y表示两个数字表达式，以上的移位运算符代表的运算如下：

X：ROL：Y 表示将X循环左移Y位。

X：ROR：Y 表示将X循环右移Y位。

X：SHL：Y 表示将X左移Y位。

X：SHR：Y 表示将X右移Y位。

— “AND”、“OR”、“NOT”及“EOR”按位逻辑运算符

以X和Y表示两个数字表达式，以上的按位逻辑运算符代表的运算如下：

X：AND：Y 表示将X和Y按位作逻辑与的操作。

X：OR：Y 表示将X和Y按位作逻辑或的操作。

：NOT：Y 表示将Y按位作逻辑非的操作。

X：EOR：Y 表示将X和Y按位作逻辑异或的操作。

2、逻辑表达式及运算符

逻辑表达式一般由逻辑量、逻辑运算符和括号构成，其表达式的运算结果为真或假。与逻辑表达式相关的运算符如下：

— “=”、“>”、“<”、“>=”、“<= ”、“/=”、“ <>” 运算符

以X和Y表示两个逻辑表达式，以上的运算符代表的运算如下：

X = Y 表示X等于Y。

X > Y 表示X大于Y。

X < Y 表示X小于Y。

X >= Y 表示X大于等于Y。

X <= Y 表示X小于等于Y。

X /= Y 表示X不等于Y。

X <> Y 表示X不等于Y。

— “LAND”、“LOR”、“LNOT”及“LEOR”运算符

以X和Y表示两个逻辑表达式，以上的逻辑运算符代表的运算如下：

X：LAND：Y 表示将X和Y 作逻辑与的操作。

X：LOR：Y 表示将X和Y作逻辑或的操作。

：LNOT：Y 表示将Y作逻辑非的操作。

X：LEOR：Y 表示将X和Y作逻辑异或的操作。

3、字符串表达式及运算符

字符串表达式一般由字符串常量、字符串变量、运算符和括号构成。编译器所支持的字符串最大长度为512字节。常用的与字符串表达式相关的运算符如下：

— LEN运算符

LEN运算符返回字符串的长度（字符数），以X表示字符串表达式，其语法格式如下：

：LEN：X

— CHR运算符

CHR运算符将0～255之间的整数转换为一个字符，以M表示某一个整数，其语法格式如下：

：CHR：M

— STR运算符

STR运算符将将一个数字表达式或逻辑表达式转换为一个字符串。对于数字表达式，STR运算符将其转换为一个以十六进制组成的字符串；对于逻辑表达式，STR运算符将其转换为字符串T或F，其语法格式如下：

：STR：X

其中，X为一个数字表达式或逻辑表达式。

— LEFT运算符

LEFT运算符返回某个字符串左端的一个子串，其语法格式如下：

X：LEFT：Y

其中：X为源字符串，Y为一个整数，表示要返回的字符个数。

— RIGHT运算符

与LEFT运算符相对应，RIGHT运算符返回某个字符串右端的一个子串，其语法格式如下：

X：RIGHT：Y

其中：X为源字符串，Y为一个整数，表示要返回的字符个数。

— CC运算符

CC运算符用于将两个字符串连接成一个字符串，其语法格式如下：

X：CC：Y

其中：X为源字符串1，Y为源字符串2，CC运算符将Y连接到X的后面。

4、与寄存器和程序计数器（PC）相关的表达式及运算符

常用的与寄存器和程序计数器（PC）相关的表达式及运算符如下：

— BASE运算符

BASE运算符返回基于寄存器的表达式中寄存器的编号，其语法格式如下：

：BASE：X

其中，X为与寄存器相关的表达式。

— INDEX运算符

INDEX运算符返回基于寄存器的表达式中相对于其基址寄存器的偏移量，其语法格式如下：

：INDEX：X

其中，X为与寄存器相关的表达式。

5、其他常用运算符

— ？运算符

？运算符返回某代码行所生成的可执行代码的长度，例如：

返回定义符号X的代码行所生成的可执行代码的字节数。

— DEF运算符

DEF运算符判断是否定义某个符号，例如：

：DEF：X

如果符号X已经定义，则结果为真，否则为假。

4.3 汇编语言的程序结构
4.3.1 汇编语言的程序结构

在ARM（Thumb）汇编语言程序中，以程序段为单位组织代码。段是相对独立的指令或数据序列，具有特定的名称。段可以分为代码段和数据段，代码段的内容为执行代码，数据段存放代码运行时需要用到的数据。一个汇编程序至少应该有一个代码段，当程序较长时，可以分割为多个代码段和数据段，多个段在程序编译链接时最终形成一个可执行的映象文件。

可执行映象文件通常由以下几部分构成：

— 一个或多个代码段，代码段的属性为只读。

— 零个或多个包含初始化数据的数据段，数据段的属性为可读写。

— 零个或多个不包含初始化数据的数据段，数据段的属性为可读写。

链接器根据系统默认或用户设定的规则，将各个段安排在存储器中的相应位置。因此源程序中段之间的相对位置与可执行的映象文件中段的相对位置一般不会相同。

以下是一个汇编语言源程序的基本结构：

AREA Init，CODE，READONLY

ENTRY

Start

LDR R0，=0x3FF5000

LDR R1，0xFF

STR R1，[R0]

LDR R0，=0x3FF5008

LDR R1，0x01

STR R1，[R0]

┉┉

END

在汇编语言程序中，用AREA伪指令定义一个段，并说明所定义段的相关属性，本例定义一个名为Init的代码段，属性为只读。ENTRY伪指令标识程序的入口点，接下来为指令序列，程序的末尾为END伪指令，该伪指令告诉编译器源文件的结束，每一个汇编程序段都必须有一条END伪指令，指示代码段的结束。

4.3.2 汇编语言的子程序调用

在ARM汇编语言程序中，子程序的调用一般是通过BL指令来实现的。在程序中，使用指令：BL 子程序名

即可完成子程序的调用。

该指令在执行时完成如下操作：将子程序的返回地址存放在连接寄存器LR中，同时将程序计数器PC指向子程序的入口点，当子程序执行完毕需要返回调用处时，只需要将存放在LR中的返回地址重新拷贝给程序计数器PC即可。在调用子程序的同时，也可以完成参数的传递和从子程序返回运算的结果，通常可以使用寄存器R0～R3完成。

以下是使用BL指令调用子程序的汇编语言源程序的基本结构：

AREA Init，CODE，READONLY

ENTRY

Start

LDR R0，=0x3FF5000

LDR R1，0xFF

STR R1，[R0]

LDR R0，=0x3FF5008

LDR R1，0x01

STR R1，[R0]

BL PRINT_TEXT

┉┉

PRINT_TEXT

┉┉

MOV PC，BL

┉┉

END

4.3.3 汇编语言程序示例

以下是一个基于S3C4510B的串行通讯程序，关于S3C4510B的串行通讯的工作原理，可以参考第六章的相关内容，在此仅向读者说明一个完整汇编语言程序的基本结构：

Institute of Automation,Chinese Academy of Sciences

Description: This example shows the UART communication！

Author: JuGuang,Lee

Date:

UARTLCON0 EQU 0x3FFD000

UARTCONT0 EQU 0x3FFD004

UARTSTAT0 EQU 0x3FFD008

UTXBUF0 EQU 0x3FFD00C

UARTBRD0 EQU 0x3FFD014

AREA Init,CODE,READONLY

ENTRY

LED Display

LDR R1,=0x3FF5000

LDR R0,=&ff

STR R0,[R1]

LDR R1,=0x3FF5008

LDR R0,=&ff

STR R0,[R1]

UART0 line control register

LDR R1,=UARTLCON0

LDR R0,=0x03

STR R0,[R1]

UART0 control regiser

LDR R1,=UARTCONT0

LDR R0,=0x9

STR R0,[R1]

UART0 baud rate divisor regiser

Baudrate=19200，对应于50MHz的系统工作频率

LDR R1,=UARTBRD0

LDR R0,=0x500

STR R0,[R1]

Print the messages!

LOOP

LDR R0,=Line1

BL PrintLine

LDR R0,=Line2

BL PrintLine

LDR R0,=Line3

BL PrintLine

LDR R0,=Line4

BL PrintLine

LDR R1,=0x7FFFFF

LOOP1

SUBS R1,R1,#1

BNE LOOP1

B LOOP

Print line

PrintLine

MOV R4,LR

MOV R5,R0

Line

LDRB R1,[R5],#1

AND R0,R1,#&FF

TST R0,#&FF

MOVEQ PC,R4

BL PutByte

B Line

PutByte

LDR R3,=UARTSTAT0

LDR R2,[R3]

TST R2,#&40

BEQ PutByte

LDR R3,=UTXBUF0

STR R0,[R3]

MOV PC,LR

Line1 DCB &A,&D,"",0

Line2 DCB &A,&D,"Chinese Academy of Sciences,Institute of Automation,Complex System Lab.",0

Line3 DCB &A,&D," ARM Development Board Based on Samsung ARM S3C4510B.",0

Line4 DCB &A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,&A,&D,0

END

4.3.4 汇编语言与C/C++的混合编程

在应用系统的程序设计中，若所有的编程任务均用汇编语言来完成，其工作量是可想而知的，同时，不利于系统升级或应用软件移植，事实上，ARM体系结构支持C/C＋以及与汇编语言的混合编程，在一个完整的程序设计的中，除了初始化部分用汇编语言完成以外，其主要的编程任务一般都用C/C++ 完成。

汇编语言与C/C++的混合编程通常有以下几种方式：

－在C/C＋＋代码中嵌入汇编指令。

－在汇编程序和C/C＋＋的程序之间进行变量的互访。

－汇编程序、C/C＋＋程序间的相互调用。

在以上的几种混合编程技术中，必须遵守一定的调用规则，如物理寄存器的使用、参数的传递等，这对于初学者来说，无疑显得过于烦琐。在实际的编程应用中，使用较多的方式是：程序的初始化部分用汇编语言完成，然后用C/C＋＋完成主要的编程任务，程序在执行时首先完成初始化过程，然后跳转到C/C＋＋程序代码中，汇编程序和C/C＋＋程序之间一般没有参数的传递，也没有频繁的相互调用，因此，整个程序的结构显得相对简单，容易理解。以下是一个这种结构程序的基本示例，该程序基于第五、六章所描述的硬件平台：

Institute of Automation, Chinese Academy of Sciences

File Name: Init.s

Description:

Author: JuGuang,Lee

Date:

IMPORT Main ;通知编译器该标号为一个外部标号

AREA Init,CODE,READONLY ；定义一个代码段

ENTRY ；定义程序的入口点

LDR R0,=0x3FF0000 ；初始化系统配置寄存器，具体内容可参考第五、六章

LDR R1,=0xE7FFFF80

STR R1,[R0]

LDR SP,=0x3FE1000 ；初始化用户堆栈，具体内容可参考第五、六章

BL Main ；跳转到Main（）函数处的C/C++代码执行

END ；标识汇编程序的结束

以上的程序段完成一些简单的初始化，然后跳转到Main（）函数所标识的C/C＋＋代码处执行主要的任务，此处的Main仅为一个标号，也可使用其他名称，与C语言程序中的main（）函数没有关系。

* Institute of Automation, Chinese Academy of Sciences

* File Name: main.c

* Description: P0,P1 LED flash.

* Author: JuGuang,Lee

* Date:

void Main(void)

{

int i;

*((volatile unsigned long *) 0x3ff5000) = 0x0000000f;

while(1)

{

*((volatile unsigned long *) 0x3ff5008) = 0x00000001;

for(i=0; i<0x7fFFF; i++);

*((volatile unsigned long *) 0x3ff5008) = 0x00000002;

for(i=0; i<0x7FFFF; i++);

}

}
4.4 本章小节

本章介绍了ARM程序设计的一些基本概念，以及在汇编语言程序设计中常见的伪指令、汇编语言的基本语句格式等，汇编语言程序的基本结构等，同时简单介绍了C/C＋＋和汇编语言的混合编程等问题，这些问题均为程序设计中的基本问题，希望读者掌握，注意本章最后的两个示例均与后面章节介绍的基于S3C4510B的硬件平台有关系，读者可以参考第五、六章的相关内容。

关键字：ARM基础伪指令引用地址：ARM基础：ARM 伪指令详解

上一篇：ARM 浮点运算详解
下一篇：ARM指令详解

推荐阅读最新更新时间：2024-03-16 14:53

ARM伪指令必读

在 ARM 汇编语言程序里，有一些特殊指令助记符，这些助记符与指令系统的助记符不同，没有相对应的操作码，通常称这些特殊指令助记符为伪指令，他们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程序作各种准备工作的，这些伪指令仅在汇编过程中起作用，一旦汇编结束，伪指令的使命就完成。在 ARM 的汇编程序中，有如下几种伪指令：符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令以及其他伪指令。符号定义（ Symbol Definition ）伪指令符号定义伪指令用于定义 ARM 汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。常见的符号定义伪指令有如下几种：用于定义全局变量的

[单片机]

ARM学习笔记9——ARM汇编汇编语言中的伪指令

　　ARN汇编器支持ARM伪指令，这些伪指令在汇编阶段被翻译成ARM或Thumb指令。ARM伪指令包含ADR、ADRL、MOV32和LDR。一、ADR伪指令　　1、作用　　　　ADR是小范围地址读取伪指令，基于PC相对偏移地址或基于寄存器相对偏移地址读取到寄存器中，当地址值是字节对齐时，取值范围为-255到255，当地址值是字对齐时，取值范围-1020到1020 　　2、语法格式　　　　ADR{ condition }{.W} register,label 　　3、参数说明　　　　3.1、.W：可选项，指定指令宽度　　　　3.2、register：目标寄存器　　　　3.3、label：基于PC或具有寄存器的表达式

[单片机]

arm 汇编中 .word伪指令的用法

PS：在u-boot源码时遇到_armboot_start、_bss_start等这些变量，不知道指向什么地址，于是查了一下，弄清了ARM汇编中 .word 这个伪指令是什么意思了，感觉自己很菜。借鉴一下网友帖子的内容，关键在帖子最后的总结：汇编和C引用变量的不同：汇编是绝对引用，即没有指针的概念，引用得到的就是值；c语言是间接引用，相当于指针的概念，引用地址变量，得到的就是该变量所指的内容值。感谢原作者，以下为原帖： aaronwong: u-boot中代码的疑问(_armboot_start与_start)? --------------------------- 我使用的是u-boot-1.3.0-rc

[单片机]

简述PIC单片机伪指令

简介：阅读一些PIC单片机的源程序开始段，会发现有一些特殊指令助记符，这些助记符与指令系统的助记不同，没有相对应的操作码，通常称这些特殊指令助记符为伪指令。伪指令在源程序中的作用是为完成汇编程序作各种准备工作的(实际上是给PC机汇编的注释)，这些伪指令仅在汇编过程中起作用，一旦汇编结束，伪指令的使命就完成。在汇编程序MPASM中，有四类伪指令：数据伪指令、列表伪指令、控制伪指令和宏汇编指令。现在，我们将对前两类中的常用伪指令予以说明，后两类伪指令等到在具体程序中出现时，再加以说明。 (1)ORG 存放单元起始地址格式：标号 ORG 地址表达式说明：ORG用于指定该伪指令后面的源程序存放的起始地址

[单片机]

ARM汇编器所支持的伪指令

　　在ARM汇编语言程序里，有一些特殊指令助记符，这些助记符与指令系统的助记符不同，没有相对应的操作码，通常称这些特殊指令助记符为伪指令，它们所完成的操作称为伪操作。伪指令在源程序中的作用是为完成汇编程序做各种准备工作的，这些伪指令仅在汇编过程中起作用，一旦汇编结束，伪指令的使命就完成了。　　在ARM的汇编程序中，有如下几种伪指令：符号定义伪指令、数据定义伪指令、汇编控制伪指令、宏指令及其他伪指令。　　1．符号定义（Symbol Definition）伪指令　　符号定义伪指令用于定义ARM汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。常见的符号定义伪指令有如下几种。　　·用于定义全局变量的GBLA、GBLL

[单片机]

ARM基础知识教程六

简介：ARM基础知识- ARM映像文件 1.ELF格式文件的结构 1.1映像文件组成部分 **一个映像文件有一个或多个域组成 **每个域包含一个或多个输出段 **每个输出段包含一个或多个输入段 **各输入段中包含了目标文件中的代码和数据输入段中包含了四类内容：代码、已经初始化的数据、未经初始化的存储区域、内容初始化成0的存储区域。每个输入段有相应的属性，可以为只读的（RO）、可读写的（RW）以及初始化成0的（ZI）。ARM连接器根据个输入段的属性将这些输入段分组，再组成不同的输出段及域。一个输出段中包含了一系列的具有相同的RO、RW和ZI属性的输入段。输出段的属性与其中包含的输入段的属性相同。在一个输出段的内

[单片机]

ARM基础学习-Cache和写缓冲器

Cache介绍 CPU的主频可以达到200MHZ，而一般性能的主存储器操用DRAM。其存储周期仅为100ns-200ns，主存储的性能将会影响整个系统的性能，Cache和写缓冲区位于主存储区和CPU之间，主要用来提高存储系统性能；而cache经常与写缓冲器（write buffer）一起使用，使用writer buffer的目的是，将处理器和cache从较慢的对主存的写操作中脱离出来。在处理器和MMU之间的cache称为逻辑cache，逻辑cache在虚拟地址空间存储数据，处理器可以直接通过cache访问数据，而无需通过MMU。逻辑cache又称为虚拟cache。在MMU与物理存储器之间的cache称为物理c

[单片机]

<font color='red'>ARM</font><font color='red'>基础</font>学习-Cache和写缓冲器

汇编语言 ORG伪指令

ORG伪指令给它下面一条语句指定起始偏移地址。通常，段定义语句 segment 指出了段的起点，偏移地址为0，段内各个语句或数据的地址，将会由段起始地址开始依次后推。当要对某条指令或某些数据规定特殊的存放地址时，可用ORG伪指令来实现，ORG语句可放在程序的任何位置。 assume cs:code, ds:data data segment ORG 1500H Test1 DB 12H, 34H ;Test1变量的偏移地址为1500H ORG 3000H Test2 DW 3040H, 2830H ;Test2变量的偏移地址为3000H data ends code segment

[单片机]