从0学ARM-汇编伪指令、LDS详解

一、MDK和/GNU伪指令区别

我们在学习汇编代码的时候经过会看到以下两种风格的代码：

gnu代码开头是：

.global_start
_start:@汇编入口
ldrsp,=0x41000000
.end@汇编程序结束

MDK代码开头是：

AREAExample,CODE,READONLY;声明代码段Example
ENTRY;程序入口
Start
MOVR0,#0
OVER
END

这两种风格的代码是要使用不同的编译器，我们之前的实例代码都是MDK风格的。

那么多对于我们初学者来说要学习哪种风格呢?答案是肯定的，学习GNU风格的汇编代码，因为做Linux驱动开发必须掌握的linux内核、uboot，而这两个软件就是GNU风格的。

为了大家不要把过多精力浪费在暂时没用的知识上，下面我们只讲GNU风格汇编。

二、GNU汇编书写格式：

1. 代码行中的注释符号:

‘@’ 整行注释符号: ‘#’ 语句分离符号:

直接操作数前缀: ‘#’ 或 ‘$’

2. 全局标号：

标号只能由a～z，A～Z，0～9，“.”，_等(由点、字母、数字、下划线等组成，除局部标号外，不能以数字开头)字符组成，标号的后面加“：”。

段内标号的地址值在汇编时确定;段外标号的地址值在连接时确定。

3. 局部标号:

局部标号主要在局部范围内使用而且局部标号可以重复出现。它由两部组成开头是一个0-99直接的数字局部标号后面加“:”

F：指示编译器只向前搜索，代码行数增加的方向/代码的下一句
B：指示编译器只向后搜索，代码行数减小的方向

注意局部标号的跳转，就近原则「举例：」

文件位置
arch/arm/kernel/entry-armv.S

三、伪操作：

1. 符号定义伪指令

2. 数据定义(Data Definition)伪操作

数据定义伪操作一般用于为特定的数据分配存储单元，同时可完成已分配存储单元的初始化。常见的数据定义伪操作有如下几种：

【举例】

.word

val:.word0x11223344
movr1,#val;将值0x11223344设置到寄存器r1中

.space

label:.spacesize,expr;expr可以是4字节以内的浮点数
a:space8,0x1

.rept

.reptcnt;cnt是重复次数
.endr

注意：

变量的定义放在，stop后，.end前
标号是地址的助记符，标号不占存储空间。位置在end前就可以，相对随意。

3. if选择

语法结构

.iflogical-expressing
……
.else
……
.endif

类似c语言里的条件编译。

【举例】

.ifval2==1
movr1,#val2
.endif

4. macro宏定义.

macro，.endm 宏定义类似c语言里的宏函数。

macro伪操作可以将一段代码定义为一个整体，称为宏指令。然后就可以在程序中通过宏指令多次调用该段代码。

语法格式：

.macro{$label}名字{$parameter{,$parameter}…}
……..code
.endm

其中，$标号在宏指令被展开时，标号会被替换为用户定义的符号。

宏操作可以使用一个或多个参数，当宏操作被展开时，这些参数被相应的值替换。

「注意」：先定义后使用

举例：

「【例1】：没有参数的宏实现子函数返回」

.macroMOV_PC_LR
MOVPC,LR
.endm

调用方式如下：
MOV_PC_LR

「【例2】：带参数宏实现子函数返回」

.macroMOV_PC_LR,param
movr1,\\param
MOVPC,LR
.endm

调用方法如下:

MOV_PC_LR#12

四、杂项伪操作

举例：.set

.setstart,0x40
movr1,#start;r1里面是0x40

举例 .equ

.equstart,0x40
movr1,#start;r1里面是0x40

#definePI3.1415

等价于

.equPI,31415

五、GNU伪指令

关键点：伪指令在编译时会转化为对应的ARM指令

1.ADR伪指令：该指令把标签所在的地址加载到寄存器中。ADR伪指令为小范围地址读取伪指令，使用的相对偏移范围：当地址值是字节对齐 (8位) 时，取值范围为-255～255，当地址值是字对齐 (32位) 时，取值范围为-1020～1020。语法格式:

ADR{cond}register,label
RR0,lable

2.ADRL伪指令：将中等范围地址读取到寄存器中

ADRL伪指令为中等范围地址读取伪指令。使用相对偏移范围：当地址值是字节对齐时，取值范围为-64～64KB;当地址值是字对齐时，取值范围为-256～256KB

语法格式：

ADRL{cond}register,label
ADRLR0，lable

3.LDR伪指令: LDR伪指令装载一个32位的常数和一个地址到寄存器。语法格式：

LDR{cond}register,=[expr|label-expr]
LDRR0，=0XFFFF0000；movr1,#0x12对比一下

注意：(1)ldr伪指令和ldr指令区分下面是ldr伪指令：

ldrr1,=val@r1=val是伪指令，将val标号地址赋给r1
【与MDK不一样，MDK只支持ldrr1,=val】

下面是ldr指令：

ldrr2,val@r1=*val是arm指令,将标号val地址里的内容给r2
val:.word0x11223344

(2)如何利用ldr伪指令实现长跳转

ldrpc，=32位地址

(3)编码中解决非立即数的问题用arm伪指令ldr

ldrr0,=0x999；0x999不是立即数，

六、GNU汇编的编译

1. 不含lds文件的编译

假设我们有以下代码，包括1个main.c文件，1个start.s文件：start.s

.global_start
_start:@汇编入口
ldrsp,=0x41000000
bmain
.globalmystrcopy
.text
mystrcopy://参数dest->r0,src->r2
LDRBr2,[r1],#1
STRBr2,[r0],#1
CMPr2,#0//判断是不是字符串尾
BNEmystrcopy
MOVpc,lr
stop:
bstop@死循环，防止跑飞等价于while(1)
.end@汇编程序结束

main.c

externvoidmystrcopy(char*d,constchar*s);
intmain(void)
{
constchar*src="yikoulinux";
chardest[20]={};
mystrcopy(dest,src);//调用汇编实现的mystrcopy函数
while(1);
return0;
}

Makefile编写方法如下：

1.TARGET=start
2.TARGETC=main
3.all:
4.arm-none-linux-gnueabi-gcc-O0-g-c-o$(TARGETC).o$(TARGETC).c
5.arm-none-linux-gnueabi-gcc-O0-g-c-o$(TARGET).o$(TARGET).s
6.#arm-none-linux-gnueabi-gcc-O0-g-S-o$(TARGETC).s$(TARGETC).c
7.arm-none-linux-gnueabi-ld$(TARGETC).o$(TARGET).o-Ttext0x40008000-o$(TARGET).elf
8.arm-none-linux-gnueabi-objcopy-Obinary-S$(TARGET).elf$(TARGET).bin
9.clean:
10.rm-rf*.o*.elf*.dis*.bin

Makefile含义如下：

定义环境变量TARGET=start，start为汇编文件的文件名
定义环境变量TARGETC=main，main为c语言文件
目标：all，4~8行是该指令的指令语句
将main.c编译生成main.o,$(TARGETC)会被替换成main
将start.s编译生成start.o,$(TARGET)会被替换成start
4-5也可以用该行1条指令实现
通过ld命令将main.o、start.o链接生成start.elf,-Ttext 0x40008000表示设置代码段起始地址为0x40008000
通过objcopy将start.elf转换成start.bin文件，-O binary (或–out-target=binary) 输出为原始的二进制文件,-S (或 –strip-all)输出文件中不要重定位信息和符号信息，缩小了文件尺寸，
clean目标
clean目标的执行语句，删除编译产生的临时文件

【补充】

gcc的代码优化级别，在 makefile 文件中的编译命令 4级 O0 — O3 数字越大，优化程度越高。O3最大优化
volatile作用 volatile修饰的变量，编译器不再进行优化，每次都真正访问内存地址空间。

2. 依赖lds文件编译

实际的工程文件，段复杂程度远比我们这个要复杂的多，尤其Linux内核有几万个文件，段的分布及其复杂，所以这就需要我们借助lds文件来定义内存的分布。

文件列表

main.c和start.s和上一节一致。

map.lds

OUTPUT_FORMAT("elf32-littlearm","elf32-littlearm","elf32-littlearm")
/*OUTPUT_FORMAT("elf32-arm","elf32-arm","elf32-arm")*/
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
.=0x40008000;
.=ALIGN(4);
.text:
{
.start.o(.text)
*(.text)
}
.=ALIGN(4);
.rodata:
{*(.rodata)}
.=ALIGN(4);
.data:
{*(.data)}
.=ALIGN(4);
.bss:
{*(.bss)}
}

解释一下上述的例子:

OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") 指定输出object档案预设的binary 文件格式。可以使用objdump -i列出支持的binary 文件格式;
OUTPUT_ARCH(arm) 指定输出的平台为arm，可以透过objdump -i查询支持平台;
ENTRY(_start) ：将符号_start的值设置成入口地址;
. = 0x40008000: 把定位器符号置为0x40008000(若不指定, 则该符号的初始值为0);
.text : { .start.o(.text) *(.text) } :前者表示将start.o放到text段的第一个位置，后者表示将所有(*符号代表任意输入文件)输入文件的.text section合并成一个.text section;
.rodata : { *(.data) } : 将所有输入文件的.rodata section合并成一个.rodata section;
.data : { *(.data) } : 将所有输入文件的.data section合并成一个.data section;
.bss : { *(.bss) } : 将所有输入文件的.bss section合并成一个.bss section;该段通常存放全局未初始化变量
. = ALIGN(4);表示下面的段4字节对齐

连接器每读完一个section描述后, 将定位器符号的值增加该section的大小。

来看下，Makefile应该如何写：

#CORTEX-A9PERIDRIVERCODE
#VERSION1.0
#ATHUOR一口Linux
#MODIFYDATE
#2020.11.17Makefile
#=================================================#
CROSS_COMPILE=arm-none-linux-gnueabi-
NAME=start
CFLAGS=-mfloat-abi=softfp-mfpu=vfpv3-mabi=apcs-gnu-fno-builtin-fno-builtin-function-g-O0-c
LD=$(CROSS_COMPILE)ld
CC=$(CROSS_COMPILE)gcc
OBJCOPY=$(CROSS_COMPILE)objcopy
OBJDUMP=$(CROSS_COMPILE)objdump
OBJS=start.omain.o
#================================================#
all:$(OBJS)
$(LD)$(OBJS)-Tmap.lds-o$(NAME).elf
$(OBJCOPY)-Obinary$(NAME).elf$(NAME).bin
$(OBJDUMP)-D$(NAME).elf>$(NAME).dis
%.o:%.S
$(CC)$(CFLAGS)-c-o$@$<
%.o:%.s
$(CC)$(CFLAGS)-c-o$@$<
%.o:%.c
$(CC)$(CFLAGS)-c-o$@$<
clean:
rm-rf$(OBJS)*.elf*.bin*.dis*.o