一、MDK和/GNU伪指令区别
我们在学习汇编代码的时候经过会看到以下两种风格的代码:
gnu代码开头是:
-
.global_start
-
_start:@汇编入口
-
ldrsp,=0x41000000
-
.end@汇编程序结束
MDK代码开头是:
-
AREAExample,CODE,READONLY;声明代码段Example
-
ENTRY;程序入口
-
Start
-
MOVR0,#0
-
OVER
-
END
这两种风格的代码是要使用不同的编译器,我们之前的实例代码都是MDK风格的。
那么多对于我们初学者来说要学习哪种风格呢?答案是肯定的,学习GNU风格的汇编代码,因为做Linux驱动开发必须掌握的linux内核、uboot,而这两个软件就是GNU风格的。
为了大家不要把过多精力浪费在暂时没用的知识上,下面我们只讲GNU风格汇编。
二、GNU汇编书写格式:
1. 代码行中的注释符号:
‘@’ 整行注释符号: ‘#’ 语句分离符号:
直接操作数前缀: ‘#’ 或 ‘$’
2. 全局标号:
标号只能由a~z,A~Z,0~9,“.”,_等(由点、字母、数字、下划线等组成,除局部标号外,不能以数字开头)字符组成,标号的后面加“:”。
段内标号的地址值在汇编时确定;段外标号的地址值在连接时确定。
3. 局部标号:
局部标号主要在局部范围内使用而且局部标号可以重复出现。它由两部组成开头是一个0-99直接的数字局部标号 后面加“:”
-
F:指示编译器只向前搜索,代码行数增加的方向/代码的下一句
-
B:指示编译器只向后搜索,代码行数减小的方向
注意局部标号的跳转,就近原则「举例:」
-
文件位置
-
arch/arm/kernel/entry-armv.S
三、伪操作:
1. 符号定义伪指令
2. 数据定义(Data Definition)伪操作
数据定义伪操作一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。常见的数据定义伪操作有如下几种:
【举例】
.word
-
val:.word0x11223344
-
movr1,#val;将值0x11223344设置到寄存器r1中
.space
-
label:.spacesize,expr;expr可以是4字节以内的浮点数
-
a:space8,0x1
.rept
-
.reptcnt;cnt是重复次数
-
.endr
注意:
- 变量的定义放在,stop后,.end前
- 标号是地址的助记符,标号不占存储空间。位置在end前就可以,相对随意。
3. if选择
语法结构
-
.iflogical-expressing
-
……
-
.else
-
……
-
.endif
类似c语言里的条件编译 。
【举例】
-
.ifval2==1
-
movr1,#val2
-
.endif
4. macro宏定义.
macro,.endm 宏定义类似c语言里的宏函数 。
macro伪操作可以将一段代码定义为一个整体,称为宏指令。然后就可以在程序中通过宏指令多次调用该段代码。
语法格式:
-
.macro{$label}名字{$parameter{,$parameter}…}
-
……..code
-
.endm
其中,$标号在宏指令被展开时,标号会被替换为用户定义的符号。
宏操作可以使用一个或多个参数,当宏操作被展开时,这些参数被相应的值替换。
「注意」:先定义后使用
举例:
「【例1】:没有参数的宏实现子函数返回」
-
.macroMOV_PC_LR
-
MOVPC,LR
-
.endm
-
调用方式如下:
-
MOV_PC_LR
「【例2】:带参数宏实现子函数返回」
-
.macroMOV_PC_LR,param
-
movr1,\\param
-
MOVPC,LR
-
.endm
调用方法如下:
-
MOV_PC_LR#12
四、杂项伪操作
举例:.set
-
.setstart,0x40
-
movr1,#start;r1里面是0x40
举例 .equ
-
.equstart,0x40
-
movr1,#start;r1里面是0x40
-
#definePI3.1415
等价于
-
.equPI,31415
五、GNU伪指令
1.ADR伪指令 :该指令把标签所在的地址加载到寄存器中。ADR伪指令为小范围地址读取伪指令,使用的相对偏移范围:当地址值是字节对齐 (8位) 时,取值范围为-255~255,当地址值是字对齐 (32位) 时,取值范围为-1020~1020。语法格式:
-
ADR{cond}register,label
-
RR0,lable
2.ADRL伪指令:将中等范围地址读取到寄存器中
ADRL伪指令为中等范围地址读取伪指令。使用相对偏移范围:当地址值是字节对齐时,取值范围为-64~64KB;当地址值是字对齐时,取值范围为-256~256KB
语法格式:
-
ADRL{cond}register,label
-
ADRLR0,lable
3.LDR伪指令: LDR伪指令装载一个32位的常数和一个地址到寄存器。语法格式:
-
LDR{cond}register,=[expr|label-expr]
-
LDRR0,=0XFFFF0000;movr1,#0x12对比一下
注意:(1)ldr伪指令和ldr指令区分 下面是ldr伪指令:
-
ldrr1,=val@r1=val是伪指令,将val标号地址赋给r1
-
【与MDK不一样,MDK只支持ldrr1,=val】
下面是ldr指令:
-
ldrr2,val@r1=*val是arm指令,将标号val地址里的内容给r2
-
val:.word0x11223344
(2)如何利用ldr伪指令实现长跳转
-
ldrpc,=32位地址
(3)编码中解决非立即数的问题 用arm伪指令ldr
-
ldrr0,=0x999;0x999不是立即数,
六、GNU汇编的编译
1. 不含lds文件的编译
假设我们有以下代码,包括1个main.c文件,1个start.s文件:start.s
-
.global_start
-
_start:@汇编入口
-
ldrsp,=0x41000000
-
bmain
-
.globalmystrcopy
-
.text
-
mystrcopy://参数dest->r0,src->r2
-
LDRBr2,[r1],#1
-
STRBr2,[r0],#1
-
CMPr2,#0//判断是不是字符串尾
-
BNEmystrcopy
-
MOVpc,lr
-
stop:
-
bstop@死循环,防止跑飞等价于while(1)
-
.end@汇编程序结束
main.c
-
externvoidmystrcopy(char*d,constchar*s);
-
intmain(void)
-
{
-
constchar*src="yikoulinux";
-
chardest[20]={};
-
mystrcopy(dest,src);//调用汇编实现的mystrcopy函数
-
while(1);
-
return0;
-
}
Makefile编写方法如下:
-
1.TARGET=start
-
2.TARGETC=main
-
3.all:
-
4.arm-none-linux-gnueabi-gcc-O0-g-c-o$(TARGETC).o$(TARGETC).c
-
5.arm-none-linux-gnueabi-gcc-O0-g-c-o$(TARGET).o$(TARGET).s
-
6.#arm-none-linux-gnueabi-gcc-O0-g-S-o$(TARGETC).s$(TARGETC).c
-
7.arm-none-linux-gnueabi-ld$(TARGETC).o$(TARGET).o-Ttext0x40008000-o$(TARGET).elf
-
8.arm-none-linux-gnueabi-objcopy-Obinary-S$(TARGET).elf$(TARGET).bin
-
9.clean:
-
10.rm-rf*.o*.elf*.dis*.bin
Makefile含义如下:
- 定义环境变量TARGET=start,start为汇编文件的文件名
- 定义环境变量TARGETC=main,main为c语言文件
- 目标:all,4~8行是该指令的指令语句
- 将main.c编译生成main.o,$(TARGETC)会被替换成main
- 将start.s编译生成start.o,$(TARGET)会被替换成start
- 4-5也可以用该行1条指令实现
- 通过ld命令将main.o、start.o链接生成start.elf,-Ttext 0x40008000表示设置代码段起始地址为0x40008000
- 通过objcopy将start.elf转换成start.bin文件,-O binary (或–out-target=binary) 输出为原始的二进制文件,-S (或 –strip-all)输出文件中不要重定位信息和符号信息,缩小了文件尺寸,
- clean目标
- clean目标的执行语句,删除编译产生的临时文件
【补充】
- gcc的代码优化级别,在 makefile 文件中的编译命令 4级 O0 — O3 数字越大,优化程度越高。O3最大优化
- volatile作用 volatile修饰的变量,编译器不再进行优化,每次都真正访问内存地址空间。
2. 依赖lds文件编译
实际的工程文件,段复杂程度远比我们这个要复杂的多,尤其Linux内核有几万个文件,段的分布及其复杂,所以这就需要我们借助lds文件来定义内存的分布。
文件列表
main.c和start.s和上一节一致。
map.lds
-
OUTPUT_FORMAT("elf32-littlearm","elf32-littlearm","elf32-littlearm")
-
/*OUTPUT_FORMAT("elf32-arm","elf32-arm","elf32-arm")*/
-
OUTPUT_ARCH(arm)
-
ENTRY(_start)
-
SECTIONS
-
{
-
.=0x40008000;
-
.=ALIGN(4);
-
.text:
-
{
-
.start.o(.text)
-
*(.text)
-
}
-
.=ALIGN(4);
-
.rodata:
-
{*(.rodata)}
-
.=ALIGN(4);
-
.data:
-
{*(.data)}
-
.=ALIGN(4);
-
.bss:
-
{*(.bss)}
-
}
解释一下上述的例子:
- OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") 指定输出object档案预设的binary 文件格式。可以使用objdump -i列出支持的binary 文件格式;
- OUTPUT_ARCH(arm) 指定输出的平台为arm,可以透过objdump -i查询支持平台;
- ENTRY(_start) :将符号_start的值设置成入口地址;
- . = 0x40008000: 把定位器符号置为0x40008000(若不指定, 则该符号的初始值为0);
- .text : { .start.o(.text) *(.text) } :前者表示将start.o放到text段的第一个位置,后者表示将所有(*符号代表任意输入文件)输入文件的.text section合并成一个.text section;
- .rodata : { *(.data) } : 将所有输入文件的.rodata section合并成一个.rodata section;
- .data : { *(.data) } : 将所有输入文件的.data section合并成一个.data section;
- .bss : { *(.bss) } : 将所有输入文件的.bss section合并成一个.bss section;该段通常存放全局未初始化变量
- . = ALIGN(4);表示下面的段4字节对齐
连接器每读完一个section描述后, 将定位器符号的值增加该section的大小。
来看下,Makefile应该如何写:
-
#CORTEX-A9PERIDRIVERCODE
-
#VERSION1.0
-
#ATHUOR一口Linux
-
#MODIFYDATE
-
#2020.11.17Makefile
-
#=================================================#
-
CROSS_COMPILE=arm-none-linux-gnueabi-
-
NAME=start
-
CFLAGS=-mfloat-abi=softfp-mfpu=vfpv3-mabi=apcs-gnu-fno-builtin-fno-builtin-function-g-O0-c
-
LD=$(CROSS_COMPILE)ld
-
CC=$(CROSS_COMPILE)gcc
-
OBJCOPY=$(CROSS_COMPILE)objcopy
-
OBJDUMP=$(CROSS_COMPILE)objdump
-
OBJS=start.omain.o
-
#================================================#
-
all:$(OBJS)
-
$(LD)$(OBJS)-Tmap.lds-o$(NAME).elf
-
$(OBJCOPY)-Obinary$(NAME).elf$(NAME).bin
-
$(OBJDUMP)-D$(NAME).elf>$(NAME).dis
-
%.o:%.S
-
$(CC)$(CFLAGS)-c-o$@$<
-
%.o:%.s
-
$(CC)$(CFLAGS)-c-o$@$<
-
%.o:%.c
-
$(CC)$(CFLAGS)-c-o$@$<
-
clean:
-
rm-rf$(OBJS)*.elf*.bin*.dis*.o
编译结果如下:
编译结果
最终生成start.bin,改文件可以烧录到开发板测试,因为本例没有直观现象,后续文章我们加入其它功能再测试。
【注意】
- 其中交叉编译工具链「arm-none-linux-gnueabi-」 要根据自己实际的平台来选择,本例是基于三星的exynos-4412工具链实现的。
- 地址0x40008000也不是随便选择的,
exynos4412 地址分布
读者可以根据自己手里的开发板对应的soc手册查找该地址。
linux内核的异常向量表
linux内核的内存分布也是依赖lds文件定义的,linux内核的编译我们暂不讨论,编译好之后会再以下位置生成对应的lds文件:
-
arch/arm/kernel/vmlinux.lds
我们看下该文件的部分内容:
vmlinux.lds
OUTPUT_ARCH(arm)制定对应的处理器;
ENTRY(stext)表示程序的入口是stext。
同时我们也可以看到linux内存的划分更加的复杂,后续我们讨论linux内核,再继续分析该文件。
3. elf文件和bin文件区别:
1) ELF
ELF文件格式是一个开放标准,各种UNIX系统的可执行文件都采用ELF格式,它有三种不同的类型:
- 可重定位的目标文件(Relocatable,或者Object File)
- 可执行文件(Executable)
- 共享库(Shared Object,或者Shared Library)
ELF格式提供了两种不同的视角,链接器把ELF文件看成是Section的集合,而加载器把ELF文件看成是Segment的集合。
2) bin
BIN文件是直接的二进制文件,内部没有地址标记。bin文件内部数据按照代码段或者数据段的物理空间地址来排列。一般用编程器烧写时从00开始,而如果下载运行,则下载到编译时的地址即可。
在Linux OS上,为了运行可执行文件,他们是遵循ELF格式的,通常gcc -o test test.c,生成的test文件就是ELF格式的,这样就可以运行了,执行elf文件,则内核会使用加载器来解析elf文件并执行。
在Embedded中,如果上电开始运行,没有OS系统,如果将ELF格式的文件烧写进去,包含一些ELF文件的符号表字符表之类的section,运行碰到这些,就会导致失败,如果用objcopy生成纯粹的二进制文件,去除掉符号表之类的section,只将代码段数据段保留下来,程序就可以一步一步运行。
elf文件里面包含了符号表等。BIN文件是将elf文件中的代码段,数据段,还有一些自定义的段抽取出来做成的一个内存的镜像。
并且elf文件中代码段数据段的位置并不是它实际的物理位置。他实际物理位置是在表中标记出来的。
原文地址:https://mp.weixin.qq.com/s/e_2RDcjBCPqLYNLFxXXKZQ