函数的本质
关于CPU的补充
寄存器
CPU除了由控制器、运算器,还有寄存器。其中寄存器的作用就是进行数据的临时存储。
PS: CPU的运算速度是非常快的,为了性能,CPU在那边开辟了一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块存储区域中,运算时就在这一小块临时存储区域进行。我们称这一小块临时存储区域位寄存器。
对于arm64系的CPU来说,如果寄存器以x开头,则表明是一个64位的寄存器,如果以w开头,则说明是一个32位的寄存器,在系统中没有提供16位和8位的寄存器访问和使用。其中32位寄存器是64位寄存器的低32位部分,不是独立存在的。
- 对于程序员来说,CPU中最重要的部件是寄存器,可以通过改变寄存器的内容事件对CPU的控制
- 不同的CPU,寄存器的个数、结构不相同
高速缓存
iPhoneX上搭载的ARM处理器A11它的1级缓存的容量为64KB,二级缓存的容量为8MB
PS: CPU每执行一条指令前都需要从内存中将指令读取到CPU内执行。而寄存器的运行速度相比内存读取要快得多,为了性能,CPU还集成了一个高速缓存存储区域。当程序运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成)。CPU直接从高速缓存依次读取指令来执行。
PS: 操作系统会建立高速缓存和虚拟内存的映射关系 和 pagefault的策略很像
寄存器的补充
数据地址寄存器
数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。
ARM64中
- 64位:X0~X30,XZR(零寄存器)
- 32位:W0~W30,WZR(零寄存器)
PS:8086汇编中有一种个数的寄存器 段寄存器 CS DS SS ES 四个寄存器,用来保存段的地址,这个属于Intel架构CPU中。在ARM中没有。
浮现和向量寄存器
因为浮点数的存储以及运算的特殊性,CPU中专门提供浮点寄存器来处理浮点数
- 浮点寄存器 64位 D0~D31 32位: S0~S31
现在的CPU支持向量运算。(向量运算在图形处理相关的领域用的非常多)为了支持向量运算计算机也提供了向量寄存器。
- 向量寄存器 128位 V0~V31
栈
是一种具有特殊访问方式的存储空间(后进先出,Last In Out Last, LIFO)
SP和FP寄存器
- sp寄存器在任意时刻会保存我们的栈顶地址
- fp寄存器也称为x29寄存器,属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址
PS: ARM64开始,取消32位的LDM、STM、PUSH和POP指令。取而代之的是ldr\ldp str\stp。
PS: ARM64里面,对栈的操作是16字节对齐的。
PS: 函数没有嵌套调用的时候,不需要使用fp
PS: AMR64,是先开辟一段栈空间,再往栈中放数据。所以不存在push操作。
PS: 栈的开口方向是往低地址
PS: 局部变量和参数需要放到栈空间 函数名不放,函数名是符号
函数调用栈
常见的函数调用开辟和恢复的栈空间
sub sp, sp, #0x40 ; 拉伸0x40(64字节)空间
stp x29, x30, [sp, #0x30] ; x29\x30 寄存器的栈保护
add x29, sp, #0x30 ; x29指向栈帧的底部
...
ldp x29, x30, [sp, #0x30] ; 恢复x29\x30寄存器的值
add sp, sp, #0x40 ; 栈平衡
ret
PS: 栈的开口方向是低地址。所以开辟栈空间是减(sub),恢复栈空间是加(add)
关于内存的读写指令
PS: 读/写 数据都是往高地址读/写 * 如果放的数据占用两个字节,起始地址是0x0001, 实际占用的是0x0001和0x0002
str(store register)指令 * 将数据从寄存器中读出来,存到内存中 ldr(load register)指令 * 将数据从内存中读出来,存到寄存器中
此ldr和str的变种ldp和stp还可以操作2个寄存器
PS: str/ldr 是内存和寄存器交互的指令
堆栈操作练习
使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换
sub sp, sp, #0x20 ; 拉伸栈空间32个字节
stp x0, x1, [sp, #0x10] ; sp往上加16个字节,存放x0和x1
ldp x1, x0, [sp, #0x10] ; 将sp偏移16个字节的值读取出来,放入x1和x0
add sp, sp, #0x20 ; 恢复栈平衡
PS:stp x0, x1, [sp, #0x10]这条命令可以改为stp x0, x1, [sp],但是不可以 stp x0, x1, [sp, #0x20],因为会写入到其他的空间里面。 PS: [地址] 是将地址的内容取出来
stp x0, x1, [sp, #0x10] 这条命令执行的结果
PS: **ldp x1, x0, [sp, #0x10]**指令执行之后,x0 x1的内容变了,sp和内存中的数据没有变化
PS: 内存空间布局
PS: 死循环恢复会奔溃? PS: 当堆空间和栈空间碰到了一起,就会出现堆栈溢出。
bl和ret指令
bl标号
- 将下一条指令的地址放入lr(x30)寄存器
- 转到标号处执行指令
ret
- 默认使用lr(x30)寄存器的值,通过底层指令提示CPU此处作为下一条指令的地址
PS: ARM64平台的特色指令,它面向硬件做了优化处理的
x30寄存器
- x30寄存器存放的是函数的返回地址。当ret指令执行时刻,会寻找x30寄存器保存的地址值。保存的是回家的路
PS: 在函数嵌套调用的时候,需要将x30入栈
.text
.global _A, _B
_A:
mov x0, #0xaaaa
bl _B
mov x0, #0xaaaa
ret
_B:
mov x0, #0xbbbb
ret
之后进入死循环。需要将lr保存到当前的栈
看看系统是如做的
两种方式保存x30
.text
.global _A, _B
_A:
sub sp, sp, #0x10
str x30, [sp]
mov x0, #0xaaaa
bl _B
mov x0, #0xaaaa
ldr x30, [sp]
add sp, sp, #0x10
ret
_B:
mov x0, #0xbbbb
ret
.text
.global _A, _B
_A:
//sub sp, sp, #0x10
//str x30, [sp]
str x30, [sp, #-0x10]!
mov x0, #0xaaaa
bl _B
mov x0, #0xaaaa
//ldr x30, [sp]
//add sp, sp, #0x10
ldr x30, [sp], #0x10
ret
_B:
mov x0, #0xbbbb
ret
将x30的值放入栈空间
使用汇编写一个带参数的函数
参考系统的
int sum(int a, int b) {
return a + b;
}
PS: w0 / x0 保存的是函数的返回值
自己实现第一个带参数汇编函数
_suma:
add x0, x0, x1
ret
PS: 函数的参数放在寄存器里面,返回值放在x0寄存器里面
函数的参数和返回值
- ARM64下,函数的参数是存放在x0到x7(w0到w7)这8个寄存器里面的。如果超过8个参数,就会入栈。
- 函数的返回值是存放在x0寄存器里面的。
PS: OC的方法最好不要超过6个,因为有两个隐形的参数,超过8个会影响效率。
函数的局部变量
- 函数的局部变量放在栈里面
总结
- 栈
- 是一种具有特殊的访问方式的存储空间(后进先出, Last In Out Last, LIFO)
- SP和FP寄存器
- SP寄存器在任意时刻会保存我们的栈顶地址
- FP寄存器也称为x29寄存器,属于通用寄存器,但是在某些时刻,我们利用它保存栈底的地址
- ARM64里面 对栈的操作是16字节对齐
- 栈的读写指令
- 读: ldr(load register)指令 LDR、LDP
- 写: str(store register)指令 STR、STP
- 汇编的练习
- 指令:
- sub sp, sp, #0x10; 拉伸空间16字节
- stp x0, x1, [sp];往sp所在的位置存放x0 x1
- 简写:
- stp x0, x1, [sp, #-0x10]! 先移动sp 再写内存
- 指令:
- bl指令
- 跳转指令: bl标号,标识程序执行到的标号。将下一条指令的地址保存到bl寄存器。
- b代表着跳转
- l代表lr(x30)寄存器 放回家的路
- ret
- 累死函数中的return
- 让CPU执行lr寄存器所指向的指令
- 函数嵌套调用 lr(x30) 保存到当前自己的栈空间 保护现场
- 函数的参数
- ARM64中,参数是放在x0到x7的8个寄存器中
- 如果是浮点数,就会用浮点寄存器
- 如果超过8个参数就会用栈传递
- 函数的返回值
- 一般函数的返回值使用x0寄存器保存
- 如果返回值大于8个字节,就会利用内存传递返回值