函数的本质

关于CPU的补充

寄存器

CPU除了由控制器、运算器，还有寄存器。其中寄存器的作用就是进行数据的临时存储。

PS: CPU的运算速度是非常快的，为了性能，CPU在那边开辟了一小块临时存储区域，并在进行运算时先将数据从内存复制到这一小块存储区域中，运算时就在这一小块临时存储区域进行。我们称这一小块临时存储区域位寄存器。

对于arm64系的CPU来说，如果寄存器以x开头，则表明是一个64位的寄存器，如果以w开头，则说明是一个32位的寄存器，在系统中没有提供16位和8位的寄存器访问和使用。其中32位寄存器是64位寄存器的低32位部分，不是独立存在的。

对于程序员来说，CPU中最重要的部件是寄存器，可以通过改变寄存器的内容事件对CPU的控制
不同的CPU，寄存器的个数、结构不相同

高速缓存

iPhoneX上搭载的ARM处理器A11它的1级缓存的容量为64KB，二级缓存的容量为8MB

PS: CPU每执行一条指令前都需要从内存中将指令读取到CPU内执行。而寄存器的运行速度相比内存读取要快得多，为了性能，CPU还集成了一个高速缓存存储区域。当程序运行时，先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成)。CPU直接从高速缓存依次读取指令来执行。

PS: 操作系统会建立高速缓存和虚拟内存的映射关系和 pagefault的策略很像

寄存器的补充

数据地址寄存器

数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是在CPU指令中保存操作数，在CPU中当做一些常规变量来使用。

ARM64中

64位:X0~X30,XZR(零寄存器)
32位:W0~W30,WZR(零寄存器)

PS:8086汇编中有一种个数的寄存器段寄存器 CS DS SS ES 四个寄存器，用来保存段的地址，这个属于Intel架构CPU中。在ARM中没有。

浮现和向量寄存器

因为浮点数的存储以及运算的特殊性，CPU中专门提供浮点寄存器来处理浮点数

浮点寄存器 64位 D0～D31 32位: S0~S31

现在的CPU支持向量运算。(向量运算在图形处理相关的领域用的非常多)为了支持向量运算计算机也提供了向量寄存器。

向量寄存器 128位 V0～V31

栈

是一种具有特殊访问方式的存储空间(后进先出，Last In Out Last, LIFO)

SP和FP寄存器

sp寄存器在任意时刻会保存我们的栈顶地址
fp寄存器也称为x29寄存器，属于通用寄存器，但是在某些时刻我们利用它保存栈底的地址

PS: ARM64开始，取消32位的LDM、STM、PUSH和POP指令。取而代之的是ldr\ldp str\stp。 PS: ARM64里面，对栈的操作是16字节对齐的。
PS: 函数没有嵌套调用的时候，不需要使用fp PS: AMR64，是先开辟一段栈空间，再往栈中放数据。所以不存在push操作。 PS: 栈的开口方向是往低地址 PS: 局部变量和参数需要放到栈空间函数名不放，函数名是符号

函数调用栈

常见的函数调用开辟和恢复的栈空间

sub sp, sp, #0x40           ; 拉伸0x40(64字节)空间
stp x29, x30, [sp, #0x30]   ; x29\x30 寄存器的栈保护
add x29, sp, #0x30          ; x29指向栈帧的底部
...
ldp x29, x30, [sp, #0x30]   ; 恢复x29\x30寄存器的值
add sp, sp, #0x40           ; 栈平衡
ret

PS: 栈的开口方向是低地址。所以开辟栈空间是减(sub),恢复栈空间是加(add)

关于内存的读写指令

PS: 读/写数据都是往高地址读/写 * 如果放的数据占用两个字节，起始地址是0x0001, 实际占用的是0x0001和0x0002

str(store register)指令 * 将数据从寄存器中读出来，存到内存中 ldr(load register)指令 * 将数据从内存中读出来，存到寄存器中

此ldr和str的变种ldp和stp还可以操作2个寄存器

PS: str/ldr 是内存和寄存器交互的指令

堆栈操作练习

使用32个字节空间作为这段程序的栈空间，然后利用栈将x0和x1的值进行交换

    sub sp, sp, #0x20           ; 拉伸栈空间32个字节
    stp x0, x1, [sp, #0x10]     ; sp往上加16个字节，存放x0和x1
    ldp x1, x0, [sp, #0x10]     ; 将sp偏移16个字节的值读取出来，放入x1和x0
    add sp, sp, #0x20           ; 恢复栈平衡

PS：stp x0, x1, [sp, #0x10]这条命令可以改为stp x0, x1, [sp]，但是不可以 stp x0, x1, [sp, #0x20]，因为会写入到其他的空间里面。 PS: [地址] 是将地址的内容取出来

stp x0, x1, [sp, #0x10] 这条命令执行的结果

PS: **ldp x1, x0, [sp, #0x10]**指令执行之后,x0 x1的内容变了,sp和内存中的数据没有变化

PS: 内存空间布局

PS: 死循环恢复会奔溃？ PS: 当堆空间和栈空间碰到了一起，就会出现堆栈溢出。

bl和ret指令

bl标号

将下一条指令的地址放入lr(x30)寄存器
转到标号处执行指令

ret

默认使用lr(x30)寄存器的值，通过底层指令提示CPU此处作为下一条指令的地址

PS: ARM64平台的特色指令,它面向硬件做了优化处理的

x30寄存器

x30寄存器存放的是函数的返回地址。当ret指令执行时刻，会寻找x30寄存器保存的地址值。保存的是回家的路

PS: 在函数嵌套调用的时候，需要将x30入栈

.text
.global _A, _B

_A:
    mov x0, #0xaaaa
    bl _B
    mov x0, #0xaaaa
    ret

_B:
    mov x0, #0xbbbb
    ret

之后进入死循环。需要将lr保存到当前的栈

看看系统是如做的

两种方式保存x30

.text
.global _A, _B

_A:
    sub sp, sp, #0x10
    str x30, [sp]
    mov x0, #0xaaaa
    bl _B
    mov x0, #0xaaaa
    ldr x30, [sp]
    add sp, sp, #0x10
    ret

_B:
    mov x0, #0xbbbb
    ret

.text
.global _A, _B

_A:
    //sub sp, sp, #0x10
    //str x30, [sp]
    str x30, [sp, #-0x10]!
    mov x0, #0xaaaa
    bl _B
    mov x0, #0xaaaa
    //ldr x30, [sp]
    //add sp, sp, #0x10
    ldr x30, [sp], #0x10
    ret

_B:
    mov x0, #0xbbbb
    ret

将x30的值放入栈空间

使用汇编写一个带参数的函数

参考系统的

int sum(int a, int b) {
    return a + b;
}

PS: w0 / x0 保存的是函数的返回值

自己实现第一个带参数汇编函数

_suma:
    add x0, x0, x1
    ret

PS: 函数的参数放在寄存器里面，返回值放在x0寄存器里面

函数的参数和返回值

ARM64下，函数的参数是存放在x0到x7(w0到w7)这8个寄存器里面的。如果超过8个参数，就会入栈。
函数的返回值是存放在x0寄存器里面的。

PS: OC的方法最好不要超过6个，因为有两个隐形的参数，超过8个会影响效率。

函数的局部变量

函数的局部变量放在栈里面

总结

栈
- 是一种具有特殊的访问方式的存储空间(后进先出， Last In Out Last, LIFO)
- SP和FP寄存器
  - SP寄存器在任意时刻会保存我们的栈顶地址
  - FP寄存器也称为x29寄存器，属于通用寄存器，但是在某些时刻，我们利用它保存栈底的地址
- ARM64里面对栈的操作是16字节对齐
- 栈的读写指令
  - 读: ldr(load register)指令 LDR、LDP
  - 写: str(store register)指令 STR、STP
- 汇编的练习
  - 指令：
    - sub sp, sp, #0x10; 拉伸空间16字节
    - stp x0, x1, [sp];往sp所在的位置存放x0 x1
  - 简写：
    - stp x0, x1, [sp, #-0x10]! 先移动sp 再写内存
bl指令
- 跳转指令: bl标号，标识程序执行到的标号。将下一条指令的地址保存到bl寄存器。
- b代表着跳转
- l代表lr(x30)寄存器放回家的路
ret
- 累死函数中的return
- 让CPU执行lr寄存器所指向的指令
- 函数嵌套调用 lr（x30) 保存到当前自己的栈空间保护现场
函数的参数
- ARM64中，参数是放在x0到x7的8个寄存器中
- 如果是浮点数，就会用浮点寄存器
- 如果超过8个参数就会用栈传递
函数的返回值
- 一般函数的返回值使用x0寄存器保存
- 如果返回值大于8个字节，就会利用内存传递返回值