函数的本质

413 阅读8分钟

函数的本质

关于CPU的补充

寄存器

CPU除了由控制器、运算器,还有寄存器。其中寄存器的作用就是进行数据的临时存储。

PS: CPU的运算速度是非常快的,为了性能,CPU在那边开辟了一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块存储区域中,运算时就在这一小块临时存储区域进行。我们称这一小块临时存储区域位寄存器。

对于arm64系的CPU来说,如果寄存器以x开头,则表明是一个64位的寄存器,如果以w开头,则说明是一个32位的寄存器,在系统中没有提供16位和8位的寄存器访问和使用。其中32位寄存器是64位寄存器的低32位部分,不是独立存在的。

  • 对于程序员来说,CPU中最重要的部件是寄存器,可以通过改变寄存器的内容事件对CPU的控制
  • 不同的CPU,寄存器的个数、结构不相同

高速缓存

iPhoneX上搭载的ARM处理器A11它的1级缓存的容量为64KB,二级缓存的容量为8MB

PS: CPU每执行一条指令前都需要从内存中将指令读取到CPU内执行。而寄存器的运行速度相比内存读取要快得多,为了性能,CPU还集成了一个高速缓存存储区域。当程序运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成)。CPU直接从高速缓存依次读取指令来执行。

PS: 操作系统会建立高速缓存和虚拟内存的映射关系 和 pagefault的策略很像

寄存器的补充

数据地址寄存器

数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。

ARM64中

  • 64位:X0~X30,XZR(零寄存器)
  • 32位:W0~W30,WZR(零寄存器)

PS:8086汇编中有一种个数的寄存器 段寄存器 CS DS SS ES 四个寄存器,用来保存段的地址,这个属于Intel架构CPU中。在ARM中没有。

浮现和向量寄存器

因为浮点数的存储以及运算的特殊性,CPU中专门提供浮点寄存器来处理浮点数

  • 浮点寄存器 64位 D0~D31 32位: S0~S31

现在的CPU支持向量运算。(向量运算在图形处理相关的领域用的非常多)为了支持向量运算计算机也提供了向量寄存器。

  • 向量寄存器 128位 V0~V31

是一种具有特殊访问方式的存储空间(后进先出,Last In Out Last, LIFO)

16192483495803.png

SP和FP寄存器

  • sp寄存器在任意时刻会保存我们的栈顶地址
  • fp寄存器也称为x29寄存器,属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址

PS: ARM64开始,取消32位的LDM、STM、PUSH和POP指令。取而代之的是ldr\ldp str\stp。 PS: ARM64里面,对栈的操作是16字节对齐的。
PS: 函数没有嵌套调用的时候,不需要使用fp PS: AMR64,是先开辟一段栈空间,再往栈中放数据。所以不存在push操作。 PS: 栈的开口方向是往低地址 PS: 局部变量和参数需要放到栈空间 函数名不放,函数名是符号

函数调用栈

常见的函数调用开辟和恢复的栈空间

sub sp, sp, #0x40           ; 拉伸0x40(64字节)空间
stp x29, x30, [sp, #0x30]   ; x29\x30 寄存器的栈保护
add x29, sp, #0x30          ; x29指向栈帧的底部
...
ldp x29, x30, [sp, #0x30]   ; 恢复x29\x30寄存器的值
add sp, sp, #0x40           ; 栈平衡
ret

PS: 栈的开口方向是低地址。所以开辟栈空间是减(sub),恢复栈空间是加(add)

关于内存的读写指令

PS: 读/写 数据都是往高地址读/写 * 如果放的数据占用两个字节,起始地址是0x0001, 实际占用的是0x0001和0x0002

str(store register)指令 * 将数据从寄存器中读出来,存到内存中 ldr(load register)指令 * 将数据从内存中读出来,存到寄存器中

此ldr和str的变种ldp和stp还可以操作2个寄存器

PS: str/ldr 是内存和寄存器交互的指令

堆栈操作练习

使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换

    sub sp, sp, #0x20           ; 拉伸栈空间32个字节
    stp x0, x1, [sp, #0x10]     ; sp往上加16个字节,存放x0和x1
    ldp x1, x0, [sp, #0x10]     ; 将sp偏移16个字节的值读取出来,放入x1和x0
    add sp, sp, #0x20           ; 恢复栈平衡

PS:stp x0, x1, [sp, #0x10]这条命令可以改为stp x0, x1, [sp],但是不可以 stp x0, x1, [sp, #0x20],因为会写入到其他的空间里面。 PS: [地址] 是将地址的内容取出来

stp x0, x1, [sp, #0x10] 这条命令执行的结果

WeChatf6cafbfc6305b616cd83e7b65e28092e.png

PS: **ldp x1, x0, [sp, #0x10]**指令执行之后,x0 x1的内容变了,sp和内存中的数据没有变化

WeChat14074894bcf52928f8f7fd7353ef40d2.png

WeChat455da036741055add799da394a073f13.png

WeChat1942ca47bd122a84d89a3e1bd33c388d.png

WeChat84486f5d140ae3832996ae1857604d21.png

WeChat6aa3d5cd942196c491e889d00b8f77ef.png

WeChatcf6a5748342bd6345dead179c79fb877.png

WeChat9cec54a0abf776e7c571bcc40cb39324.png

WeChat00c739de0c677c5c197688d1f3f5b2a8.png

WeChat9a73e9774b6d96d2c6dc6bfa97bbc9c2.png

PS: 内存空间布局 16192549417310.png

PS: 死循环恢复会奔溃? PS: 当堆空间和栈空间碰到了一起,就会出现堆栈溢出。

WeChat7c1a65daf376818dc60ae8761465e580.png

bl和ret指令

bl标号

  • 将下一条指令的地址放入lr(x30)寄存器
  • 转到标号处执行指令

ret

  • 默认使用lr(x30)寄存器的值,通过底层指令提示CPU此处作为下一条指令的地址

PS: ARM64平台的特色指令,它面向硬件做了优化处理的

x30寄存器

  • x30寄存器存放的是函数的返回地址。当ret指令执行时刻,会寻找x30寄存器保存的地址值。保存的是回家的路

PS: 在函数嵌套调用的时候,需要将x30入栈

.text
.global _A, _B

_A:
    mov x0, #0xaaaa
    bl _B
    mov x0, #0xaaaa
    ret

_B:
    mov x0, #0xbbbb
    ret

WeChat187a3b500de31003897f3ec836b4e9b4.png

WeChate923b4f31e4f7b79400ce1e6e868ecd1.png

WeChat2de7cfa5227405c11072886fbd02b1a7.png

WeChatc8459960ef3b337b8b0bc5e7c166c665.png

WeChat23794295804d3b52423e6adc3c0af600.png

之后进入死循环。需要将lr保存到当前的栈

WeChat39cb08459c3e42a0320db6b7c613bd24.png

看看系统是如做的 WeChat45e956a6480d0cb55562e54cdd4806f9.png

两种方式保存x30

.text
.global _A, _B

_A:
    sub sp, sp, #0x10
    str x30, [sp]
    mov x0, #0xaaaa
    bl _B
    mov x0, #0xaaaa
    ldr x30, [sp]
    add sp, sp, #0x10
    ret

_B:
    mov x0, #0xbbbb
    ret

.text
.global _A, _B

_A:
    //sub sp, sp, #0x10
    //str x30, [sp]
    str x30, [sp, #-0x10]!
    mov x0, #0xaaaa
    bl _B
    mov x0, #0xaaaa
    //ldr x30, [sp]
    //add sp, sp, #0x10
    ldr x30, [sp], #0x10
    ret

_B:
    mov x0, #0xbbbb
    ret

将x30的值放入栈空间

WeChat3b5fb6d1c0b91c2611ef171a8420dac0.png

WeChat0273c5458fb0c9dd9c98f8fa77b5f230.png

WeChatf375ba63fa749765f5f929200a5e74f8.png

WeChat7ac4c210d9f63128d3e100486ddb28a3.png

WeChat9d9d475465f93db50d250a58fcc7187f.png

使用汇编写一个带参数的函数

参考系统的

int sum(int a, int b) {
    return a + b;
}

WeChat936d433e92898ac81cc70bb4b0305796.png

WeChatabf52f9649566a88f8c30c1ee03b73f6.png

PS: w0 / x0 保存的是函数的返回值

自己实现第一个带参数汇编函数

_suma:
    add x0, x0, x1
    ret

PS: 函数的参数放在寄存器里面,返回值放在x0寄存器里面

函数的参数和返回值

  • ARM64下,函数的参数是存放在x0到x7(w0到w7)这8个寄存器里面的。如果超过8个参数,就会入栈。
  • 函数的返回值是存放在x0寄存器里面的。

PS: OC的方法最好不要超过6个,因为有两个隐形的参数,超过8个会影响效率。

函数的局部变量

  • 函数的局部变量放在栈里面

总结

    • 是一种具有特殊的访问方式的存储空间(后进先出, Last In Out Last, LIFO)
    • SP和FP寄存器
      • SP寄存器在任意时刻会保存我们的栈顶地址
      • FP寄存器也称为x29寄存器,属于通用寄存器,但是在某些时刻,我们利用它保存栈底的地址
    • ARM64里面 对栈的操作是16字节对齐
    • 栈的读写指令
      • 读: ldr(load register)指令 LDR、LDP
      • 写: str(store register)指令 STR、STP
    • 汇编的练习
      • 指令:
        • sub sp, sp, #0x10; 拉伸空间16字节
        • stp x0, x1, [sp];往sp所在的位置存放x0 x1
      • 简写:
        • stp x0, x1, [sp, #-0x10]! 先移动sp 再写内存
  • bl指令
    • 跳转指令: bl标号,标识程序执行到的标号。将下一条指令的地址保存到bl寄存器。
    • b代表着跳转
    • l代表lr(x30)寄存器 放回家的路
  • ret
    • 累死函数中的return
    • 让CPU执行lr寄存器所指向的指令
    • 函数嵌套调用 lr(x30) 保存到当前自己的栈空间 保护现场
  • 函数的参数
    • ARM64中,参数是放在x0到x7的8个寄存器中
    • 如果是浮点数,就会用浮点寄存器
    • 如果超过8个参数就会用栈传递
  • 函数的返回值
    • 一般函数的返回值使用x0寄存器保存
    • 如果返回值大于8个字节,就会利用内存传递返回值