一. 空main函数的汇编代码
***************** C ***********************
#include<stdio.h>
int main(){
return 0;
}
***************** ASM *********************
.file "1.c"
.text
.globl main
.type main, @function
main:
.LFB0:
.cfi_startproc
endbr64
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
movl $0, %eax
popq %rbp
.cfi_def_cfa 7, 8
ret
.cfi_endproc
.LFE0:
.size main, .-main
.ident "GCC: (Ubuntu 9.4.0-1ubuntu1~20.04.1) 9.4.0"
.section .note.GNU-stack,"",@progbits
.section .note.gnu.property,"a"
.align 8
.long 1f - 0f
.long 4f - 1f
.long 5
0:
.string "GNU"
1:
.align 8
.long 0xc0000002
.long 3f - 2f
2:
.long 0x3
3:
.align 8
4:
上面这个是个基本框架,一个什么也不干的程序,所必须要干的汇编(机器指令)核心就是把栈帧指针rdp指向栈指针rsp所指向的位置。因为此时是一个空程序,栈里没有数据。注意:栈帧和栈不是一回事,可以把栈帧理解成栈的一个元素,一个栈帧就一一对应一个函数,函数运行时产生的数据就放到它自己对应的栈帧中,栈首存储着当前正在执行的函数的栈帧。所以,有2个寄存器,rsp存储着栈首的地址,rdp存储着当前正在运行的那个函数的栈帧的尾部地址。(内存是从高地址往地址增加,只不过此时增加的值是负数)
二. 含有int和double的c语言代码,会被编译成什么汇编指令?
首先,我们都知道,int是4个字节,double是8个字节,这是前提,直接看代码。
#include<stdio.h>
int main(){
float i = 123.345;
double j = 12.34567;
int k = 12345678;
i = i + j; // double 转 float
j = j + k; // int 转 double
k = i + k; // float 转 int
int m = i + j;
return 0;
}
******** asm *******
.file "1.c"
.text
.globl main
.type main, @function
main:
.LFB0:
.cfi_startproc
endbr64
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
movss .LC0(%rip), %xmm0
movss %xmm0, -20(%rbp)
movsd .LC1(%rip), %xmm0
movsd %xmm0, -8(%rbp)
movl $12345678, -16(%rbp)
cvtss2sd -20(%rbp), %xmm0
addsd -8(%rbp), %xmm0
cvtsd2ss %xmm0, %xmm0
movss %xmm0, -20(%rbp)
cvtsi2sdl -16(%rbp), %xmm0
movsd -8(%rbp), %xmm1
addsd %xmm1, %xmm0
movsd %xmm0, -8(%rbp)
cvtsi2ssl -16(%rbp), %xmm0
addss -20(%rbp), %xmm0
cvttss2sil %xmm0, %eax
movl %eax, -16(%rbp)
cvtss2sd -20(%rbp), %xmm0
addsd -8(%rbp), %xmm0
cvttsd2sil %xmm0, %eax
movl %eax, -12(%rbp)
movl $0, %eax
popq %rbp
.cfi_def_cfa 7, 8
ret
.cfi_endproc
.LFE0:
.size main, .-main
.section .rodata
.align 4
.LC0:
.long 1123463332
.align 8
.LC1:
.long 2827119273
.long 1076408571
.ident "GCC: (Ubuntu 9.4.0-1ubuntu1~20.04.1) 9.4.0"
.section .note.GNU-stack,"",@progbits
.section .note.gnu.property,"a"
.align 8
.long 1f - 0f
.long 4f - 1f
.long 5
0:
.string "GNU"
1:
.align 8
.long 0xc0000002
.long 3f - 2f
2:
.long 0x3
3:
.align 8
4:
对比空main函数的汇编和第二个int、double的main函数的汇编代码,能看出来第2个汇编多了不少指令,如下:
movss .LC0(%rip), %xmm0
movss %xmm0, -20(%rbp)
movsd .LC1(%rip), %xmm0
movsd %xmm0, -8(%rbp)
movl $12345678, -16(%rbp)
cvtss2sd -20(%rbp), %xmm0
addsd -8(%rbp), %xmm0
cvtsd2ss %xmm0, %xmm0
movss %xmm0, -20(%rbp)
cvtsi2sdl -16(%rbp), %xmm0
movsd -8(%rbp), %xmm1
addsd %xmm1, %xmm0
movsd %xmm0, -8(%rbp)
cvtsi2ssl -16(%rbp), %xmm0
addss -20(%rbp), %xmm0
cvttss2sil %xmm0, %eax
movl %eax, -16(%rbp)
cvtss2sd -20(%rbp), %xmm0
addsd -8(%rbp), %xmm0
cvttsd2sil %xmm0, %eax
movl %eax, -12(%rbp)
···
.section .rodata
.align 4
.LC0:
.long 1123463332
.align 8
.LC1:
.long 2827119273
.long 1076408571
首先,先看汇编是怎么给float、double、int分配4字节和8字节内存的。rbp指向的是main函数的栈帧尾部地址,rip指向当前正在执行的这条代码的内存地址:
movss .LC0(%rip), %xmm0
movss %xmm0, -20(%rbp)
movsd .LC1(%rip), %xmm0
movsd %xmm0, -8(%rbp)
movl $12345678, -16(%rbp)
很简单,把.LC0标号的绝对地址处的4字节数据,拿出来放到xmm0寄存器中,
然后第二句就是把xmm0寄存器里的4字节数据放到rbp-20的内存地址指向的内存块里。
为什么是4字节?因为movss指令就是移动4字节。
同理,把.LC1标号的绝对地址处的8字节数据最终放到rbp-8所指向的地址的内存块中。因为movsd就是移动8字节。
最后把立即数12345678放到rbp-8处的内存地址里。
这就是给它们分配了内存!
然后,再看它们是怎么相加的:
cvtss2sd -20(%rbp), %xmm0
addsd -8(%rbp), %xmm0
cvtsd2ss %xmm0, %xmm0
movss %xmm0, -20(%rbp)
cvtsi2sdl -16(%rbp), %xmm0
movsd -8(%rbp), %xmm1
addsd %xmm1, %xmm0
movsd %xmm0, -8(%rbp)
cvtsi2ssl -16(%rbp), %xmm0
addss -20(%rbp), %xmm0
cvttss2sil %xmm0, %eax
movl %eax, -16(%rbp)
cvtss2sd -20(%rbp), %xmm0
addsd -8(%rbp), %xmm0
cvttsd2sil %xmm0, %eax
movl %eax, -12(%rbp)
# cvtss2sd、cvtsd2ss、cvtsi2sdl、cvtsi2ssl、cvttss2sil, 就靠上述这几条指令进行强制类型转换!
# float转double、double转float、float转int等。
# 最后用addss、addsd指令进行相加,这两条指令都是相加,只不过addss是float类型相加,addsd是double类型相加。