把C语言编译成汇编是什么样子:1、 如何用汇编程序实现int,double数据类型?

360 阅读3分钟

一. 空main函数的汇编代码

***************** C ***********************
#include<stdio.h>
int main(){
    return 0;
}
***************** ASM *********************
	.file	"1.c"
	.text
	.globl	main
	.type	main, @function
main:
.LFB0:
	.cfi_startproc
	endbr64
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	movl	$0, %eax
	popq	%rbp
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE0:
	.size	main, .-main
	.ident	"GCC: (Ubuntu 9.4.0-1ubuntu1~20.04.1) 9.4.0"
	.section	.note.GNU-stack,"",@progbits
	.section	.note.gnu.property,"a"
	.align 8
	.long	 1f - 0f
	.long	 4f - 1f
	.long	 5
0:
	.string	 "GNU"
1:
	.align 8
	.long	 0xc0000002
	.long	 3f - 2f
2:
	.long	 0x3
3:
	.align 8
4:

上面这个是个基本框架,一个什么也不干的程序,所必须要干的汇编(机器指令)核心就是把栈帧指针rdp指向栈指针rsp所指向的位置。因为此时是一个空程序,栈里没有数据。注意:栈帧和栈不是一回事,可以把栈帧理解成栈的一个元素,一个栈帧就一一对应一个函数,函数运行时产生的数据就放到它自己对应的栈帧中,栈首存储着当前正在执行的函数的栈帧。所以,有2个寄存器,rsp存储着栈首的地址,rdp存储着当前正在运行的那个函数的栈帧的尾部地址。(内存是从高地址往地址增加,只不过此时增加的值是负数)

二. 含有int和double的c语言代码,会被编译成什么汇编指令?

首先,我们都知道,int是4个字节,double是8个字节,这是前提,直接看代码。

#include<stdio.h>
int main(){
    float i = 123.345;
    double j = 12.34567;
    int k = 12345678;
    i = i + j; // double 转 float
    j = j + k; // int 转 double
    k = i + k; // float 转 int
    int m = i + j;


    return 0;
}

******** asm *******
	.file	"1.c"
	.text
	.globl	main
	.type	main, @function
main:
.LFB0:
	.cfi_startproc
	endbr64
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	movss	.LC0(%rip), %xmm0
	movss	%xmm0, -20(%rbp)
	movsd	.LC1(%rip), %xmm0
	movsd	%xmm0, -8(%rbp)
	movl	$12345678, -16(%rbp)
	cvtss2sd	-20(%rbp), %xmm0
	addsd	-8(%rbp), %xmm0
	cvtsd2ss	%xmm0, %xmm0
	movss	%xmm0, -20(%rbp)
	cvtsi2sdl	-16(%rbp), %xmm0
	movsd	-8(%rbp), %xmm1
	addsd	%xmm1, %xmm0
	movsd	%xmm0, -8(%rbp)
	cvtsi2ssl	-16(%rbp), %xmm0
	addss	-20(%rbp), %xmm0
	cvttss2sil	%xmm0, %eax
	movl	%eax, -16(%rbp)
	cvtss2sd	-20(%rbp), %xmm0
	addsd	-8(%rbp), %xmm0
	cvttsd2sil	%xmm0, %eax
	movl	%eax, -12(%rbp)
	movl	$0, %eax
	popq	%rbp
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE0:
	.size	main, .-main
	.section	.rodata
	.align 4
.LC0:
	.long	1123463332
	.align 8
.LC1:
	.long	2827119273
	.long	1076408571
	.ident	"GCC: (Ubuntu 9.4.0-1ubuntu1~20.04.1) 9.4.0"
	.section	.note.GNU-stack,"",@progbits
	.section	.note.gnu.property,"a"
	.align 8
	.long	 1f - 0f
	.long	 4f - 1f
	.long	 5
0:
	.string	 "GNU"
1:
	.align 8
	.long	 0xc0000002
	.long	 3f - 2f
2:
	.long	 0x3
3:
	.align 8
4:

对比空main函数的汇编和第二个int、double的main函数的汇编代码,能看出来第2个汇编多了不少指令,如下:

  movss .LC0(%rip), %xmm0
	movss	%xmm0, -20(%rbp)
	movsd	.LC1(%rip), %xmm0
	movsd	%xmm0, -8(%rbp)
	movl	$12345678, -16(%rbp)
	cvtss2sd	-20(%rbp), %xmm0
	addsd	-8(%rbp), %xmm0
	cvtsd2ss	%xmm0, %xmm0
	movss	%xmm0, -20(%rbp)
	cvtsi2sdl	-16(%rbp), %xmm0
	movsd	-8(%rbp), %xmm1
	addsd	%xmm1, %xmm0
	movsd	%xmm0, -8(%rbp)
	cvtsi2ssl	-16(%rbp), %xmm0
	addss	-20(%rbp), %xmm0
	cvttss2sil	%xmm0, %eax
	movl	%eax, -16(%rbp)
	cvtss2sd	-20(%rbp), %xmm0
	addsd	-8(%rbp), %xmm0
	cvttsd2sil	%xmm0, %eax
	movl	%eax, -12(%rbp)
        
        ···
        
  .section .rodata
	.align 4
.LC0:
	.long	1123463332
	.align 8
.LC1:
	.long	2827119273
	.long	1076408571

首先,先看汇编是怎么给float、double、int分配4字节和8字节内存的。rbp指向的是main函数的栈帧尾部地址,rip指向当前正在执行的这条代码的内存地址:

  movss	.LC0(%rip), %xmm0
	movss	%xmm0, -20(%rbp)
  movsd	.LC1(%rip), %xmm0
	movsd	%xmm0, -8(%rbp)
	movl	$12345678, -16(%rbp)
很简单,把.LC0标号的绝对地址处的4字节数据,拿出来放到xmm0寄存器中,
然后第二句就是把xmm0寄存器里的4字节数据放到rbp-20的内存地址指向的内存块里。
为什么是4字节?因为movss指令就是移动4字节。

同理,把.LC1标号的绝对地址处的8字节数据最终放到rbp-8所指向的地址的内存块中。因为movsd就是移动8字节。

最后把立即数12345678放到rbp-8处的内存地址里。

这就是给它们分配了内存!

然后,再看它们是怎么相加的:

cvtss2sd	-20(%rbp), %xmm0
	addsd	-8(%rbp), %xmm0
	cvtsd2ss	%xmm0, %xmm0
	movss	%xmm0, -20(%rbp)
	cvtsi2sdl	-16(%rbp), %xmm0
	movsd	-8(%rbp), %xmm1
	addsd	%xmm1, %xmm0
	movsd	%xmm0, -8(%rbp)
	cvtsi2ssl	-16(%rbp), %xmm0
	addss	-20(%rbp), %xmm0
	cvttss2sil	%xmm0, %eax
	movl	%eax, -16(%rbp)
	cvtss2sd	-20(%rbp), %xmm0
	addsd	-8(%rbp), %xmm0
	cvttsd2sil	%xmm0, %eax
	movl	%eax, -12(%rbp)


# cvtss2sd、cvtsd2ss、cvtsi2sdl、cvtsi2ssl、cvttss2sil, 就靠上述这几条指令进行强制类型转换!
# float转double、double转float、float转int等。
# 最后用addss、addsd指令进行相加,这两条指令都是相加,只不过addss是float类型相加,addsd是double类型相加。
后面的文章,我只会截取关键汇编,不再粘贴上来空main函数的汇编了,空main函数的汇编都是那一套流程,一个程序框架而已,加所有的c代码,都是在空main函数的汇编框架上再往里面添加汇编代码。
后面会再依次介绍 if/else、while、for,函数,数组,结构体,指针 等关键c语法所对应的汇编,全面了解汇编指令是如何表达复杂抽象的c语言语法功能的。