【C C++内功心法】剖析编译链接的过程，探究源文件是如何一步步变成可执行程序，提升C C网上学习资料一大堆，但如果学到

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

集成开发环境（IDE，Integrated Development Environment ）是用于提供程序开发环境的应用程序，一般包括代码编辑器、编译器、调试器和图形用户界面等工具。集成了代码编写功能、分析功能、编译功能、调试功能等一体化的开发软件服务套。所有具备这一特性的软件或者软件套（组）都可以叫集成开发环境。

而在Linux下就是把这些工具都裁开，一个工具只负责一个功能。所以在Linux下编写代码就用vim，编译代码就用gcc/g++，调试代码就用gdb，运行或者自动化构建程序就用make和makefile。

如果你去vs2019的安装路径下找一定能找到vs2019的编译器和链接器。

vs2019的编译器 —— cl.exe

vs2019的链接器 —— link.exe

2 编译本身也分为几个阶段

由于vs2019是集成开发环境，不方便观察每个阶段的细节，所以我下面将会使用Linux下的gcc为大家演示编译和链接的过程。

温馨提示：就算没有Linux基础也能看懂哦，所以不用担心没有Linux基础而看不懂。

最后我们将刚刚写的 test.c、add.c、sub.c 这三个文件的代码复制到Linux下。

test.c文件

add.c文件

sub.c文件

2.1 预编译（预处理）

在预处理阶段编译器会做以下几个动作

将源文件中包含的头文件展开。例如：#include<stdio.h>，其中#include被称为预处理指令。

#define 定义符号的替换。例如：#define Max 100，其中#define也被称为预处理指令。

删除注释。

Linux下的命令。

预处理选项 gcc -E test.c -o test.i

预处理完成之后就停下来，预处理之后产生的结果都放在test.i文件中。

我们将执行下面这三个命令，让编译器对这三个.c文件预处理完后就停下来。

命令1：gcc -E test.c -o test.i
命令2：gcc -E add.c -o add.i
命令3：gcc -E sub.c -o sub.i

预处理后，当前目录下就会出现三个.i文件。

进入test.i文件。

大家注意观察行数，我们将test.c文件预处理后，得到的test.i文件的代码比源文件多了800多行（这就是因为预处理后，源文件中包含的头文件被展开)。并且我们刚才写的所有注释也都被删除。

验证头文件展开。

在Linux环境下，头文件是放在 /usr/include 这个路径下的，我们可以到这个路径下去找到相应的头文件。
命令：cd /usr/include

我们在 /usr/include 路径下可以看到有很多头文件，包括我们刚刚在test.c文件里面包含过的stdio.h文件。

进入stdio.h这个文件。

我们注意观察就可以发现test.i文件里面的增加内容基本上都是来自stdio.h文件。

验证#define 定义符号的替换。

我们添加一行宏定义。

然后再对test.c文件进行预处理后，进入test.i文件观察。这时就可以观察到刚刚定义的Max被替换掉了。

2.2 编译

在编译阶段编译器会做以下几个动作

编译器会对你写的代码进行：

语法分析

词法分析

语义分析

符号汇总（与后面的汇编、链接有关）

最后把你写的代码翻译成汇编语言。

Linux下的命令

编译选项 gcc -S test.c

编译完成之后就停下来，结果保存在test.s中。

我们将执行下面这三个命令，让编译器对这三个.i文件编译完后就停下来。

命令1：gcc -S test.i -o test.s
命令2：gcc -S add.i -o add.s
命令3：gcc -S sub.i -o sub.s

注意：这里的 -S 选项是大写的哦！

编译后，当前目录下就会出现三个.s文件。

进入test.s文件。

这时我们写的代码就已经被完全转化为了汇编语言。

详解符号汇总

什么是符号？

其实符号就是程序中的变量名、函数名
就比如test.i文件里面的main、Add、Sub、printf都是符号，编译过程中编译器会将它们汇总起来，为后面的汇编和链接阶段做准备。（由于变量a、b、c、d都是局部变量，局部变量只有在当前作用域里才可以用，所以不用统计，一般汇总的符号都是全局的）
在add.i文件里面可以汇总到符号Add
在sub.i文件里面可以汇总到符号Sub
在编译阶段看不出什么，符号汇总的作用主要体现在汇编和链接阶段，所以我们后面讲汇编和链接的时候会详细讲解。

2.3 汇编

在汇编阶段编译器会做以下几个动作

形成符号表（与编译过程中的符号汇总有关系）

最后把汇编指令翻译成二进制指令。（因为计算机只认识二进制指令）

注意：

在Windows环境下的目标文件名是 xxx.obj

在Linux环境下的目标文件名是 xxx.o

Linux下的命令

汇编 gcc -c test.c

汇编完成之后就停下来，结果保存在test.o中。

我们将执行下面这三个命令，让编译器对这三个.s文件汇编完后就停下来。

命令1：gcc -c test.s -o test.o
命令2：gcc -c add.s -o add.o
命令3：gcc -c sub.s -o sub.o

注意：这里的 -c 选项是小写的哦！

汇编完后，当前目录下就会出现三个.o文件。

进入test.o文件。

这时test.i文件里面的汇编语言就已经被完全转化为了二进制指令。

详解符号表

注意：

在Linux环境下，像 test.o 和可执行程序这样的文件的格式是：elf 格式。

虽然我们看不懂这样的二进制文件，但是我们可以通过 readelf工具来看这些二进制文件。

我们可以通过man手册来查看readelf的功能和所有选项。
命令：man readelf
这里我们只需要用-s选项来查看符号表信息即可。