C/C++ 解编译执行过程

C语言的编译链接过程要把我们编写的一个c程序（源代码）转换成可以在硬件上运行的程序（可执行代码），需要进行编译和链接。
编译就是把文本形式源代码翻译为机器语言形式的目标文件的过程。链接是把目标文件、操作系统的启动代码和用到的库文件进行组织，形成最终生成可执行代码的过程。

编译过程
- 编译过程又可以分成两个阶段：编译和汇编
- 编译是读取源程序（字符流），对之进行词法和语法的分析，将高级语言指令转换为功能 - 等效的汇编代码，源文件的编译过程包含两个主要阶段：
  “
  - 编译预处理: 读取c源程序，对其中的伪指令（以# 开头的指令）和特殊符号进行处理。
  - 编译、优化阶段: 经过预编译得到的输出文件中，只有常量；如数字、字符串、变量的定义，以及C语言的关键字，如 main, if , else , for , while , { , } , + , - , * , \ 等等。编译程序所要作得工作就是通过词法分析和语法分析，在确认所有的指令都符合语法规则之后，将其翻译成等价的中间代码表示或汇编代码。
  ”
- 汇编过程实际上指把汇编语言代码翻译成目标机器指令的过程。对于被翻译系统处理的每一个C语言源程序，都将最终经过这一处理而得到相应的目标文件。目标文件中所存放的也就是与源程序等效的目标的机器语言代码。
  “
  - 目标文件由段组成。通常一个目标文件中至少有两个段：
    - 代码段：该段中所包含的主要是程序的指令。该段一般是可读和可执行的，但一般却不可写。
    - 数据段：主要存放程序中要用到的各种全局变量或静态的数据。一般数据段都是可读，可写，可执行的。
  - UNIX环境下主要有三种类型的目标文件：
    - 可重定位文件: 其中包含有适合于其它目标文件链接来创建一个可执行的或者共享的目标文件的代码和数据。
    - 共享的目标文件: 这种文件存放了适合于在两种上下文里链接的代码和数据。
      
      “
      
      第一种是链接程序可把它与其它可重定位文件及共享的目标文件一起处理来创建另一个目标文件；
      第二种是动态链接程序将它与另一个可执行文件及其它的共享目标文件结合到一起，创建一个进程映象。
      ”
    - 可执行文件: 它包含了一个可以被操作系统创建一个进程来执行之的文件。
  - 汇编程序生成的实际上是第一种类型的目标文件。对于后两种还需要其他的一些处理方能得到，这个就是链接程序的工作了。
  ”
链接过程
- 链接程序的主要工作就是将有关的目标文件彼此相连接，也即将在一个文件中引用的符号同该符号在另外一个文件中的定义连接起来，使得所有的这些目标文件成为一个能够被操作系统装入执行的统一整体。
“
- 根据开发人员指定的同库函数的链接方式的不同，链接处理可分为两种：
  - 1. 静态链接
  - 在这种链接方式下，函数的代码将从其所在的静态链接库中被拷贝到最终的可执行程序中。这样该程序在被执行时这些代码将被装入到该进程的虚拟地址空间中。静态链接库实际上是一个目标文件的集合，其中的每个文件含有库中的一个或者一组相关函数的代码。
  - 1. 动态链接
  - 在此种方式下，函数的代码被放到称作是动态链接库或共享对象的某个目标文件中。链接程序此时所作的只是在最终的可执行程序中记录下共享对象的名字以及其它少量的登记信息。在此可执行文件被执行时，动态链接库的全部内容将被映射到运行时相应进程的虚地址空间。动态链接程序将根据可执行程序中记录的信息找到相应的函数代码。
- 对于可执行文件中的函数调用，可分别采用动态链接或静态链接的方法。使用动态链接能够使最终的可执行文件比较短小，并且当共享对象被多个进程使用时能节约一些内存，因为在内存中只需要保存一份此共享对象的代码。但并不是使用动态链接就一定比使用静态链接要优越。在某些情况下动态链接可能带来一些性能上损害。
”

可注意概要演示

一个简单的文件操作cpp源代码如下：

#include <stdio.h>
#include <stdlib.h>

#define N 2

int main()
{
 FILE *fp;
 char str[N + 1];
 //判断文件是否打开失败
 if ((fp = fopen("d:\\Key.txt", "rt")) == NULL) {
  puts("Fail to open file!");
  exit(0);
 }
 //循环读取文件的每一行数据
 while (fgets(str, N, fp) != NULL) {
  printf("%s", str);
 }

 //操作结束后关闭文件
 fclose(fp);

 system("pause");
 return 0;
}

直接编译执行

“
g++ file.cpp
”

仅编译生成 .o 文件

“
g++ -c file.cpp
nm -C file.o
”

.o 对象文件内容

“
”

有十六进制地址位，表示定义在main()内部
printf等方法则在标准库中查找

编译阶段进行语法检查

“

注释语法错误，不通过
”

“

语法正确，函数未定义错误，执行不通过
”

定义到外部源文件 other.cc

“
编译外部源文件

”

“
”

“
main() 内声明并引用

”

“
编译主函数并连接执行两个对象文件生成可执行程序

”

“
两个对象文件内容

”

工程开发规范中，声明放于头文件中，定义放在源文件中

源文件命名为log.cpp:

/*************************************************************************
 > File Name: log.cpp
 ************************************************************************/

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <queue>
#include <stack>
#include <algorithm>
#include <string>
#include <map>
#include <set>
#include <vector>
using namespace std;

#define PI 3.1415926
#define S(a, b) a * b

#ifdef DEBUG

#define LOG(msg) { \
    printf("[%s : %d] %s", __FILE__, __LINE__, msg); \
}

#else

#define LOG(msg)

#endif

void test() {
    LOG("hello world\n"); // 这也是一行调试信息
    return ;
}

int main() {
    printf("%lf\n", 2 * PI);
    printf("S(3, 4) = %d\n", S(3, 4));
    printf("S(3 + 6, 4) = %d\n", S(3 + 6, 4));
    int n;
    S(int, p) = &n;
    LOG("hello world\n"); // 这一行是一个调试信息
    test();
    printf("__DATE__ = %s\n", __DATE__);
    printf("__TIME__ = %s\n", __TIME__);
    printf("__FILE__ = %s\n", __FILE__);
    printf("__LINE__ = %d\n", __LINE__);
    printf("__func__ = %s\n", __func__);
    printf("__PRETTY_FUNCTION__ = %s\n", __PRETTY_FUNCTION__);
    return 0;
}

程序执行结果由待编译文件决定

g++ -E file.cpp -o file.i

“
预处理源文件并输出到待编译文件 .i
”

“
”

“

S(int, p) = &n; 转换成 int * p = &n; 从而完美执行
”

命令简单总结

“
基本流程：
”

“

g++ -E file.cpp （源文件预处理）
g++ -S file.i      （编译预处理文件）自动生成 .s 汇编代码文件
g++ -c file.s      （编译汇编代码文件）自动生成 .o 二进制目标代码
g++ file.o file.o （链接生成可执行文件）
g++ -o file.exe   （指定生成的输出文件）
”

编译执行过程概要(c/c++)

C/C++ 解编译执行过程

可注意概要演示

直接编译执行

仅编译生成 .o 文件

.o 对象文件内容

编译阶段进行语法检查

定义到外部源文件 other.cc

编译外部源文件

main() 内声明并引用

编译主函数并连接执行两个对象文件生成可执行程序

两个对象文件内容

程序执行结果由待编译文件决定

g++ -E file.cpp -o file.i

命令简单总结