Linux fork()是怎样执行的？当你的程序执行到下面的语句： pid=fork(); 操作系统创建一个新的进程

相信很多同学在看Android源码的过程中，都看到了Zygote fork创建进程，那么今天就整理下，Linux系统函数fork()的执行流程，以便加深对Android源码的理解。

当程序执行到下面的语句： pid=fork();

操作系统会创建一个新的进程（即子进程），并且在进程表中相应为它建立一个新的表项。那么父进程为什么要创建子进程呢？Linux是一个多用户操作系统，在同一时间会有许多的用户在争夺系统的资源。有时进程为了早一点完成任务就创建子进程来争夺资源。一旦子进程被创建，父子进程一起从fork处继续执行，相互竞争系统的资源。还有时候我们希望子进程继续执行，而父进程阻塞，直到子进程完成任务，这个时候我们可以调用wait或者waitpid系统调用。

接着上边说，创建出的子进程和原有进程的可执行程序是同一个程序；上下文和数据，绝大部分就是原进程（父进程）的拷贝，但它们是两个相互独立的进程。此时程序寄存器PC，在父、子进程的上下文中都声称，这个进程目前执行到fork调用即将返回（此时子进程不占有CPU，子进程的PC不是真正保存在寄存器中，而是作为进程上下文保存在进程表中的对应表项内），那么关键问题来了：fork如何返回？

父进程继续执行，操作系统对fork的实现，使这个调用在父进程中返回刚刚创建的子进程的pid（一个正整数），所以pid<0和pid==0的两个分支都不会执行。

子进程在之后的某个时候得到调度，它的上下文被换入，占据 CPU，操作系统对fork的实现，使得子进程中fork调用返回0。所以在这个进程（注意这不是父进程了哦，虽然是同一个程序，但是这是同一个程序的另外一次执行，在操作系统中这次执行是由另外一个进程表示的，从执行的角度说和父进程相互独立）中pid=0。这个进程继续执行的过程中，pid<0不满足，但是pid==0是条件可以执行。

为什么看上去程序中互斥的两个分支都被执行了？在一个程序的一次执行中，这当然是不可能的；但是你看到的两个执行是来自两个进程，这两个进程来自同一个程序的两次执行。

fork之后，操作系统会复制一个与父进程完全相同的子进程，虽说是父子关系，但是在操作系统看来，他们更像兄弟关系，这两个进程共享代码空间，但是数据空间是互相独立的，子进程数据空间中的内容是父进程的完整拷贝，指令指针也完全相同，但只有一点不同，那就是进程id不同。如果fork成功，子进程中fork的返回值是0，父进程中fork的返回值是子进程的进程id；如果fork不成功(如内存不足或已达到用户的最大进程数)，则父进程会返回-1。我们就是根据这个返回值来区分父子进程的。

可以这样想象，两个进程一直同时运行，而且步调一致，在fork之后，他们分别作不同的工作，也就是分岔了，这也是fork为什么叫fork的原因，在程序段里用了fork()之后程序出了分岔，派生出了两个进程。具体哪个先运行就看该系统的调度算法了，如果需要父子进程协同，可以通过原语的办法解决。

还有以下三点需要注意：

1、派生子进程的进程，即父进程，其pid不变；

2、对子进程来说，fork返回给它0，但它的pid绝对不会是0；之所以fork返回0给它，是因为它随时可以调用getpid()来获取自己的pid；

3、fork之后父子进程除非采用了同步手段，否则不能确定谁先运行，也不能确定谁先结束。认为子进程结束后父进程才从fork返回的，这是不对的，fork不是这样的，vfork才这样。