2.Linux多进程开发

349 阅读27分钟

2.1进程概述

程序

程序是包含一系列信息的文件,这些信息描述了如何在运行时创建一个进程

image.png

进程

进程是正在运行的程序的实例

image.png

进程控制块(PCB)

◼ 为了管理进程,内核必须对每个进程所做的事情进行清楚的描述。内核为每个进程分 配一个 PCB(Processing Control Block)进程控制块,维护进程相关的信息, Linux 内核的进程控制块是 task_struct 结构体。

◼ 在 /usr/src/linux-headers-xxx/include/linux/sched.h 文件中可以查看 struct task_struct 结构体定义。其内部成员有很多,我们只需要掌握以下 部分即可:

⚫ 进程id:系统中每个进程有唯一的 id,用 pid_t 类型表示,其实就是一个非负整数

⚫ 进程的状态:有就绪、运行、挂起、停止等状态

⚫ 进程切换时需要保存和恢复的一些CPU寄存器

⚫ 描述虚拟地址空间的信息

⚫ 描述控制终端的信息

⚫ 当前工作目录(Current Working Directory)

⚫ umask 掩码

⚫ 文件描述符表,包含很多指向 file 结构体的指针

⚫ 和信号相关的信息

⚫ 用户 id 和组 id

⚫ 会话(Session)和进程组

⚫ 进程可以使用的资源上限(Resource Limit)

2.2 进程间的切换

进程的状态

三状态

image.png

五状态

image.png

进程相关命令

查看当前进程

ps aux/ajx
- a 显示终端上的所有进程 包含其他用户的进程
- u 显示进程详细的信息
- x 显示没有控制终端的进程
- j 列出与作业控制相关的进程

STAT参数含义

image.png

显示实时进程

top

image.png

杀死进程(具体来讲就是咋杀死)

image.png

进程号和相关函数

  • 除了初始进程都有父进程 image.png

2.3 创建进程

image.png

2.4 父子进程的虚拟地址空间情况

读时共享、写时拷贝针对的是物理内存,只是在读时会有两个独立的虚拟内存空间,指向同一个物理内存。

 父子进程之间的关系:
        区别:
            1.fork()函数的返回值不同
                父进程中: >0 返回的子进程的ID
                子进程中: =0
            2.pcb中的一些数据
                当前的进程的id pid
                当前的进程的父进程的id ppid
                信号集

        共同点:
            某些状态下:子进程刚被创建出来,还没有执行任何的写数据的操作
                - 用户区的数据
                - 文件描述符表
        
        父子进程对变量是不是共享的?
            - 刚开始的时候,是一样的,共享的。如果修改了数据,不共享了。
            
            - 读时共享(子进程被创建,两个进程没有做任何的写的操作),写时拷贝。
            
            
实际上,更准确来说,Linux 的 fork() 使用是通过写时拷贝 (copy- on-write) 实现。
写时拷贝是一种可以推迟甚至避免拷贝数据的技术。
内核此时并不复制整个进程的地址空间,而是让父子进程共享同一个地址空间。
只用在需要写入的时候才会复制地址空间,从而使各个进行拥有各自的地址空间。
也就是说,资源的复制是在需要写入的时候才会进行,在此之前,只有以只读方式共享。
注意:fork之后父子进程共享文件,
fork产生的子进程与父进程相同的文件文件描述符指向相同的文件表,引用计数增加,共享文件偏移指针。

2.5 GDB调试多进程

使用GDB调试时只能跟踪一个进程,可以在fork调用之前,通过指令设置GDB调试工具

设置调试进程 set follow-fork-mode parent | child (默认是parent)

设置调试模式 set detach-on-fork on|off (默认是on)
默认为 on,表示调试当前进程的时候,其它的进程继续运行,如果为 off,调试当前进 程的时候,其它进程被 GDB 挂起。

查看调试的进程 info inferiors

切换调试的进程 inferior id

使进程脱离GDB调试 detach inferiors id

2.6 exec函数族

介绍

  • exec函数主要是替换当前进程的用户区的内容,去执行别的命令
  • exec函数执行成功后不会返回,执行失败返回-1(没有进行替换)

函数族

image.png

execl

  int execl(const char *path, const char *arg, ...);
        - 参数:
            - path:需要指定的执行的文件的路径或者名称
                a.out /home/nowcoder/a.out 推荐使用绝对路径
                ./a.out hello world

            - arg:是执行可执行文件所需要的参数列表
                第一个参数一般没有什么作用,为了方便,一般写的是执行的程序的名称
                从第二个参数开始往后,就是程序执行所需要的的参数列表。
                参数最后需要以NULL结束(哨兵)

        - 返回值:
            只有当调用失败,才会有返回值,返回-1,并且设置errno
            如果调用成功,没有返回值。

execlp

    #include <unistd.h> 
    int execlp(const char *file, const char *arg, ... );
        - 会到环境变量中查找指定的可执行文件,如果找到了就执行,找不到就执行不成功。
        - 参数:
            - file:需要执行的可执行文件的文件名
                a.out
                ps

            - arg:是执行可执行文件所需要的参数列表
                第一个参数一般没有什么作用,为了方便,一般写的是执行的程序的名称
                从第二个参数开始往后,就是程序执行所需要的的参数列表。
                参数最后需要以NULL结束(哨兵)

        - 返回值:
            只有当调用失败,才会有返回值,返回-1,并且设置errno
            如果调用成功,没有返回值。

execv

     int execv(const char *path, char *const argv[]);
    argv是需要的参数的一个字符串数组
    char * argv[] = {"ps", "aux", NULL};
    execv("/bin/ps", argv);

    int execve(const char *filename, char *const argv[], char *const envp[]);
    char * envp[] = {"/home/nowcoder", "/home/bbb", "/home/aaa"};
    
    

2.7 退出进程 孤儿进程 僵尸进程

退出进程

exit 和 _exit

image.png

孤儿进程

父进程被杀死 被Init进程领养

image.png

僵尸进程

没有使用wait 和 waitpid函数 子进程成为僵尸进程 无法回收PCB资源(如果回收了 父进程就无法访问了)

image.png

2.8 wait函数

    #include <sys/types.h>
    #include <sys/wait.h>
    pid_t wait(int *wstatus);
        功能:等待任意一个子进程结束,如果任意一个子进程结束了,次函数会回收子进程的资源。
        
        参数:int *wstatus
            进程退出时的状态信息,传入的是一个int类型的地址,传出参数。
            
        返回值:
            - 成功:返回被回收的子进程的id
            - 失败:-1 (所有的子进程都结束,调用函数失败)

调用wait函数的进程会被挂起(阻塞),
直到它的一个子进程退出或者收到一个不能被忽略的信号时才被唤醒(相当于继续往下执行)
如果没有子进程了,函数立刻返回,返回-1;如果子进程都已经结束了,也会立即返回,返回-1.

#include <sys/types.h>
#include <sys/wait.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>


int main() {

    // 有一个父进程,创建5个子进程(兄弟)
    pid_t pid;

    // 创建5个子进程
    for(int i = 0; i < 5; i++) {
        pid = fork();
        if(pid == 0) {
            break;
        }
    }

    if(pid > 0) {
        // 父进程
        while(1) {
            printf("parent, pid = %d\n", getpid());

            // int ret = wait(NULL);
            int st;
            int ret = wait(&st);

            if(ret == -1) {
                break;
            }

            if(WIFEXITED(st)) {
                // 是不是正常退出
                printf("退出的状态码:%d\n", WEXITSTATUS(st));
            }
            if(WIFSIGNALED(st)) {
                // 是不是异常终止
                printf("被哪个信号干掉了:%d\n", WTERMSIG(st));
            }

            printf("child die, pid = %d\n", ret);

            sleep(1);
        }

    } else if (pid == 0){
        // 子进程
         while(1) {
            printf("child, pid = %d\n",getpid());    
            sleep(1);       
         }

        exit(0);
    }

    return 0; // exit(0)
}

2.9 waitpid函数

非阻塞wait

#include <sys/types.h>
#include <sys/wait.h>
pid_t waitpid(pid_t pid, int *wstatus, int options);
    功能:回收指定进程号的子进程,可以设置是否阻塞。
    参数:
        - pid:
            pid > 0 : 某个子进程的pid
            pid = 0 : 回收当前进程组的所有子进程    
            pid = -1 : 回收所有的子进程,相当于 wait()  (最常用)
            pid < -1 : 某个进程组的组id的绝对值,回收指定进程组中的子进程
        - options:设置阻塞或者非阻塞
            0 : 阻塞
            WNOHANG : 非阻塞
        - 返回值:
            > 0 : 返回子进程的id
            = 0 : options=WNOHANG, 表示还有子进程或者
            = -1 :错误,或者没有子进程了

2.10 进程间通信简介

进程间通信的概念

  • 进程是独立分配的资源单位,不同进程间数据不能直接访问共享
  • 但是 进程不是孤立的 不同进程需要进行信息的交互和状态的的传递,因此需要进程间通信(IPC Internet Process Comuciation)

进程间通信的目的

  1. 数据传输 (一个进程将他数据发送给另外一个进程)
  2. 通知事件(一个进程向另外一个进程或一组进程发送信息,通知它们发生了某种事件 ) 例如子进程终止通知父进程
  3. 资源共享 需要内核提供互斥和同步机制
  4. 进程控制 例如利用GDB调试进程

进程间通信方式(very very important 必须记忆下来)

image.png

匿名管道

  • 管道也叫匿名(无名)管道,它是Unix的IPC最古老的方式,所有的Unix都支持这种通信方式
  • 统计一个目录中文件的数量命令:ls | ws-l,为了执行这个指令 shell创建了两个进程来执行ls和wl image.png

管道的特点

  • 管道是在内核内存中的一段缓冲器,这个缓冲器大小有限
  • 管道拥有文件的特性:可以进行读写操作,匿名管道没有文件实体,有名管道有文件实体但不存储数据,可以按照对文件的操作对管道进行操作
  • 一个管道是一个字节流,使用管道时不存在消息或者消息边界的概念(类似于Tcp数据报).从管道可以读取任意大小的数据,而不管管道内数据的大小
  • 管道内维护的是一个循环队列所以数据时有序的
  • 管道数据传递方向是单向的,一端用于读,一段用于写,管道是半双工的
  • 从管道读读数据是一次性操作,读完就释放空间,无法用lseek函数来随机的访问数据
  • 匿名管道只能用在有公共祖先的进程(父进程和子进程 两个兄弟进程 具有亲缘关系)之间进行使用

为什么可以使用管道来能进行通信

子进程和父进程共享文件描述符表,fork后父子进程fd为5都指向管道的一端 f6为6指向管道的另一端

  • 可以从父进程进程5指向的端口写入数据 从子进程6指向的端口读数据
  • 可以从子进程进程5指向的端口写入数据 从父亲进程6指向的端口读数据

image.png

管道的数据结构

维护了一个 循环队列 image.png

匿名管道的使用

创建匿名管道

#include<unistd.h>
int pipe(int pipefd[2]);

查看管道的命令

ulimit -a

查看管道大小的函数

#include<unistd.h>
long fpathconf(int fd,int name);

2.11 父子间通过匿名管道通信

一定要先创建匿名管道之后再fork pipe.jpg

2.12 匿名管道通信案例

2.13 管道的读写特点和设置管道为非阻塞

读管道

管道中有数据

read返回读取的实际字节数

管道中无数据

  • 写端全部被关闭,read返回0
  • 写段没有全部被关闭,read阻塞等待

写管道

管道中读端全部被关闭

进程异常终止(收到SIGPIPE信号)

管道中读端未全部关闭

  • 管道满了 write阻塞
  • 管道未满 write将数据写入,并返回实际写入的字节数

2.15 有名管道介绍及使用

有名管道的介绍

  • 由于匿名管道没有名字,只能用fd操作,所以只能用在具有亲缘关系的进程之间,为了克服这个缺点,提出了有名管道,FIFO文件
  • FIFO是一种特殊的文件,和普通文件一样,可以通过路径访问,该文件没有在磁盘上的文件实体,只是在kenerl中的一段内存缓冲

有名管道的使用

通过系统调用

FIFO 严格遵循先进先出(First in First out),对管道及 FIFO 的读总是 从开始处返回数据,对它们的写则把数据添加到末尾。它们不支持诸如 lseek() 等文件定位操作

#include<sys/types.h>
#include<sys/stat.h>
#include 
int mkfifo(const char *pathname, mode_t mode)

通过shell

mkfifo namename

注意事项

  • 只读只写进程会相互阻塞,直到读写进程全都开始运行

读管道

管道中有数据

read返回实际读到的字节数

管道中无数据

管道的写端全部被关闭,返回0(相当于读到了文件末尾)

管道的写端未被全部关闭,阻塞,直到管道中有了新的数据

写管道

管道的读端全都被关闭

管道破裂,终止(收到一个SIGPIPE信号)

管道中读端未被全部关闭

  • 若管道中数据已满,则阻塞
  • 若管道中数据未满,返回实际写入的数据大小

2.16 有名管道实现简单版聊天功能

有阻塞状态

image.png

无阻塞状态升级版

将读写进程分开,用子进程读就用父进程写,用子进程写就用父进程读

关键是将读写分离

image.png

2.17 2.18 内存映射

mmap详解

1.如果对mmap的返回值(ptr)做++操作(ptr++), munmap是否能够成功? void * ptr = mmap(...); ptr++; 可以对其进行++操作 munmap(ptr, len); // 错误,要保存地址

2.如果open时O_RDONLY, mmap时prot参数指定PROT_READ | PROT_WRITE会怎样? 错误,返回MAP_FAILED open()函数中的权限建议和prot参数的权限保持一致。

3.如果文件偏移量为1000会怎样? 偏移量必须是4K的整数倍,返回MAP_FAILED

4.mmap什么情况下会调用失败? - 第二个参数:length = 0 - 第三个参数:prot - 只指定了写权限 - prot PROT_READ | PROT_WRITE 第5个参数fd 通过open函数时指定的 O_RDONLY / O_WRONLY

5.可以open的时候O_CREAT一个新文件来创建映射区吗? - 可以的,但是创建的文件的大小如果为0的话,肯定不行 - 可以对新的文件进行扩展 - lseek() - truncate()

6.mmap后关闭文件描述符,对mmap映射有没有影响? int fd = open("XXX"); mmap(,,,,fd,0); close(fd); 映射区还存在,创建映射区的fd被关闭,没有任何影响。

7.对ptr越界操作会怎样? void * ptr = mmap(NULL, 100,,,,,); 4K 越界操作操作的是非法的内存 -> 段错误

2.19 信号概述

概念

信号是 Linux 进程间通信的最古老的方式之一,是事件发生时对进程的通知机制,有时也 称之为软件中断,它是在软件层次上对中断机制的一种模拟,是一种异步通信的方式。信号 可以导致一个正在运行的进程被另一个正在运行的异步进程中断,转而处理某一个突发事件.

引发内核为进程产生信号事件

  • 对于前台进程按下某些按键通常会给进程发送终止信号如(Ctrl + C)
  • 使用kill命令
  • 硬件异常产生的信号:除0,无效的内存引用(似乎数组越界也是)
  • 检测到某种软件条件已发生,如进程所设置的定时器已经超时(SIGALRM)

重要信号

image.png

image.png

image.png

信号的5种默认处理动作

查看信号详细信息: man 7 signal

  • Term 终止进程
  • Ign 当前进程忽略掉这个信号
  • Core 终止进程,并生成一个Core文件
  • Stop 暂停当前进程
  • Cont 继续执行当前被暂停的进程

查看core文件

设置core文件大小

image.png

image.png

以调试模式编译源文件

gdb 可执行文件

输入core-file

2.20 kill raise abort 函数

kill函数

int kill(pid_t pid, int sig);

kill可以给任何进程发送信号

pid的几种情况:

  • 若pid大于0 给指定的进程发送sig信号
  • 若pid等于0 给当前进程组发送sig信号
  • 若pid等于-1 给所有有权限接受sig的进程发送信号
  • 若pid小于-1 给进程组号为pid的绝对值的进程发送信号

raise函数

给当前进程发送sig信号,若sig = 0则不发送信号

#include <signal.h>

       int raise(int sig);

abort函数终止当前进程

#include <stdlib.h>

       void abort(void);    

2.21alarm函数

从名字上来说就很形象的一个函数,设置倒计时,到了给进程发送一个信号,默认是终止信号

补充:程序运行的时间 = 内核时间 + 内核时间 + 执行代码时间

    #include <unistd.h>
    unsigned int alarm(unsigned int seconds);
        - 功能:设置定时器(闹钟)。函数调用,开始倒计时,当倒计时为0的时候,
                函数会给当前的进程发送一个信号:SIGALARM
        - 参数:
            seconds: 倒计时的时长,单位:秒。如果参数为0,定时器无效(不进行倒计时,不发信号)。
                    取消一个定时器,通过alarm(0)。
        - 返回值:
            - 之前没有定时器,返回0
            - 之前有定时器,返回之前的定时器剩余的时间

    - SIGALARM :默认终止当前的进程,每一个进程都有且只有唯一的一个定时器。
        alarm(10);  -> 返回0
        过了1秒
        alarm(5);   -> 返回9

    alarm(100) -> 该函数是不阻塞的
    

setitimer

#include <sys/time.h>
int setitimer(int which, const struct itimerval *new_value,
                    struct itimerval *old_value);

    - 功能:设置定时器(闹钟)。可以替代alarm函数。精度微妙us,可以实现周期性定时
    - 参数:
        - which : 定时器以什么时间计时
          ITIMER_REAL: 真实时间,时间到达,发送 SIGALRM   常用
          ITIMER_VIRTUAL: 用户时间,时间到达,发送 SIGVTALRM
          ITIMER_PROF: 以该进程在用户态和内核态下所消耗的时间来计算,时间到达,发送 SIGPROF

        - new_value: 设置定时器的属性
        
            struct itimerval {      // 定时器的结构体
            struct timeval it_interval;  // 每个阶段的时间,间隔时间
            struct timeval it_value;     // 延迟多长时间执行定时器
            };

            struct timeval {        // 时间的结构体
                time_t      tv_sec;     //  秒数     
                suseconds_t tv_usec;    //  微秒    
            };

        过10秒后,每个2秒定时一次
       
        - old_value :记录上一次的定时的时间参数,一般不使用,指定NULL
    
    - 返回值:
        成功 0
        失败 -1 并设置错误号
        
        
        

2.23 signal信号捕捉函数

自以为signal函数就是对信号捕捉然后可以做一些在默认行为之外的行为,增加对信号的处理方式

 #include <signal.h>
typedef void (*sighandler_t)(int);
sighandler_t signal(int signum, sighandler_t handler);
    - 功能:设置某个信号的捕捉行为
    - 参数:
        - signum: 要捕捉的信号
        - handler: 捕捉到信号要如何处理
            - SIG_IGN : 忽略信号
            - SIG_DFL : 使用信号默认的行为
            - 回调函数 :  这个函数是内核调用,程序员只负责写,捕捉到信号后如何去处理信号。
            回调函数:
                - 需要程序员实现,提前准备好的,函数的类型根据实际需求,看函数指针的定义
                - 不是程序员调用,而是当信号产生,由内核调用
                - 函数指针是实现回调的手段,函数实现之后,将函数名放到函数指针的位置就可以了。

    - 返回值:
        成功,返回上一次注册的信号处理函数的地址。第一次调用返回NULL
        失败,返回SIG_ERR,设置错误号
        
SIGKILL SIGSTOP不能被捕捉,不能被忽略。


2.24信号集及其相关函数

信号集及其相关定义

1.用户通过键盘 Ctrl + C, 产生2号信号SIGINT (信号被创建)

2.信号产生但是没有被处理 (未决) - 在内核中将所有的没有被处理的信号存储在一个集合中 (未决信号集) - SIGINT信号状态被存储在第二个标志位上 - 这个标志位的值为0, 说明信号不是未决状态 - 这个标志位的值为1, 说明信号处于未决状态

3.这个未决状态的信号,需要被处理,处理之前需要和另一个信号集(阻塞信号集),进行比较 - 阻塞信号集默认不阻塞任何的信号 - 如果想要阻塞某些信号需要用户调用系统的API

4.在处理的时候和阻塞信号集中的标志位进行查询,看是不是对该信号设置阻塞了 - 如果没有阻塞,这个信号就被处理 - 如果阻塞了,这个信号就继续处于未决状态,直到阻塞解除,这个信号就被处理

处理信号集的相关函数操作(增删改查)

    以下信号集相关的函数都是对自定义的信号集进行操作。

int sigemptyset(sigset_t *set);
    - 功能:清空信号集中的数据,将信号集中的所有的标志位置为0
    - 参数:set,传出参数,需要操作的信号集
    - 返回值:成功返回0, 失败返回-1

int sigfillset(sigset_t *set);
    - 功能:将信号集中的所有的标志位置为1
    - 参数:set,传出参数,需要操作的信号集
    - 返回值:成功返回0, 失败返回-1

int sigaddset(sigset_t *set, int signum);
    - 功能:设置信号集中的某一个信号对应的标志位为1,表示阻塞这个信号
    - 参数:
        - set:传出参数,需要操作的信号集
        - signum:需要设置阻塞的那个信号
    - 返回值:成功返回0, 失败返回-1

int sigdelset(sigset_t *set, int signum);
    - 功能:设置信号集中的某一个信号对应的标志位为0,表示不阻塞这个信号
    - 参数:
        - set:传出参数,需要操作的信号集
        - signum:需要设置不阻塞的那个信号
    - 返回值:成功返回0, 失败返回-1

int sigismember(const sigset_t *set, int signum);
    - 功能:判断某个信号是否阻塞
    - 参数:
        - set:需要操作的信号集
        - signum:需要判断的那个信号
    - 返回值:
        1 : signum被阻塞
        0 : signum不阻塞
        -1 : 失败
        

2.25 sigprocmask函数

将自己设置的阻塞信号集覆盖到内核中

int sigprocmask(int how,const sigset_t *set,sigset_t *old set)
- 功能:将用户设置好的阻塞信号集设置到内核中(设置阻塞,解除阻塞,替换)
- 参数:
  - how : 如何对内核阻塞信号进行处理
    SIG_BLOCK:将用户设置的阻塞信号集添加到内核中,内核中的原数据不变
    原来的mask |= set
    SIG_UNBLOCK:解除阻塞
    mask &= ~set
    SIG_SETMASK:覆盖原来的值
  
  - set : 已经初始化好的用户自定义的信号集
  - oldset : 传出参数,之前已经设置好的内核信号集,可以是null  
- 返回值:
  - 成功 : 返回0
  - 失败 : 返回-1 设置错误号
  

int sigpending(sigset_t *set);
  - 功能 : 获取内核中的未决信号集
  - 参数 : 传出参数,保存的是内核中的未决信号集

补充

  • 将可执行文件后加一个 & 该进行在后台进行运行
  • fg可以将后台程序切换到前台

2.26 sigaction 信号捕捉函数

和前面学的一个信号处理几乎一样,但该函数更加通用和系统

int sigaction (int signum, const struct sigaction *act,struct sigaction *oldact);

- 功能 : 检查或者改变信号的处理,信号捕捉
- 参数 : 
  - signum : 需要捕捉的函数的宏值
  - act : 对捕捉后的信号的处理
  - oldact : 上一次对信号的处理,一般不用设置为NULL(传出参数)
- 返回值 : 
  - 成功 : 0
  - 失败 : 1
  
struct sigaction {
// 函数指针,指向的函数就是信号捕捉之后的处理函数
void (*sa_handler)(int);

//不常用
void (*sa_sigaction)(int, siginfo_t *, void *);

// 临时阻塞信号集,在信号捕捉函数的执行过程中,临时阻塞某些信号
sigset_t sa_mask;

 // 这个值可以是0,表示使用sa_handler,也可以是SA_SIGINFO表示使用sa_sigaction
int sa_flags;
}

内核实现信号捕捉的过程

image.png

2.27 SIGCHLD函数

SIGCHLD信号产生的3个条件:
    1.子进程结束
    2.子进程暂停了
    3.子进程继续运行
    都会给父进程发送该信号,父进程默认忽略该信号。

使用SIGCHLD信号解决僵尸进程的问题。

提前设置好阻塞信号集,阻塞SIGCHLD,因为有可能子进程很快结束,父进程还没有注册完信号捕捉
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <signal.h>
#include <sys/wait.h>

void myFun(int num) {
    printf("捕捉到的信号 :%d\n", num);
    // 回收子进程PCB的资源
    // while(1) {
    //     wait(NULL); 
    // }
    while(1) {
        // 回收所有的子进程
        int ret = waitpid(-1, NULL, WNOHANG);
        if(ret > 0) {
            printf("child die , pid = %d\n", ret);
        } else if(ret == 0) {
            // 说明还有子进程或者
            break;
        } else if(ret == -1) {
            // 没有子进程
            break;
        }
    }
}

int main() {

    // 提前设置好阻塞信号集,阻塞SIGCHLD,因为有可能子进程很快结束,父进程还没有注册完信号捕捉
    sigset_t set;
    sigemptyset(&set);
    sigaddset(&set, SIGCHLD);
    sigprocmask(SIG_BLOCK, &set, NULL);

    // 创建一些子进程
    pid_t pid;
    for(int i = 0; i < 20; i++) {
        pid = fork();
        if(pid == 0) {
            break;
        }
    }

    if(pid > 0) {
        // 父进程

        // 捕捉子进程死亡时发送的SIGCHLD信号
        struct sigaction act;
        act.sa_flags = 0;
        act.sa_handler = myFun;
        sigemptyset(&act.sa_mask);
        sigaction(SIGCHLD, &act, NULL);

        // 注册完信号捕捉以后,解除阻塞
        sigprocmask(SIG_UNBLOCK, &set, NULL);

        while(1) {
            printf("parent process pid : %d\n", getpid());
            sleep(2);
        }
    } else if( pid == 0) {
        // 子进程
        printf("child process pid : %d\n", getpid());
    }

    return 0;
}

2.28,2.29 共享内存(1)(2)

共享内存相关的函数
#include <sys/ipc.h>
#include <sys/shm.h>

int shmget(key_t key, size_t size, int shmflg);
    - 功能:创建一个新的共享内存段,或者获取一个既有的共享内存段的标识。
        新创建的内存段中的数据都会被初始化为0
    - 参数:
        - key : key_t类型是一个整形,通过这个找到或者创建一个共享内存。
                一般使用16进制表示,非0值
        - size: 共享内存的大小
        - shmflg: 属性
            - 访问权限
            - 附加属性:创建/判断共享内存是不是存在
                - 创建:IPC_CREAT
                - 判断共享内存是否存在: IPC_EXCL , 需要和IPC_CREAT一起使用
                    IPC_CREAT | IPC_EXCL | 0664
        - 返回值:
            失败:-1 并设置错误号
            成功:>0 返回共享内存的引用的ID,后面操作共享内存都是通过这个值。


void *shmat(int shmid, const void *shmaddr, int shmflg);
    - 功能:和当前的进程进行关联
    - 参数:
        - shmid : 共享内存的标识(ID),由shmget返回值获取
        - shmaddr: 申请的共享内存的起始地址,指定NULL,内核指定
        - shmflg : 对共享内存的操作
            - 读 : SHM_RDONLY, 必须要有读权限
            - 读写: 0
    - 返回值:
        成功:返回共享内存的首(起始)地址。  失败(void *) -1


int shmdt(const void *shmaddr);
    - 功能:解除当前进程和共享内存的关联
    - 参数:
        shmaddr:共享内存的首地址
    - 返回值:成功 0, 失败 -1

int shmctl(int shmid, int cmd, struct shmid_ds *buf);
    - 功能:对共享内存进行操作。删除共享内存,共享内存要删除才会消失,创建共享内存的进行被销毁了对共享内存是没有任何影响。
    - 参数:
        - shmid: 共享内存的ID
        - cmd : 要做的操作
            - IPC_STAT : 获取共享内存的当前的状态
            - IPC_SET : 设置共享内存的状态
            - IPC_RMID: 标记共享内存被销毁
        - buf:需要设置或者获取的共享内存的属性信息
            - IPC_STAT : buf存储数据
            - IPC_SET : buf中需要初始化数据,设置到内核中
            - IPC_RMID : 没有用,NULL

key_t ftok(const char *pathname, int proj_id);
    - 功能:根据指定的路径名,和int值,生成一个共享内存的key
    - 参数:
        - pathname:指定一个存在的路径
            /home/nowcoder/Linux/a.txt
            / 
        - proj_id: int类型的值,但是这系统调用只会使用其中的1个字节
                   范围 : 0-255  一般指定一个字符 'a'


问题1:操作系统如何知道一块共享内存被多少个进程关联?
    - 共享内存维护了一个结构体struct shmid_ds 这个结构体中有一个成员 shm_nattch
    - shm_nattach 记录了关联的进程个数

问题2:可不可以对共享内存进行多次删除 shmctl
    - 可以的
    - 因为shmctl 标记删除共享内存,不是直接删除
    - 什么时候真正删除呢?
        当和共享内存关联的进程数为0的时候,就真正被删除
    - 当共享内存的key为0的时候,表示共享内存被标记删除了
        如果一个进程和共享内存取消关联,那么这个进程就不能继续操作这个共享内存。也不能进行关联。

    共享内存和内存映射的区别
    1.共享内存可以直接创建,内存映射需要磁盘文件(匿名映射除外)
    2.共享内存效果更高
    3.内存
        所有的进程操作的是同一块共享内存。
        内存映射,每个进程在自己的虚拟地址空间中有一个独立的内存。
    4.数据安全
        - 进程突然退出
            共享内存还存在
            内存映射区消失
        - 运行进程的电脑死机,宕机了
            数据存在在共享内存中,没有了
            内存映射区的数据 ,由于磁盘文件中的数据还在,所以内存映射区的数据还存在。

    5.生命周期
        - 内存映射区:进程退出,内存映射区销毁
        - 共享内存:进程退出,共享内存还在,标记删除(所有的关联的进程数为0),或者关机
            如果一个进程退出,会自动和共享内存进行取消关联。
            
            

2.30守护进程

补充

echo $$ 可以查看当前进程的pid

tty命令查看当前终端

终端

  • 在Unix系统中,通过终端登录得到一个shell进程,这个终端就是shell的控制终端,控制终端是保存在PCB中的信息,因此通过fork后得到的子进程的控制终端不变
  • 默认情况(无重定向),每个进程的标准输入,输出,错误都指向控制终端.
  • 在控制终端通过一些特殊键位组合可以给前台进程发送信号如 Ctrl + c Ctrl + \

进程组

  • 进程组是相关进程的集合,会话是相关进程组的集合
  • 一个进程组有一个首进程,即创建该进程组的进程,进程组号就是该进程的pid
  • 进程组生命周期从创建开始到最后一个进程组中的进程退出结束,首进程可以不是最后一个离开进程组的进程

会话

  • 会话是一组进程组的集合,其首进程为创建会话的进程,其进程ID会成为会话ID,子进程会继承父进程的会话ID
  • 一个会话中的所有进程共享一个控制终端,控制终端会在会话首进程首次打开一个终端设备时被建立,一个终端最多可能成为一个会话的控制终端
  • 在任一时刻,会话中的其中一个进程组会成为终端的前台进程组,其他进程组会成为后台进程组。只有前台进程组中的进程才能从控制终端中读取输入。当用户在控制终端中输入终端字符生成信号后,该信号会被发送到前台进程组中的所有成员
  • 当控制终端的连接建立起来之后,会话首进程会成为该终端的控制进程。

进程组,控制终端,会话之间的关系

image.png

守护进程

  • 守护进程生命周期很长,守护进程在系统启动时被创建并一直运行到系统关闭.
  • 它在后台运行且没有控制终端,因此内核不会为守护进程自动的生成任何控制信号以及终端相关信号

创建守护进程过程

  • fork并关闭父进程
  • 子进程创建会话调用setsid函数
  • 清除进程的umask以确保守护进程创建文件和目录时所需要的权限
  • 修改当前的工作目录,通常是改为/
  • 关闭守护进程从父进程继承来的文件描述符
  • 用dup2将 0 1 2重定向到/dev/null
  • 核心业务逻辑(你要实现的)