1 课程目标
- Linux是现代化应用程序交付的首选平台,无论是部署在裸机、虚拟化还是容器化环境
- 公司内部服务(TCE、FaaS、SCM)统一使用DebianLinux系统
- 熟悉Linux基础指令,熟练运维前端常用服务 (Nginx,Node.js)
- 加深对操作系统概念和实现的理解,夯实基础知识
2 Linux系统结构 --进程管理
- 在Linux中,进程是指正在执行的程序实例
- 每个进程都拥有自己独立的虚拟地址空间、寄存器集合和打开文件的描述符等资源
- 进程是Linux中最为重要的概念之一
进程的特点
-
进程是正在执行的一个程序或命令
- 进程是操作系统中正在执行的一个程序或命令的实例。每个进程都有一个唯一的进程标识符(PID)和一组相关的系统资源,例如内存、打开的文件和输入/输出设备
-
进程有自己的地址空间,占用一定的系统资源
- 独立性:每个进程都是独立的实体,拥有自己的虚拟地址空间,因此一个进程无法访问另一个进程的内存空间,从而保证了进程的独立性和安全性
-
一个CPU核同一时间只能运行一个进程
- 在单核 CPU 上,同时只能运行一个进程。因为 CPU 在同一时间只能执行一条指令,而每个进程都有自己的一组指令需要被执行,因此同一时间只能有一个进程在执行。当有多个进程需要执行时,操作系统会使用时间片轮转算法,轮流为每个进程分配 CPU 时间,以达到看起来多个进程同时运行的效果。但实际上,每个进程都只在短暂的时间内运行了一小段代码。在多核 CPU 上,可以同时运行多个进程,每个进程都可以被分配到一个 CPU 核心上运行。
-
进程由它的进程ID和它父进程的进程PPID唯一识别
- 进程程的唯一识别是通过进程ID(PID)来实现的,PID是一个唯一的数字标识符,用于区分正在运行的不同进程。在Linux中,每个进程都有一个唯一的PID,而且PID不会重复,因此可以通过PID来确定进程的身份
- 与进程ID相关的另一个重要的属性是父进程ID(PPID),它是创建该进程的父进程的进程ID。在Linux中,每个进程都是由另一个进程创建的,所以每个进程都有一个PPID。通过PPID,我们可以建立进程之间的父子关系,形成进程树的结构
- 除了PID和PPID之外,每个进程还有许多其他属性,例如进程的状态、优先级、打开的文件和共享内存等信息。这些属性可以通过/proc文件系统中的相应文件来查看
进程命令
- 查看启动的Nginx进程:
- 可以使用 ps 命令查看正在运行的进程,配合 grep 命令可以过滤出含有关键字的进程
ps aux | grep nginx
- 查看某个进程:
- 可以使用 ps 命令查看某个进程的信息
ps -p <pid>
top -p <pid> 命令查看指定进程的系统资源使用情况
- 关闭指定的进程:
- 可以使用 kill 命令关闭指定进程。下面命令会向进程 ID 为 的进程发送终止信号,使其退出。
kill <pid>
- 全部进程动态实时视图:
- 可以使用 top 命令查看所有进程的动态实时信息。会打印出一个实时更新的进程列表,包含 CPU 占用率、内存占用率等信息。可以使用快捷键 q 退出 top 命令
top
问题思考
-
系统中运行的程序远远大于CPU的核数,那Liux系统是如何实现同时运行这么多程序的?
- 进程调度是指操作系统按某种策略或规则选择进程占用CPU进行运行的过程
- 它负责将系统中的进程分配到 CPU 的执行时间。因为一个系统中同时可能有很多进程需要运行,而 CPU 的时间是有限的,因此需要对这些进程进行调度,以便让它们都得到适当的时间片,从而使整个系统运行更加高效
- 进程调度的目标是提高系统的资源利用率和响应速度,通过有效地利用 CPU 时间,让系统可以同时运行多个进程,从而实现高效的资源共享。常见的进程调度算法包括先来先服务(FCFS)、短作业优先(SJF)、时间片轮转(RR)等
-
Linux系统通过操作系统内核对进程进行调度,以实现同时运行多个程序的目的。
-
Linux内核采用了抢占式调度方式,每个进程都有自己的进程控制块(PCB),内核利用调度算法动态地将CPU时间片分配给各个进程,从而实现多任务处理。
-
当多个进程需要同时运行时,内核会对它们进行时间片轮转,即将CPU的使用时间按照时间片划分给多个进程,每个进程都能在一定时间内运行一段时间。当进程的时间片用完时,内核会将其挂起,将CPU时间片分配给下一个进程。
-
Linux系统还采用了分时系统(Time Sharing System),即让每个进程都感觉到自己是独占整个系统的,因为系统在一段时间内快速地在各个进程之间切换,所以每个进程都有足够的响应速度和计算能力。这也是Linux系统能够同时运行多个程序的重要原因
-
-
进程阶段
- 创建阶段:进程在创建时,会分配资源并初始化进程控制块(Process Control Block,PCB),包括进程标识、程序计数器、CPU寄存器、内存分配情况等。
- 就绪阶段:进程在获得了运行所需的资源后,会被放置在就绪队列中等待CPU的分配。此时进程已经准备好运行了,只是还没有得到CPU的资源。
- 运行阶段:当进程被调度到CPU上运行时,进程的代码被加载到CPU中执行,这时进程进入运行状态。
- 阻塞阶段:在运行过程中,如果进程需要等待某些事件(如等待I/O操作完成),就会进入阻塞状态,此时进程会释放CPU资源,直到等待的事件完成。
- 结束阶段:当进程完成了它的任务或发生错误时,就会进入终止(僵死)状态。此时系统会回收该进程所占用的资源,并从进程表中删除该进程,也说明了这个进程结束了
进程的状态
- R、S、D、T是常见的进程状态。
- 进程的状态会随着进程运行和系统调度而不断变化。
- 进程状态可以通过命令ps -ef或top查看
- R(TASK_RUNNING),可执行状态
- S(TASK_INTERRUPTIBLE),可中断的睡眠状态
- D(TASK_UNINTERRUPTIBLE),不可中断的睡眠状态
- T(TASK_STOPPED or TASK_TRACED),暂停状态或跟踪状态Z(TASK_DEAD-EXIT_ZOMBIE),退出状态,进程成为僵尸进程
- X(TASK_DEAD-EXIT_DEAD),退出状态,进程即将被销毁
进程的系统调用
- 内核空间(Kernal Space)
- 系统内核运行的空间
- 用户空间(User Space)
- 应用程序运行的空间
-
进程的系统调用是用户程序(用户态)与内核之间的一个接口,可以让用户程序获得内核提供的服务和功能。下面是进程的系统调用的基本流程:
- 用户程序发起系统调用,例如调用打开文件的系统调用
open()。 - 程序经过用户态内核态切换后,进入内核态执行系统调用。
- 内核执行系统调用,并返回结果给用户程序,例如返回一个文件句柄。
- 程序再次经过内核态用户态切换后,回到用户态执行后续代码。
- 用户程序发起系统调用,例如调用打开文件的系统调用
进程调度原则
- 一个CPU核同一时间只能运行一个进程
在多道程序设计中,CPU资源是必须被多个进程共享的。因为CPU核心数量是有限的,所以操作系统必须在多个进程之间进行调度,以便将CPU时间均匀地分配给它们。
- 每个进程有近乎相等的执行时间
当进程开始执行时,操作系统会根据进程的优先级和时间片大小进行调度。在进程执行的过程中,操作系统会监测进程的执行时间,并在进程的时间片用尽之前将其挂起,以便为其他进程腾出CPU时间
- 对于逻辑CPU而言进程调度使用轮询的方式执行,当轮询完成则回到第一个进程反复
操作系统通过轮询算法来进行进程调度。在轮询算法中,每个进程都被分配一个时间片,在时间片用尽之前,进程将一直运行。如果时间片用尽,则操作系统会将该进程挂起,并将CPU时间分配给下一个进程
- 进程执行消耗时间和进程量成正比
进程的执行时间与进程数量成正比。当系统中有更多的进程需要执行时,操作系统需要更多的时间来进行进程调度。这就导致了更多的上下文切换和调度时间,进而降低了系统的性能
3 总结
- Linux命令是更不熟悉的点,还需要自己多多学习
- 对于Linux的进程进行复习,印象更深刻,不过线程也很重要
- 很开心自己的学习有所产出,以后复习时候也可以拿自己文章来复习