操作系统-进程管理

294 阅读1小时+

二、进程管理

概念

进程
程序是静态的,就是个存放在磁盘里的可执行文件,就是一系列的指令集合。
进程 (Process)是动态的,是程序的一次执行过程。同一个程序多次执行会对应多个进程。
当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的“身份证号”PID (Process ID,进程ID)。
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。

1.进程的组成

进程的组成
一个进程实体 (进程映像) 由PCB、程序段、数据段组成。进程是动态的,进程实体(进程映像) 是静态的。
PCB 是给操作系统用的。程序段、数据段是给进程自己用的,与进程自身的运行逻辑有关。
进程控制块 (Process Control Block,PCB)
操作系统需要对各个并发运行的进程进行管理,但凡管理时所需要的信息,都会被放在PCB中。
PCB是进程存在的唯一标志,当进程被创建时,操作系统为其创建PCB,当进程结束时,会回收其PCB。
PCB包含:1.进程描述信息。2.进程控制和管理信息。3.资源分配清单。4.处理机相关信息。
程序段
程序的代码 (指令序列)。
数据段
运行过程中产生的各种数据(如,程序中定义的变量)。

2.进程的特征

进程的特征
动态性进程是程序的一次执行过程,是动态地产生、变化和消亡的。
并发性内存中有多个进程实体,各进程可并发执行。
独立性进程是能独立运行、独立获得资源、独立接受调度的基本单位。
异步性各进程按各自独立的、不可预知的速度向前推进,操作系统要提供”进程同步机制”来解决异步问题。
结构性每个进程都会配置一个PCB。结构上看,进程由程序段、数据段、PCB组成。

进程的状态与转换

进程的基本状态
就绪态(Ready)
运行态(Running)单CPU情况下,同一时刻只会有一个进程处于运行态,多核CPU情况下,可能有多个进程处于运行态。
阻塞态/等待态(Waiting/Blocked)

进程的状态

进程组织

进程的组织
为了对同一个状态下的各个进程进行统一的管理 ,操作系统会将各个进程的PCB组织起来 。
1.链接方式:按照进程状态将PCB分为多个队列。操作系统持有指向各个队列的指针。大多数操作系统采用。(1)执行指针。指向当前处于运行态(执行态)的进程。(2)就绪队列指针。指向当前处于就绪态的进程。通常会把优先级高的进程放在队头。(3)阻塞队列指针。指向当前处于阻塞态的进程。很多操作系统还会根据阻塞原因不同,再分为多个阻塞队列,等待打印机的阻塞队列、等待磁盘的阻塞队列。
2.索引方式:根据进程状态的不同,建立几张索引表。操作系统持有指向各个索引表的指针。 就绪索引表、阻塞索引表。

进程控制

进程控制
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。
简化理解:反正进程控制就是要实现进程状态转换
如何实现进程控制?
用“原语”实现。
如何实现原语的“原子性”?
原语的执行具有原子性,即执行过程只能一气呵成,期间不允许被中断。
可以用“关中断指令”和“开中断指令”这两个特权指令实现原子性。
CPU执行了关中断指令之后,就不再例行检查中断信号,直到执行开中断指令之后才会恢复检查。这样,关中断、开中断之间的这些指令序列就是不可被中断的,这就实现了“原子性“。
思考:如果这两个特权指令允许用户程序使用的话,会发生什么情况? 只能让内核程序使用。

1.创建原语

创建原语:操作系统创建一个进程时使用的原语。
申请空白PCB
为新进程分配所需资源
初始化PCB
将PCB插入就绪队列
引起进程创建的事件
用户登录:分时系统中,用户登录成功,系统会建立为其建立一个新的进程。
作业调度:多道批处理系统中,有新的作业放入内存时,会为其建立一个新的进程。
提供服务:用户向操作系统提出某些请求时,会新建一个进程处理该请求。
应用请求:由用户进程主动请求创建一个子进程。

2.撤销原语

撤销原语:就绪态/阻塞态/运行态→终止态→无
从PCB集合中找到终止进程的PCB。
若进程正在运行,立即剥夺CPU,将CPU分配给其他进程。
终止其所有子进程。进程间的关系是树形结构。
将该进程拥有的所有资源归还给父进程或操作系统。
删除PCB。
引起进程终止的事件
正常结束:进程自己请求终止(exit系统调用)。
异常结束:整数除以0、非法使用特权指令,然后被操作系统强行杀掉。
外界干预:Ctrl+Alt+delete,用户选择杀掉进程。

3.阻塞原语

阻塞原语:运行态→阻塞态。
找到要阻塞的进程对应的PCB。
保护进程运行现场,将PCB状态信息设置为“阻塞态”,暂时停止进程运行。
将PCB插入相应事件的等待队列。
引起进程阻塞的事件
需要等待系统分配某种资源
需要等待相互合作的其他进程完成工作

4.唤醒原语

唤醒原语:阻塞态→就绪态
在事件等待队列中找到PCB。
将PCB从等待队列移除,设置进程为就绪态。
将PCB插入就绪队列,等待被调度。
引起进程唤醒的事件
等待的事件发生:因何事阻塞,就应由何事唤醒。阻塞原语、唤醒原语必须成对使用。

5.切换原语

切换原语:运行态→就绪态,就绪态→运行态。
将运行环境信息存入PCB。
PCB移入相应队列。
选择另一个进程执行,并更新其PCB。
根据PCB恢复新进程所需的运行环境。
引起进程切换的事件
当前进程时间片到
有更高优先级的进程到达
当前进程主动阻塞
当前进程终止
进程切换原语
无论哪个进程控制原语,要做的无非三类事情:1.更新PCB中的信息。修改进程状态(state)保存/恢复运行环境。2.将PCB插入合适的队列。3.分配/回收资源。

进程通信

什么是进程间通信?
进程间通信 (Inter-Process Communication, IPC)是指两个进程之间产生数据交互。
为什么进程通信需要操作系统支持?
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。
为了保证安全,一个进程不能直接访问另一个进程的地址空间。

1.共享存储

共享存储
为避免出错,各个进程对共享空间的访问应该是互斥的。各个进程可使用操作系统内核提供的同步互斥工具(如P、V操作)。
1.基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式。 2.基于存储区的共享:操作系统在内存中划出一块共享存储区,数据的形式、存放位置都由通信进程控制,而不是操作系统。这种共享方式速度很快,是一种高级通信方式。

2.消息传递

消息传递
进程间的数据交换以格式化的消息 (Message) 为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
1.直接通信方式:消息发送进程要指明接收进程的ID。 2.间接通信方式:通过“信箱”间接地通信,因此又称“信箱通信方式“。可以多个进程往同一个信箱send消息,也可以多个进程从同一个信箱中receive消息。

3.管道通信

管道通信
“管道”是一个特殊的共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的内存缓冲区。
1.管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
2.各进程要互斥地访问管道(由操作系统实现)。
3.当管道写满时,写进程将阻塞,直到读进程将管道中的数据取走,即可唤醒写进程。
4.当管道读空时,读进程将阻塞,直到写进程往管道中写入数据,即可唤醒读进程。
5.管道中的数据一旦被读出,就彻底消失。因此,当多个进程读同一个管道时,可能会错乱。对此,通常有两种解决方案:(1)一个管道允许多个写进程,一个读进程(2014年408真题高教社官方答案);(2)允许有多个写进程,多个读进程,但系统会让各个读进程轮流从管道中读数据 (Linux 的方案)。

线程

1.概念

什么是线程,为什么要引入线程?
有的进程可能需要“同时”做很多事,而传统的进程只能串行地执行一系列程序。为此,引入了“线程”,来增加并发度。
传统的进程是程序执行流的最小单位。引入线程后,线程成为了程序执行流的最小单位。
可以把线程理解为“轻量级进程”。线程是一个基本的CPU执行单元,也是程序执行流的最小单位。
引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务 (如QQ可以同时进行视频、文字聊天、传文件)。
引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。
每个线程都有自己独立的、私有的栈区。
线程局部存储(Thread Local Storage,TLS):线程局部存储可以让你使用一个独属于线程的全局变量。也就是说,虽然该变量可以被所有线程访问,但该变量在每个线程中都有一个副本,一个线程改变TLS不会影响到其它线程。
进程和线程:“进程是操作系统分配资源的单位,线程是调度的基本单位,线程之间共享进程资源”。
引入线程机制后,有什么变化?
资源分配、调度:传统进程机制中,进程是资源分配、调度的基本单位。引入线程后,进程是资源分配的基本单位,线程是调度的基本单位。
并发性:传统进程机制中,只能进程间并发。引入线程后,各线程间也能并发,提升了并发度。
系统开销:传统的进程间并发,需要切换进程的运行环境,系统开销很大。线程间并发,如果是同一进程内的线程切换,则不需要切换进程环境,系统开销小。
线程的属性
线程是处理机调度的单位。
多CPU计算机中,各个线程可占用不同的CPU。
每个线程都有一个线程控制块 (Thread Control Block,TCB),控制块之中有线程ID(Thread ID)、线程状态(Thread Status)等。
线程也有就绪、阻塞、运行三种基本状态。
线程几乎不拥有系统资源。
同一进程的不同线程间共享进程的资源。
由于共享内存地址空间,同一进程中的线程间通信甚至无需系统干预。
同一进程中的线程切换,不会引起进程切换。
切换同进程内的线程,系统开销很小。不同进程中的线程切换,会引起进程切换。
切换进程,系统开销较大。

2.线程实现方式

内核级线程

用户级线程(User-Level Thread,ULT)
历史背景:早期的操作系统(如: 早期Unix) 只支持进程,不支持线程。当时的“线程”是由线程库实现的。
很多编程语言提供了强大的线程库,可以实现线程的创建、销毁、调度等功能。
1.线程的管理工作由谁来完成? 用户级线程由应用程序通过线程库实现所有的线程管理工作都由应用程序负责 (包括线程切换)。
2.线程切换是否需要CPU变态? 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
3.操作系统是否能意识到用户级线程的存在? 在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。用户级线程”就是“从用户视角看能看到的线程“。
4.这种线程的实现方式有什么优点和缺点? 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
int main(){
    int i = 0;
    while(true){
        if(i==0){处理视频聊天的代码;)
        if(i==1){处理文字聊天的代码;}
        if(i==2){处理文件传输的代码;i=(i+1)号3;//i的值为 0,1,2,0,1,2..
              }
   }
从代码的角度看,线程其实就是一段代码逻辑。上述三段代码逻辑上可以看作三个“线程”。while 循环就是一个最弱智的“线程库”,线程库完成了对线程的管理工作(如调度)。       
内核级线程(Kernel-Level Thread,KLT,又称“内核支持的线程”)
大多数现代操作系统都实现了内核级线程,如Windows、Linux。
1.线程的管理工作由谁来完成? 内核级线程的管理工作由操作系统内核完成。
2线程切换是否需要CPU变态? 线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
3.操作系统是否能意识到用户级线程的存在? 操作系统会为每个内核级线程建立相应的TCB,通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程”。
4.这种线程的实现方式有什么优点和缺点? 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

多线程模型

多线程模型
在支持内核级线程的系统中,根据用户级线程和内核级线程的映射关系,可以划分为几种多线程模型。
操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。
一对一模型
一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
多对一模型
多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
多对多模型
n个用户级线程映射到m个内核级线程(n>= m)。每个用户进程对应m个内核级线程。
克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。

3.线程的状态与转换

4.线程的组织与控制

线程的组织

处理机调度

调度基本概念
当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理这些任务的顺序,这就是“调度”研究的问题。
作业:一个具体的任务。 用户向系统提交一个作业 ≈ 用户让操作系统启动一个程序(来处理一个具体的任务)

1.三层调度

调度的三个层次
高级调度(作业调度):按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立PCB,调出时才撤销PCB。
中级调度(内存调度):内存不够时,可将某些进程的数据调出外存。等内存空闲或者进程需要运行时再重新调入内存。 暂时调到外存等待的进程状态为挂起状态。被挂起的进程PCB会被组织成挂起队列。 按照某种策略决定将哪个处于挂起状态的进程重新调入内存。 一·个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高。
低级调度(进程调度/处理机调度):按照某种策略从就绪队列中选取一个进程,将处理机分配给它。 进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度。 进程调度的频率很高,一般几十毫秒一次。
进程的挂起态与七状态模型
暂时调到外存等待的进程状态为挂起状态(挂起态,suspend)。
挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态。
五状态模型→七状态模型

七状态模型

三层调度的联系、对比

2.进程调度

进程调度的时机

进程调度的时机
需要进行进程调度与切换的情况:1.当前运行的进程主动放弃处理机。进程正常终止、运行过程中发生异常而终止、进程主动请求阻塞(如等待I/0)。 2.当前运行的进程被动放弃处理机。分给进程的时间片用完、有更紧急的事需要处理(如I/O中断)、有更高优先级的进程进入就绪队列。
不能进行进程调度与切换的情况:1.在处理中断的过程中。中断处理过程复杂,与硬件密切相关做到在中断处理过程中进行进程切换。2.进程在操作系统内核程序临界区中。3.在原子操作过程中(原语)。原子操作不可中断,要一气呵成(如之前讲过的修改PCB中进程状态标志,并把PCB放到相应队列)。
进程调度的时机
进程在操作系统内核程序临界区中不能进行调度与切换(√)。进程处于临界区时不能进行处理机调度(×)。
临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。
临界区:访问临界资源的那段代码。
内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的PCB组成)。
内核程序临界区访问的临界资源如果不尽快释放的话,极有可能影响到操作系统内核的其他管理工作。因此在访问内核程序临界区期间不能进行调度与切换。
在打印机打印完成之前,进程一直处于临界区内,临界资源不会解锁。但打印机又是慢速设备,此时如果一直不允许进程调度的话就会导致CPU一直空闲。 普通临界区访问的临界资源不会直接影响操作系统内核的管理工作。因此在访问普通临界区时可以进行调度与切换。

进程调度的方式

进程调度的方式
非剥夺调度方式,又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。实现简单,系统开销小但是无法及时处理紧急任务,适合于早期的批处理系统。
剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能 (通过时钟中断)。适合于分时操作系统、实时操作系统。
进程的切换与过程
“狭义的进程调度”与“进程切换”的区别:狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)。进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度包含了选择一个进程和进程切换两个步骤。
进程切换的过程主要完成了:1.对原来运行进程各种数据的保存。2.对新的进程各种数据的恢复。(如,程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息一般保存在进程控制块)。
注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。

3.调度程序

调度器/调度程序(scheduler)
让谁运行?——调度算法 运行多长时间?——时间片大小
调度时机——什么事件会触发“调度程序”?
1.创建新进程。2.进程退出。3.运行进程阻塞。4.I/0中断发生(可能唤醒某些阻塞进程)。
非抢占式调度策略,只有运行进程阻塞或退出才触发调度程序工作。抢占式调度策略,每个时钟中断或k个时钟中断会触发调度程序工作。

调度程序

闲逛进程
调度程序永远的备胎,没有其他就绪进程时,运行闲逛进程(idle)。
闲逛进程的特性:1.优先级最低。2.可以是0地址指令,占一个完整的指令周期(指令周期末尾例行检查中断)。3.能耗低。

4.调度算法

调度算法的评价指标

CPU利用率
由于早期的CPU造价极其昂贵,因此人们会希望让CPU尽可能多地工作。
CPU利用率:指CPU“忙碌”的时间占总时间的比例。
利用率 = 忙碌的时间 / 总时间
系统吞吐量
对于计算机来说,希望能用尽可能少的时间处理完尽可能多的作业。
系统吞吐量:单位时间内完成作业的数量。
系统吞吐量 = 总共完成了多少道作业 / 总共花了多少时间
周转时间:上厕所等待
对于计算机的用户来说,他很关心自己的作业从提交到完成花了多少时间。
周转时间,是指从作业被提交给系统开始,到作业完成为止的这段时间间隔。
它包括四个部分:作业在外存后备队列上等待作业调度(高级调度)的时间、进程在就绪队列上等待进程调度(低级调度)的时间、进程在CPU上执行的时间、进程等待IO操作完成的时间。后三项在一个作业的整个处理过程中,可能发生多次。
(作业)周转时间 = 作业完成时间 - 作业提交时间对于用户来说,更关心自己的单个作业的周转时间。
平均周转时间 = 各作业周转时间之和 / 作业数对于操作系统来说,更关心系统的整体表现,因此更关心所有作业周转时间的平均值。
带权周转时间 = 作业周转时间 / 作业实际运行的时间 = (作业完成时间-作业提交时间) / 作业实际运行的时间对于周转时间相同的两个作业,实际运行时间长的作业在相同时间内被服务的时间更多,带权周转时间更小,用户满意度更高。对于实际运行时间相同的两个作业,周转时间短的带权周转时间更小,用户满意度更高。 带权周转时间必然 ≥ 1。带权周转时间与周转时间都是越小越好。
平均带权周转时间 = 各作业带权周转时间之和 / 作业数
等待时间
计算机的用户希望自己的作业尽可能少的等待处理机。
等待时间,指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低。
对于进程来说,等待时间就是指进程建立后等待被服务的时间之和,在等待I/0完成的期间其实进程也是在被服务的,所以不计入等待时间。
对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间。
一个作业总共需要被CPU服务多久,被I/0设备服务多久一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间。当然,与前面指标类似,也有“平均等待时间”来评价整体性能。
等待时间 = 周转时间 - 运行时间
平均等待时间 = 各作业等待时间周转时间之和 / 作业数
响应时间
对于计算机用户来说,会希望自己的提交的请求(比如通过键盘输入了一个调试命令)尽早地开始被系统服务、回应。
响应时间,指从用户提交请求到首次产生响应所用的时间。

早期批处理系统

FCFS
先来先服务(First Come First Serve,FCFS)
算法思想主要从“公平”的角度考虑(类似于我们生活中排队买东西的例子)。
算法规则按照作业/进程到达的先后顺序进行服务。
用于作业/进程调度用于作业调度时,考虑的是哪个作业先到达后备队列;用于进程调度时,考虑的是哪个进程先到达就绪队列。
是否可抢占?非抢占式的算法。
优缺点优点:公平、算法实现简单。 缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即,FCFS算法对长作业有利,对短作业不利。(排队买奶茶..)
是否会导致饥饿不会。

FCFS

SJF
短作业优先(shortest Job First,SJF)
算法思想追求最少的平均等待时间,最少的平均周转时间、最少的平均带权周转时间。
算法规则最短的作业/进程优先得到服务(所谓“最短”是指要求。服务时间最短)。
用于作业/进程调度即可用于作业调度,也可用于进程调度。用于进程调度时称为“短进程优先(SPF,Shortest Process First)算法”。
否可抢占?SJF和SPF是非抢占式的算法。但是也有抢占式的版本,最短剩余时间优先算法(SRTN,Shortest Remaining Time Next)。
优缺点优点:“最短的”平均等待时间、平均周转时间。 缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业/进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先。
是否会导致饥饿会。如果源源不断地有短作业/进程到来,可能使长作业/进程长时间得不到服务,产生“饥饿”现象。如果一直得不到服务,则称为“饿死“。
注意几个小细节1.如果题目中未特别说明,所提到的“短作业/进程优先算法”默认是非抢占式的。 2.很多书上都会说“SJF 调度算法的平均等待时间、平均周转时间最少”。 严格来说,这个表述是错误的,不严谨的。之前的例子表明,最短剩余时间优先算法得到的平均等待时间、平均周转时间还要更少。 应该加上一个条件“在所有进程同时可运行时,采用SJF调度算法的平均等待时间、平均周转时间最少”;或者说“在所有进程都几乎同时到达时,采用SIF调度算法的平均等待时间、平均周转时间最少”。 如果不加上述前提条件,则应该说“抢占式的短作业/进程优先调度算法(最短剩余时间优先,SRNT算法)的平均等待时间、平均周转时间最少”。 3.虽然严格来说,SJF的平均等待时间、平均周转时间并不一定最少,但相比于其他算法(如FCFS),SJF依然可以获得较少的平均等待时间、平均周转时间。 4.如果选择题中遇到“SJF 算法的平均等待时间、平均周转时间最少”的选项,那最好判断其他选项是不是有很明显的错误,如果没有更合适的选项,那也应该选择该选项。

SJF

最短剩余时间优先(Shortest Remaining Time Next,SRTN)
法根据每个进程在其到达时所需的总处理时间来确定其优先级。具体来说,具有最短剩余处理时间的进程将优先获得处理器。

SJF-抢占式

SJF-抢占式1

HRRN
高响应比优先(Highest Response Ratio Next,HRRN)
算法思想要综合考虑作业/进程的等待时间和要求服务的时间。
算法规则在每次调度时先计算各个作业/进程的响应比,选择响应比最高的作业/进程为其服务。响应比 = (等待时间+要求服务时间) / 要求服务时间 (响应比≥1)
用于作业/进程调度即可用于作业调度,也可用于进程调度。
否可抢占?非抢占式的算法。因此只有当前运行的作业/进程主动放弃处理机时,才需要调度,才需要计算响应比。
优缺点综合考虑了等待时间和运行时间(要求服务时间)。等待时间相同时,要求服务时间短的优先(SIF的优点)。要求服务时间相同时,等待时间长的优先(FCFS 的优点)。 对于长作业来说,随着等待时间越来越久其响应比也会越来越大,从而避免了长作业饥饿的问题。
是否会导致饥饿不会。

HRRN

调度算法总结

交互式系统

RR
时间片轮转(Round-Robin,RR)
算法思想公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应。
算法规则按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如100ms)。若进程未在一个时间片内执行完则剥夺处理机,将进程重新放到就绪队列队尾重新排队。 时间片轮转调度算法:轮流让就绪队列中的进程依次执行一个时间片(每次选择的都是排在就绪队列队头的进程)。
用于作业/进程调度用于进程调度(只有作业放入内存建立了相应的进程后,才能被分配处理机时间片)。
是否可抢占?若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知CPU时间片已到。
优缺点优点:公平;响应快,适用于分时操作系统。 缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度。
是否会导致饥饿不会。
时间片太大或太小分别有什么影响?如果时间片太大,使得每个进程都可以在一个时间片内就完成,则时间片轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间。因此时间片不能太大。 另一方面,进程调度、切换是有时间代价的(保存、恢复运行环境),因此如果时间片太小,会导致进程切换过于频繁,系统会花大量的时间来处理进程切换,从而导致实际用于进程执行的时间比例减少。可见时间片也不能太小。 一般来说,设计时间片时要让切换进程的开销占比不超过1%。
优先级调度算法
优先级调度算法
算法思想随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序。
算法规则每个作业/进程有各自的优先级,调度时选择优先级最高的作业/进程。
用于作业/进程调度既可用于作业调度,也可用于进程调度。甚至,还会用于在之后会学习的I/0调度中。
否可抢占?抢占式、非抢占式都有。 做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占。
优缺点优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度。 缺点:若源源不断地有高优先级进程到来,则可能导致饥饿。
是否会导致饥饿会。
补充就绪队列未必只有一个,可以按照不同优先级来组织。另外,也可以把优先级高的进程排在更靠近队头的位置。 根据优先级是否可以动态改变,可将优先级分为静态优先级和动态优先级两种。静态优先级:创建进程时确定,之后一直不变。动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级。
如何合理地设置各类进程的优先级?系统进程优先级高于用户进程。前台进程优先级高于后台进程。 操作系统更偏好IO型进程(或称 IO繁忙型进程)。注:与I/0型进程相对的是计算型进程(或称CPU繁忙型进程)。
如果采用的是动态优先级,什么时候应该调整?可以从追求公平、提升资源利用率等角度考虑。 如果某进程在就绪队列中等待了很长时间,则可以适当提升其优先级。 如果某进程占用处理机运行了很长时间,则可适当降低其优先级。 如果发现一个进程频繁地进行I/0操作,则可适当提升其优先级。

非抢占式-优先级调度算法

抢占式-优先级调度算法

多级反馈队列调度算法
多级反馈队列调度算法
算法思想对其他调度算法的折中权衡。
算法规则1.设置多级就绪队列,各级队列优先级从高到低,时间片从小到大。 2.新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片。若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是在最下级的队列,则重新放回该队列队尾。 3.只有第k级队列为空时,才会为k+1级队头的进程分配时间片。 4.被抢占处理机的进程重新放回原队列队尾。
用于作业/进程调度用于进程调度。
否可抢占?抢占式的算法。在k级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回k级队列队尾。
优缺点对各类型进程相对公平(FCFS的优点);每个新到达的进程都可以很快就得到响应(RR的优点);短进程只用较少的时间就可完成(SPF的优点);不必实现估计进程的运行时间(避免用户作假);可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/0密集型进程(拓展,可以将因I/0而阻塞的进程重新放回原队列,这样IO型进程就可以保持较高优先级)。
是否会导致饥饿会。

多级反馈队列调度算法

算法

多级队列调度算法
多级队列调度算法
系统中按进程类型设置多个队列,进程创建成功后插入某个队列。
队列之间可采取固定优先级,或时间片划分。固定优先级:高优先级空时低优先级进程才能被调度。时间片划分:如三个队列分配时间50%、40%、10%。
各队列可采用不同的调度策略,如,系统进程队列采用优先级调度、交互式队列采用RR、批处理队列采用FCFS。
主要区别在于它们的调度策略和队列优先级设置。多级队列调度算法为每个队列设置了固定的调度策略和优先级,而多级反馈队列调度算法则允许根据进程的行为动态地调整其优先级和调度策略。这使得多级反馈队列调度算法能够更好地适应各种不同类型的进程和负载情况,因此在实践中得到了广泛的应用。

进程同步与互斥

进程同步
如何解决异步问题,就是“进程同步”所讨论的内容。
同步亦称直接制约关系,它是指为完成某种任务而建立的两个或多个进程,这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系。进程间的直接制约关系就是源于它们之间的相互合作。
进程互斥
进程的“并发”需要“共享”的支持。各个并发执行的进程不可避免的需要共享一些系统资源(比如内存,又比如打印机、摄像头这样的I/0设备)。
两种资源共享方式:互斥共享方式、同时共享方式。
我们把一个时间段内只允许一个进程使用的资源称为临界资源。许多物理设备(比如摄像头、打印机)都属于临界资源。此外还有许多变量、数据、内存缓冲区等都属于临界资源。 对临界资源的访问,必须互斥地进行。互斥,亦称间接制约关系。进程互斥指当一个进程访问某临界资源时,另一个想要访问该临界资源的进程必须等待。当前访问临界资源的进程访问结束,释放该资源之后,另一个进程才能去访问临界资源。
对临界资源的互斥访问,可以在逻辑上分为如下四个部分:进入区(上锁)、临界区、退出区(解锁)、剩余区。 进入区和退出区是负责实现互斥的代码段。临界区是进程中访问临界资源的代码段。临界区也可称为“临界段”。
为了实现对临界资源的互斥访问,同时保证系统整体性能,需要遵循以下原则:1.空闲让进。临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区;2.忙则等待。当已有进程进入临界区时,其他试图进入临界区的进程必须等待;3.有限等待。对请求访问的进程,应保证能在有限时间内进入临界区(保证不会饥饿);4.让权等待。当进程不能进入临界区时,应立即释放处理机,防止进程忙等待。

1.进程互斥的软件实现方法

单标志法

单标志法
算法思想:两个进程在访问完临界区后会把使用临界区的权限转交给另一个进程。也就是说每个进程进入临界区的权限只能被另一个进程赋予。
因此,该算法可以实现“同一时刻最多只允许一个进程访问临界区“。
因此,单标志法存在的主要问题是:违背“空闲让进”原则。
turn 变量背后的逻辑:表达“谦让”。

单标志法

双标志先检查法

双标志先检查法
算法思想:设置一个布尔型数组flag[],数组中各个元素用来标记各进程想进入临界区的意愿,比如“flag[0]=ture”意味着0号进程P0现在想要进入临界区。每个进程在进入临界区之前先检查当前有没有别的进程想进入临界区,如果没有,则把自身对应的标志flag[i]设为true,之后开始访问临界区。
因此,双标志先检查法的主要问题是:违反“忙则等待''原则。原因在于,进入区的“检查”和“上锁”两个处理不是一气呵成的。“检查”后,“上锁”前可能发生进程切换
由于循环体为空(只有一个分号),这个循环不会执行任何操作,只是不断检查 flag[1] 的值。

双标志先检查法

双标志后检查法

双标志后检查法
算法思想:双标志先检查法的改版。前一个算法的问题是先“检査”后“上锁”,但是这两个操作又无法一气呵成,因此导致了两个进程同时进入临界区的问题。因此,人们又想到先“上锁”后“检查’的方法,来避免上述问题。
因此,双标志后检查法虽然解决了“忙则等待”的问题,但是又违背了“空闲让进”和“有限等待“原则,会因各进程都长期无法访问临界资源而产生“饥饿”现象。两个进程都争着想进入临界区,但是谁也不让谁,最后谁都无法进入临界区。

双标志后检查法

Peterson

Peterson 算法
算法思想:结合双标志法、单标志法的思想。如果双方都争着想进入临界区,那可以让进程尝试“孔融让梨”(谦让)。做一个有礼貌的进程。
Peterson 算法用软件方法解决了进程互斥问题,遵循了空闲让进、忙则等待、有限等待三个原则,但是依然未遵循让权等待的原则。
Peterson 算法相较于之前三种软件解决方案来说,是最好的,但依然不够好。
进入区:1.主动争取;2.主动谦让;3.检查对方是否也想使用,且最后一次是不是自己说了“客气话“。
压岁钱算法:谁最后说了“客气话”,谁就失去了行动的优先权。

Peterson 算法

2.进程互斥的硬件实现方法

中断屏蔽方法
利用“开/关中断指令”实现。(与原语的实现思想相同,即在某进程开始访问临界区到结束访问为止都不允许被中断,也就不能发生进程切换,因此也不可能发生两个同时访问临界区的情况)
优点:简单、高效。 缺点:不适用于多处理机;只适用于操作系统内核进程,不适用于用户进程。(因为开/关中断指令只能运行在内核态,这组指令如果能让用户随意使用会很危险)。
TestAndset指令
简称 TS 指令,也有地方称为 TestAndSetLock指令,或TSL指令。TSL指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成。
相比软件实现方法,TSL指令把“上锁”和“检查”操作用硬件的方式变成了一气呵成的原子操作。
优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境。 缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等”。
Swap指令
有的地方也叫 Exchange 指令,或简称XCHG 指令。
swap 指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成。
逻辑上来看Swap 和 TSL并无太大区别,都是先记录下此时临界区是否已经被上锁(记录在 old变量上),再将上锁标记 lock 设置为true,最后检查 old,如果old为false 则说明之前没有别的进程对临界区上锁,则可跳出循环,进入临界区。
优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境。 缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等”。
互斥锁
解决临界区最简单的工具就是互斥锁(mutex lock)。一个进程在进入临界区时应获得锁;在退出临界区时释放锁。函数acquire()获得锁,而函数release()释放锁。每个互斥锁有一个布尔变量 available,表示锁是否可用。如果锁是可用的,调用 acqiure()会成功,且锁不再可用。当一个进程试图获取不可用的锁时,会被阻塞,直到锁被释放。
互斥锁的主要缺点是忙等待,当有一个进程在临界区中,任何其他进程在进入临界区时必须连续循环调用 acquire()。当多个进程共享同一CPU时,就浪费了CPU周期。因此,互斥锁通常用于多处理器系统,一个线程可以在一个处理器上等待,不影响其他线程的执行。
需要连续循环忙等的互斥锁,都可称为自旋锁(spin lock),如TSL指令、swap指令、单标志法。
特性:1.需忙等,进程时间片朋完才下处理机,违反“让权等待”。2.优点,等待期间不用切换进程上下文,多处理器系统中,若上锁的时间短,则等待代价很低。3.常用于多处理器系统,一个核忙等,其他核照常工作,并快速释放临界区。4.不太适用于单处理机系统,忙等的过程中不可能解锁。

3.信号量机制

信号量机制
出现背景:1.在双标志先检查法中,进入区的“检查”、“上锁”操作无法一气呵成,从而导致了两个进程有可能同时进入临界区的问题。2.所有的解决方案都无法实现“让权等待”。
1965年,荷兰学者Diikstra提出了一种卓有成效的实现进程互斥、同步的方法——信号量机制。
用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作,从而很方便的实现了进程互斥、进程同步。
信号量其实就是一个变量(可以是一个整数,也可以是更复杂的记录型变量),可以用一个信号量来表示系统中某种资源的数量,比如,系统中只有一台打印机,就可以设置一个初值为1的信号量。
PV原语
原语是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由关中断/开中断指令实现的。软件解决方案的主要问题是由“进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用“原语”实现,使这些操作能“一气呵成”就能避免问题。
一对原语:wait(S) 原语和 signal(S)原语,可以把原语理解为我们自己写的函数,函数名分别为 wait和 signal,括号里的信号量S其实就是函数调用时传入的一个参数。
wait、signal原语常简称为P、V操作(来自荷兰语 proberen和 verhogen)。因此,做题的时候常把wait(S)、signal(s)两个操作分别写为 P(S)、V(S)。
在考研题目中 wait(S)、signal(s)也可以记为 P(S)、V(S)这对原语可用于实现系统资源的 “申请”和“释放”

整型与记录型信号量

整型信号量
用一个整数型的变量作为信号量,用来表示系统中某种资源的数量。
与普通整数变量的区别,对信号量的操作只有三种即初始化、P操作、V操作。

整型信号量

记录型信号量
整型信号量的缺陷是存在“忙等”问题,因此人们又提出了“记录型信号量”,即用记录型数据结构表示的信号量。
满足“让权等待“原则。
注:若考试中出现P(S)、V(S)的操作,除非特别说明,否则默认S为记录型信号量。
申请-阻塞、释放-唤醒

记录型信号量

信号量机制实现进程互斥、同步、前驱

信号量机制实现进程互斥
1.分析并发进程的关键活动,划定临界区(如:对临界资源打印机的访问就应放在临界区)。 2设置互斥信号量 mutex,初值为 1。 3.在进入区 P(mutex)--申请资源。 4.在退出区 V(mutex)--释放资源。
理解:信号量 mutex 表示“进入临界区的名额”。
注意:对不同的临界资源需要设置不同的互斥信号量。
P、V操作必须成对出现。缺少P(mutex)就不能保证临界资源的互斥访问。缺少 V(mutex)会导致资源永不被释放,等待进程永不被唤醒。
//要会自己定义记录型信号量,但如果题目中没特别说明,可以把信号量的声明简写成这种形式
/*信号量机制实现互斥*/
semaphore mutex=1;//初始化信号量/*记录型信号量的定义*/
typedef struct {
    int value; //剩余资源数
    struct process *L; //等待队列
}semaphore;
信号量机制实现进程同步
1.分析什么地方需要实现“同步关系”,即必须保证“一前一后”执行的两个操作(或两句代码)。 2.设置同步信号量S,初始为0。 3.在“前操作”之后执行 V(S)。 4.在“后操作”之前执行 P(S)。
前V后P。
理解:信号量S代表“某种资源”,刚开始是没有这种资源的。P2需要使用这种资源,而又只能由P1产生这种资源。
信号量机制实现前驱关系
1.要为每一对前驱关系各设置一个同步信号量。 2.在“前操作”之后对相应的同步信号量执行V操作。 3.在“后操作”之前对相应的同步信号量执行P操作。
前驱关系问题,本质上就是多级同步问题。

4.进程同步与互斥问题

解题思路
1.关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
2.整理思路。根据各进程的操作流程确定P、V操作的大致顺序。
3.设置信号量。设置需要的信号量,并根据题目条件确定信号量初值。(互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)。

生产者消费者问题

生产者消费者问题
系统中有一组生产者进程和一组消费者进程,生产者进程每次生产一个产品放入缓冲区,消费者进程每次从缓冲区中取出一个产品并使用。(注,这里的“产品”理解为某种数据)。 生产者、消费者共享一个初始为空、大小为n的缓冲区。 只有缓冲区没满时,生产者才能把产品放入缓冲区,否则必须等待。(缓冲区没满→生产者生产) 只有缓冲区不空时,消费者才能从中取出产品,否则必须等待。(缓冲区没空→消费者消费) 缓冲区是临界资源,各进程必须互斥地访问。(互斥关系)
生产者消费者问题是一个互斥、同步的综合问题。对于初学者来说最难的是发现题目中隐含的两对同步关系。有时候是消费者需要等待生产者生产,有时候是生产者要等待消费者消费,这是两个不同的“一前一后问题”’,因此也需要设置两个同步信号量。

生产者和消费者

生产者与消费者-pv顺序

多生产者-多消费者问题

多生产者-多消费者问题
桌子上有一只盘子,每次只能向其中放入一个水果。爸爸专向盘子中放苹果,妈妈专向盘子中放橘子,儿子专等着吃盘子中的橘子,女儿专等着吃盘子中的苹果。只有盘子空时,爸爸或妈妈才可向盘子中放一个水果。仅当盘子中有自己需要的水果时,儿子或女儿可以从盘子中取出水果。
互斥关系:(mutex=1):对缓冲区(盘子)的访问要互斥地进行。 同步关系(一前一后):1.父亲将苹果放入盘子后,女儿才能取苹果。2.母亲将橘子放入盘子后,儿子才能取橘子。3.只有盘子为空时,父亲或母亲才能放入水果。
在生产者-消费者问题中,如果缓冲区大小为1,那么有可能不需要设置互斥信号量就可以实现互斥访问缓冲区的功能。当然,这不是绝对的,要具体问题具体分析。

多生产者-多消费者

吸烟者问题

吸烟者问题
假设一个系统有三个抽烟者进程和一个供应者进程。每个抽烟者不停地卷烟并抽掉它,但是要卷起并抽掉一支烟,抽烟者需要有三种材料:烟草、纸和胶水。三个抽烟者中,第一个拥有烟草、第二个拥有纸、第三个拥有胶水。供应者进程无限地提供三种材料,供应者每次将两种材料放桌子上,拥有剩下那种材料的抽烟者卷一根烟并抽掉它,并给供应者进程一个信号告诉完成了,供应者就会放另外两种材料再桌上,这个过程一直重复(让三个抽烟者轮流地抽烟)。
本质上这题也属于“生产者-消费者”问题,更详细的说应该是“可生产多种产品的单生产者-多消费者”。
组合一:纸+胶水。组合二:烟草+胶水。组合三:烟草+纸。
互斥关系:桌子可以抽象为容量为1的缓冲区,要互斥访问。 同步关系(从事件的角度来分析): 桌上有组合一→第一个抽烟者取走东西。 桌上有组合二→第二个抽烟者取走东西。 桌上有组合三→第三个抽烟者取走东西。 发出完成信号→供应者将下一个组合放到桌上。
吸烟者问题可以为我们解决“可以生产多个产品的单生产者”问题提供一个思路。
值得吸取的精华是:“轮流让各个吸烟者吸烟”,必然需要“轮流的在桌上放上组合一、二、三”,注意体会我们是如何用一个整型变量i实现这个“轮流”过程的。如果题目改为“每次随机地让一个吸烟者吸烟”,我们有应该如何用代码写出这个逻辑呢?
若一个生产者要生产多种产品(或者说会引发多种前驱事件),那么各个V操作应该放在各自对应的“事件”发生之后的位置。

吸烟者问题

读者-写者问题

读者-写者问题
有读者和写者两组并发进程,共享一个文件,当两个或两个以上的读进程同时访问共享数据时不会产生副作用,但若某个写进程和其他进程(读进程或写进程)同时访问共享数据时则可能导致数据不一致的错误。因此要求:①允许多个读者可以同时对文件执行读操作;②只允许一个写者往文件中写信息;③任一写者在完成写操作之前不允许其他读者或写者工作;④写者执行写操作前,应让已有的读者和写者全部退出。
两类进程:写进程、读进程。 互斥关系:写进程一写进程、写进程一读进程。读进程与读进程不存在互斥问题。
思考:若两个读进程并发执行,则count=0时两个进程也许都能满足if条件,都会执行P(rw),从而使第二个读进程阻塞的情况。如何解决:出现上述问题的原因在于对count 变量的检查和赋值无法一气呵成,因此可以设置另一个互斥信号量来保证各读进程对count的访问是互斥的。
潜在的问题:只要有读进程还在读,写进程就要一直阻塞等待,可能“饿死因此,这种算法中,读进程是优先的。实现写优先。
读者-写者问题为我们解决复杂的互斥问题提供了一个参考思路。其核心思想在于设置了一个计数器count 用来记录当前正在访问共享文件的读进程数。我们可以用count的值来判断当前进入的进程是否是第一个/最后一个读进程,从而做出不同的处理。 另外,对 count 变量的检查和赋值不能一气呵成导致了一些错误,如果需要实现“一气呵成”,自然应该想到用互斥信号量。 最后,还要认真体会我们是如何解决“写进程饥饿”问题的。
绝大多数的考研PV操作大题都可以用之前介绍的几种生产者-消费者问题的思想来解决,如果遇到更复杂的问题,可以想想能否用读者写者问题的这几个思想来解决。

读者-写者

读者-写者问题

哲学家进餐问题

哲学家进餐问题
一张圆桌上坐着5名哲学家,每两个哲学家之间的桌上摆一根筷子,桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐,哲学家在思考时,并不影响他人。只有当哲学家饥饿时,才试图拿起左、右两根筷子(一根一根地拿起)。如果筷子已在他人手上,则需等待。饥饿的哲学家只有同时拿起两根筷子才可以开始进餐,当进餐完毕后,放下筷子继续思考。
如何防止死锁的发生呢? 1.可以对哲学家进程施加一些限制条件,比如最多允许四个哲学家同时进餐。这样可以保证至少有一个哲学家是可以拿到左右两只筷子的。 2.要求奇数号哲学家先拿左边的筷子,然后再拿右边的筷子,而偶数号哲学家刚好相反。用这种方法可以保证如果相邻的两个奇偶号哲学家都想吃饭,那么只会有其中一个可以拿起第一只筷子,另一个会直接阻塞。这就避免了占有一支后再等待另一支的情况。 3.仅当一个哲学家左右两支筷子都可用时才允许他抓起筷子。
哲学家进餐问题的关键在于解决进程死锁。这些进程之间只存在互斥关系,但是与之前接触到的互斥关系不同的是,每个进程都需要同时持有两个临界资源,因此就有“死锁”问题的隐患。 如果在考试中遇到了一个进程需要同时持有多个临界资源的情况,应该参考哲学家问题的思想,分析题中给出的进程之间是否会发生循环等待,是否会发生死锁。可以参考哲学家就餐问题解决死锁的三种思路。

哲学家进餐

哲学家进餐-左右筷子同时拿起

5.管程

为什么要引入管程
信号量机制存在的问题:编写程序困难、易出错。
能不能设计一种机制,让程序员写程序时不需要再关注复杂的PV操作,让写代码更轻松呢?
1973年,Brinch Hansen 首次在程序设计语言(Pascal)中引入了“管程”成分——一种高级同步机制。
管程的定义和基本特征
管程是一种特殊的软件模块,有这些部分组成:1.局部于管程的共享数据结构说明;2.对该数据结构进行操作的一组过程;3.对局部于管程的共享数据设置初始值的语句;4.管程有一个名字。
管程的基本特征:1.局部于管程的数据只能被局部于管程的过程所访问;2.一个进程只有通过调用管程内的过程才能进入管程访问共享数据;3每次仅允许一个进程在管程内执行某个内部过程。
拓展1:用管程解决生产者消费者问题
由编译器负责实现各进程互斥地进入管程中的过程!
拓展2:Java 中类似于管程的机制
Java 中,如果用关键字 synchronized 来描述一个函数,那么这个函数同一时间段内只能被一个线程调用。
每次只能有一个线程进入insert 函数,如果多个线程同时调用insert 函数,则后来者需要排队等待。

死锁

什么是死锁
在并发环境下,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推讲的现象,就是“死锁”。发生死锁后若无外力干涉,这些进程都将无法向前推进。
死锁、饥饿、死循环的区别
死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。
饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。比如,在短进程优先(SPF)算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程“饥饿”。
死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑bug 导致的,有时是程序员故意设计的。

死锁、饥饿、死循环

1.死锁产生条件

死锁产生的必要条件:产生死锁必须同时满足一下四个条件,只要其中任一条件不成立,死锁就不会发生。
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)。
不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。
请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
注意:1.发生死锁时一定有循环等待,但是发生循环等待时未必死锁(循环等待是死锁的必要不充分条件)。2.如果同类资源数大于1,则即使有循环等待,也未必发生死锁。但如果系统中每类资源都只有一个,那循环等待就是死锁的充分必要条件了。
什么时候会发生死锁
1.对系统资源的竞争。各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的。
2.进程推进顺序非法。请求和释放资源的顺序不当,也同样会导致死锁。例如,并发执行的进程P1、P2分别申请并占有了资源 R1、R2,之后进程P1又紧接着申请资源R2,而进程P2又申请资源R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。
3.信号量的使用不当也会造成死锁。如生产者-消费者问题中,如果实现互斥的P操作在实现同步的P操作之前,就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是一种抽象的系统资源)
总之,对不可剥夺资源的不合理分配,可能导致死锁。

2.死锁的处理策略

死锁的处理策略
1.预防死锁。破坏死锁产生的四个必要条件中的一个或几个。
2.避免死锁。用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)。
3.死锁的检测和解除。允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁。

预防死锁

静态策略:预防死锁(不允许死锁发生)
破坏互斥条件
如果把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。
比如,SPOOLing技术。操作系统可以采用 SPO0Ling 技术把独占设备在逻辑上改造成共享设备。比如,用SPOOLing技术将打印机改造为共享设备。使用了SPooLing技术后,在各进程看来,自己对打印机资源的使用请求立即就被接收处理了,不需要再阻寒等待。
该策略的缺点,并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件。
破坏不剥夺条件
方案一:当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件。
方案二:当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级(比如,剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)。
该策略的缺点:1.实现起来比较复杂。2.释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般只适用于易保存和恢复状态的资源,如CPU。3.反复地申请和释放资源会增加系统开销,降低系统吞吐量。4.若采用方案一,意味着只要暂时得不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿。
破坏请求和保持条件
可以采用静态分配方法,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了。
该策略实现起来简单,但也有明显的缺点,有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿。
破坏循环等待条件
可采用顺序资源分配法(有序资源分配)。首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(即编号相同的资源)一次申请完。
原理分析:一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。
该策略的缺点:1.不方便增加新的设备,因为可能需要重新分配所有的编号;2.进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费;3.必须按规定次序申请资源,用户编程麻烦。

避免死锁

动态策略:避免死锁(不允许死锁发生)
安全序列、不安全状态、死锁的联系
所谓安全序列,就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要能找出一个安全序列,系统就是安全状态。当然,安全序列可能有多个。
如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态,不过我们在分配资源之前总是要考虑到最坏的情况。
如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态,就可能发生死锁(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态)。
因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求。这也是“银行家算法”的核心思想。
银行家算法
银行家算法是荷兰学者 Dikstra 为银行系统设计的,以确保银行在发放现金贷款时,不会发生不能满足所有客户需要的情况。后来该算法被用在操作系统中,用于避免死锁。
核心思想:在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态。如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待。
实际做题(手算)时可用更快速的方法找到一个安全序列:经对比发现,(3,3,2)可满足P1、P3,说明无论如何,这两个进程的资源需求一定是可以依次被满足的,因此P1、P3 一定可以顺利的执行完,并归还资源。可把P1、P3先加入安全序列。(2,0,0)+(2,1,1)+(3,3,2)=(7,4,3)。剩下的 P0、P2、P4 都可被满足。同理,这些进程都可以加入安全序列。于是,5个进程全部加入安全序列,说明此时系统处于安全状态,暂不可能发生死锁。
银行家算法代码实现:

银行家算法-1

银行家算法-2

死锁的检测和解除

死锁的检测和解除(允许死锁发生)
如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供两个算法:①死锁检测算法,用于检测系统状态,以确定系统中是否发生了死锁。②死锁解除算法,当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来。
死锁的检测
为了能对系统是否已发生了死锁进行检测,必须:①用某种数据结构来保存资源的请求和分配信息;②提供一种算法,利用上述信息来检测系统是否已进入死锁状态。
如果按上述过程分析,最终能消除所有边,就称这个图是可完全简化的。此时一定没有发生死锁(相当于能找到一个安全序列)。如果最终不能消除所有边,那么此时就是发生了死锁。最终还连着边的那些进程就是处于死锁状态的进程。
死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁。

死锁的检测

死锁的解除
一旦检测出死锁的发生,就应该立即解除死锁。
补充:并不是系统中所有的进程都是死锁状态,用死锁检测算法化简资源分配图后,还连着边的那些进程就是死锁进程。
解除死锁的主要方法有:1.资源剥夺法。挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿。2.撤销进程法(或称终止进程法)。强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来。3.进程回退法。让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点。
如何决定“对谁动手”:1.进程优先级。2.已执行多长时间。3.还要多久能完成。4.进程已经使用了多少资源。5.进程是交互式的还是批处理式的。

习题

某计算机只支持单道程序,某个作业刚开始需要在CPU上运行5秒再用打印机打印输出5秒,之后再执行5秒,才能结束。在此过程中,CPU利用率、打印机利用率分别是多少?
CPU利用率 = 5+5 / 5+5+5 = 66.66%
打印机利用率 = 5 / 15 = 33.33%
某计算机系统处理完10道作业,共花费100秒,则系统吞吐量为?
10/100 = 0.1 道/秒

附录

k个进程,需要n个资源,需要多少系统资源不会发生死锁:*process (resource - 1)+1

Max(每个进程的最大需求)

Allocation(已分配资源)

Need(还需要的资源) = Max - Allocation

Available(每个资源剩余量) = 资源总数 - Allocation

计算每个资源剩余量:R 1 = 9 -(1+2+2+1+1) = 2