进程同步、进程互斥
进程同步
并发的进程具有异步性的特征,进程的异步性是指各个并发执行的进程以各自独立的、不可预知的速度向前推进
进程的异步意味着接下来执行哪个进程是不确定的,有可能仍然执行当前进程的下一个操作,也有可能执行其他进程的某一步操作
同步亦称直接制约关系,它是指为完成某种任务而建立的两个或多个进程,这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系。进程间的直接制约关系就是源于它们之间的相互合作
以进程通信中的管道通信方式为例:
读进程和写进程是并发执行的,这必然会导致进程的异步性,也就是“写数据”和“读数据”两个操作执行的先后顺序是不确定的,而实际应用中,又必须按照“先写数据后读数据”的顺序来进行,因此需要使用到进程同步机制解决此类问题
进程互斥
进程的“并发”需要“共享”的支持,各个并发执行的进程不可避免地需要共享一些系统资源(如内存、打印机、摄像头等I/O设备)
两种资源共享方式:
互斥共享方式:系统中的某些资源,虽然可以提供给多个进程使用,但一个时间段内只允许一个进程访问该资源(临界资源)
同时共享方式:系统中的某些资源,允许一个时间段内有多个进程“同时”对它们进行访问
我们把一个时间段内只允许一个进程使用的资源称为临界资源,许多物理设备(摄像头、打印机)都属于临界资源,此外还有许多变量、数据、内存缓冲区等都属于临界资源
对临界资源的访问,必须互斥地进行
互斥亦称间接制约关系。进程互斥指当一个进程访问某临界资源时,其它想要访问该临界资源的进程必须等待,当前访问临界资源的进程访问结束,释放该资源之后,其它进程才能去访问临界资源
对临界资源的互斥访问,可以在逻辑上分为四个部分:
do {
entry section; // 进入区
critical section; // 临界区
exit section; // 退出区
remainer section; // 剩余区
}while(true);
上面的各个区本质上就是一段代码
- 进入区:负责检查是否可以进入临界区(检查临界资源是否被锁),若可以进入,则还应设置正在访问临界资源的标志(即给临界资源上锁),以阻止其他进程同时进入临界区
- 临界区:访问临界资源的那段代码
- 退出区:负责解除正在访问临界资源的标志(即将临界资源解锁)
- 剩余区:做其它处理
注意:
- 临界区是进程中访问临界资源的那段代码
- 进入区和退出区是负责实现进程互斥的代码段
- 临界区也可称为“临界段”
为了实现对临界资源的互斥访问,同时保证系统整体性能,需要遵循以下原则:
- 空闲让进:临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区
- 忙则等待:当已有进程进入临界区时,其他试图进入临界区的进程必须等待
- 有限等待:对请求访问临界区的进程,应保证其能在有限时间内进入临界区(保证不会饥饿)
- 让权等待:当进程不能进入临界区时,应立即释放处理机,防止进程忙等待
忙等待是指进程不能进入临界区并在接下来的一段时间内还一直占用着处理机资源
忙等待会使得原本能够空闲下来的处理机资源不能提供给别的进程服务,造成处理机资源的浪费
总结
进程互斥的软件实现方法
单标志法
思想:两个进程在访问完临界区后会把使用临界区的权限转交给另一个进程,也就是说每一个进程进入临界区的权限只能被另一个进程赋予
使用(访问)临界区就是执行临界区代码
首先给需要互斥的进程设置公用的变量:
int turn = 0; // turn表示当前允许进入临界区的进程号
P0进程:
while(turn != 0); ①
critical section; ②
turn = 1; ③
remainder section; ④
P1进程:
while(turn != 1); ⑤
critical section; ⑥
turn = 0; ⑦
remainder section; ⑧
turn的初值为0,即刚开始只允许0号进程进入临界区 若P1先上处理机运行,则会一直卡在⑤,直到P1的时间片用完,发生调度,切换P0进程上处理机运行 代码①不会卡住P0,P0可以正常访问临界区,在P0访问临界区期间即使切换回P1,P1依然会卡在⑤ 只有P0在退出区将turn改为1后,P1才能进入临界区
因此,该算法可以实现“同一时刻最多只允许一个进程访问临界区”
但这种方法实现的互斥只能按P0 → P1 → P0 → P1 → ...这样轮流访问,这种必须“轮流”带来的问题是,如果此时允许进入临界区的进程是P0,而P0一直不访问临界区,那么虽然此时临界区空闲,但是并不允许P1访问,因此,单标志法存在的主要问题是违背“空闲让进”的原则
双标志先检查法
思想:设置一个布尔型的数组flag[],数组中各个元素用来标记各进程想进入临界区的意愿,比如flag[0] = true表示0号进程现在想要进入临界区。每个进程在进入临界区之前先检查当前是否有别的进程想要进入临界区,如果没有,则把自身对应的标志flag[i]设为true,之后开始访问临界区
进入临界区就是开始执行临界区代码
首先给需要互斥的进程设置公用的变量:
bool flag[2]; // 表示进入临界区意愿的数组
flag[0] = false;
flag[1] = false; // 刚开始设置为两个进程都不想进入临界区
P0进程:
while(flag[1]); ①
flag[0] = true; ②
critical section; ③
flag[0] = false; ④
remainder section;
P1进程:
while(flag[0]); ⑤ // 如果此时P0想进入临界区,P1就一直循环等待
flag[1] = true; ⑥ // 标记为P1进程想要进入临界区
critical section; ⑦ // 访问临界区
flag[1] = false; ⑧ // 访问完临界区,修改标记为P1不想使用临界区
remainder section;
在双标志先检查法中,每个进程的进入区都做了两个事情:
while(flag[i]):检查另一个进程是否想要进入临界区,如果对方想,那么自己就会卡在循环这里flag[j] = true:当检查到对方不想进入临界区后,就可以表示自己想进入临界区的意愿
假设此时这两个并发执行的进程的代码执行顺序是①⑤②③⑥⑦...这种情况,那么还是会出现两个进程对临界资源的“同时”访问,没能达到互斥的目的
因此,双标志先检查法的主要问题是违背了“忙则等待”的原则
出现这种问题的原因在于,进入区的“检查”和“上锁”两个处理并不是一气呵成的,“检查”后“上锁”前就可能出现进程切换的情况
双标志后检查法
思想:先“上锁”后“检查”,是上一种算法的改版
首先给需要互斥的进程设置公用的变量:
bool flag[2]; // 表示进入临界区意愿的数组
flag[0] = false;
flag[1] = false; // 刚开始设置为两个进程都不想进入临界区
P0进程:
flag[0] = true; ①
while(flag[1]); ②
critical section; ③
flag[0] =false; ④
remainder section;
P1进程:
flag[1] = true; ⑤ // 标记为P1进程想要进入临界区
while(flag[0]); ⑥ // 如果此时P0想进入临界区,P1就一直循环等待
critical section; ⑦ // 访问临界区
flag[1] =false; ⑧ // 访问完临界区,修改标记为P1不想使用临界区
remainder section;
在双标志后检查法中,每个进程的进入区都做了两个事情:
flag[i] = true:先表达自己想进入临界区的意愿while(flag[j]):再检查另一个进程是否想要进入临界区,如果对方想,那么自己就会卡在循环这里
假设此时这两个并发执行的进程的代码执行顺序是①⑤②⑥...这种情况,那么还是会出现两个进程同时等待使用临界资源的情况(即发生了死锁),导致两个进程都无法使用临界资源
因此,双标志后检查法虽然解决了“忙则等待”的问题,但是又违背了“空闲让进”和“有限等待”原则会因为各进程长期无法访问临界资源而产生“饥饿”现象
Peterson算法
思想:结合双标志、单标志法的思想。如果都争着想进入临界区,那可以尝试“谦让”
首先给需要互斥的进程设置公用的变量:
bool flag[2] = {false, false}; // 表示进入临界区意愿的数组,初始值都是false。表达“意愿”
int turn = 0; // turn表示优先让哪个进程进入临界区,表达“谦让”(最后一次谁做了谦让动作)
P0进程:
flag[0] = true; ①
turn = 1; ②
while(flag[1] && turn == 1); ③
critical section; ④
flag[0] =false; ⑤
remainder section;
P1进程:
flag[1] = true; ⑥ // 表示自己想进入临界区
turn = 0; ⑦ // 可以优先让对方进入临界区
while(flag[0] && turn == 0); ⑧ // 对方想进,且最后一次是自己谦让,那自己就循环等待
critical section; ⑨
flag[1] =false; ⑩ // 访问完临界区,表示自己已经不想访问临界区了
remainder section;
在Peterson算法中,每个进程的进入区都做了三个事情:
flag[i] = true:先表达自己想进入临界区的意愿turn = 0|1:表示可以让对方进入临界区(谦让)while(flag[j] && turn == 0|1):检查另一个进程是否想要进入临界区,如果对方想且最后一次是自己愿意谦让给你对方,那么自己就会卡在循环这里,让对方访问临界区
Peterson算法用软件方法解决了进程的互斥问题,遵循了空闲让进、忙则等待、有限等待三个原则,但是依然未遵循让权等待的原则
Peterson算法相较于上面三种算法来说是最好的,但依然不够好
总结
进程互斥的硬件实现方法
中断屏蔽方法
思想:与原语的实现思想相同,即在某进程开始访问临界区到结束访问临界区为止都不允许被中断,也就不能发生进程切换,因此也不可能发生两个进程同时访问临界区的情况,需要使用“开/关中断指令”来实现
...
关中断; // 关中断后即不允许当前进程被中断,也必然不会发生切换
临界区;
开中断; // 直到当前进程访问完临界区,在执行开中断指令,才有可能有别的进程上处理机并访问临界区
...
优点:简单、高效
缺点:不适用于多处理机系统,因为开/关中断指令只对执行它们的处理机有效;只适用于操作系统内核进程,不适用于用户进程,因为开/关中断指令只能运行在内核态
TestAndSet指令
简称TS指令,也有的地方称为TestAndSetLock指令,或TSL指令
TSL指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成
以下是用C语言描述的逻辑(该指令是用硬件实现的,下面的代码只是对实现的逻辑进行描述):
// 布尔型共享变量lock表示当前临界区是否被加锁
// true表示已加锁,false表示未加锁
bool TestAndSet(bool *lock){
bool old;
old = *lock; // old存放lock原来的值
*lock = true; // 无论之前是否已加锁,都将lock设为true
return old; // 返回lock原来的值
}
// 以下是使用TSL指令实现互斥的算法逻辑
while(TestAndSet(&lock)); // “上锁”并“检查”
临界区代码段...
lock = false; // “解锁”
剩余区代码段...
这里可以把TestAndSet指令理解为一个TestAndSet函数,在指令执行的过程中不会被打断相当于在函数执行的过程中不会发生进程切换
若进程开始执行时lock为false,则TSL返回的old值为false,while循环条件不满足,直接跳过循环,进入临界区;若进程开始执行时lock是true,则执行TSL后old返回的值为true,while循环条件满足是,会一直循环,直到当前访问临界区的进程在退出区进行“解锁”
相比软件实现,TSL指令把“上锁”和“检查”操作用硬件的方式变成了一气呵成的原子操作
优点:实现简单;适用于多处理机环境
缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等”
Swap指令
有的地方也叫Exchange指令,或简称XCHG指令
Swap指令使用硬件实现的,执行的过程中不允许被中断,只能一气呵成
以下是用C语言描述的逻辑:
// Swap指令的作用是交换两个变量的值
void Swap(bool *a, bool *b){
bool temp;
temp = *a;
*a = *b;
*b = temp;
}
// 以下是用Swap指令实现互斥的算法逻辑
// lock表示当前临界区是否被加锁
bool old = true;
while(old == true){
Swap(&lock, &old);
}
临界区代码段...
lock = false;
剩余区代码段...
逻辑上看Swap和TSL并无太大区别,都是先记录下此时临界区是否已经被上锁(记录在old变量中),再将上锁标记lock设置为true,最后检查old,如果old为false则说明之前没有别的进程对临界区上锁,则可跳出循环,进入临界区
优点:实现简单;适用于多处理机环境
缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行Swap指令,从而导致“忙等”
总结
互斥锁
解决临界区问题的最简单工作就是互斥锁(mutex lock),一个进程在进入临界区时应该获得锁,在退出临界区时释放锁。函数acquire()获得锁,而函数release()释放锁
每个互斥锁有一个共享型布尔变量available,表示锁是否可用。如果锁是可用的,调用acquire()会成功,且锁不再可用。当一个进程试图获取不可用的锁时,会被阻塞(循环等待),直到锁被释放
void acquire(){ // 进入区
while(!available); // 忙等待
available = false; // 获得锁(即上锁)
}
void release(){ // 退出区
available = true; // 释放锁(即解锁)
}
acquire()和release()的执行必须是原子操作,因此互斥锁通常采用硬件机制来实现
互斥锁的主要缺点是忙等待,当有一个进程在临界区中,任何其它进程在进入临界区时就只能卡在循环的位置。当多个进程共享同一个CPU时,就浪费了CPU周期。因此,互斥锁通常用于多处理机系统,一个进程(或线程)可以在一个处理机上等待,不影响其它进程去其它处理机上执行
需要连续循环忙等的互斥锁,可以称为自旋锁(spin lock),如TSL指令、Swap指令、单标志法
自旋锁的特性:
- 需要忙等:进程时间片用完才下处理机,违反“让权等待”原则
- 优点:
- (不适合单处理机系统)常用于多处理机系统,一个核忙等,其它核照常工作,并可以快速释放临界区,供给其它进程访问
- 在多处理机系统中,等待期间可以不切换进程上下文(不需要保存和恢复进程环境),若上锁的时间短,则等待代价很低
如多处理机系统中的1号核心内的P1进程正在忙等,2号核心中P2进程正在访问临界区,若突然P2进程退出临界区并解锁,那么处于另一个核中的P1进程就可以迅速检查到解锁的动作从而访问临界区,而不必像单处理机系统那样“先等到P2进程解锁,再等待从P2进程切换到P1进程,之后P1进程再检查上锁的状态”,也就不需要切换进程上下文
在单处理机系统中,若一个进程在时间片还没有用完时就已经解锁,那么其它进程还是需要等到当前进程被切换掉后才能访问临界区(即在单处理机系统中,忙等的时间一定是完整的n个时间片,不可能出现进程在同一个时间片内突然从忙等的状态转变为访问的状态),因此等待的代价相比与多处理机系统较大
信号量机制
用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作,从而很方便地实现进程互斥、进程同步
信号量其实就是一个变量,可以是一个整数(整型信号量),比如可以用一个信号量来表示系统中某种资源的数量(系统中只有一台打印机,就可以设置一个初始值为1的信号量);也可以是更复杂的记录型变量(记录型信号量)
原语是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由开/关中断指令实现的。双标志先检查法的主要问题是由“进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用“原语”实现,就能避免问题
一对原语:wait(S)原语和signal(S)原语,可以把原语理解为我们自己写的函数,函数名分别为wait和signal,信号量S其实就是函数调用时传入的一个参数
wait、signal原语常简称为P、V操作(proberen和verhogen),因此也常把wait(S)、signal(S)两个操作分别写为P(S)和V(S)
整型信号量
用一个整型的变量作为信号量,用来表示系统中某种资源的数量
整型信号量与普通的整型变量的区别:整型信号量的操作只能有三种:初始化、P操作、V操作
int S = 1; // 初始化整型信号量,表示当前系统中可用的资源(如打印机)的数量
void wait(int S){
while(S == 0); // 如果资源数不够,就一直循环等待
S = S - 1; // 如果资源数够,则占用一个资源
}
void signal(int S){
S = S + 1; // 使用完资源后,则释放资源
}
进程:
...
wait(S); // 进入区,申请资源
使用打印机资源... // 临界区,访问资源
signal(S); // 退出区,释放资源
...
优点:wait(S)实现的功能其实和双标志先检查法中检查+上锁是一样的,不过wait(S)操作是一气呵成的,因此不会出现双标志先检查法中因为进程的并发性和异步性导致的无法实现互斥的问题
缺点:不满足“让权等待”原则,会发生“忙等”
记录型信号量
整型信号量的缺陷是存在“忙等”问题,因此有提出了“记录型信号量”,即用记录型数据结构表示的信号量
记录型信号量的定义:
typedef struct {
int value; // 剩余的资源数量
struct process *L; // 等待队列(阻塞队列),初始为空
} semaphore;
// 当value为负数时,则可以表示等待队列中有几个进程正在等待资源分配,如value = -2,表示此时等待队列中有两个处于阻塞态的进程
某进程需要使用资源时,通过wait原语申请:
void wait(semaphore S){
S.value--;
if(S.value < 0){
// 如果剩余资源数不够,使用block原语使进程从运行态进入阻塞态,并挂到信号量S的等待队列中
block(S.L);
}
}
进程使用完资源后,通过signal原语释放:
void signal(semphore S){
S.value++;
if(S.value <= 0){
// 释放资源后,若还有别的进程在等待这种资源,则使用wakeup原语唤醒等待队列中的第一个进程,并把资源分配给该进程,该进程从阻塞态转变为就绪态
wakeup(S.L);
}
}
进程:
...
wait(S); // 进入区,申请资源
使用打印机资源... // 临界区,访问资源
signal(S); // 退出区,释放资源
...
在实际做题中,wait(S)和signal(S)也可以记为P(S)和V(S),这对原语可用于实现系统资源的“申请”和“释放”
若题目中没有特别说明,则默认S为记录型信号量
S.value的初值表示系统中某种资源的数目(初值必须大于等于0)
对信号量S的一次P操作意味着进程请求一个单位的该类资源,因此需要执行S.value--。当S.value--后S.value<0时表示该类资源已全部分配完毕,因此进程应调用block原语进行自我阻塞(当前运行的进程从运行态转变为阻塞态),主动放弃处理机,并插入到该类资源的等待队列S.L中
对信号量S的一次V操作意味着进程释放一个单位的该类资源,因此需要执行S.value++,表示资源数加1,若加1后仍是S.value<=0,表示依然有进程在等待该类资源,因此应该调用wakeup原语唤醒等待队列中的第一个进程(被唤醒的进程从阻塞态转变为就绪态,并从等待队列中移除),并可以把资源分配给该进程(由于该进程已经使用了wait(S)原语来申请使用资源,因此等到该进程变为运行态时就可以直接使用该资源了,但使用完后仍然需要signal(S)释放资源)
该机制遵循了“让权等待”的原则,不会出现“忙等”现象
总结
用信号量实现进程互斥、进程同步、前驱关系
回顾
信号量的值代表了资源的剩余数量,信号量的值如果小于0,则说明此时有进程在等待这种资源
P(S)代表的含义是申请一个资源S,如果资源不够的话就阻塞等待(即如果此时资源的数量如果为0,那么之后进程再执行P(S),该进程就会阻塞)
V(S)代表的含义是释放一个资源S,如果有进程在等待资源,则唤醒其中的一个进程
信号量机制实现进程互斥
步骤:
- 分析并发进程的关键活动,划定临界区范围
- 设置互斥信号量mutex,初始值设置为1
- 在进入临界区前执行P(mutex)操作,出了临界区后执行V(mutex)操作
semaphore mutex = 1; // 初始化信号量
// 根据类型判断信号量为记录型信号量,而不是看初始化的值
P1(){
...
P(mutex); // 使用临界资源前需要加锁
临界区代码段...
V(mutex); // 使用临界资源后需要解锁
...
}
P2(){
...
P(mutex);
临界区代码段...
V(mutex);
...
}
理解:信号量mutex代表“进入临界区的名额”
注意:
- 对不同的临界资源需要设置不同的互斥信号量
- P、V操作必须成对出现。缺少P操作就不能保证临界资源的互斥访问;缺少V操作会导致资源永不被释放,等待进程永不被唤醒
信号机制实现进程同步
进程同步:让各种进程按照要求有序的推进
比如,P1、P2两个进程并发执行,由于存在异步性,因此二者交替推进的次序是不确定的
P1(){ 代码1; 代码2; 代码3; } P2(){ 代码4; 代码5; 代码6; }若P2的“代码4”要基于P1的“代码1”和“代码2”的运行结果才能执行,那么就必须保证“代码4”一定是在执行完“代码2”之后才会执行
步骤:
- 分析什么地方需要实现是“同步”,即必须确定需要“一前一后”执行的两个操作的位置
- 设置同步信号量S,初始值为0
- 在“前操作”之后执行V(S)
- 在“后操作”之前执行P(S)
前V后P:前操作之后加V,后操作之前加P
初始化信号量S:
semaphore S = 0; // 初始化同步信号量,初始值为0
P1(){
代码1;
代码2;
V(S);
代码3;
}
P2(){
P(S);
代码4;
代码5;
代码6;
}
理解:信号量S代表“某种资源”(实际不存在什么资源),而刚开始是没有这种“资源”的(因为初值是0,即用初值为0代表没有“资源”的含义),P2由于需要使用这种“资源”(使用P操作使用资源),而又只能由P1产生这种“资源”(使用V操作提供资源),因此P2必须得在P1提供“资源”之后才能使用“资源”(即实现了同步关系)
若先执行到V(S)操作,则S++后S=1,之后当执行到P(S)操作时,由于S=1,表示有可用资源,会执行S--,S的值变回0,P2进程不会执行block原语,而是继续往下执行代码4
若先执行到P(S)操作,由于S=0,S--后S=-1,表示此时没有可用资源,因此P操作中会执行block原语,主动请求阻塞。之后当执行完代码2,继而执行V(S)操作,S++,使S变回0,由于此时有进程在该信号量对应的阻塞队列中,这样P2就可以继续执行代码4了
信号量机制实现前驱关系
假设进程1中有代码S1,进程2中有代码S2,...,进程6中有代码S6
S2和S3的执行必须在S1执行完后,S4和S5的执行必须在S2执行完后,S6的执行必须在S3、S4和S5都执行完后
分析:每一对前驱关系本质上都是一个进程同步问题
步骤:
- 为每一对前驱关系分别设置一个同步信号量,各个同步信号量的初值都是0
- 在每一个“前操作”之后对相应的同步信号量执行V操作
- 在每一个“后操作”之前对相应的同步信号量执行P操作
总结
生产者-消费者问题
系统中有一组生产者进程和一组消费者进程,生产者进程每次生产一个产品并放入缓冲区,消费者进程每次从缓冲区中取出一个产品并使用。生产者、消费者进程需要互斥共享一个初始为空、大小为n的缓冲区
只有缓冲区没满时,生产者才能把产品放入缓冲区,否则必须阻塞等待
同步关系:缓冲区没满 → 生产者生产
只有缓冲区不空时,消费者才能从中取出产品,否则必须阻塞等待
同步关系:缓冲区没空 → 消费者消费
缓冲区是临界资源,各进程必须互斥地访问
互斥关系
分析:
- 关系分析:找出问题描述中的各个进程,分析它们之间的同步、互斥关系
- 整理思路:根据各进程的操作流程确定P、V操作的大致顺序
- 设置信号量,并根据题目条件确定信号量的初值(互斥信号量初值一般为1,同步信号量的初值要看对应资源的初始值是多少)
- full:消费者消费的是产品,也就是说在消费者使用产品之前,需要申请一个产品资源(即
P(产品资源数)),因此full代表产品的数量,产品的数量初始值为0,因此full的初始值为0 - empty:生产者生产的产品,需要使用一个缓冲区的空位,因此生产者在将产品放入缓冲区之前,需要申请一个空闲缓冲区资源(即
P(空闲缓冲区数)),因此empty代表空闲缓冲区的数量,空闲缓冲区的数量初始值为n,因此empty的初始值为n - 当生产者进程往缓冲区中放入一个产品后,缓冲区就不为空,因此需要在生产者进程放入产品后执行V(full)操作;当消费者进程从缓冲区中取出一个产品前,需要执行P(full)操作
- 当消费者进程从缓冲区取出一个产品后,缓冲区就不满,因此需要在消费者进程取出产品后执行V(empty)操作;当生产者进程往缓冲区中放入一个产品前,需要执行P(empty)操作
semaphore mutex = 1; // 互斥信号量,实现对缓冲区的互斥访问
semaphore empty = n; // 同步信号量,表示空闲缓冲区的数量
semaphore full = 0; // 同步信号量,表示产品的数量,即非空缓冲区的数量
producer(){
while(1){
生产一个产品;
P(empty); // 申请一个空闲缓冲区
P(mutex); // 进入区
把产品放入缓冲区;
V(mutex); // 退出区
V(full); // 增加一个产品
}
}
consumer(){
while(1){
P(full); // 申请一个产品
P(mutex); // 进入区
从缓冲区取出一个产品;
V(mutex); // 退出区
V(empty); // 增加一个空闲缓冲区
使用产品;
}
}
可以看到,实现互斥的一对PV操作是在同一进程下出现的;实现两进程的同步关系,是在其中一个进程中执行P,另一个进程中执行V(执行V操作的进程可以唤醒执行P操作的进程)
思考:能否改变相邻的P、V操作的顺序?
改变P操作顺序:
producer(){ while(1){ 生产一个产品; P(mutex); ① P(empty); ② 把产品放入缓冲区; V(mutex); V(full); } }consumer(){ while(1){ P(mutex); ③ P(full); ④ 从缓冲区取出一个产品; V(mutex); V(empty); 使用产品; } }若此时缓冲区内已经放满产品,即empty = 0,full = n
假设此时按照①②③...的执行顺序
生产者进程执行①使mutex变为0,再执行②,由于已没有空闲缓冲区,因此生产者进程被阻塞 由于生产者阻塞,因此切换回消费者进程,消费者进程执行③,由于mutex为0,即生产者还没有释放临界资源的“锁”,因此消费者进程也被阻塞 这就造成了生产者等待消费者释放空闲缓冲区,而消费者又在等待生产者释放临界区的情况,生产者和消费者循环等待被对方唤醒,出现“死锁”
同样的,若缓冲区中没有产品,即full = 0,empty = n,按照③④①的顺序执行也会发生死锁
因此,实现互斥的P操作一定要在实现同步的P操作之后
改变V操作顺序:
V操作不会导致进程阻塞,因此两个V操作的顺序是可以交换的
生产者
生产一个产品;和消费者使用产品;的操作是否可以发生在各自的PV操作之间?可以,但这会导致临界区代码的增多,也就导致进程对临界资源的上锁时间变得更长,会影响临界资源被各个进程交替使用
总结
生产者-消费者问题是一个互斥、同步的综合问题
有时候是消费者需要等待生产者生产,有时候是生产者要等待消费者消费,这是两个不同的“一前一后问题”,因此需要设置两个同步信号量
多生产者-多消费者问题
桌子上有一个盘子,每次只能向其中放入一个水果。爸爸专门向盘子中放苹果,妈妈专门向盘子里放橘子,女儿专门等着吃盘子里的苹果,儿子专门等着吃盘子里的橘子。只有盘子没有水果时,爸爸或妈妈才能向盘子里放一个水果,仅当盘子中有自己需要的水果时,儿子或女儿才可以从盘子中取出水果
可以把盘子看作一个大小为1,初始为空的缓冲区;橘子和苹果就是两种产品;父亲和母亲就是两个生产者进程;女儿和儿子就是两个消费者进程
分析:
互斥关系:所有成员对盘子的访问都要互斥地进行
同步关系:
- 爸爸将苹果放入盘子后,女儿才能取苹果
- 妈妈将橘子放入盘子后,儿子才能取橘子
- 只有盘子为空时,爸爸或妈妈才能放入水果
- 盘子为空存在两种情况:① 最开始时盘子就是空的;② 儿子或女儿将自己想要的水果拿走后盘子就是空的
“最开始盘子为空”可以通过将表示盘子的信号量设置初始值为来表达
儿子或女儿将盘子中的水果那走使得盘子变空可以通过
V(表示盘子的信号量)来表达
根据分析得出的同步关系,做出同步关系图
- apple:表示盘子中苹果的数量,刚开始盘子中没有苹果,因此代表苹果资源的信号量初始值为0;苹果只能由爸爸提供,只能由女儿拿走
- plate:表示盘子能放的水果数量,盘子始终只有一个,且刚开始盘子为空,因此代表盘子能放的水果数量的信号量初始值为1
- orange:表示盘子中橘子的数量,刚开始盘子中没有橘子,因此代表橘子资源的信号量初始值为0;橘子只能由妈妈提供,只能由儿子拿走
semaphore mutex = 1; // 实现互斥的信号量
semaphore apple = 0; // 盘子中有几个苹果(盘子中有没有苹果)
semaphore plate = 1; // 盘子能放几个水果(盘子能不能装水果)
semaphore orange = 0; // 盘子中有几个橘子(盘子中有没有橘子)
dad(){
while(1){
准备一个苹果;
P(plate);
P(mutex);
将苹果放入盘子;
V(mutex);
V(apple);
}
}
mom(){
while(1){
准备一个橘子;
P(plate);
P(mutex);
将橘子放入盘子;
V(mutex);
V(orange);
}
}
daughter(){
while(1){
P(apple);
P(mutex);
从盘子中取出苹果;
V(mutex);
V(plate);
吃掉苹果;
}
}
son(){
while(1){
P(orange);
P(mutex);
从盘子中取出橘子;
V(mutex);
V(plate);
吃掉橘子;
}
}
可不可以不用互斥信号量?
semaphore apple = 0; // 盘子中有几个苹果 semaphore plate = 1; // 盘子能放几个水果 semaphore orange = 0; // 盘子中有几个橘子dad(){ while(1){ 准备一个苹果; P(plate); 将苹果放入盘子; V(apple); } }mom(){ while(1){ 准备一个橘子; P(plate); 将橘子放入盘子; V(orange); } }daughter(){ while(1){ P(apple); 从盘子中取出苹果; V(plate); 吃掉苹果; } }son(){ while(1){ P(orange); 从盘子中取出橘子; V(plate); 吃掉橘子; } }分析:
刚开始,儿子、女儿进程即使上处理机运行也会被阻塞,因为盘子中还没有水果
假设刚开始是父亲进程先上处理机运行,则:
- 父亲P(plate),可以访问盘子
- 母亲P(plate),盘子正在被父亲使用,母亲阻塞等待
- 父亲放入苹果V(apple),使得女儿进程被唤醒,其他进程即使运行也都会阻塞,暂时不可能访问盘子
- 女儿P(apple),访问盘子,V(plate),等待盘子的母亲进程被唤醒
- 母亲进程访问盘子时,其他进程暂时都无法进入临界区
- ...
可以发现,即使不专门设置互斥信号量mutex也能实现各个进程之间互斥地访问临界资源
原因在于,在本问题中缓冲区的大小(盘子容量)为1,在任何时刻,apple、orange和plate这三个同步信号量中最多只有一个为1,因此在任何时刻,最多只有一个进程的P操作不会被阻塞,并顺利地进入临界区
如果盘子的容量为2,那么:父亲P(plate),可以访问盘子 → 母亲P(plate),可以访问盘子 → 父亲往盘子里放苹果 → 母亲也可以往盘子里放橘子。于是就出现了两个进程同时访问缓冲区的情况,有可能导致两个进程写入缓冲区的数据相互覆盖的情况。因此,如果缓冲区大小大于1,就必须专门设置一个互斥信号量mutex来保证互斥访问缓冲区
总结
在多生产者-多消费者问题中,如果缓冲区的大小为1,那么有可能不需要设置互斥信号量就可以实现互斥访问缓冲区的功能。但这不是绝对的,要具体情况具体分析
在分析同步问题时不能从单个进程行为的角度来分析,而是要把“一前一后”发生的事看做两种“事件”的前后关系
比如,如果从单个进程行为的角度来考虑,则会有以下结论:
如果盘子里装有苹果,那么一定要女儿取走苹果后父亲或母亲才能再放入水果
如果盘子里装有橘子,那么一定要儿子取走橘子后父亲或母亲才能再放入水果
因此就会得出下面的同步关系图:
这么分析就好像需要设置四个同步信号量分别实现这四个“一前一后”的关系
其实正确的分析方法应该是从“事件”的角度来考虑,我们可以把上述四对“进程行为的前后关系”抽象为一对“事件的前后关系”
盘子变空事件 → 放入水果事件。“盘子变空事件”即可由儿子引发,也可由女儿引发;“放水果事件”即可能是父亲执行,也可能是母亲执行。这样的话就可以用一个同步信号量解决问题
吸烟者问题
假设一个系统有三个抽烟者进程和一个供应者进程以及一个桌子,每个抽烟者不停地卷烟并抽掉它,但是要卷起并抽掉一支烟,抽烟者需要有三种材料:烟草、纸和胶水。三个抽烟者中,第一个拥有烟草、第二个拥有纸、第三个拥有胶水。供应者进程无限地提供三种材料,供应者每次将两种材料放到桌子上,拥有剩下那种材料的抽烟者卷一根烟并抽掉它,并给供应者进程一个信号告诉完成了,供应者就会放另外两种材料在桌上,这个过程一直重复(让三个抽烟者轮流地抽烟)
分析:
- 桌子可以抽象为容量为1的缓冲区,各进程要互斥访问
- 每次桌子上只有可能出现四种情况:
- 初始时桌子为空(即
offer1 = offer2 = offer3 = 0) - 桌子上有纸和胶水(即
offer1 = 1) - 桌子上有烟草和胶水(即
offer2 = 1) - 桌子上有烟草和纸(即
offer3 = 1)
- 初始时桌子为空(即
- 同步关系:
- 桌子上有纸和胶水(组合一) → 第一个抽烟者取走材料
- 桌子上有烟草和胶水(组合二) → 第二个抽烟者取走材料
- 桌子上有烟草和纸(组合三) → 第三个抽烟者取走材料
- 任何一个抽烟者,抽完烟后向供应者发出完成信号 → 供应者将下一个组合放在桌子上
根据分析得出的同步关系,做出同步关系图:
- offer1:表示桌子上是否有组合一,刚开始桌子上没有任何材料,因此初始值为0
- offer2:表示桌子上是否有组合二,刚开始桌子上没有任何材料,因此初始值为0
- offer3:表示桌子上是否有组合三,刚开始桌子上没有任何材料,因此初始值为0
- finish:表示是否有完成信号,完成信号可以由三个吸烟者中的任何一个发出
semaphore offer1 = 0; // 桌子上组合一的数量
semaphore offer2 = 0; // 桌子上组合二的数量
semaphore offer3 = 0; // 桌子上组合三的数量
semaphore finish = 0; // 抽烟是否完成
int i = 0; // 用于实现“三个抽烟者轮流抽烟”
provider(){
while(1){
if(i == 0){
将组合一放在桌上;
V(offer1);
}else if(i == 1){
将组合二放在桌上;
V(offer2);
}else{
将组合三放在桌上;
V(offer3);
}
i = (i + 1) % 3;
P(finish);
}
}
smoker1(){
while(1){
P(offer1);
从桌子上拿走组合一;
卷烟;
抽掉;
V(finish);
}
}
smoker2(){
while(1){
P(offer2);
从桌子上拿走组合二;
卷烟;
抽掉;
V(finish);
}
}
smoker3(){
while(1){
P(offer3);
从桌子上拿走组合三;
卷烟;
抽掉;
V(finish);
}
}
桌子最多只能存放一个组合的材料,因此缓冲区的大小为1
在同一时刻,四个同步信号量中至多只有一个值为1,因此可以不设置专门的互斥信号量来实现互斥操作
信号量finish = 0并将P(finish)放在provider进程的所有V操作之后的做法和设置信号量为table = 1并将P(table)放在provider进程的所有V操作之前的效果一样,不过后者不符合题意
总结
吸烟者问题为解决“可以生产多种产品的单生产者”问题提供一个思路
“轮流让各个吸烟者吸烟”必然需要“轮流地在桌上放上组合一、二、三”,因此使用一个专门设置一个循环递增的变量来帮助实现“轮流”的过程
读者-写者问题
有读者和写者两组并发进程(读者进程和写者进程都有多个),它们共享一个文件,当两个或两个以上的读进程同时访问共享数据时不会产生副作用,但若某个写进程和其他进程(读进程和写进程)同时访问共享数据时则可能导致数据不一致的问题。因此要求:
① 允许多个读者“同时”对文件执行读操作
② 只允许一个写者进程往文件中写信息
③ 任一写者在完成写操作之前不允许其他读者或写者工作
④ 写者执行写操作前,应保证其他读者和写者全部退出
读进程与消费者进程不同,读者进程在读数据后并不会将数据清空,并不会改变数据,因此多个读者可以同时访问共享文件,即读进程之间不存在互斥关系
读进程与写进程同时共享数据,可能会导致读出的数据不一致的问题,即写进程与读进程之间存在互斥关系
两个写进程同时共享数据,可能导致数据错误覆盖的问题,即写进程之间存在互斥关系
分析:
互斥关系:
- 写进程 - 写进程
- 写进程 - 读进程
读进程与读进程之间不存在互斥关系
semaphore mutex_file = 1; // 用于实现对共享文件的互斥访问
writer(){
while(1){
P(mutex_file); // 写之前“加锁”
写文件;
V(mutex_file); // 写完后“解锁”
}
}
reader(){
while(1){
P(mutex_file); // 读之前“加锁”
读文件;
V(mutex_file); // 读完后“解锁”
}
}
这样就可以保证写进程和读进程之间可以互斥访问共享文件
但这么做无法做到读进程之间“同时”访问共享文件,因此可以设置一个计数变量count
semaphore mutex_file = 1; // 用于实现对共享文件的互斥访问
int count = 0; // 记录当前有几个读进程在访问文件
writer(){
while(1){
P(mutex_file); // 写之前“加锁”
写文件;
V(mutex_file); // 写完后“解锁”
}
}
reader(){
while(1){
if(count == 0){ // 由第一个读进程负责
P(mutex_file); // 读之前“加锁”
}
count++; // 访问文件的读进程数+1
读文件;
count--; // 访问文件的读进程数-1
if(count == 0){ // 由最后一个读进程负责
V(mutex_file); // 读完后“解锁”
}
}
}
除第一个读进程在读取文件前要P(mutex_file)外,其他读进程读取文件不需要P(mutex_file),因此可以实现多个读进程对同一个文件进行访问
但考虑到两个读进程是在并发执行,当读进程1执行完if判断后发现count为0,于是接下来可以执行P(mutex_files)(此时还没有读进程1还没有执行到count++),此时如果进程切换到第二个读进程,第二个读进程也执行完if判断也发现count为0,于是也可以执行P(mutex_file),这还是会使得只有第一个读进程能访问,第二个读进程被阻塞的情况发生
导致这种现象出现的原因在于count变量的检查和赋值不是一气呵成地完成的,因此可以再设置一个互斥信号量来保证各读进程对count的访问是互斥的,以从宏观上实现“一气呵成”的效果
把从count的检查到count的赋值的这段代码看作是一个临界区,使用一个互斥型号量来实现各个进程对这个临界区的访问是互斥的,即一个时间段内只允许一个进程进行对count变量的检查和赋值
semaphore mutex_file = 1; // 用于实现对共享文件的互斥访问
int count = 0; // 记录当前有几个读进程在访问文件
semaphore mutex_count = 1; // 用于保证对count变量的互斥访问
writer(){
while(1){
P(mutex_file); // 写之前“加锁”
写文件;
V(mutex_file); // 写完后“解锁”
}
}
reader(){
while(1){
P(mutex_count); // 各读进程互斥访问count
if(count == 0){ // 由第一个读进程负责
P(mutex_file); // 读之前“加锁”
}
count++; // 访问文件的读进程数+1
V(mutex_count);
读文件;
P(mutex_count);
count--; // 访问文件的读进程数-1
if(count == 0){ // 由最后一个读进程负责
V(mutex_file); // 读完后“解锁”
}
V(mutex_count);
}
}
这样就可以真正实现多个读进程“同时”读文件
潜在的问题:只要还有读进程还在读,写进程就要一直阻塞等待,可能导致写进程“饿死”,因此在这种算法中读进程是优先的
可以通过设置一个互斥信号量write_first来防止写进程“饿死”的现象
semaphore mutex_file = 1; // 用于实现对共享文件的互斥访问
int count = 0; // 记录当前有几个读进程在访问文件
semaphore mutex_count = 1; // 用于保证对count变量的互斥访问
semaphore write_first = 1; // 用于处理“写进程饥饿”问题
writer(){
while(1){
P(write_first);
P(mutex_file); // 写之前“加锁”
写文件;
V(mutex_file); // 写完后“解锁”
V(write_first);
}
}
reader(){
while(1){
P(write_first);
P(mutex_count); // 各读进程互斥访问count
if(count == 0){ // 由第一个读进程负责
P(mutex_file); // 读之前“加锁”
}
count++; // 访问文件的读进程数+1
V(mutex_count);
V(write_first);
读文件;
P(mutex_count);
count--; // 访问文件的读进程数-1
if(count == 0){ // 由最后一个读进程负责
V(mutex_file); // 读完后“解锁”
}
V(mutex_count);
}
}
分析以下几种并发执行的情况:
- 读者1 → 读者2
- 写者1 → 写者2
- 写者1 → 读者1
- 读者1 → 写者1 → 读者2
- 写者1 → 读者1 → 写者2
在这种算法中,连续进入的多个读进程可以同时读文件;写者和其他进程不能同时访问文件;写者不会饥饿,但也并不真正的“写优先”,而是相对公平的实现先来先服务的原则
因此这种算法也称为“读写公平法”
思考:在“读写公平法”中,
P(write_first)和P(mutex_file)是否可以互换位置?
可以,但是这样就无法实现“先来先服务”的原则
V(write_first)是否可以改变位置?
V(write_first)可以与V(mutex_file)互换位置,但这样就无法实现“先来先服务”的原则;此外,也可以将V(write_first)放到原位置之后,不过放置的位置越靠前,处于阻塞队列中的读进程就越快地能被唤醒并进入文件中读取
是否可以把读进程准备读文件时的P(mutex_file)和V(mutex_file)删除?
可以,因为在读进程准备读文件时,P(write_first)和V(write_first)不仅实现了“读优先”,还实现了读进程之间对count变量的互斥访问。但需要注意的是,如果把对mutex_file的PV操作删除,那么V(write_first)的位置就不能随意改变了(还是可以改变,但改变的位置相比之前就很局限了)
reader(){ while(1){ P(write_first); // “读优先” + 各读进程互斥访问count if(count == 0){ // 由第一个读进程负责 P(mutex_file); // 读之前“加锁” } count++; // 访问文件的读进程数+1 V(write_first); 读文件; P(mutex_count); count--; // 访问文件的读进程数-1 if(count == 0){ // 由最后一个读进程负责 V(mutex_file); // 读完后“解锁” } V(mutex_count); } }
总结
读者-写者问题为我们解决复杂的互斥问题提供了参考思路
其核心思想在于设置了一个计数器count用来记录当前正在访问共享文件的进程数,我们可以用count的值来判断当前进入的进程是否是第一个/最后一个读进程,从而做出不同的处理
另外,对count变量的检查和赋值不能一气呵成导致一些错误,如果需要实现宏观上的“一气呵成”,可以想到使用互斥信号量
哲学家进餐问题
一张圆桌上坐着5位哲学家,每两个哲学家之间的摆着一根筷子,桌子中间的是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐,哲学家在思考时,并不影响他人。只有当哲学家饥饿时,才试图拿起左、右两根筷子(一根一根拿起)。如果有筷子已在他人手上,则需要等待。饥饿的哲学家只有同时拿起两根筷子时才可以开始进餐,当进餐完毕后,放下筷子继续思考
关系分析:系统中有5个哲学家,5位哲学家各与自己左右相邻的哲学家对其中间的筷子的访问是互斥的
整理思路:在这个问题中,只存在互斥关系,但与之前遇到的问题不同的是,每个哲学家进程需要同时拥有两个临界资源后才能吃饭。如何避免临界资源分配不当造成的死锁现象,是哲学家问题的精髓
信号量设置:定义互斥信号量数组chopstick[5] = {1, 1, 1, 1, 1}用于实现对5根筷子的互斥访问,并对哲学家按0 ~ 4的编号,哲学家i左边的筷子编号为i,右边的筷子编号为(i + 1) % 5
很容易想到的是下面的做法:
semaphore chopstick[5] = {1, 1, 1, 1, 1};
Pi(){ // i号哲学家进程
while(1){
P(chopstick[i]); // 拿起左边的那根筷子
P(chopstick[(i + 1) % 5]); // 拿起右边的那根筷子
吃饭;
V(chopstick[i]); // 放下左边的那根筷子
V(chopstick[(i + 1) % 5]); // 放下右边的那根筷子
思考;
}
}
这种做法的问题在于:如果5个哲学家并发地拿起了自己左手边的筷子之后,此时如果再有哲学家尝试拿起自己右边的筷子时就会发生阻塞,最终就会形成所有哲学家都循环等待自己右边的人放下筷子(即阻塞)的局面,造成“死锁”
为了避免死锁现象的发生,可以采取以下几种做法:
- 可以对哲学家进程施加一些限制条件,比如最多允许四个哲学家同时进餐,这样就可以保证至少有是一个哲学家能拿到左右两只筷子并进餐,之后当该哲学家进餐结束并将筷子归还后就可以让其他哲学家进餐
semaphore chopstick[5] = {1, 1, 1, 1, 1};
semaphore power = 4; // 最多只允许4个哲学家拿到筷子
Pi(){ // i号哲学家进程
while(1){
P(power);
P(chopstick[i]); // 拿起左边的那根筷子
P(chopstick[(i + 1) % 5]); // 拿起右边的那根筷子
吃饭;
V(power);
V(chopstick[i]); // 放下左边的那根筷子
V(chopstick[(i + 1) % 5]); // 放下右边的那根筷子
思考;
}
}
- 要求奇数号哲学家先拿起左边的筷子,然后再拿起右边的筷子,而偶数号的哲学家刚好相反。用这种方法可以避免出现所有哲学家都已经拿起自己左边或者都已经拿起右边的筷子后等待别人归还所需的另一边筷子的现象
semaphore chopstick[5] = {1, 1, 1, 1, 1};
Pi(){ // i号哲学家进程
while(1){
if(i % 2 != 0){
P(chopstick[i]); // 拿起左边的那根筷子
P(chopstick[(i + 1) % 5]); // 拿起右边的那根筷子
}else{
P(chopstick[(i + 1) % 5]); // 拿起右边的那根筷子
P(chopstick[i]); // 拿起左边的那根筷子
}
吃饭;
V(chopstick[i]); // 放下左边的那根筷子
V(chopstick[(i + 1) % 5]); // 放下右边的那根筷子
思考;
}
}
- 仅当一个哲学家左右两支筷子是都可用时才允许他拿起这两支筷子
semaphore chopstick[5] = {1, 1, 1, 1, 1};
semaphore mutex = 1; // 互斥地取筷子
Pi(){ // i号哲学家进程
while(1){
P(mutex);
P(chopstick[i]); // 拿起左边的那根筷子
P(chopstick[(i + 1) % 5]); // 拿起右边的那根筷子
V(mutex);
吃饭;
V(chopstick[i]); // 放下左边的那根筷子
V(chopstick[(i + 1) % 5]); // 放下右边的那根筷子
思考;
}
}
更准确的说法应该是:各哲学家拿起筷子这件事必须互斥地执行,这就保证了即使一个哲学家在拿筷子拿到一半(拿起其中一根)时有其他哲学家试图拿筷子(拿到一半时发生了进程切换),试图拿筷子的哲学家也无法拿筷子(会被阻塞)。这样就能保证当前正在吃饭的哲学家放下是筷子后,被阻塞的哲学家就可以获得等待的筷子了
总结
哲学家进餐问题的关键在于解决进程死锁
这些进程之间只存在互斥关系,但是与之前接触的互斥关系不同的是,每个进程都需要同时持有两个临界资源,因此就有“死锁”问题的隐患存在
因此遇到一个进程需要同时持有多个临界资源的情况时,就可以利用哲学家问题的思想解决问题
管程
管程的定义和基本特征
传统进程同步互斥问题的解决方法是利用信号量机制
信号量机制虽然可以解决进程同步互斥问题,但使用信号量机制编写程序困难,易出错
管程也可以实现进程之间的同步与互斥,且使用管程机制比使用信号量机制解决问题更方便
管程是一种特殊的软件模块,它由这些部分组成:
- 局部于管程的共享数据结构
- 对该数据结构进行操作的一组过程
- 对局部于管程的共享数据设置初始值的语句
- 管程需要有一个名字
管程的定义类似于面向对象语言中的类,局部于管程的共享数据结构好比类中的变量,对共享数据进行操作的一组过程好比类中操作变量的方法
管程的基本特征:
- 局部于管程的数据只能被局部于管程的过程所访问
- 一个进程只有通过调用管程内的过程才能进行管程访问共享数据
- 每次仅仅允许一个进程在管程内执行某个内部过程
进程在执行管程中的某个内部过程时其他进程不可再次进入该管程,只有当上一个进程执行完过程并从管程退出后,其他进程才可以执行该管程,也就是说所有进程对管程进入是互斥地进行的
各进程互斥地进入管程的操作是由编译器负责实现
用管程解决生产者消费者问题
管程定义:
monitor ProducerConsumer
condition full, empty; // 阻塞队列条件变量,用来实现同步
int count = 0; // 缓冲区中的产品数
void insert(Item item){ // 把产品item放入缓冲区
if(count == N){
wait(full);
}
count++;
insert_item(item);
if(count == 1){
signal(empty);
}
}
Item remove(){ // 从缓冲区中取出一个产品
if(count == 0){
wait(empty);
}
count--;
if(count == N-1){
signal(full);
}
return remove_item();
}
end monitor;
条件变量full和empty是阻塞队列而不是信号量,
wait(empty)也不是之前介绍的P操作,它只是单纯地将当前执行该过程的进程加入到名为empty的阻塞队列的队尾中;signal(empty)也不是之前介绍的V操作,它只是单纯地将empty阻塞队列中的队头进程唤醒,将其从阻塞态转变为就绪态
生产者进程:
producer(){
while(1){
item = 生产一个产品;
ProducerConsumer.insert(item);
}
}
消费者进程:
consumer(){
while(1){
item = ProducerConsumer.remove();
消费产品item;
}
}
管程内过程的互斥进入是由编译器实现的,而管程中设置条件变量搭配等待/唤醒操作就能解决同步问题
总结
引入管程的目的无非就是要更方便地实现进程互斥和同步
- 需要在管程中定义共享数据(如生产者消费者问题的缓冲区)
- 需要在管程中定义用于访问这些共享数据的“入口”——其实就是一些函数(如生产者消费者问题中,可以定义一个函数用于将产品放入缓冲区,再定义一个函数用于从缓冲区取出产品)
- 只有通过这些特定的“入口”才能访问共享数据
- 管程中有很多“入口”,但是每次只能开放其中一个“入口”,并且只能让一个进程或线程进入(如生产者消费者问题中,各进程需要互斥地访问共享缓冲区。管程的这种特性可以保证一个时间段内最多只会有一个进程或线程在访问缓存区。这种互斥特性是由编译器负责实现的,程序员不用关心)
- 可在管程中设置条件变量及等待/唤醒操作以解决同步问题。可以让一个进程或线程在条件变量上等待(此时,该进程应释放管程的使用权,也就是让出“入口”);可以通过唤醒操作将等待在条件变量上的进程或线程唤醒
程序员可以用某种特殊的语法定义一个管程(比如:monitor ProducerConsumer ... end monitor),之后其他程序员就可以使用这个管程提供的特定的“入口”很方便地实现进程同步/互斥了
管程其实就是运用了封装的思想,将进程同步互斥等复杂的细节隐藏在管程中定义的函数内,而管程对外只提供一些简单易用的函数调用接口
死锁的概念
在并发环境下,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象,就是“死锁”。发生死锁后若无外力干涉,这些进程就都将无法向前推进
比如之前介绍的哲学家进餐问题,如果不对各个哲学家“拿筷子”的动作加以限制,就会出现5位哲学家已经拿起自己左手边的筷子,于是再尝试拿起自己右手边的筷子,而自己右边的筷子有已经被别的哲学家拿走,并且他还不会主动归还这根筷子,因此就发生阻塞,导致所有哲学家都无法进餐的现象,这就是死锁
死锁、饥饿、死循环的区别
死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象
饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。比如:在短进程优先(SPF)算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程“饥饿”
死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑bug导致的,有时是程序员故意设计的
三者的共同点:都是进程无法顺利向前推进的现象(故意设计的死循环除外)
三者的区别:
- 死锁:死锁一定是“循环等待对方手里的资源”而导致的,因此如果有死锁现象,那至少有两个或两个以上的进程同时发生死锁。另外,发生死锁的进程一定处于阻塞态
- 饥饿:可能只有一个进程发生饥饿。发生饥饿的进程既可能是阻塞态(如长期得不到需要的I/O设备),也可能是就绪态(长期得不到处理机)
- 死循环:可能只有一个进程发生死循环。死循环的进程可以上处理机运行(可以是运行态),只不过可能无法像期待的那样顺利推进。死锁和饥饿问题是由于操作系统分配资源的策略不合理导致的,而死循环是由代码逻辑的错误导致的。死锁和饥饿是管理者(操作系统)的问题,死循环是被管理者的问题
死锁产生的必要条件
产生死锁必须同时满足以下四个条件,只要其中任一条件不成立,死锁就不会发生:
- 互斥条件:并发执行的进程只有对必须互斥使用的资源进行争抢时才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)
- 不可剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放
比如在哲学家问题中,假设此时所有哲学家都已经持有自己左手边的筷子,哲学家右边的筷子已被另一个哲学家拿走,一旦哲学家在尝试拿起自己右边的筷子时发现可以拿到(即可以强行从其他哲学家那里拿到自己想要的筷子),就不会出现死锁的现象,因此不可剥夺条件也是死锁形成的必要条件之一
- 请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该请求的资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放(导致其他请求自己所持有的资源的进程也阻塞)
比如在哲学家问题中,出现死锁局面的哲学家们一定是处于自身已经拿到自己左手边的筷子,而自己所需的右手边的筷子又在别人手中,并且他还并不会主动释放这根筷子
- 循环等待条件:存在一种进程资源的循环等待,链中的每一个进程已获得的资源同时被上一个进程所请求
注意:发生死锁时一定有循环等待,但发生循环等待时未必死锁
即循环等待是死锁的必要不充分条件
如果同类资源数大于1,则即使有循环等待,也未必发生死锁。但如果系统中每类资源都只有一个,那循环等待就是死锁的充分必要条件
什么时候会发生死锁
- 对系统资源的竞争:各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(如CPU)的竞争是不会引起死锁的
- 进程推进顺序非法:请求和释放资源的顺序不当,也会导致死锁。例如,并发执行的进程P1、P2分别申请并占有了资源R1、R2,之后进程P1有紧接着申请资源R2,而进程P2又申请资源R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁
- 信号量使用不当时也会造成死锁。如生产者-消费者问题中,如果实现互斥的P操作在实现同步的P操纵之前,就有可能导致死锁(可以把互斥信号量、同步信号量看作一种抽象的系统资源)
总之,对不可剥夺资源的不合理分配,就可能导致死锁
死锁的处理策略
- 预防死锁:破坏死锁产生的四个必要条件中的一个或多个
- 避免死锁:用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
- 死锁的检测和解除:允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁
1和2不会让死锁现象发生,而3是允许死锁发生
总结
死锁的处理策略 —— 预防死锁
思想:破坏死锁产生的四个必要条件中的一个或多个
破坏互斥条件
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁
如果把只能互斥使用的资源改造成允许共享使用,则系统就不会进入死锁状态
比如:SPOOLing技术。操作系统可以采用SPOOLing技术把独占设备在逻辑上改造成共享设备。比如,用SPOOLing技术将打印机改造为共享设备
在使用SPOOLing技术之前,两个进程如果都想使用打印机资源,那么只有其中一个进程使用完打印机后,另一个进程才能使用打印机
采用SPOOLing技术之后,各个进程对打印机发出的请求会被输出进程接收,当提出请求的进程的请求被输出进程接收后,提出请求的进程就可以继续处理其它事情。之后输出进程根据各个进程的请求来合理地使用打印机
使用了SPOOLing技术后,打印机依然还是必须互斥使用的设备,但在各进程看来,自己对打印机资源的使用请求是立即就被接收处理了的,不需要再被阻塞等待
该策略的缺点:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,大部分情况下都无法破坏互斥条件
破坏不可剥夺条件
不可剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放
破坏不可剥夺条件:
- 当某个进程请求新的资源但又得不到满足时,它必须立即释放自己保持的所有资源,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏不可剥夺条件
- 当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级(比如:剥夺调度方式,即抢占式调度,就是将处理机资源强行剥夺给高优先级的进程使用)
这些策略的缺点:
- 实现起来比较复杂
- 释放已获得的资源可能造成前一阶段工作的失效,因此这种方法一般只适用于易保存和恢复状态的资源,如CPU
- 反复地申请和释放资源会增加系统开销,降低系统吞吐量
- 采用方法1意味着只要暂时得不到某个资源,那么进程之前获得的那些资源就都需要放弃,以后还需要再全部重新申请。如果一直发生这样的情况,就会导致进程饥饿
破坏请求和保持条件
请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该请求的资源又被其他进程占有(且不会主动放弃该资源),此时请求进程被阻塞,但又对自己已有的资源保持不放
可以采用静态分配方法(资源预分配):即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了
该策略实现起来简单,但也有明显的缺点:某些资源可能只需要使用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,这就会对那些在运行期间只使用了一小部分时间的资源造成浪费,造成资源的利用率极低。另外,该策略也有可能导致某些进程饥饿
假设系统中的A类进程只需要资源1就可以运行,B类进程只需要资源2就可以运行,C类进程需要同时持有资源1和资源2才能运行
采用“只有进程所需的资源全部可用时才有可能分配给进程”这种策略
如果系统源源不断地出现新的A类和B类进程时,那么一个A类进程使用完资源1后,释放的资源1就只会被分配给新的A类进程、一个B类进程使用完资源2后,释放的资源2就只会被分配给新的B类进程,只有当资源1和资源2都空闲时它们才有可能被分配给C类进程,就有可能导致C类进程饥饿
破坏循环等待条件
循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求
可采用顺序资源分配法。首先给系统中的资源编号,并规定每个进程必须按编号递增的顺序请求资源(先申请编号更小的资源,占有小编号资源后才能申请编号更大的资源),同类资源(即具有相同编号的资源)一次申请完(即进程会一次性拥有编号相同的所有资源)
原理分析:一个进程只有占有小编号的资源时,才能申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象
该策略的缺点:
- 不方便增加新的设备,因为可能需要重新分配所有的编号
- 进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费
假设系统为打印机分配的编号为5号,为扫描仪分配的编号为6号
实际生活中需要先使用扫描仪再使用打印机,那么一个进程需要申请这两个资源时,就只能先申请5号打印机资源,再申请6号扫描仪资源,这就造成了先申请的打印机资源在进程申请扫描仪资源成功并使用完扫描仪之后的这段时间里是得不到使用的,造成打印机资源的浪费
- 必须按规定次序申请资源,会导致用户编程麻烦
不同系统对各个资源分配的编号可能不一样,如果采取破坏循环等待条件的策略,就会导致编写的程序必须经过修改之后才能在不同的系统上运行
总结
死锁的处理策略 —— 避免死锁
安全序列
安全序列,就是指如果系统按照这种序列分配资源,则每个进程最终都能够顺利完成。只要能找出一个安全序列,系统就是安全状态。当然,安全序列可能有多个
如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利地执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态,不过我们在分配资源之前总是要考虑到最坏的情况
如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态,就可能发生死锁
处于不安全状态未必就发生了死锁,但发生死锁时一定是在不安全状态
因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求。这是“银行家算法”的核心思想
银行家算法
核心思想:在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态。如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待
假设系统中有5个进程P0 ~ P4,3种资源R0 ~ R2,资源(R0, R1, R2)的初始数量为(10, 5, 7),则某一时刻的情况可表示如下:
进程 最大需求 已分配 P0 (7, 5, 3) (0, 1, 0) P1 (3, 2, 2) (2, 0, 0) P2 (9, 0, 2) (3, 0, 2) P3 (2, 2, 2) (2, 1, 1) P4 (4, 3, 3) (0, 0, 2) 分析:
此时,系统已经分配出去(7, 2, 5),所以剩余的可用资源数为(3, 3, 2)
各进程还需要的资源数为:
进程 最多还需要 P0 (7, 4, 3) P1 (1, 2, 2) P2 (6, 0, 0) P3 (0, 1, 1) P4 (4, 3, 1) 依次检查剩余可用资源(3, 3, 2)是否能满足各进程的需求:
- P0还需的资源数与系统剩余的资源数进行对比:(7, 4, 3) > (3, 3, 2),因此系统剩余的资源数满足不了P0所需要的资源数,因此不能将资源分配给P0进程
- P1还需的资源数与系统剩余的资源数进行对比:(1, 2, 2) < (3, 3, 2),因此系统剩余的资源数可以满足P1所需要的资源数。如果优先把资源分配给P1,那P1一定可以顺利执行结束。等到P1执行结束后就会归还其所持有的资源。于是资源数就可以增加到(2, 0, 0) + (3, 3, 2) = (5, 3, 2),因此可以将资源分配给P1进程
检查得出可以满足P1的需求,将P1加入安全序列,并更新剩余可用资源值为(5, 3, 2)(同时P1从表格中移除)
进程 最多还需要 P0 (7, 4, 3) P2 (6, 0, 0) P3 (0, 1, 1) P4 (4, 3, 1) 第二轮检查,检查剩余可用资源(5, 3, 2)是否能满足剩余进程(不用检查已加入安全序列的进程):
P0还需的资源数与系统剩余的资源数进行对比:(7, 4, 3) > (5, 3, 2),因此系统剩余的资源数满足不了P0所需要的资源数,因此不能将资源分配给P0进程
P2还需的资源数与系统剩余的资源数进行对比:(6, 0, 0) > (5, 3, 2),因此系统剩余的资源数满足不了P2所需要的资源数,因此不能将资源分配给P2进程
注意:只要三个资源的数量有一个不满足需求,就说资源数满足不了进程的需要
P3还需的资源数与系统剩余的资源数进行对比:(0, 1, 1) < (3, 3, 2),因此系统剩余的资源数可以满足P3所需要的资源数。如果优先把资源分配给P3,那P3一定可以顺利执行结束。等到P3结束后就会归还其所持有资源。于是资源数就可以增加到(2, 1, 1) + (5, 3, 2) = (7, 4, 3),因此可以将资源分配给P3进程
检查得出可以满足P3的需求,将P3加入安全序列,并更新剩余可用资源值为(7, 4, 3)(同时P3从表格中移除)
进程 最多还需要 P0 (7, 4, 3) P2 (6, 0, 0) P4 (4, 3, 1) 第三轮检查:...
依此类推,共五次循环检查即可将5个进程都加入安全序列中,最终可得一个安全序列{P1, P3, P0, P2, P4}。该算法称为安全性算法
如果5个进程全部都加入到安全序列中,说明此时系统处于安全状态,暂不可能发生死锁
实际做题中可用更快速的方法找到一个安全序列:
- 第一轮对比:通过肉眼对比发现(3, 3, 2)可满足P1、P3,说明无论如何,这两个进程的资源需求一定是可以依次被满足的,因此P1、P3一定可以顺利地执行完,并归还资源。所以可以直接把P1、P3两个进程加入到安全序列中。等P1和P3都运行结束后,系统中拥有的资源数就为(2, 0, 0) + (2, 1, 1) + (3, 3, 3) = (7, 4, 3)
- 第二轮对比:对比发现(7, 4, 3)可满足剩下的P0、P2、P4进程,因此可以把这些进程都加入到安全序列中
因此安全序列为{P1, P3, P0, P2, P4}
假设系统中有5个进程P0 ~ P4,3种资源R0 ~ R2,资源(R0, R1, R2)的初始数量为(10, 5, 7),则某一时刻的情况可表示如下:
进程 最大需求 已分配 还需要 P0 (8, 5, 3) (0, 1, 0) (8, 4, 3) P1 (3, 2, 2) (2, 0, 0) (1, 2, 2) P2 (9, 5, 2) (3, 0, 2) (6, 5, 0) P3 (2, 2, 2) (2, 1, 1) (0, 1, 1) P4 (4, 3, 6) (0, 0, 2) (4, 3, 4) 此时系统剩余可用资源数为(3, 3, 2)
第一轮对比:(3, 3, 2)可满足P1、P3,因此可先把P1、P3加入到安全序列中。加入后,系统剩余的可用资源数为(2, 0, 0) + (2, 1, 1) + (3, 3, 2) = (7, 4, 3)
第二轮对比:(7, 4, 3)无法满足剩下的进程中的任意一个的需求
于是,无法找到任何一个安全序列,说明此时系统处于不安全状态,有可能发生死锁
银行家算法的代码实现
假设系统中有n个进程,m种资源
每个进程在运行前先声明对各种资源的最大需求数,可用一个n*m的矩阵(二维数组)表示所有进程对各种资源的最大需求数。不妨称为最大需求矩阵Max,Max[i, j] = K表示进程Pi最多需要K个资源Rj
同理,系统可以用一个n*m的分配矩阵Allocation表示对所有进程的资源分配情况
Max - Allocation = Need矩阵,Need矩阵表示各进程最多还需要多少各类资源
另外,还要用一个长度为m的一维数组Available表示当前系统中还有多少可用资源
某进程Pi向系统申请资源,可用一个长度为m的一维数组Request_i表示本次申请的各种资源量
用银行家算法“预判”本次分配是否会导致系统进入不安全状态:
“预判”其实就是用一些数据与另一些数据进行数学运算,并查看运算结果是否合理,而并非真正把资源分配出去
假设此时“预判”的对象为进程i:
① 如果Request_i[j] ≤ Need[i, j] (0 ≤ m) 便转向②;否则认为出错(因为它所需的资源数已经超过它所宣布的最大值)
② 如果Request_i[j] ≤ Available[j] (0 ≤ j ≤ m),便转向③;否则表示尚无足够资源,Pi必须等待
③ 系统试探着把资源分配给进程Pi,并修改相应的数据(并非真的分配,修改数值只是为了做预判):
Available = Available - Request_i;
Allocation[i, j] = Allocation[i, j] + Request_i[j];
Need[i, j] = Need[i, j] - Request_i[j];
④ 操作系统执行安全性算法,检查此次资源分配后,系统是否处于安全状态。若安全,才真正给进程分配本次请求的资源;否则,恢复回修改前的数据,并让进程阻塞等待
总结
数据结构:
- 长度为m的一维数组Available表示系统还有多少可用资源
- n*m矩阵Max表示各进程对各资源的最大需求数
- n*m矩阵Allocation表示已经给各进程分配了多少资源
- Max - Allocation = Need矩阵表示各进程最多还需要多少资源
- 用长度为m的一维数组Request表示进程此次申请的各种资源数(进程此次申请的各种资源数不能超过进程最多还需要的各种资源数,该过程就是银行家算法的第①步)
银行家算法的步骤:
- 检查此次申请(Request)是否超过了之前声明的最大需求数(Max)
- 检查此时系统剩余的可用资源数(Available)是否还能满足这次请求
- 试探着分配,更改数据结构
- 用安全性算法检查此次分配是否会导致系统进入不安全状态
安全性算法步骤:
- 检查当前的系统剩余可用资源(available)是否能满足某个进程的剩余最大需求量(Need),如果可以,就把该进程加入安全序列,并把该进程持有的资源全部回收
- 不断重复上述过程,看最终是否能让所有进程都加入安全序列
死锁的处理策略 —— 检测和解除
如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就有可能发生死锁。在这种情况下,系统应当提供两种算法:
- 死锁检测算法:用于检测系统状态,以确定系统中是否发生了死锁
- 死锁解除算法:当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来
死锁的检测
为了能对系统是否已经发生了死锁进行检测,必须:
-
用某种数据结构来保存资源的请求和分配信息
数据结构:资源分配图
资源分配图中包含两种结点:
① 进程结点:对应一个进程
② 资源结点:对应一类资源,一类资源可能有多个
用矩形代表一类资源,一类资源可能有多个,因此用矩形中的一个圆代表该类资源中的一个具体资源
包含两种边:
- 进程结点 → 资源结点(请求边):表示进程还想申请几个资源(每条边代表一个)
- 资源结点 → 进程结点(分配边):表示已经为进程分配了几个资源(每条边代表一个)
- 提供一种算法,利用上述信息来检测系统是否已经进入死锁状态
分析:如果系统中剩余的可用资源足够满足进程的需求,那么这个进程就暂时不会阻塞,可以顺利地执行下去。等到这个进程执行结束后把资源归还给系统,就可能使某些正在等待这些资源的进程被激活,被激活的进程就可以顺利地执行下去。相应的,这些被激活的进程在执行完后又会将资源归还,这样可能又会激活另外一些阻塞的进程...
比如在上面的资源分配图中,P1进程请求一个R2资源,而R2资源已被分配出去了一个,还剩一个,因此剩余的R2资源的数量可以满足P1进程的需求,所以P1不会被阻塞
而对于P2进程,它请求一个R1资源,而R1资源已经全部被分配出去,因此剩余的R1资源的数量不能满足P2的需求,P2会被阻塞
对于P1进程,如果先将它所需要的R2资源分配给它,那么当P1得到资源并执行结束后,就能将其手中的一个R2资源和2个R1资源全部归还给系统(用资源分配图表示就是与P1进程相连的请求边和分配边都被删除),之后系统中就有充足的资源给到P2进程
由于系统已经具有了充足的资源,所以P2进程就可以被唤醒。待到P2执行结束后,P2手上的资源也会全部归还给系统,之后其他那些因为所需资源不足而被阻塞的进程(上图中并未画出)就可以被唤醒
如果按照上述过程分析,最终能够消除资源分配图的所有边,就称这个图是可完全简化的。此时一定没有发生死锁(相当于可以找到一个安全序列)
如果最终不能消除所有边,那么此时就是发生了死锁。最终还连着边的那些进程就是处于死锁状态的进程
如上图,P1进程由于缺少两个R2资源并且系统中此时R2的剩余资源数不足两个因而发生阻塞,P2进程由于缺少一个R1资源并且此时系统中R1资源的剩余数量不足一个因而发生阻塞,P3进程已经获得了所需的一个R2资源,可以顺利地执行下去。当P3进程执行结束后,归还其所持有的一个R2资源,归还后系统中剩余R2资源的数量为一个,但依旧不满足P1的需求量,因此P1还会处于阻塞态,P2由于资源不足仍然也处于阻塞态,因此P1和P2进程就发生了死锁
检测死锁的算法:
- 在资源分配图中,找出既没有阻塞(即所申请的资源的数量比系统中剩余的资源数量少或相等)又不是孤点(至少与一条“(请求或分配)边”相连)的进程Pi(即找出至少有一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有空闲资源数量)。消去它所有的请求边和分配边,使之成为孤立的结点(即将系统中的资源分配给它,待进程执行结束后将资源归还给系统)
- 进程Pi所释放的资源(使系统中的剩余资源数增加),可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程
循环往复执行上述两个步骤,直到把图中所有结点的能够消除的边消除。若此时图中还有连着边的结点,这些结点就是处于死锁状态的进程,如果没有,那么系统就处于安全状态,没有发生死锁
死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁
死锁的解除
一旦检测出死锁的发生,就应该立即解除死锁:
死锁状态下的系统并不是指系统中所有的进程都是死锁状态,用死锁检测算法化简资源分配图后,还连着边的进程就是死锁进程
解除死锁的主要方法有:
- 资源剥夺法:挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但也应该防止被挂起的进程因长时间得不到资源而饥饿
- 撤销进程法(终止进程法):强制撤销部分或全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,马上就要结束了,一旦被终止就代表着功亏一篑,以后还得从头再来
- 进程回退法:让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点
可以根据下面的指标来决定对哪个死锁进程“下手”:
-
进程优先级
对进程优先级更低的进程下手
-
已执行时间
执行时间越长的进程,如果要让他回退或撤销,就需要付出更大的代价,因此对已执行时间较短的进程下手
-
还要多久完成
优先让马上就能完成的进程先获得资源,待它们执行结束后就能够把手头的资源归还
-
进程已经持有了多少种资源
如果一个进程已经持有了很多资源,那么将该进程撤销或者将该进程的资源剥夺就意味着能更快速地将死锁局面解除
-
进程是交互式的还是批处理式的
交互式的进程是要实现与用户交互的,因此如果对交互式进程动手,会增加交互式进程的反馈时间,降低用户的体验感。批处理进程与用户交互没有直接关系,对用户的体验感的影响不大,因此可以优先选择对批处理式进程下手