处理机调度

200 阅读17分钟

点击阅读:操作系统系列文章


1. 调度的概念、层次

1.1 调度的概念

当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理这些任务的执行顺序,这就是调度研究的问题。

1.2 调度的层次

1.2.1 高级调度(作业调度)

作业:一个具体的任务

用户向系统提交一个作业 ≈ 用户让操作系统启动一个程序(来处理一个具体的任务)。

内存空间有限,有时无法将用户提交的作业全部放入内存。高级调度(作业调度),按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次作业调入时会建立PCB,调出时才撤销PCB

1.2.2 中级调度(内存调度)

内存不够时,可将某些进程的数据调出外存。等内存空闲或者进程需要运行时再重新调入内存。

暂时调到外存等待的进程状态为挂起状态。被挂起的进程PCB会被组织成挂起队列

中级调度(内存调度)——按照某种策略决定将哪个处于挂起状态的进程重新调入内存一个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高

1.2.3 低级调度(进程调度)

低级调度(进程调度/处理机调度)—— 按照某种策略从就绪队列中选取一个进程,将处理机分配给它

进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度。进程调度的频率很高,一般几十毫秒一次

1.3 三层调度的对比

image.png

2. 进程的七状态模型

image.png

挂起和阻塞的区别:两种状态都是暂时不能获得CPU的服务,但挂起态是将进程映像调到外存去了,而阻塞态下进程映像还在内存中。

有的操作系统会把就绪挂起、阻塞挂起分为两个挂起队列,甚至会根据阻塞原因不同再把阻塞挂起进程进一步细分为多个队列。

3. 调度算法的评价指标

3.1 CPU 利用率

CPU利用率:指CPU “忙碌”的时间占总时间的比例。

CPU 利用率 = 忙碌的时间 / 总时间\text{\textcolor{red}{CPU 利用率 = 忙碌的时间 / 总时间}}

3.2 系统吞吐量

系统吞吐量:单位时间内完成作业的数量。

系统吞吐量 = 总共完成多少道作业 / 总共花了多少时间\text{\textcolor{red}{系统吞吐量 = 总共完成多少道作业 / 总共花了多少时间}}

3.3 周转时间

周转时间:指从作业被提交给系统开始,到作业完成为止的这段时间间隔。

它包括四个部分

  1. 作业在外存后备队列上等待作业调度(高级调度)的时间
  2. 进程在就绪队列上等待进程调度(低级调度)的时间
  3. 进程在CPU上执行的时间
  4. 进程等待I/O操作完成的时间。

后三项在一个作业的整个处理过程中,可能发生多次。

(作业)周转时间 = 作业完成时间 - 作业提交时间\text{\textcolor{red}{(作业)周转时间 = 作业完成时间 - 作业提交时间}}

对于操作系统来说,更关心系统的整体表现,因此更关心所有作业周转时间的平均值

平均周转时间 = 各作业周转时间之和 / 作业数\text{\textcolor{red}{平均周转时间 = 各作业周转时间之和 / 作业数}}

3.4 带权周转时间

对于周转时间相同的两个作业,实际运行时间长的作业在相同时间内被服务的时间更多,带权周转时间更小,用户满意度更高。

对于实际运行时间相同的两个作业,周转时间短的带权周转时间更小,用户满意度更高。

带权周转时间与周转时间都是越小越好

带权周转时间 = 作业周转时间 / 作业实际运行的时间\text{\textcolor{red}{带权周转时间 = 作业周转时间 / 作业实际运行的时间}}

平均带权周转时间 = 各作业带权周转时间之和 / 作业数\text{\textcolor{red}{平均带权周转时间 = 各作业带权周转时间之和 / 作业数}}

3.5 等待时间

等待时间:指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低。

对于进程来说,等待时间就是指进程建立后等待被服务的时间之和,在等待I/O完成的期间其实进程也是在被服务的,所以不计入等待时间。

对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间。一个作业总共需要被CPU服务多久,被I/O设备服务多久一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间。当然,与前面指标类似,也有“平均等待时间”来评价整体性能。

3.6 响应时间

响应时间:指从用户提交请求到首次产生响应所用的时间。

4. 进程调度的时机与方式

4.1 进程调度的时机

进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机。

需要进行进程调度与切换的情况

  1. 当前运行进程主动放弃处理机:
    • 进程正常终止
    • 进程发生异常而终止
    • 进程主动请求阻塞(如等待I/O)
  2. 当前运行进程被动放弃处理机:
    • 时间片用完
    • 有更紧急的事处理(如I/O中断)
    • 更高优先级的进程进入就绪队列

不能进行进程调度与切换的情况

  1. 在处理中断的过程中。中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换。
  2. 进程在操作系统内核程序临界区中。进程在普通临界区中是可以进行调度、切换的。
  3. 在原子操作过程中(原语)。原子操作不可中断,要一气呵成(如修改PCB中进程状态标志,并把PCB放到相应队列)

临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。

临界区:访问临界资源的那段代码。

内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的PCB组成)。

4.2 进程调度的方式

  1. 非剥夺调度方式:又称非抢占方式,只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。

    实现简单,系统开销小但是无法及时处理紧急任务,适合于早期的批处理系统

  2. 剥夺调度方式:又称抢占方式,当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。

    可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能(通过时钟中断)。适合于分时操作系统、实时操作系统。

4.3 进程的切换与过程

狭义的进程调度:指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)。

进程切换:是指一个进程让出处理机,由另一个进程占用处理机的过程。

广义的进程调度:包含了选择一个进程进程切换两个步骤。

进程切换的过程主要完成了:

  1. 对原来运行进程各种数据的保存
  2. 对新的进程各种数据的恢复(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息一般保存在进程控制块)

进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。

4.4 调度器/调度程序(scheduler)

调度程序决定:

  1. 使哪个进程运行——调度算法
  2. 运行多长时间——时间片大小

调度时机

  1. 创建新进程
  2. 进程退出
  3. 运行进程阻塞
  4. I/O中断发生

非抢占式调度策略,只有运行进程阻塞或退出才触发调度程序工作。

抢占式调度策略,每个时钟中断或k个时钟中断会触发调度程序工作。

不支持内核级线程的操作系统,调度程序处理的对象是进程。支持内核级线程的操作系统,调度程序的处理对象是内核线程。

没有其他就绪进程时,运行闲逛进程(idle)。

闲逛进程的特性

  1. 优先级最低
  2. 可以是0地址指令,占一个完整的指令周期(指令周期末尾例行检查中断)
  3. 能耗低

5. 批处理系统的调度算法

这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是不关心“响应时间”,也并不区分任务的紧急程度,因此对于用户来说,交互性很糟糕。因此这三种算法一般适合用于早期的批处理系统,当然,FCFS算法也常结合其他的算法使用,在现在也扮演着很重要的角色。

5.1 先来先服务(FCFS,First Come First Service)

  1. 算法思想:主要从“公平”的角度考虑。

  2. 算法规则:按照作业/进程到达的先后顺序进行服务。

  3. 作业/进程调度:用于作业调度时,考虑的是哪个作业先到达后备队列;用于进程调度时,考虑的是哪个进程先到达就绪队列。

  4. 是否可抢占:非抢占式的算法。

  5. 算法优缺点:FCFS算法对长作业有利,对短作业不利。

    • 优点:公平、算法实现简单。
    • 缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。
  6. 是否会导致饥饿:不会。

5.2 短作业优先(SJF,Shortest Job First)

  1. 算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的平均平均带权周转时间

  2. 算法规则:最短的作业/进程优先得到服务(所谓“最短”,是指要求服务时间最短)

  3. 作业/进程调度:既可用于作业调度,也可用于进程调度。用于进程调度时称为“短进程优先(SPF, Shortest Process First)算法”

  4. 是否可抢占:SJF和SPF是非抢占式的算法。但是也有抢占式的版本——最短剩余时间优先算法(SRTN, Shortest Remaining Time Next)

    最短剩余时间优先算法:每当有进程加入就绪队列改变时就需要调度,如果新到达的进程剩余时间比当前运行的进程剩余时间更短,则由新进程抢占处理机,当前运行进程重新回到就绪队列。另外,当一个进程完成时也需要调度

  5. 算法优缺点

    • 优点:在所有进程都几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少。“抢占式的短作业/进程优先调度算法(最短剩余时间优先, SRNT算法)的平均等待时间、平均周转时间最少
    • 缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业/进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先。
  6. 是否会导致饥饿:会。如果源源不断地有短作业/进程到来,可能使长作业/进程长时间得不到服务,产生“饥饿”现象。

5.3 高响应比优先(HRRN,Highest Response Ratio Next)

  1. 算法思想:要综合考虑作业/进程的等待时间和要求服务的时间。

  2. 算法规则:在每次调度时先计算各个作业/进程的响应比,选择响应比最高的作业/进程为其服务。

    响应比 = (等待时间 + 要求服务时间) / 要求服务时间\text{\textcolor{red}{响应比 = (等待时间 + 要求服务时间) / 要求服务时间}}

  3. 作业/进程调度:既可用于作业调度,也可用于进程调度

  4. 是否可抢占:非抢占式的算法。因此只有当前运行的作业/进程主动放弃处理机时,才需要调度,才需要计算响应比。

  5. 算法优缺点: 综合考虑了等待时间和运行时间(要求服务时间)等待时间相同时,要求服务时间短的优先(SJF 的优点)。要求服务时间相同时,等待时间长的优先(FCFS 的优点)。对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题。

  6. 是否会导致饥饿:不会。

6. 交互式系统的调度算法

比起早期的批处理操作系统来说,由于计算机造价大幅降低,因此之后出现的交互式操作系统(包括分时操作系统、实时操作系统等)更注重系统的响应时间、公平性、平衡性等指标。而这几种算法恰好也能较好地满足交互式系统的需求。因此这三种算法适合用于交互式系统。

6.1 时间片轮转(RR,Round-Robin)

  1. 算法思想:公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应。常用于分时操作系统,更注重“响应时间”。

  2. 算法规则:按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如 100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队。

  3. 作业/进程调度:用于进程调度(只有作业放入内存建立了相应的进程后,才能被分配处理机时间片)。

  4. 是否可抢占:抢占式的算法。若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知CPU时间片已到。

  5. 算法优缺点

    • 优点:公平;响应快,适用于分时操作系统;
    • 缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度。
  6. 是否会导致饥饿:不会。

  7. 时间片大小:如果时间片太大,每个进程都可以在一个时间片内完成,时间片轮转算法会退化为先来先服务调度算法,并且会增大进程响应时间,因此时间片不能过大。

    另一方面,进程调度、切换是有时间代价的(保存、恢复运行环境),因此,时间片如果太小,会导致进程切换过于频繁,系统会花大量时间处理进程切换,从而导致进程执行时间比例减少,时间片也不能太小。

    一般来说,设计时间片时要让切换进程的开销占比不超过1%。

6.2 优先级调度算法

  1. 算法思想:随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序。

  2. 算法规则:每个作业/进程有各自的优先级,调度时选择优先级最高的作业/进程。

  3. 作业/进程调度:既可用于作业调度,也可用于进程调度。还会用于在I/O调度中。

  4. 是否可抢占:抢占式、非抢占式都有。

  5. 算法优缺点

    • 优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度。
    • 缺点:若源源不断地有高优先级进程到来,则可能导致饥饿。
  6. 是否会导致饥饿:会。

就绪队列未必只有一个,可以按照不同优先级来组织。另外,也可以把优先级高的进程排在更靠近队头的位置

根据优先级是否可以动态改变,可将优先级分为静态优先级和动态优先级两种:

  • 静态优先级:创建进程时确定,之后一直不变。
  • 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级。

通常:

  1. 系统进程优先级 高于 用户进程
  2. 前台进程优先级 高于 后台进程
  3. 操作系统更偏好 I/O型进程(或称 I/O繁忙型进程)。与I/O型进程相对的是计算型进程(或称 CPU繁忙型进程)。I/O设备和CPU可以并行工作。如果优先让I/O繁忙型进程优先运行的话,则越有可能让I/O设备尽早地投入工作,则资源利用率、系统吞吐量都会得到提升。

可以从追求公平、提升资源利用率等角度考虑如果某进程在就绪队列中等待了很长时间,则可以适当提升其优先级如果某进程占用处理机运行了很长时间,则可适当降低其优先级如果发现一个进程频繁地进行I/O操作,则可适当提升其优先级。

6.3 多级反馈队列调度算法

  1. 算法思想:对其他调度算法的折中权衡。

  2. 算法规则

    a. 设置多级就绪队列,各级队列优先级从高到低,时间片从小到大

    b. 新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是在最下级的队列,则重新放回该队列队尾。

    c. 只有第 k 级队列为空时,才会为 k+1 级队头的进程分配时间片。

  3. 作业/进程调度:用于进程调度。

  4. 是否可抢占:抢占式的算法。在 k 级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回 k 级队列队尾。

  5. 算法优缺点:对各类型进程相对公平(FCFS的优点);每个新到达的进程都可以很快就得到响应(RR的优点);短进程只用较少的时间就可完成(SPF的优点);不必实现估计进程的运行时间(避免用户作假);可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密集型进程(拓展:可以将因I/O而阻塞的进程重新放回原队列,这样I/O型进程就可以保持较高优先级)。

  6. 是否会导致饥饿:会。

6.4 多级队列调度算法

系统中按进程类型设置多个队列,进程创建成功后插入某个队列。

队列之间可采取固定优先级,或时间片划分:

  • 固定优先级:高优先级空时低优先级进程才能被调度
  • 时间片划分:如三个队列分配时间50%、40%、10%

各队列可采用不同的调度策略,如:

  1. 系统进程队列采用优先级调度
  2. 交互式队列采用RR
  3. 批处理队列采用FCFS

点击阅读:操作系统系列文章