线程模型 + GMP 调度

131 阅读6分钟

用户级线程

int main() {
int i = 0;
while (true) {
   if (i == 0) {处理视频聊天的代码;}
   if (i == 1) {处理文字聊天的代码;}
   if (i == 2) {处理文件传输的代码;}
   i = (i + 1) % 3;
}
}

从代码的角度看,线程其实就是一段代码逻辑。上述三段代码逻辑上可以看作三个“线程”while 循环就是一个最弱智的“线程库”,线程库完成了对线程的管理工作(如调度)。

一对N模型

a11.png

线程的管理工作由谁来完成?

应用程序自己管理

线程切换是否需要CPU变态?

不需要

操作系统是否能意识到用户级线程的存在?

操作系统只能感知到进程的存在,感知不到用户级线程的存在。

优缺点

优点:

用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高

缺点:

当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。

N 对 N 模型

ann.png

线程的管理工作由谁来完成?

内核级线程的管理工作由操作系统内核完成。

线程切换是否需要CPU变态?

线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。

操作系统是否能意识到用户级线程的存在?

操作系统会为每个内核级线程建立相应的TCB(Thread ControlBlock,线程控制块),通过TCB对线程进行管理。内核级线程就是从操作系统内核视角看能看到的线程

优缺点

优点:

当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。

缺点:

一个用户进程会占用多个内核级线程线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

M 对 N 模型

dsadsadsa.png

多对多模型: n用户及线程映射到m个内核级线程(n>=m)。每个用户进程对应m个内核级线程。

克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。属于是一种折中的方案。

  1. 用户级线程是“代码逻辑”的载体
  2. 内核级线程是“运行机会”的载体

内核级线程才是处理机分配的单位。例如:多核CPU环境下,上边这个进程最多能被分配两个核。

一段“代码逻辑”只有获得了“运行机会”才能被CPU执行

内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有两个内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞

GMP调度器

模型简介

image.png

image.png

GMP:

  1. G:goroutine 协程
  2. P:processor 处理器
  3. M:threa 内核线程

全局队列

存放等待运行的G

P的本地队列

  1. 存放等待运行的G
  2. 数量限制 不超过256G
  3. 优先将新创建的G放在P的本地队列中,如果满了会放在全局队列中

P列表

程序启动时创建

M列表

  1. 当前操作系统分配到当前Go程序的内核线程数
  2. 有一个M阻塞,会创建一个新的M
  3. 如果有M空闲,那么就会回收或者睡眠

GMP调度器设计策略

working stealing机制

image.png

M2是空闲的,他会从 M1的 P 的本地队列里面偷取G3运行。

image.png

总结:当本线程无可运行的G时,尝试从其他线程绑定的P偷取G,而不是销毁线程。

hand off 机制

image.png

M1运行的G1发生阻塞操作,那么M1和P会分离,然后创建/唤醒一个thread,M1的P和M3进行绑定

image.png

总结: 当本线程因为G进行系统调用阻塞时,线程释放绑定的P,把P转移给其他空闲的线程执行。

抢占

在coroutine中要等待一个协程主动让出CPU才执行下一个协程,在Go-个goroutine最多占用CPU10ms,防止其他goroutine被饿死

全局G队列

当M执行work stealing从其他P偷不到G时,它可以从全局G队列获取G。

go func经历了什么流程?

image.png

  1. 我们通过 go func()来创建一个goroutine;
  2. 有两个存储G的队列,一个是局部调度器P的本地队列、一个是全局G队列。新创建的G会先保存在P的本地队列中,如果P的本地队列已经满了就会保存在全局的队列中;
  3. G只能运行在M中,一个M必须持有一个P,M与P是1:1的关系。M会从P的本地队列弹出一个可执行状态的G来执行,如果P的本地队列为空,就会想其他的MP组合偷取一个可执行的G来执行;
  4. 一个M调度G执行的过程是一个循环机制;
  5. 当M执行某一个G时候如果发生了syscall或则其余阻塞操作,M会阻塞,如果当前有一些G在执行,runtime会把这个线程M从P中摘除(detach),然后再创建一个新的操作系统的线程(如果有空闲的线程可用就复用空闲线程)来服务于这个P
  6. 当M系统调用结束时候,这个G会尝试获取一个空闲的P执行,并放入到这个P的本地队列。如果获取不到P,那么这个线程M变成休眠状态,加入到空闲线程中,然后这个G会被放入全局队列中。

Go的启动周期 M0 和 G0

image.png

M0 :M0是启动程序后的编号为0的主线程,这个M对应的实例会在全局变量runtime.m0中,不需要在heap上分配,MO负责执行初始化操作和启动第一个G,在之后M0就和其他的M一样了。

G0 : G0是每次启动一个M都会第一个创建的gourtine,G0仅用于负责调度的G,G0不指向任何可执行的函数,每个M都会有一个自己的G0。在调度或系统调用时会使用G0的空间,全局变量的G0是M0的G0。