用户级线程
int main() {
int i = 0;
while (true) {
if (i == 0) {处理视频聊天的代码;}
if (i == 1) {处理文字聊天的代码;}
if (i == 2) {处理文件传输的代码;}
i = (i + 1) % 3;
}
}
从代码的角度看,线程其实就是一段代码逻辑。上述三段代码逻辑上可以看作三个“线程”while 循环就是一个最弱智的“线程库”,线程库完成了对线程的管理工作(如调度)。
一对N模型
线程的管理工作由谁来完成?
应用程序自己管理
线程切换是否需要CPU变态?
不需要
操作系统是否能意识到用户级线程的存在?
操作系统只能感知到进程的存在,感知不到用户级线程的存在。
优缺点
优点:
用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点:
当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
N 对 N 模型
线程的管理工作由谁来完成?
内核级线程的管理工作由操作系统内核完成。
线程切换是否需要CPU变态?
线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
操作系统是否能意识到用户级线程的存在?
操作系统会为每个内核级线程建立相应的TCB(Thread ControlBlock,线程控制块),通过TCB对线程进行管理。内核级线程就是从操作系统内核视角看能看到的线程
优缺点
优点:
当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点:
一个用户进程会占用多个内核级线程线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
M 对 N 模型
多对多模型: n用户及线程映射到m个内核级线程(n>=m)。每个用户进程对应m个内核级线程。
克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。属于是一种折中的方案。
- 用户级线程是“代码逻辑”的载体
- 内核级线程是“运行机会”的载体
内核级线程才是处理机分配的单位。例如:多核CPU环境下,上边这个进程最多能被分配两个核。
一段“代码逻辑”只有获得了“运行机会”才能被CPU执行
内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有两个内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞
GMP调度器
模型简介
GMP:
- G:goroutine 协程
- P:processor 处理器
- M:threa 内核线程
全局队列
存放等待运行的G
P的本地队列
- 存放等待运行的G
- 数量限制 不超过256G
- 优先将新创建的G放在P的本地队列中,如果满了会放在全局队列中
P列表
程序启动时创建
M列表
- 当前操作系统分配到当前Go程序的内核线程数
- 有一个M阻塞,会创建一个新的M
- 如果有M空闲,那么就会回收或者睡眠
GMP调度器设计策略
working stealing机制
M2是空闲的,他会从 M1的 P 的本地队列里面偷取G3运行。
总结:当本线程无可运行的G时,尝试从其他线程绑定的P偷取G,而不是销毁线程。
hand off 机制
M1运行的G1发生阻塞操作,那么M1和P会分离,然后创建/唤醒一个thread,M1的P和M3进行绑定
总结: 当本线程因为G进行系统调用阻塞时,线程释放绑定的P,把P转移给其他空闲的线程执行。
抢占
在coroutine中要等待一个协程主动让出CPU才执行下一个协程,在Go-个goroutine最多占用CPU10ms,防止其他goroutine被饿死
全局G队列
当M执行work stealing从其他P偷不到G时,它可以从全局G队列获取G。
go func经历了什么流程?
- 我们通过 go func()来创建一个goroutine;
- 有两个存储G的队列,一个是局部调度器P的本地队列、一个是全局G队列。新创建的G会先保存在P的本地队列中,如果P的本地队列已经满了就会保存在全局的队列中;
- G只能运行在M中,一个M必须持有一个P,M与P是1:1的关系。M会从P的本地队列弹出一个可执行状态的G来执行,如果P的本地队列为空,就会想其他的MP组合偷取一个可执行的G来执行;
- 一个M调度G执行的过程是一个循环机制;
- 当M执行某一个G时候如果发生了syscall或则其余阻塞操作,M会阻塞,如果当前有一些G在执行,runtime会把这个线程M从P中摘除(detach),然后再创建一个新的操作系统的线程(如果有空闲的线程可用就复用空闲线程)来服务于这个P
- 当M系统调用结束时候,这个G会尝试获取一个空闲的P执行,并放入到这个P的本地队列。如果获取不到P,那么这个线程M变成休眠状态,加入到空闲线程中,然后这个G会被放入全局队列中。
Go的启动周期 M0 和 G0
M0 :M0是启动程序后的编号为0的主线程,这个M对应的实例会在全局变量runtime.m0中,不需要在heap上分配,MO负责执行初始化操作和启动第一个G,在之后M0就和其他的M一样了。
G0 : G0是每次启动一个M都会第一个创建的gourtine,G0仅用于负责调度的G,G0不指向任何可执行的函数,每个M都会有一个自己的G0。在调度或系统调用时会使用G0的空间,全局变量的G0是M0的G0。