再学golang协程机制

700 阅读4分钟

一、golang线程与协程的区别

备注: 需要区分进程、线程(内核级线程)、协程(用户级线程)三个概念。

进程、线程和协程之间的概念区别
  • 对于进程、线程,都是内核态进行调度,有cpu时间片的概念,进行==抢占式调度==(有多种调度算法)
  • 对于协程,对内核是透明的,也就是系统并不知道协程的存在,是完全由用户自己的程序进行调度的,因为是由用户自己控制,那么就很难像抢占式那样做到强制的cpu控制权切换到其他进程/线程,==通常只能协作式调度,需要协程自己主动把控制权让出去之后,其他协程才能被执行到。==
goroutine和协程的区别

本质上,goroutine就是协程。不同的是,golang在rutime、系统调用等方面对goroutine调度进行了封装和处理,当遇到长时间执行或者系统调用时,会主动把当前goroutine的CPU(P)转让出去,让其他goroutine能够被调度执行,也就是golang从语言层面支持了协程。

==golang的一大特色就是从语言层面原生支持协程==,在方法或者函数前面加go关键字就可以创建一个协程。

其他方面的比较
  • 内存消耗方面 每个goroutine默认占用内存比java,c的线程少
  • 线程和goroutine切换开销方面 goroutine远比线程小 线程:涉及到从用户态切换到内核态,16个寄存器,PC、SP...等寄存器的刷新 goroutine:只有三个寄存器的值修改,PC、SP、DX

更多线程与goroutine的比较查看我的www.crownblog.icu/post/gorout…

二、协程底层实现原理

  线程是操作系统的内核对象,多线程编程时,如果线程数过多,就会导致频繁的上下文切换,这些 cpu 时间是一个额外的耗费。所以在一些高并发的网络服务器编程中,使用一个线程服务一个 socket 连接是很不明智的。于是操作系统提供了基于事件模式的异步编程模型。用少量的线程来服务大量的网络连接和I/O操作。但是采用异步和基于事件的编程模型,复杂化了程序代码的编写,非常容易出错。因为线程穿插,也提高排查错误的难度。

  ==协程,是在应用层模拟的线程,他避免了上下文切换的额外耗费,兼顾了多线程的优点。简化了高并发程序的复杂度。举个例子,一个高并发的网络服务器,每一个socket连接进来,服务器用一个协程来对他进行服务。代码非常清晰。而且兼顾了性能。==

那么,协程是怎么实现的呢?

  他和线程的原理是一样的,当 a线程 切换到 b线程 的时候,需要将 a线程 的相关执行进度压入栈,然后将 b线程 的执行进度出栈,进入 b线程 的执行序列。协程只不过是在 应用层 实现这一点。但是,协程并不是由操作系统调度的,而且应用程序也没有能力和权限执行 cpu 调度。怎么解决这个问题?

  答案是,协程是基于线程的。内部实现上,维护了一组数据结构和 n 个线程,真正的执行还是线程,协程执行的代码被扔进一个待执行队列中,由这 n 个线程从队列中拉出来执行。这就解决了协程的执行问题。那么协程是怎么切换的呢?答案是:golang 对各种 io函数 进行了封装,这些封装的函数提供给应用程序使用,而其内部调用了操作系统的异步 io函数,当这些异步函数返回 busy 或 bloking 时,golang 利用这个时机将现有的执行序列压栈,让线程去拉另外一个协程的代码来执行,基本原理就是这样,利用并封装了操作系统的异步函数。包括 linux 的 epoll、select 和 windows 的 iocp、event 等。

  由于golang是从编译器和语言基础库多个层面对协程做了实现,所以,golang的协程是目前各类有协程概念的语言中实现的最完整和成熟的。十万个协程同时运行也毫无压力。关键我们不会这么写代码。但是总体而言,程序员可以在编写 golang 代码的时候,可以更多的关注业务逻辑的实现,更少的在这些关键的基础构件上耗费太多精力。

文章同步发送到www.crownblog.icu/post/goruti…