Go - channel 实现原理

216 阅读5分钟

Go - channel 实现原理

image.png

channel是Golang在语言层面提供的goroutine间的通信方式,比Unix管道更易用也更轻便。channel主要用于进 程内各goroutine间通信,如果需要跨进程通信,建议使用分布式系统的方法来解决。

一、chan数据结构

src/runtime/chan.go:hchan 定义了channel的数据结构:

type hchan struct {
    qcount   uint           // 当前队列中剩余元素个数
    dataqsiz uint           // 环形队列长度,即可以存放的元素个数
    buf      unsafe.Pointer // 环形队列指针
    elemsize uint16         // 每个元素的大小
    closed   uint32         // 标识关闭状态
    elemtype *_type         // 元素类型
    sendx    uint           // 队列下标,指示元素写入时存放到队列中的位置
    recvx    uint           // 队列下标,指示元素从队列的该位置读出
    recvq    waitq          // 等待读消息的goroutine队列
    sendq    waitq          // 等待写消息的goroutine队列
​
    lock mutex              // 互斥锁,chan不允许并发读写
}
  • waitq
type waitq struct {
    first *sudog   // 队列头部
    last  *sudog   // 队列尾部
}

从数据结构可以看出channel由队列、类型信息、goroutine等待队列组成,下面分别说明其原理

1.1 环形队列

chan内部实现了一个环形队列作为其缓冲区,队列的长度是创建chan时指定的。

下图展示了一个可缓存6个元素的channel示意图:

image.png

  • dataqsiz:指示了队列长度为6,即可缓存6个元素;
  • buf:指向队列的内存,队列中还剩余2个元素;
  • qcount:表示队列中还有4个元素;
  • sendx:指示后续写入的数据存储的位置,值为0 ,取值范围[0, 6);
  • recvx:指示从该位置读取数据,值为4 ,取值[0, 6);

1.2 等待队列

从channel读数据,如果channel缓冲区为空或者没有缓冲区,当前goroutine会被阻塞。

向channel写数据,如 果channel缓冲区已满或者没有缓冲区,当前goroutine会被阻塞。

被阻塞的goroutine将会挂在channel的等待队列中:

  • 因读阻塞的goroutine会被向channel写入数据的goroutine唤醒;
  • 因写阻塞的goroutine会被从channel读数据的goroutine唤醒;

展示了一个没有缓冲区的channel,有几个goroutine阻塞等待读数据:

image.png

注意,一般情况下recvq和sendq至少有一个为空。只有一个例外,那就是同一个goroutine使用select语句向 channel一边写数据,一边读数据。

1.3 类型信息

一个channel只能传递一种类型的值,类型信息存储在hchan数据结构中。

  • elemtype代表类型,用于数据传递过程中的赋值;
  • elemsize代表类型大小,用于在buf中定位元素位置。

1.4 锁

一个channel同时仅允许被一个goroutine读写,为简单起见,本章后续部分说明读写过程时不再涉及加锁和解锁

二、Channel读写

2.1 创建channel

image.png

创建channel的过程实际上是初始化hchan结构。其中类型信息和缓冲区长度由make语句传入,buf的大小则与元素 大小和缓冲区长度共同决定。

创建channel的伪代码如下所示:

func makechan(t *chantype, size int) *hchan {
    var c *hchan
    c = new(hchan)
    c.buf = malloc(元素类型大小*size)
    c.elemsize = 元素类型大小
    c.elemtype = 元素类型
    c.dataqsiz = size
    
    return c
}
​

2.2 向channel写数据

向一个channel中写数据简单过程如下:

  • 如果等待接收队列recvq不为空,说明缓冲区中没有数据或者没有缓冲区,此时直接从recvq取出G, 并把数据写入,最后把该G唤醒,结束发送过程;
  • 如果缓冲区中有空余位置,将数据写入缓冲区结束发送过程;
  • 如果缓冲区中没有空余位置,将待发送数据写入G,将当前G加入sendq进入睡眠,等待被读goroutine唤醒;

image.png

2.3 从channel读数据

从一个channel读数据简单过程如下:

  • 如果等待发送队列sendq不为空,且没有缓冲区,直接从sendq中取出G,把G中数据读出,最后把G唤醒,结束 读取过程;
  • 如果等待发送队列sendq不为空,此时说明缓冲区已满,从缓冲区中首部读出数据,把G中数据写入缓冲区尾 部,把G唤醒,结束读取过程;
  • 如果缓冲区中有数据,则从缓冲区取出数据,结束读取过程;
  • 将当前goroutine加入recvq,进入睡眠,等待被写goroutine唤醒;

image.png

2.4 关闭channel

关闭channel时会把recvq中的G全部唤醒,本该写入G的数据位置为nil。把sendq中的G全部唤醒,但这些G会 panic。

除此之外,panic出现的常见场景还有:

  • 关闭值为nil的channel
  • 关闭已经被关闭的channel
  • 向已经关闭的channel写数据

2.5 可操作方式

操作 channel 一般有如下三种方式:

  • 读 <-ch
  • 写 ch<-
  • 关闭 close(ch)

image.png

注意 对于 nil channel 的情况,有1个特殊场景:

当 nil channel 在 select 的某个 case 中时,这个 case 会阻塞,但不会造成死锁

三、常见用法

3.1 常见的用法

单向channel

单向channel指只能用于发送或接收数据,实际上也没有单向channel

  • func readChan(chanName <-chan int):

    通过形参限定函数内部只能从channel中读取数据

  • func writeChan(chanName chan<- int):

    通过形参限定函数内部只能向channel中写入数据

func    readChan(chanName   <-chan  int)    {
                    <-  chanName
}

func    writeChan(chanName  chan<-  int)    {
                chanName    <-  1
}

func    main()  {
            var mychan  =   make(chan   int,    10) 
            writeChan(mychan)
            readChan(mychan)
}

mychan是个正常的channel,而readChan()参数限制了传入的channel只能用来读,writeChan()参数限制了传 入的channel只能用来写。

Select

使用select可以监控多channel,比如监控多个channel,当其中某一个channel有数据时,就从其读出数据。

Range

通过range可以持续从channel中读出数据,好像在遍历一个数组一样,当channel中没有数据时会阻塞当前goroutine,与读channel时阻塞处理机制一样。

    func chanRange(chanName chan    int)    {
        for e:= range   chanName    {
            fmt.Printf("Get element from    chan:   %d\n",  e)
        }
    }

注意:如果向此channel写数据的goroutine退出时,系统检测到这种情况后会panic,否则range将会永久阻塞。