Go 中 Channel 的死锁与泄漏防范：从原理到实践这篇文章从 channel 的底层原理出发，剖析死锁和泄漏的成因

引言

在 Go 中，channel 是并发编程的命脉，goroutine 靠它传递数据、协调工作。但用得不小心，channel 很容易引发问题，比如死锁和泄漏。死锁会让程序卡住，泄漏则会导致 goroutine 或资源堆积，拖垮性能。

这篇文章从 channel 的底层原理出发，剖析死锁和泄漏的成因，再结合实际代码给出防范招数。目标是深入浅出，既有技术深度，又能直接上手解决实际问题。

死锁：为什么会卡住

死锁的核心是：某个 goroutine 在操作 channel 时（发送或接收），等着另一方配合，但另一方永远不来。

死锁的底层原因

channel 的操作依赖 Go 运行时的 hchan 结构（在 runtime/chan.go 里定义）。发送（ch <- data）和接收（<-ch）的行为跟 sendq 和 recvq 两个等待队列密切相关：

无缓冲 channel：发送时，如果 recvq 里没接收者，当前 goroutine 就挂进 sendq 等着；接收时，如果 sendq 里没发送者，就挂进 recvq。
有缓冲 channel：发送时缓冲区满（qcount == dataqsiz）就进 sendq，接收时缓冲区空（qcount == 0）就进 recvq。

死锁发生在所有相关 goroutine 都进了等待队列，但没人能把它们唤醒。

典型死锁场景

场景 1：单 goroutine 无缓冲 channel

func main() {
    ch := make(chan int)
    ch <- 1 // 卡住
    fmt.Println(<-ch)
}

问题：无缓冲 channel 要求发送和接收同步，但这里只有一个 goroutine，发送时没接收者，goroutine 被塞进 sendq，没人唤醒，死锁。

报错：fatal error: all goroutines are asleep - deadlock!

场景 2：有缓冲 channel 操作不当

func main() {
    ch := make(chan int, 1)
    ch <- 1
    ch <- 2 // 缓冲区满，卡住
    fmt.Println(<-ch)
}

问题：缓冲区大小是 1，塞进第 2 个数据时满了，goroutine 进 sendq 等着，但后续接收代码没机会执行，死锁。

防范死锁

无缓冲 channel 用 goroutine 配对
无缓冲 channel 需要发送和接收两端同时就位，单 goroutine 用不了。

func main() {
    ch := make(chan int)
    go func() {
        ch <- 1 // 发送有接收者，不会卡
    }()
    fmt.Println(<-ch) // 主 goroutine 接收
}

有缓冲 channel 确保容量够用
计算好缓冲区大小，避免发送超过容量。

func main() {
    ch := make(chan int, 2) // 容量够
    ch <- 1
    ch <- 2
    fmt.Println(<-ch)
}

用 select 避免单点阻塞
如果不确定对端会不会就绪，用 select 加默认分支。

func main() {
    ch := make(chan int)
    select {
    case ch <- 1:
        fmt.Println("sent")
    default:
        fmt.Println("no receiver, move on")
    }
}

泄漏：goroutine 和资源的堆积

泄漏指的是 goroutine 或 channel 资源没被正确释放，悄悄堆积，最终耗尽内存或 CPU。

泄漏的底层原因

goroutine 阻塞在 channel 上：如果 goroutine 在发送或接收时进了 sendq 或 recvq，但没人唤醒，它就一直占着内存。
channel 未关闭：没关闭的 channel 可能让等着它的 goroutine 永远挂起。

典型泄漏场景

场景 1：接收者没了

func main() {
    ch := make(chan int)
    go func() {
        ch <- 1 // 发送者卡住
    }()
    time.Sleep(time.Second) // 主 goroutine 不接收
}

问题：发送 goroutine 在 sendq 里等着，但主 goroutine 不读，goroutine 泄漏。

场景 2：channel 未关闭

func process(ch chan int) {
    for i := 0; i < 5; i++ {
        ch <- i
    }
    // 没 close(ch)
}

func main() {
    ch := make(chan int)
    go process(ch)
    for v := range ch { // 无限等下去
        fmt.Println(v)
    }
}

问题：process 发完 5 个数就不发了，但没关闭 channel，主 goroutine 在 range 上一直等，泄漏。

防范泄漏

确保 channel 有接收者
每条发送路径都要有对应的接收逻辑。

func main() {
    ch := make(chan int)
    go func() {
        ch <- 1
    }()
    fmt.Println(<-ch) // 保证接收
}

及时关闭 channel
数据发完后，主动关闭 channel，通知接收者结束。

func process(ch chan int) {
    for i := 0; i < 5; i++ {
        ch <- i
    }
    close(ch) // 关键
}

func main() {
    ch := make(chan int)
    go process(ch)
    for v := range ch {
        fmt.Println(v)
    }
}

用 context 控制生命周期
用 context 超时或取消，避免 goroutine 无休止等待。

func main() {
    ctx, cancel := context.WithTimeout(context.Background(), time.Second)
    defer cancel()
    ch := make(chan int)
    go func() {
        select {
        case ch <- 1:
        case <-ctx.Done():
            return // 超时退出
        }
    }()
    select {
    case v := <-ch:
        fmt.Println(v)
    case <-ctx.Done():
        fmt.Println("timeout")
    }
}

调试与工具

遇到死锁或泄漏，可以用这些方法定位：

runtime.GoroutineProfile：用 pprof 看 goroutine 状态，找卡在 channel 上的。
打印日志：在发送/接收处加日志，追踪谁没就位。
go vet：静态分析工具，能揪出一些潜在问题。

总结

channel 的死锁和泄漏，说到底是 goroutine 间的协作出了岔子。死锁是因为大家都在等对方，泄漏是因为有人被忘在了等待队列里。明白这些底层机制后，防范就不难：

无缓冲 channel 要配对，缓冲 channel 容量要够。
用 select 或 context 避免卡死。
发送完记得关 channel，别让接收者干等。

写并发代码，别光想着功能，得多留心这些“坑”。用好了 channel，Go 的并发才能真正顺畅、高效。