⚡ io_uring：支撑百万并发的下一代 Linux I/O 模型为什么 epoll 已经过时？阻塞 I/O：一个线

在高并发后端服务中，I/O 模型是决定性能的核心。传统的 epoll 在面对百万连接和复杂 I/O 操作时逐渐力不从心。
从 Linux 5.1 开始，io_uring 的出现彻底改变了异步 I/O 的玩法，让后端系统具备“内核级别的性能新引擎”。

1. 背景：为什么 epoll 已经过时？

阻塞 I/O：一个线程只能服务一个请求，浪费资源。
epoll 模型：虽然能复用事件，但每次 syscall（系统调用）仍然有 用户态 <-> 内核态切换开销。
问题：
- 高频 I/O 调用依然消耗大量 CPU
- 无法充分利用 NVMe SSD 的高性能
- 大量连接下存在尾延迟问题

2. io_uring 的核心原理

io_uring 通过 共享环形队列 解决了 syscall 开销问题：

SQ（Submission Queue） ：应用进程把 I/O 请求写入队列（用户态）。
CQ（Completion Queue） ：内核把执行结果写入队列，用户态直接读取结果。
零拷贝 + 批处理：避免频繁的系统调用，提升性能。

👉 本质上，io_uring 把 I/O 变成了 用户态和内核态之间的“共享内存通信” ，极大减少上下文切换。

架构示意图：

App → SQ (用户态队列) → 内核执行 → CQ (结果队列) → App

3. io_uring 在后端的实践场景

高并发 API 服务
- RPC 框架（如 gRPC、Netty 正在逐步适配）
- Web 服务器（Nginx 未来可能会全面支持 io_uring）
数据库驱动优化
- MySQL / PostgreSQL 异步驱动
- Redis 社区已有 io_uring 实验分支
日志 & 文件处理
- 高速日志写入（替代 write() 系统调用）
- 文件上传下载

4. 样例代码（C 语言示例）

#include <liburing.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdio.h>

int main() {
    struct io_uring ring;
    io_uring_queue_init(8, &ring, 0);

    int fd = open("test.txt", O_RDONLY);
    char buf[4096];

    struct io_uring_sqe *sqe = io_uring_get_sqe(&ring);
    io_uring_prep_read(sqe, fd, buf, sizeof(buf), 0);
    io_uring_submit(&ring);

    struct io_uring_cqe *cqe;
    io_uring_wait_cqe(&ring, &cqe);
    printf("Read %d bytes: %s\n", cqe->res, buf);

    io_uring_cqe_seen(&ring, cqe);
    io_uring_queue_exit(&ring);
    close(fd);
    return 0;
}

这段代码展示了如何用 io_uring 异步读取文件，避免 read() 的阻塞调用。

5. 性能对比

epoll：每个请求一次 syscall
io_uring：批量提交，减少上下文切换
实测数据（来自 Cloudflare 测试）：
- 相同硬件环境下，io_uring 吞吐量提升约 20%-30%
- 尾延迟（p99.9）显著降低

6. io_uring 的未来趋势

数据库驱动全面适配（MySQL Connector、Postgres JDBC）
主流框架支持（Netty、gRPC、Nginx、Envoy）
与 eBPF 结合：进一步实现高性能网络处理
云原生场景：Kubernetes I/O 密集型服务

7. 总结

epoll 曾经是并发王者，但 io_uring 正在成为 后端性能的新基石。
对后端工程师来说，io_uring 不仅是一个 API，而是 理解 Linux 内核下一代 I/O 的窗口。
如果说 eBPF 改变了“观测与安全” ，那么 io_uring 改变的就是“性能与并发” 。