IO多路复用,select、poll、epoll区别

8,289 阅读5分钟
  • IO多路复用是一种同步IO模型,一个线程监听多个IO事件,当有IO事件就绪时,就会通知线程去执行相应的读写操作,没有就绪事件时,就会阻塞交出cpu。多路是指网络链接,复用指的是复用同一线程。

  • select

    • fd_set数据结构定义如下,可以看出fd_set是一个整型数组,用于保存socket文件描述符
    typedef long int __fd_mask;
    
    /* fd_set for select and pselect.  */
    typedef struct
      {
    #ifdef __USE_XOPEN
        __fd_mask fds_bits[__FD_SETSIZE / __NFDBITS];
    # define __FDS_BITS(set) ((set)->fds_bits)
    #else
        __fd_mask __fds_bits[__FD_SETSIZE / __NFDBITS];
    # define __FDS_BITS(set) ((set)->__fds_bits)
    #endif
      } fd_set;
    
    • 执行过程

      流程:

      1. 用户线程调用select,将fd_set从用户空间拷贝到内核空间
      2. 内核在内核空间对fd_set遍历一遍,检查是否有就绪的socket描述符,如果没有的话,就会进入休眠,直到有就绪的socket描述符
      3. 内核返回select的结果给用户线程,即就绪的文件描述符数量
      4. 用户拿到就绪文件描述符数量后,再次对fd_set进行遍历,找出就绪的文件描述符
      5. 用户线程对就绪的文件描述符进行读写操作
      
    • 优点

      1. 所有平台都支持,良好的跨平台性
    • 缺点

      1. 每次调用select,都需要将fd_set从用户空间拷贝到内核空间,当fd很多时,这个开销很大
      2. 最大连接数(支持的最大文件描述符数量)有限制,一般为1024
      3. 每次有活跃的socket描述符时,都需要遍历一次fd_set,造成大量的时间开销,时间复杂度是O(n)
      4. 将fd_set从用户空间拷贝到内核空间,内核空间也需要对fd_set遍历一遍
  • poll

    • 数据结构

      数据结构定义如下,链表存储

      /* Data structure describing a polling request.  */
      struct pollfd
        {
          int fd;			/* File descriptor to poll.  */
          short int events;		/* Types of events poller cares about.  */
          short int revents;		/* Types of events that actually occurred.  */
        };
      
    • 与select的异同点

      相同点:

      1. 内核线程都需要遍历文件描述符,并且当内核返回就绪的文件描述符数量后,还需要遍历一次找出就绪的文件描述符
      2. 需要将文件描述符数组或链表从用户空间拷贝到内核空间
      3. 性能开销会随文件描述符的数量而线性增大

      不同点:

      1. select存储的数据结构是文件描述符数组,poll采用链表
      2. select有最大连接数限制,poll没有最大限制,因为poll采用链表存储
    • 执行过程(基本与select类型)

      1. 用户线程调用poll系统调用,并将文件描述符链表拷贝到内核空间
      2. 内核对文件描述符遍历一遍,如果没有就绪的描述符,则内核开始休眠,直到有就绪的文件描述符
      3. 返回给用户线程就绪的文件描述符数量
      4. 用户线程再遍历一次文件描述符链表,找出就绪的文件描述符
      5. 用户线程对就绪的文件描述符进行读写操作
  • epoll

    • 核心代码

      #include <sys/epoll.h>
      
      // 数据结构
      // 每一个epoll对象都有一个独立的eventpoll结构体
      // 红黑树用于存放通过epoll_ctl方法向epoll对象中添加进来的事件
      // epoll_wait检查是否有事件发生时,只需要检查eventpoll对象中的rdlist双链表中是否有epitem元素即可
      struct eventpoll {
          ...
          /*红黑树的根节点,这颗树存储着所有添加到epoll中的需要监控的事件*/
          struct rb_root  rbr;
          /*双链表存储所有就绪的文件描述符*/
          struct list_head rdlist;
          ...
      };
      
      // API
      int epoll_create(int size); // 内核中间加一个 eventpoll 对象,把所有需要监听的 socket 都放到 eventpoll 对象中
      int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); // epoll_ctl 负责把 socket 增加、删除到内核红黑树
      int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);// epoll_wait 检测双链表中是否有就绪的文件描述符,如果有,则返回
      
      

      核心点:

      1. epoll_create创建eventpoll对象(红黑树,双链表)
      2. 一棵红黑树,存储监听的所有文件描述符,并且通过epoll_ctl将文件描述符添加、删除到红黑树
      3. 一个双链表,存储就绪的文件描述符列表,epoll_wait调用时,检测此链表中是否有数据,有的话直接返回
      4. 所有添加到eventpoll中的事件都与设备驱动程序建立回调关系
    • 缺点

      1. 只能工作在linux下
    • 优点

      1. 时间复杂度为O(1),当有事件就绪时,epoll_wait只需要检测就绪链表中有没有数据,如果有的话就直接返回
      2. 不需要从用户空间到内核空间频繁拷贝文件描述符集合,使用了内存映射(mmap)技术
      3. 当有就绪事件发生时采用回调的形式通知用户线程
  • select、poll、epoll的区别

    selectpollepoll
    底层数据结构数组存储文件描述符链表存储文件描述符红黑树存储监控的文件描述符,双链表存储就绪的文件描述符
    如何从fd数据中获取就绪的fd遍历fd_set遍历链表回调
    时间复杂度获得就绪的文件描述符需要遍历fd数组,O(n)获得就绪的文件描述符需要遍历fd链表,O(n)当有就绪事件时,系统注册的回调函数就会被调用,将就绪的fd放入到就绪链表中。O(1)
    FD数据拷贝每次调用select,需要将fd数据从用户空间拷贝到内核空间每次调用poll,需要将fd数据从用户空间拷贝到内核空间使用内存映射(mmap),不需要从用户空间频繁拷贝fd数据到内核空间
    最大连接数有限制,一般为1024无限制无限制
  • epoll 的水平触发(LT)和边缘触发(ET)的区别

    LT模式:只要文件描述符还有数据可读,每次epoll_wait就会返回它的事件(只要有数据就触发

    ET模式:只有数据流到来的时候才触发,不管缓冲区是否还有数据(只有数据流到来才会触发

  • nginx和redis所使用的IO模型是什么

    IO多路复用

  • 应用场景

    1. 连接数较少并且都很活跃,用select和poll效率更高
    2. 连接数较多并且都不很活跃,使用epoll效率更高