Linux 多路复用Linux 多路复用 \ select poll epoll https://www.cnblog

Linux 多路复用

select poll epoll

www.cnblogs.com/52php/p/568…

fd文件描述

select

（1）每次调用select，都需要把fd集合从用户态拷贝到内核态，这个开销在fd很多时会很大

（2）同时每次调用select都需要在内核遍历传递进来的所有fd，这个开销在fd很多时也很大

（3）select支持的文件描述符数量太小了，默认是1024

****\

Poll

poll的实现和select非常相似

主要数据结构用的链表存储文件描述符，没有socket连接的数量限制****

****\

Epoll

****\

只需要拷贝一次文件描述集合从用户态拷贝到内核 ****，并且有读写IO时候，能够马上知道是哪个socket/ 文件描述 ****状态发生了改变

****\

（1）select，poll实现需要自己不断轮询所有fd集合，直到有事件就绪，期间可能要睡眠和唤醒多次交替。而epoll其实也需要调用epoll_wait不断轮询就绪链表，期间也可能多次睡眠和唤醒交替，但是它是设备就绪时，调用回调函数，把就绪fd放入就绪链表中，并唤醒在epoll_wait中进入睡眠的进程。虽然都要睡眠和交替，但是select和poll在“醒着”的时候要遍历整个fd集合，而epoll在“醒着”的时候只要判断一下就绪链表是否为空就行了，这节省了大量的CPU时间。这就是回调机制带来的性能提升。

****\

select，poll每次调用都要把fd集合从用户态往内核态拷贝一次，并且要把current往设备等待队列中挂一次，而epoll只要一次拷贝，而且把current往等待队列上挂也只挂一次（在epoll_wait的开始，注意这里的等待队列并不是设备等待队列，只是一个epoll内部定义的等待队列）。这也能节省不少的开销。

****\

总的来说：

select、poll实现需要不断地轮训所有的fd，直到设备就绪。期间可能要睡眠唤醒多次。而epoll也需要调用epoll_wait不断轮询就绪链表，期间也可能多次睡眠和唤醒，但是它是当设备就绪时，调用回调函数把就绪的fd放入就绪列表中，并唤醒在epoll_wait中进入睡眠的进程。相比如另外两种这个只需要遍历就绪列表。 select、poll每次都要调用把fd集合从用户态往内核态拷贝一次，并且把current往设备等待队列挂一次。而epoll只需要拷贝一次、挂载一次。

****\

LT水平触发模式 会不断通知

解决：写完移除epoll

****\

ET 边沿触发模式 只通知一次

****\

LT level triggered 水平触发模式，

同时支持阻塞和非阻塞的socket。在这种模式中，内核告诉你一个文件描述符是否就绪了，然后你可以对这个就绪的fd进行I/O操作，如果你不做任何操作，讷河还是会继续通知你。（没处理这个流还是一直通知你）

ET edge triggered 边缘触发模式

只支持非阻塞的socket。效率比LT高。这种工作模式下，当从epoll_wait调用获取到事件后，如果没有把这次事件对应的套接字处理完，那么在这个套接字中没有新的事件再次到来时，ET模式下是无法再次从epoll_wait调用中获取这个事件的。而LT只要有数据就总可以获取。

所以，在epoll的ET模式下，正确的读写方式为:

读：只要可读，就一直读，直到返回0，或者 errno = EAGAIN

写:只要可写，就一直写，直到数据发送完，或者 errno = EAGAIN

对于第一个缺点，epoll的解决方案在epoll_ctl函数中。每次注册新的事件到epoll句柄中时（在epoll_ctl中指定EPOLL_CTL_ADD），会把所有的fd拷贝进内核，而不是在epoll_wait的时候重复拷贝。epoll保证了每个fd在整个过程中只会拷贝一次。

对于第二个缺点，epoll的解决方案不像select或poll一样每次都把current轮流加入fd对应的设备等待队列中，而只在epoll_ctl时把current挂一遍（这一遍必不可少）并为每个fd指定一个回调函数，当设备就绪，唤醒等待队列上的等待者时，就会调用这个回调函数，而这个回调函数会把就绪的fd加入一个就绪链表）。epoll_wait的工作实际上就是在这个就绪链表中查看有没有就绪的fd（利用schedule_timeout()实现睡一会，判断一会的效果，和select实现中的第7步是类似的）

epoll_create

创建一个epoll的句柄

epoll_ctl

注册要监听的事件 — 放到红黑树

epoll_wait

收集在epoll监控的事件中已经发生的事件

能够在就绪链表中直接获取发生的事件

select

用的一个bitmap数组表示文件描述符编号，一共1024位，需要监听的fd会置1，不需要的置0。每次调用select会把fd集合拷贝到内核态，由内核态高效判断是否有事件

缺点：

1 上限1024位，因为用的bitmap

2 fdset不可重用，每次需要置位

3 fdset拷贝到内核态开销过大

4 事件就绪时候需要on时间复杂度遍历bitmat，虽然用了max下标做了优化

poll

缺点：

1 无上限，解决了1024大小问题，因为用了结构体，整体用链表结构

2 不用每次全部重新置位，fdset可以重用

epoll：