Linux 多路复用
\
select poll epoll
\
fd文件描述
select
(1)每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大
(2)同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大
(3)select支持的文件描述符数量太小了,默认是1024
****\
Poll
poll的实现和select非常相似
主要数据结构用的链表存储文件描述符,没有socket连接的数量限制****
****\
Epoll
****\
只需要拷贝一次文件描述集合从用户态拷贝到内核 ****,并且有读写IO时候,能够马上知道是哪个socket/ 文件描述 ****状态发生了改变
****\
****\
(1)select,poll实现需要自己不断轮询所有fd集合,直到有事件就绪,期间可能要睡眠和唤醒多次交替。而epoll其实也需要调用epoll_wait不断轮询就绪链表,期间也可能多次睡眠和唤醒交替,但是它是设备就绪时,调用回调函数,把就绪fd放入就绪链表中,并唤醒在epoll_wait中进入睡眠的进程。虽然都要睡眠和交替,但是select和poll在“醒着”的时候要遍历整个fd集合,而epoll在“醒着”的时候只要判断一下就绪链表是否为空就行了,这节省了大量的CPU时间。这就是回调机制带来的性能提升。
****\
select,poll每次调用都要把fd集合从用户态往内核态拷贝一次,并且要把current往设备等待队列中挂一次,而epoll只要一次拷贝,而且把current往等待队列上挂也只挂一次(在epoll_wait的开始,注意这里的等待队列并不是设备等待队列,只是一个epoll内部定义的等待队列)。这也能节省不少的开销。
****\
****\
总的来说:
select、poll实现需要不断地轮训所有的fd,直到设备就绪。期间可能要睡眠唤醒多次。而epoll也需要调用epoll_wait不断轮询就绪链表,期间也可能多次睡眠和唤醒,但是它是当设备就绪时,调用回调函数把就绪的fd放入就绪列表中,并唤醒在epoll_wait中进入睡眠的进程。相比如另外两种这个只需要遍历就绪列表。 select、poll每次都要调用把fd集合从用户态往内核态拷贝一次,并且把current往设备等待队列挂一次。而epoll只需要拷贝一次、挂载一次。
****\
****\
LT水平触发模式 会不断通知
解决:写完移除epoll
****\
ET 边沿触发模式 只通知一次
****\
LT level triggered 水平触发模式,
同时支持阻塞和非阻塞的socket。在这种模式中,内核告诉你一个文件描述符是否就绪了,然后你可以对这个就绪 的fd进行I/O操作,如果你不做任何操作,讷河还是会继续通知你。(没处理这个流还是一直通知你)
ET edge triggered 边缘触发模式
只支持非阻塞的socket。效率比LT高。这种工作模式下,当从epoll_wait调用获取到事件后,如果没有把这次事件 对应的套接字处理完,那么在这个套接字中没有新的事件再次到来时,ET模式下是无法再次从epoll_wait调用中获取这 个事件的。而LT只要有数据就总可以获取。
\
所以,在epoll的ET模式下,正确的读写方式为:
读:只要可读,就一直读,直到返回0,或者 errno = EAGAIN
写:只要可写,就一直写,直到数据发送完,或者 errno = EAGAIN
\
\
\
\
\
\
对于第一个缺点,epoll的解决方案在epoll_ctl函数中。每次注册新的事件到epoll句柄中时(在epoll_ctl中指定EPOLL_CTL_ADD),会把所有的fd拷贝进内核,而不是在epoll_wait的时候重复拷贝。epoll保证了每个fd在整个过程中只会拷贝一次。
\
对于第二个缺点,epoll的解决方案不像select或poll一样每次都把current轮流加入fd对应的设备等待队列中,而只在epoll_ctl时把current挂一遍(这一遍必不可少)并为每个fd指定一个回调函数,当设备就绪,唤醒等待队列上的等待者时,就会调用这个回调函数,而这个回调函数会把就绪的fd加入一个就绪链表)。epoll_wait的工作实际上就是在这个就绪链表中查看有没有就绪的fd(利用schedule_timeout()实现睡一会,判断一会的效果,和select实现中的第7步是类似的)
\
epoll_create
创建一个epoll的句柄
epoll_ctl
注册要监听的事件 — 放到红黑树
epoll_wait
收集在epoll监控的事件中已经发生的事件
能够在就绪链表中直接获取发生的事件
\
\
select
用的一个bitmap数组表示文件描述符编号,一共1024位,需要监听的fd会置1,不需要的置0。每次调用select会把fd集合拷贝到内核态,由内核态高效判断是否有事件
\
缺点:
1 上限1024位,因为用的bitmap
2 fdset不可重用,每次需要置位
3 fdset拷贝到内核态开销过大
4 事件就绪时候需要on时间复杂度遍历bitmat,虽然用了max下标做了优化
\
\
poll
缺点:
1 无上限,解决了1024大小问题,因为用了结构体,整体用链表结构
2 不用每次全部重新置位,fdset可以重用
\
epoll:
\
\