Epoll

95 阅读3分钟

Epoll

epoll是Linux下多路复用IO接口select/poll的增强版本,它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统CPU利用率,因为它会复用文件描述符集合来传递结果而不用迫使开发者每次等待事件之前都必须重新准备要被侦听的文件描述符集合,另一点原因就是获取事件的时候,它无须遍历整个被侦听的描述符集,只要遍历那些被内核IO事件异步唤醒而加入Ready队列的描述符集合就行了。 目前epell是linux大规模并发网络程序中的热门首选模型。

epoll除了提供select/poll那种IO事件的电平触发(Level Triggered)外,还提供了边沿触发(Edge Triggered),这就使得用户空间程序有可能缓存IO状态,减少epoll_wait/epoll_pwait的调用,提高应用程序效率。

Epoll API

  1. 创建一个epoll句柄,参数size用来告诉内核监听的文件描述符的个数,跟内存大小有关。

    #include <sys/epoll.h>
    int epoll_create(int size)     //size:监听数目
    
  2. 控制某个epoll监控的文件描述符上的事件:注册、修改、删除。

    #include <sys/epoll.h>
        int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)
            /*
            epfd:  为epoll_creat的句柄
            op:    表示动作,用3个宏来表示:
                EPOLL_CTL_ADD (注册新的fd到epfd),
                EPOLL_CTL_MOD (修改已经注册的fd的监听事件),
                EPOLL_CTL_DEL (从epfd删除一个fd);
            event: 告诉内核需要监听的事件*/
            
            struct epoll_event {
                __uint32_t events; /* Epoll events */
                epoll_data_t data; /* User data variable */
            };
    
            typedef union epoll_data {
                void *ptr;
                int fd;
                uint32_t u32;
                uint64_t u64;
            } epoll_data_t;
    
            **EPOLLIN** :  表示对应的文件描述符可以读(包括对端SOCKET正常关闭)
    
            **EPOLLOUT**:  表示对应的文件描述符可以写
    
            EPOLLPRI:  表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来)
    
            **EPOLLERR**:  表示对应的文件描述符发生错误
    
            EPOLLHUP:  表示对应的文件描述符被挂断;
    
            EPOLLET:   将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)而言的
    
            EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,
            需要再次把这个socket加入到EPOLL队列里
            ```
    
  3. 等待所监控文件描述符上有事件的产生,类似于select()调用。

    #include <sys/epoll.h>
    
        int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout)
    

    events:=用来存内核得到事件的集合

    maxevents: 告之内核这个events有多大,这个maxevents的值不能大于创建epoll_create()时的size,

    timeout:   是超时时间

       -1: 阻塞
    
       0: 立即返回,非阻塞
    
       \>0: 指定毫秒
    

    返回值: 成功返回有多少文件描述符就绪,时间到时返回0,出错返回-1

实现思路

lfd = socket();			监听连接事件lfd
bind();
listen();

int epfd = epoll_create(1024);		//epfd, 监听红黑树的树根。

struct epoll_event tep, ep[1024];	//tep, 用来设置单个fd属性, ep 是 epoll_wait() 传出的满足监听事件的数组。

tep.events = EPOLLIN;	            //初始化  lfd的监听属性。
tep.data.fd = lfd

epoll_ctl(epfd, EPOLL_CTL_ADD, lfd, &tep);	//将 lfd 添加到监听红黑树上。

while (1) {
	ret = epoll_wait(epfd, ep,1024-1);	//实施监听
	for (i = 0; i < ret; i++) {
		if (ep[i].data.fd == lfd) {
                // lfd 满足读事件,有新的客户端发起连接请求
			cfd = Accept();
			tep.events = EPOLLIN;    //初始化  cfd的监听属性。
			tep.data.fd = cfd;
			epoll_ctl(epfd, EPOLL_CTL_ADD, cfd, &tep);
		} else {	//cfd 们 满足读事件, 有客户端写数据来。

			n = read(ep[i].data.fd, buf, sizeof(buf));
			if ( n == 0) {
				close(ep[i].data.fd);
				epoll_ctl(epfd, EPOLL_CTL_DEL, ep[i].data.fd , NULL);	
                                // 将关闭的cfd,从监听树上摘下。
			} else if (n > 0) {
				//小--大
				write(ep[i].data.fd, buf, n);
			}
		}
	}
}

Epoll ET LT

Epoll的ET非阻塞模式

efd = epoll_create(10);
event.events = EPOLLIN | EPOLLET;
flag = fcntl(connfd,F_GETFL);
flag |= O_NONBLOCK;
fcntl(connfd,F_SETFL,flag);

20180531185610344.jpg