您的位置:首页 > 运维架构 > Linux

linux epoll机制

2015-10-19 11:02 501 查看
背景:

在linux的网络编程中,很长的时间都在使用select来做事件触发。

在linux新的内核中,有了一种替换它的机制,就是epoll。相比于select,epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。

因为在内核中的select实现中,它是采用轮询来处理的,轮询的fd数目越多,自然耗时越多。并且,linux/posix_types.h头文件有这样的声明:

#define__FD_SETSIZE   1024   表示select最多同时监听1024个fd,当然,可以通过修改头文件再重编译内核来扩大这个数目,但这似乎并不治本。

 

 

epoll的接口非常简单,一共就三个函数:

1.创建epoll句柄

       int epfd = epoll_create(intsize);                                                                   

       创建一个epoll的句柄,size用来告诉内核这个监听的数目一共有多大。

       这个参数不同于select()中的第一个参数,给出最大监听的fd+1的值。需要注意的是,当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。

函数声明:int epoll_create(int size)

该函数生成一个epoll专用的文件描述符。它其实是在内核申请一空间,用来存放你想关注的socket fd上是否发生以及发生了什么事件。size就是你在这个epoll fd上能关注的最大socket fd数。

2.将被监听的描述符添加到epoll句柄或从epool句柄中删除或者对监听事件进行修改。

函数声明:int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)

该函数用于控制某个epoll文件描述符上的事件,可以注册事件,修改事件,删除事件。

参数:

epfd:由 epoll_create 生成的epoll专用的文件描述符;

op:要进行的操作例如注册事件,可能的取值EPOLL_CTL_ADD 注册、EPOLL_CTL_MOD 修 改、EPOLL_CTL_DEL 删除

fd:关联的文件描述符;

event:指向epoll_event的指针;

如果调用成功返回0,不成功返回-1

   

int epoll_ctl(int epfd, intop, int fd, struct epoll_event*event); 

    epoll的事件注册函数,它不同与select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。

            第一个参数是epoll_create()的返回值,

            第二个参数表示动作,用三个宏来表示:

            EPOLL_CTL_ADD:       注册新的fd到epfd中;

          EPOLL_CTL_MOD:      修改已经注册的fd的监听事件;

            EPOLL_CTL_DEL:        从epfd中删除一个fd;

         第三个参数是需要监听的fd,

          第四个参数是告诉内核需要监听什么事件;

typedef union epoll_data 

{  

void *ptr;  

int fd;  

__uint32_t u32;  

__uint64_t u64;  

} epoll_data_t;  

  

struct epoll_event 

{  

__uint32_t events; /* Epoll events */  

epoll_data_t data; /* User data variable */  

};  

 

 

        events可以是以下几个宏的集合:

         EPOLLIN:            触发该事件,表示对应的文件描述符上有可读数据。(包括对端SOCKET正常关闭);

         EPOLLOUT:         触发该事件,表示对应的文件描述符上可以写数据;

        EPOLLPRI:           表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);

        EPOLLERR:         表示对应的文件描述符发生错误;

         EPOLLHUP:         表示对应的文件描述符被挂断;

        EPOLLET:           将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。

        EPOLLONESHOT:  只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里。

例如:

struct epoll_event ev;

//设置与要处理的事件相关的文件描述符

ev.data.fd=listenfd;

//设置要处理的事件类型,文件描述符上有可读数据或者将EPOLL设为边缘触发(Edge
Triggered)模式;

ev.events=EPOLLIN|EPOLLET;

//注册epoll事件

epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd,&ev);

3.等待事件触发,当超过timeout还没有事件触发时,就超时。

    int epoll_wait(int epfd, struct epoll_event * events, intmaxevents, int timeout);

    等待事件的产生,类似于select()调用。

参数events用来从内核得到事件的集合,maxevents告之内核这个events有多大(数组成员的个数),这个maxevents的值不能大于创建epoll_create()时的size,参数timeout是超时时间(毫秒,0会立即返回,-1将不确定,也有说法说是永久阻塞)。

    该函数返回需要处理的事件数目,如返回0表示已超时。

    返回的事件集合在events数组中,数组中实际存放的成员个数是函数的返回值。返回0表示已经超时。

函数声明:int epoll_wait(int epfd,struct epoll_event * events,int maxevents,int timeout)

该函数用于轮询I/O事件的发生;

参数:

epfd:由epoll_create 生成的epoll专用的文件描述符;

epoll_event:用于回传代处理事件的数组;

maxevents:每次能处理的事件数;

timeout:等待I/O事件发生的超时值(单位我也不太清楚);-1相当于阻塞,0相当于非阻塞。一般用-1即可

返回值: 返回发生事件数。

epoll_wait运行的原理:

等侍注册在epfd上的socket fd的事件的发生,如果发生则将发生的sokct fd和事件类型放入到events数组中。

并且将注册在epfd上的socket fd的事件类型给清空,所以如果下一个循环你还要关注这个socket fd的话,则需要用epoll_ctl(epfd,EPOLL_CTL_MOD,listenfd,&ev)来重新设置socket fd的事件类型。

这时不用EPOLL_CTL_ADD,因为socket fd并未清空,只是事件类型清空。这一步非常重要。

疑问:

EPOLLET:边缘触发(Edge Triggered)模式是什么意思?
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  linux