您的位置:首页 > 运维架构 > Linux

小议Linux中的僵死进程

2014-01-02 21:19 155 查看
在读《unix环境高级编程》时,发现忽然对僵死进程的处理机制很感兴趣,经过查阅资料弄清楚了其中的原理,在这里做一个记录。

1.一个进程的离去

在一个进程调用 exit 函数,或者 return 语句,或者是调用 abort 等函数终止后,总之不管进程是怎样终止的,它们在终止之后,都会去执行内核中的一个代码片断。这个代码片断负责关闭终止进程打开的文件描述符,释放终止进程占用的内存空间。但是,是否终止进程在系统中就从此消失,以后该进程在系统中,就再也找不到这个终止进程的一点踪影呢,答案是否定的。

2.僵死进程

一个进程在终止之后,会释放它所占用的一切资源。但是会在进程表中保留该进程的一些生前的信息,比如进程ID,进程使用的CPU时间,退出状态等。这时这个终止进程的状态就称之为僵死状态,它要等待它的父进程来为它收尸。这时候在 linux 系统中,僵死进程的状态被打印为 ‘Z’,它的父进程通过调用 wait 或者是 waitpid 函数来为其善后。

3.动手做,理解僵死进程

僵死进程是怎么产生的呢?这是因为,在一个程序中,不断的调用fork函数,却没有调用 wait 或者 waitpid 函数来做清除工作,而该程序又没有终止,这样就会在系统中产生僵死进程。解释了这么多概念,不如给一个例子可能会更加的清晰,下面的一个例子用来在系统中产生僵死进程:
#include <stdio.h>
#include <unistd.h>

int main(void)
{
        pid_t pid;

        while(1)
        {
                if( (pid=fork())<0 )
                {
                        printf("fork error\n");
                        return -1;
                }
                else if( pid==0 )
                {
                        printf("child\n");
                        _exit(0);
                }
                else
                {
                        sleep(1);
                }
        }

        return 0;
}


将程序编译完成之后,执行,会每隔1秒钟产生一个子进程。在子进程中输出提示信息 child 之后就立即退出。这个程序在执行的时候,我们再开一个终端,输入命令:
ps aux | grep 'Z'


可以看到输出结果如下:
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
asus      3213  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3214  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3215  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3217  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3271  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3272  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3273  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3274  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3275  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3276  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3277  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3282  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3343  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>
asus      3344  0.0  0.0      0     0 pts/0    Z+   20:54   0:00 [a.out] <defunct>


我们可以看到这些进程的STAT都为僵死进程。如果我们按 ctrl+c 把执行的程序终止,再次执行这个命令,会发现在系统中所有产生的僵死进程都消失了。

感觉很奇怪吧,既然这些僵死进程都消失了,那么就一定有一个进程为系统种的僵死进程收尸,这个进程就是 init 进程,它的PID为1。原来在 linux 中,当一个进程的父进程终止时,这个进程就成为了孤儿进程,那么 init 进程就是一个好心的人了,它专门收养孤儿进程。而 init 进程又被实现为,当它有一个子进程终止时,就立即调用 wait 函数来善后。所以就我们刚才的例子来说,当我们把程序终止后,所有僵死进程的父进程就变成了 init,而 init 发现,哦,原来你们都是僵死进程啊,所以它给每一个僵死进程调用
wait 函数,是使它们能够安心离去。init 进程的这种实现方式使得 linux 系统中的僵死进程不会太多。当然,如果这个程序永远不终止,那么系统中的僵死进程就会越来越多。

注意:一个僵死进程在内存中已经没有程序的正文和数据,所以不能使用 kill 来杀死一个僵死的进程。只能通过杀死僵死进程的父进程来清除僵死进程,或者在父进程中调用wait或waipid函数来清除。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: