【Linux案例】处理僵尸进程defunct

浅议Unix的defunct进程(“僵尸”进程)

在Unix系统管理中，当用ps命令观察进程的执行状态时，经常看到某些进程的状态栏为defunct，这就是所谓的“僵尸”进程。“僵尸”进程是一个早已死亡的进程，但在进程表（processs table）中仍占了一个位置（slot）。由于进程表的容量是有限的，所以，defunct进程不仅占用系统的内存资源，影响系统的性能，而且如果其数目太多，还会导致系统瘫痪。

我们知道，每个Unix进程在进程表里都有一个进入点（entry），核心程序执行该进程时使用到的一切信息都存储在进入点。当用ps命令察看系统中的进程信息时，看到的就是进程表中的相关数据。当以fork()系统调用建立一个新的进程后，核心进程就会在进程表中给这个新进程分配一个进入点，然后将相关信息存储在该进入点所对应的进程表内。这些信息中有一项是其父进程的识别码。当这个进程走完了自己的生命周期后，它会执行exit()系统调用，此时原来进程表中的数据会被该进程的退出码（exit code）、执行时所用的CPU时间等数据所取代，这些数据会一直保留到系统将它传递给它的父进程为止。由此可见，defunct进程的出现时间是在子进程终止后，但是父进程尚未读取这些数据之前。利用这一点我们可以用下面的程序建立一个defunct 进程：

#include <stdio.h>

#include<sys/types.h>

main(){

if(!fork()){

printf(“child pid=%d”, getpid());

exit(0)

}

sleep(20);

printf(“parent pid=%d ”, getpid());

exit(0);

}

当上述程序以后台的方式执行时，第8行强迫程序睡眠20秒，让用户有时间输入ps -e指令，观察进程的状态。当父进程执行终止后，再用ps -e命令观察时，我们会发现defunct进程也随之消失。这是因为父进程终止后，init 进程会接管父进程留下的这些“孤儿进程”（orphan process），而这些“孤儿进程”执行完后，它在进程表中的进入点将被删除。如果一个程序设计上有缺陷，就可能导致某个进程的父进程一直处于睡眠状态或是陷入死循环，那么当该子进程执行结束后就变成了defunct进程，这个defunct 进程可能会一直留在系统中直到系统重新启动。

如果我们将上述程序略作修改，在第8行sleep()系统调用前执行wait()或waitpid()系统调用，则子进程在终止后会立即把它在进程表中的数据返回给父进程，此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。

由于调度程序无法选中Defunct 进程，所以不能用kill命令删除Defunct 进程，惟一的方法只有重启系统。

如何清除系统中的defunct进程：

kill -9能杀掉的，就不是defunct进程了。
defunct进程是杀不掉的。要解决问题，不能从kill上去考虑。

如果子进程死了，父进程没有给子进程收尸，子进程就会变成僵尸进程。明白僵尸进程是怎么产生的就好办了。

如果你的系统里太多defunct，说明在系统里运行的某个软件的编程技术不过关。可以用ps查找这些defunct进程的父进程，把父进程干掉，defunct就会全部消失。如果父进程是自己写的，就去好好找找bug，改善程序；如果是别人写的，这样的软件就不要去用它了。

原文链接：

http://blog.163.com/earthman_h/blog/static/203630119201241743819737/

标签：案例僵尸进程技巧 linux defunct

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。