您的位置:首页 > 其它

如何监视一个进程,崩溃挂掉后自动重启

2013-05-09 14:14 3479 查看


如何监视一个进程,崩溃挂掉后自动重启

2011-03-21 20:53 1783人阅读 评论(0) 收藏 举报

shell脚本服务器bashpathwindows

如何保证服务一直运行?如何保证即使服务挂掉了也能自动重启?在写服务程序时经常会碰到这样的问题。

shell脚本

下面的shell通过一个while-do循环,用ps -ef|grep 检查loader进程是否正在运行,如果没有运行,则启动,这样就保证了崩溃挂掉的进程重新被及时启动。

必须注意两点:

1、ps |grep 一个进程时必须加上其路劲,否则容易grep到错误的结果;

2、必须用 -v 从结果中去除grep命令自身,否则结果非空。

#!/bin/sh

echo "Current DIR is " $PWD

while [ 1 ]

do

propserverpid=`ps -ef|grep propserver|grep 6668|grep -v grep|awk '{print $2}'`

if [ "$propserverpid" ]

then

echo "propserver is running,pid is " $propserverpid

kill -9 $propserverpid

else

echo "propserver is down ,now starting ..."

nohup $PWD/propserver -c config.ini -p 6668 &
fi

sleep 5

done

如果启动此shell时发现进程已经存在,说明以别的方式启动了进程而不是此shell,那么它会持续提醒找到进程,解决办法是,要么只用此shell启动服务,要么一经发现以其他方式启动的服务即kill掉,上面的语句就是这么干的:

kill -9 $pidof $PWD/loader

另外运行脚本是老是提示这个错误:

: bad interpreter: 没有那个文件或目录

查了下解释如下

这种情况常见于通过windows平台传递shell脚本,导致bash编码出错,但这次是两台linux服务器通过ftp来传递的,应该不会出现这种问题,算了不管~问题出现了就先解决!

解决方法:

废话少说,直奔主题!

1.在新服务器中新建shell脚本文件。

# vi jobak

2.将原来服务器上的shell脚本的内容复制到刚刚创建的脚本文件,保存退出。

3.修改shell脚本的执行权限属性等等,这个自由发挥。

///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

exec+fork方式

笔者最终采用的exec+fork方式来实现的,具体思想如下:

1,exec函数把当前进程替换为一个新的进程,新进程由path或file参数指定。可以使用exec函数将程序的执行从一个程序切换到另一个程序;

2,fork函数是创建一个新的进程,在进程表中创建一个新的表项,而创建者(即父进程)按原来的流程继续执行,子进程执行自己的控制流程;

3,wait 当fork启动一个子进程时,子进程就有了它自己的生命周期并将独立运行,我们可以在父进程中调用wait函数让父进程等待子进程的结束;

相信介绍到这里,读者已经能够想到解决方法了:1)首先使用fork系统调用,创建子进程,2)在子进程中使用exec函数,执行需要自动重启的程序,3) 在父进程中执行wait等待子进程的结束,然后重新创建一个新的子进程。

使用方法:

点击隐藏BASH CODE
#./portmap 需要监控的程序的路径
#args portmap 需要的参数
$ ./supervisor ./portmap  args.....


代码如下:

#include <stdio.h>

#include <unistd.h>

#include <errno.h>

#include <string.h>

#include <sys/types.h>

#include <sys/wait.h>

#include <stdlib.h>

int

main(int argc, char **argv)

{

int ret, i, status;

char *child_argv[100] = {0};

pid_t pid;

if (argc < 2) {

fprintf(stderr, "Usage:%s <exe_path> <args...>/n", argv[0]);

return -1;

}

for (i = 1; i < argc; ++i) {

child_argv[i-1] = (char *)malloc(strlen(argv[i])+1);

strncpy(child_argv[i-1], argv[i], strlen(argv[i]));

child_argv[i-1][strlen(argv[i])] = '/0';

}

while(1){

pid = fork();

if (pid == -1) {

fprintf(stderr, "fork() error.errno:%d error:%s/n", errno, strerror(errno));

break;

}

if (pid == 0) {

ret = execv(child_argv[0], (char **)child_argv);

//ret = execl(child_argv[0], "portmap", NULL, 0);

if (ret < 0) {

fprintf(stderr, "execv ret:%d errno:%d error:%s/n", ret, errno, strerror(errno));

continue;

}

exit(0);

}

if (pid > 0) {

pid = wait(&status);

fprintf(stdout, "wait return");

}

}

return 0;

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: