关于linux进程监听问题
2017-08-15 10:50
741 查看
目前在做一个zookeeper的集群管理,如果其中某一个挂了,及时重启。
所以采用crontab进程来每分钟执行一次脚本,查询zk进程,如果发现挂了马上重启。
脚本内容如下:
添加脚本后记得chmod 777 monitor.sh 为脚本添加执行权限
chkconfig --level 35 crond on 添加crond服务为开机自启
crontab -e编辑,并添加相关脚本配置(每分钟执行一次)。
脚本逻辑很简单,查询进程是否存在,如果不存在则重启,同时记录相关信息到log
tips:
过程中遇到一个问题搞了很久。手动运行脚本时发现
但是在crontab中运行时,却发现这个查询语句查询结果为3. 经过资料查询,可能是因为环境变量导致问题发送,所以
而多出的进程则可以发现是crontab的进程,因为脚本存放文件夹包含zookeeper所以查询到zookeeper相关进程包含了这些,所以给与屏蔽
经过修改,脚本运行正常。zk监听工作完成。
所以采用crontab进程来每分钟执行一次脚本,查询zk进程,如果发现挂了马上重启。
脚本内容如下:
#!/bin/sh PATH=/usr/lib64/qt-3.3/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/usr/local/jdk/bin:/usr/local/jdk/jre/bin:/home/zookeeper/bin:/home/zookeeper/conf:/root/bin proc_name="zookeeper" # 进程名 file_name="/home/zookeeper/monitor.log" # 日志文件 pid=0 proc_num() # 计算进程数 { num=`ps -ef | grep $proc_name | grep -v grep | grep -v /home/zookeeper | wc -l` return $num } proc_id() # 进程号 { pid=`ps -ef | grep $proc_name | grep -v grep | awk '{print $2}'` } proc_num number=$? echo `ps -ef | grep $proc_name` echo $PATH >> $file_name if [ $number -eq 0 ] # 判断进程是否存在 then cd /home/zookeeper/bin/; ./zkServer.sh start # 重启进程的命令,请相应修改 proc_id # 获取新进程号 echo ${pid}, `date` >> $file_name # 将新进程号和重启时间记录 fi
添加脚本后记得chmod 777 monitor.sh 为脚本添加执行权限
chkconfig --level 35 crond on 添加crond服务为开机自启
crontab -e编辑,并添加相关脚本配置(每分钟执行一次)。
*/1 * * * * /home/zookeeper/monitor.sh >/dev/null 2>&1 >> /home/zookeeper/monitor.logservice crond status查看进程是否启动,如果没有service crond start命令启动进程。
脚本逻辑很简单,查询进程是否存在,如果不存在则重启,同时记录相关信息到log
tips:
过程中遇到一个问题搞了很久。手动运行脚本时发现
ps -ef | grep $proc_name | grep -v grep | grep -v /home/zookeeper | wc -l查询语句的结果为0,代表没有相关进程,则会执行zk启动指令来重启zk。
但是在crontab中运行时,却发现这个查询语句查询结果为3. 经过资料查询,可能是因为环境变量导致问题发送,所以
echo `ps -ef | grep $proc_name` echo $PATH >> $file_name打印对应的进程和环境变量path。经过对比发现path不同,所以将环境变量统一,即在脚本开头加上PATH声明。
而多出的进程则可以发现是crontab的进程,因为脚本存放文件夹包含zookeeper所以查询到zookeeper相关进程包含了这些,所以给与屏蔽
grep -v /home/zookeeper
经过修改,脚本运行正常。zk监听工作完成。
相关文章推荐
- linux的一些基本命令(关于文件操作, 进程操作,以及/boot问题)
- 一个关于linux进程函数kill的问题
- linux系统下 fork()系统调用: 关于父子进程缓存问题的小坑
- 关于Oracle10.2.0自行启动两个监听进程导致服务中断问题
- 关于Linux下进程间使用共享内存和信号量通信的时的编译问题
- 关于Oracle10.2.0自行启动两个监听进程导致服务中断问题
- 关于Linux 进程 open too many files 的问题
- 菜鸟进程之关于Linux解压缩失败和jdk版本问题
- 关于linux服务器架设的问题
- 关于在neoshine linux下使用电视卡遇到的问题和总结
- 关于mysql在linux下面字符修改的问题
- linux下 APACHE 2.0 进程过多的问题
- 关于病毒模块插入系统、应用程序进程的问题
- 关于使用WindowsUpdate 或 Windows 自动升级时碰到的 svchost.exe 进程 CPU 资源占用过高的问题的相关信息
- 关于linux 僵尸进程
- 关于linux线程实时信号的一个问题
- 关于linux中mysql中编码的问题(UTF-8)
- 关于spoolsv.exe进程耗尽CPU资源问题的解决方法
- 关于Linux下中文显示不正常的问题的一点经验
- 关于病毒模块插入系统、应用程序进程的问题