20.23/20.24/20.25 告警系统邮件引擎 20.26 运行告警系统
2018-03-28 09:26
501 查看
20.23/20.24/20.25 告警系统邮件引擎
因为之前做zabbix的时候,做过mail.py的脚本,在这里,直接调用进行使用就可以。但是告警邮件引擎核心,conf主配置文件调用到的都是"mail.sh" ,所以这里需要定义调用"mail.py"的sh脚本
mail.sh目的是做告警收敛,如果不想做告警收敛,在发现问题的时候直接告警就好,但是,可能会发生1分钟前发现问题,1分钟户问题解决,这样就会变成误报,这样会很麻烦
收敛的目的就是1分钟前发现问题,然后到10分钟后,服务还没有恢复,就会告诉管理人员10分钟了服务还未恢复
• mail.sh内容 //其中"mail.py"内容到这里下载https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D22Z/mail.py
#!/bin/bahs log=$1 t_s=`date +%s` t_s2=`date -d "2 hours ago" +%s` //定义2个小时的时间戳 #日志不存在就创建日志 if [ ! -f /tmp/$log ] then echo $t_s2 > /tmp/$log fi #下面这段,等同于一个计时器 t_s2=`tail -1 /tmp/$log|awk '{print $1}'` echo $t_s>>/tmp/$log v=$[$t_s-$t_s2] //时间戳对比 echo $v #当故障存在3600秒,就会进行告警 if [ $v -gt 3600 ] then ./mail.py $1 $2 $3 echo "0" > /tmp/$log.txt //等同于计数器 else if [ ! -f /tmp/$log.txt ] then echo "0" > /tmp/$log.txt fi nu=`cat /tmp/$log.txt` nu2=$[$nu+1] echo $nu2>/tmp/$log.txt if [ $nu2 -gt 10 ] then ./mail.py $1 "trouble continue 10 min $2" "$3" echo "0" > /tmp/$log.txt //邮件告警结束以后,重新开始计数 fi fi
该脚本运用于,间隔3600 故障;10分钟内故障;间歇性故障;
核心判断:计时、计数
20.26 运行告警系统
要执行告警系统,肯定要是每分钟,执行一次crontab -e * * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh
监控发送邮件的部分,尽量少用空格,因为mail.py发送邮件是以 空格来定义三个参数的
开始测试
定义好计划以后,重启计划
手动模拟生产一个错误的情况,测试监控是否生效,是否能正常发送邮件
改动 load的检测值为 -lt 10
最后发现,根本不会发送邮件。/tmp/目录下也不会产生所谓的计时和计数文件
相关文章推荐
- 20.23 20.4 20.5告警系统邮件引擎(上中下);20.26 运行告警系统
- 20.23/20.24/20.25 告警系统邮件引擎 运行告警系统
- 20.23-20.26 告警系统邮件引擎
- 十七周二次课 2018.02.26 告警系统邮件引擎、运行告警系统
- 告警系统邮件引擎、运行告警系统
- 【shell编程】告警系统邮件引擎和运行告警系统
- 告警系统邮件引擎 运行告警系统
- 告警系统邮件引擎、运行告警系统
- 告警系统邮件引擎、运行告警系统
- 告警系统邮件引擎 运行告警系统
- 告警系统邮件引擎,运行告警系统
- 告警系统邮件引擎、运行告警系统
- 告警系统邮件引擎、运行告警系统
- 告警系统邮件引擎
- 告警系统邮件引擎
- 告警系统邮件引擎
- 简单告警系统之邮件引擎
- 解决SiteWeaver SQL版在windows2008 x64平台下运行出现的缩略图组件无效、邮件发送组件无效和学籍系统出错问题
- 《shell脚本系统监控-------邮件告警》
- shell配置邮件告警系统