shell写的告警次数控制及恢复示例代码
更新时间:2013年02月04日 17:15:04 作者:
自己写的一个监控脚本,发现告警短信次数未控制时,垃圾短信N多。经过思考,做了个简单的控制,同一故障只发送二次。之后不再发送。恢复后发送恢复短信
俺也是新手,写的有点老土,权当练手了,供初学的朋友们参考吧。
#!/bin/bash
if [ $succ_ping -gt $((ping_count-1)) ];then
if [ -f ./alarm_file/alarm_$host ];then
rm -rf ./alarm_file/alarm_$host
#发送故障消除短信通知--调用insert_table
messages="$host服务器通迅恢复正常`date "+%Y%m%d %H:%M:%S"`"
echo "$messages" >>./log/ping_err_recover.log
insert_table
else
echo "本次检测结果---->$host服务器ping检测正常"
echo "`date "+%Y%m%d %H:%M:%S"`--->$host服务器ping检测正常,ping次数$ping_count,接收$succ_ping" >>./log/ping_log
fi
else
echo "本次检测结果---->$host服务器有丢包现象,丢包率为:$loss_ping"
messages="`date "+%Y%m%d %H:%M:%S"`--->$host服务器有丢包现象,丢包率为:$loss_ping"
#对警次数进行处理,超过2次将不告警
#格式host a(告警次数)
#已经出现告警的次数加1
echo "告警服务器为$host"
if [ -f ./alarm_file/alarm_$host ];then
#取出当前的告警次数并加1
a=`awk '{print$2}' ./alarm_file/alarm_$host`
b=$(($a+1))
echo "$host $b" >./alarm_file/alarm_$host
alarm_count=`awk '{print$2}' ./alarm_file/alarm_$host`
if [ $alarm_count -gt $sms_count ];then
echo "超过2次不发送短信"
echo "`date "+%Y%m%d %H:%M:%S"`--->$host服务器有丢包现象,接收$succ_ping,丢包率为:$loss_ping,超过二次不发送。" >>./log/ping_err_log
else
#未超过2次调用insert_table函数发送短信
echo "未超过2次"
echo "`date "+%Y%m%d %H:%M:%S"`--->$host服务器有丢包现象,接收$succ_ping,丢包率为:$loss_ping">>./log/ping_err_log
insert_table
fi
else
#第一次告警
echo "第一次告警"
echo "$host 1" >./alarm_file/alarm_$host
insert_table
echo "`date "+%Y%m%d %H:%M:%S"`--->$host服务器有丢包现象,接收$succ_ping,丢包率为:$loss_ping" >>./log/ping_err_log
fi
fi
done
复制代码 代码如下:
#!/bin/bash
if [ $succ_ping -gt $((ping_count-1)) ];then
if [ -f ./alarm_file/alarm_$host ];then
rm -rf ./alarm_file/alarm_$host
#发送故障消除短信通知--调用insert_table
messages="$host服务器通迅恢复正常`date "+%Y%m%d %H:%M:%S"`"
echo "$messages" >>./log/ping_err_recover.log
insert_table
else
echo "本次检测结果---->$host服务器ping检测正常"
echo "`date "+%Y%m%d %H:%M:%S"`--->$host服务器ping检测正常,ping次数$ping_count,接收$succ_ping" >>./log/ping_log
fi
else
echo "本次检测结果---->$host服务器有丢包现象,丢包率为:$loss_ping"
messages="`date "+%Y%m%d %H:%M:%S"`--->$host服务器有丢包现象,丢包率为:$loss_ping"
#对警次数进行处理,超过2次将不告警
#格式host a(告警次数)
#已经出现告警的次数加1
echo "告警服务器为$host"
if [ -f ./alarm_file/alarm_$host ];then
#取出当前的告警次数并加1
a=`awk '{print$2}' ./alarm_file/alarm_$host`
b=$(($a+1))
echo "$host $b" >./alarm_file/alarm_$host
alarm_count=`awk '{print$2}' ./alarm_file/alarm_$host`
if [ $alarm_count -gt $sms_count ];then
echo "超过2次不发送短信"
echo "`date "+%Y%m%d %H:%M:%S"`--->$host服务器有丢包现象,接收$succ_ping,丢包率为:$loss_ping,超过二次不发送。" >>./log/ping_err_log
else
#未超过2次调用insert_table函数发送短信
echo "未超过2次"
echo "`date "+%Y%m%d %H:%M:%S"`--->$host服务器有丢包现象,接收$succ_ping,丢包率为:$loss_ping">>./log/ping_err_log
insert_table
fi
else
#第一次告警
echo "第一次告警"
echo "$host 1" >./alarm_file/alarm_$host
insert_table
echo "`date "+%Y%m%d %H:%M:%S"`--->$host服务器有丢包现象,接收$succ_ping,丢包率为:$loss_ping" >>./log/ping_err_log
fi
fi
done
相关文章
使用ubuntu搭建公网个人邮件服务器(基于postfix,dovecot,mysql)
这篇文章主要介绍了基于ubuntu搭建公网个人邮件服务器(基于postfix,dovecot,mysql),免费的邮箱每天发信数量是有限制的,所以呢就想着搭建一个自己的邮件服务器,需要的朋友可以参考下2019-06-06
Linux下is not in the sudoers file的解决
当我们使用sudo命令切换用户的时候可能会遇到提示以下错误:用户名 is not in the sudoers file.本文给大家分享原因分析及解决方案,感兴趣的朋友跟随小编一起看看吧2023-02-02
Linux crontab定时执行Shell脚本需要执行特定的命令时解决思路
今天小编就为大家分享一篇关于Linux crontab定时执行Shell脚本需要执行特定的命令时解决思路,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧2019-01-01


最新评论