您的位置:首页 > 运维架构

check_mk自定义监控插件监控IIS站点的性能计数器

2014-01-01 19:58 447 查看
场景:Web站点部分是IIS下的站点,IIS不像apache,nginx提供了status模块,可以直接通过web或nagios监控到站点的当前连接数等情况。
监控服务器是CentOS 6.3+Cacti+Nagios+check_mk 。以下简称监控服务器

所有的Windows服务器用check_mk-agent监控。以下简称监控客户端

任务:打算利用check_mk-agent的插件来监控IIS的性能数据

Windows 客户端监控插件:
由于check_mk_agent支持bat.vbs,exe的客户端插件,

最初打算用wmic实现。
C:\Program Files\check_mk\plugins\下创建w3svc_perf.bat 内容为:
@echo off
echo ^<^<^<w3svc_perf^>^>^>
wmic path Win32_PerfRawData_W3SVC_WebService get Name,currentanonymoususers,currentconnections,currentISAPIExtensionrequests /format:csv
这里只取当前连接数,当前匿名用户数,当前ISAPI请求数。
保存后重启check_mk_agent服务。
在监控服务器上执行cmk -d 监控客户端IP
得到如下内容
...........
...........
...........
[[[System]]]
[[[Windows PowerShell]]]
<<<w3svc_perf>>>
_Total,16,605,16
xxx.xxx.com,0,10,0
xxx.xxx.com,4,88,4
xxx.xxx.com,12,507,12
awstats,0,0,0
<<<local>>>
<<<mrpe>>>
<<<systemtime>>>
1388575521
但是执行多次发现 有的时候 <<<w3svc_perf>>>下有一个空行,有的时候没有。不知道问题在哪里
不晓得哪个给解释一下。逐放弃wmic bat插件 改用wmi
C:\Program Files\check_mk\plugins\下创建w3svc_perf.vbs内容如下:

' w3svc_perf.vbs
On Error Resume Next
Dim objWMIService, objItem, colItems, strComputer
Dim WshNetwork : Set WshNetwork = CreateObject("WScript.Network")
Dim Hostname : HostName = WshNetwork.ComputerName
strComputer = "."
Wscript.Echo "<<<w3svc_perf>>>"
Set objWMIService = GetObject("winmgmts:\\" & strComputer & "\root\CIMV2")
Set colItems = objWMIService.ExecQuery("select name,CurrentAnonymousUsers,CurrentConnections,CurrentISAPIExtensionRequests from Win32_PerfRawData_W3SVC_WebService",,48)
For Each objItem in colItems
Wscript.Echo objItem.Name & "," & objItem.CurrentAnonymousUsers & "," & objItem.CurrentConnections & "," & objItem.CurrentISAPIExtensionRequests
Next
WSCript.Quit


在监控服务器上执行cmk -d 监控客户端IP
得到正常结果,反复执行后<<<w3svc_perf>>>下无空行
在监控服务器/usr/share/check_mk/checks下创建w3svc_perf,内容为:

#!/usr/bin/python
# -*- encoding: utf-8; py-indent-offset: 4 -*-
#创建库存函数
def inventory_w3svc_perf(checkname,info):
inventory = []
print info:
return inventory
#创建监控check函数
def check_w3svc_perf(item, params, info):
return (0,"test ok")
#创建check类型(在check_info字典中添加新的check库存,check函数以及是否出性能图)
check_info['w3svc_perf'] = (check_w3svc_perf, "w3svc%s", 1, inventory_w3svc_perf)


cmk -L |grep w3svc_perf

w3svc_perf            tcp      yes    yes    w3svc%s
可以看到已经添加新的check类型了。
根据print info断代码的返回,可以看出,客户端插件返回的
<<<w3svc_perf>>>
_Total,16,605,16
xxx.xxx.com,0,10,0
xxx.xxx.com,4,88,4
xxx.xxx.com,12,507,12
awstats,0,0,0
部分内容 被作为参数info传递到服务端的监控插件的库存以及check函数中。且为一个列表返回。用cmk --checks=w3svc_perf -I 监控客户端 可以看到上述的print info的返回值
[['_Total,12,667,12'],
['xxx.xxx.com,1,21,1'],
['xxx.xxx.com,0,112,0'],
['xxx.xxx.com,11,534,11'],
['awstats,0,0,0']]
有了这个print的调试结果,既可对返回值进行解析处理了,修改后的监控/usr/share/check_mk/checks/w3svc_perf,内容为:
#!/usr/bin/python
# -*- encoding: utf-8; py-indent-offset: 4 -*-
w3svc_perf_default_values=(2048,1024,2048,2014,1024,512)
def inventory_w3svc_perf(checkname,info):
inventory = []
#测试输出
#     for line in info:
#        temperfdata = " ".join(line).split(",")
#        webname= tempperfdata[0]
#        curuser = int(tempperfdata[1])
#        curconn = int(tempperfdata[2])
#        curisapi = int(tempperfdata[3])
#        print "webname ,%s,curuser,%d,curconn,%d,curisapi,%d"%(webname,curuser,curconn,curisapi)
inventory.append('sessions',w3svc_perf_default_values)
return inventory
def check_w3svc_perf(item, params, info):
curusercri,curuserwrn,curconncri,curconnwrn,curisapicri,curisapiwrn = params
for line in info:
tempperfdata = " ".join(line).split(",")
webname= tempperfdata[0]
curuser = tempperfdata[1]
curconn = tempperfdata[2]
curisapi = tempperfdata[3]
if   int(curuser) > int(curusercri):
infos[0]="Critical -%s:curuser=%d,(Crit) > %d."\
%(webname,int(curuser),int(curusercri))
state=1
elif int(curuser) > int(curuserwrn):
state=2
infos[0]="Warning -%s:curuser=%d,(Warn > %d)."%\
(webname,int(curuser),int(curuserwrn))
elif int(curconn) > int(curconncri):
state=1
infos[1]="Critical -%s:curconn=%d,(Crit > %d)."%\
(webname,int(curconn),int(curconncri))
elif int(curconn) > int(curconnwrn):
state=2
infos[1]="Warning -%s:curconn=%d,(Warn > %d)."%\
(webname,int(curconn),int(curconnwrn))
elif int(curisapi) > int(curisapicri):
state=1
infos[2]="Critical -%s:curisapi=%d,(Crit > %d)."%\
(webname,int(curisapi),int(curisapicri))
elif int(curisapi) > int(curisapiwrn):
state=2
infos[2]="Warning -%s:curisapi=%d,(Warn > %d)."%\
(webname,int(curisapi),int(curisapiwrn))
else:
state=0
infos[0]="OK,webname:%s,curuser:%d,curconn:%d,curisapi:%d"%\
(webname,int(curuser),int(curconn),int(curisapi))
infotext="".join(infos)
return (state,infotext)
check_info['w3svc_perf'] = (check_w3svc_perf, "w3svc%s", 1, inventory_w3svc_perf)
最后执行cmk-I && cmk -U && cmk -O

http://serverip/check_mk/中看





竟然看到的状态是unkow 返回值也不是预想的那种循环遍历所有站点的性能值返回,而是把info列表的第一个值取出返回了。继续调试。。。。。
烦请写过check_mk插件的兄弟伙给指条明路

checks 做了修改

―――――――――――――20140108――――――――――――――――――――――――-
#!/usr/bin/python
# -*- encoding: utf-8; py-indent-offset: 4 -*-
# the agent info
#<<<w3svc_perf>>>
#_Total,8,586,8
#xxxx.xxx.com,0,11,0
#yyyy.xxx.com,0,48,0
#zzzz.xxx.com,8,527,8
#this line not agent return
#webname,curuser,curconn,curisapi
w3svc_perf_default_values=(2048,1024) #警告,严重阙值的默认值,可在main.mk中
#用w3svc_perf_default_values = (1500, 1600)
#修改
def inventory_w3svc_perf(info):
inventory = []
for line in info:
tempperfdata = " ".join(line).split(",")
webname= tempperfdata[0]
curuser = int(tempperfdata[1])
curconn = int(tempperfdata[2])
curisapi = int(tempperfdata[3])
inventory.append(('w3svc:'+webname,w3svc_perf_default_values))   \
#检查入库,用元组入库,直接'w3svc:'+webname,w3svc_perf_default_values\
#入库不得遍历
return inventory #返回库
def check_w3svc_perf(item,params,info):
cri,wrn = params #定义警告和严重的阙值
for line in info:
tempperfdata = " ".join(line).split(",")
webname = tempperfdata[0]
curuser = tempperfdata[1]
curconn = tempperfdata[2]
curisapi = tempperfdata[3]
infos=[] #定义输出内容的空数组
state=0
if int(curuser) > int(wrn) :
if   int(curuser) > int(cri):
state=2
infos.append("Crit!,%s_Curuser=%d >cri[%d]"\
%(webname,int(curuser),cri))
else :
state=1
infos.append("Warn!,%s_Curuser=%d >wrn[%d]"\
%(webname,int(curuser),wrn))
elif int(curconn) > int(wrn) :
if   int(curconn) > int(cri):
state=2
infos.append("Crit!,%s_Curconn=%d >cri[%d]"\
%(webname,int(curconn),cri))
else :
state=1
infos.append("Warn!,%s_Curconn=%d >wrn[%d]"\
%(webname,int(curconn),wrn))
elif int(curisapi) > int(wrn)  :
if   int(curisapi) > int(cri):
state=2
infos.append("Crit!,%s_Curisapi=%d >cri[%d]"\
%(webname,int(curisapi),cri))
else :
state=1
infos.append("Warn!,%s_Curisapi=%d >wrn[%d]"\
%(webname,int(curisapi),wrn))
else:
state=0
infos.append("OK!!webname=%s,curuser=%d,curconn=%d,curisapi=%d"\
%(webname,int(curuser),int(curconn),int(curisapi)))
infotext="".join(infos)
if infotext.find(item.split(':')[1]) > -1:#判断item是否在输出内容,并切分\
#后输出。
return (state, infotext)
check_info['w3svc_perf'] = (check_w3svc_perf, "%s", 1, inventory_w3svc_perf)


效果图



cmk -P create w3svc_perf
cmk -P pack w3svc_perf
打包为mkp文件 可直接cmk -P install 安装
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: