自定义监控项使用说明(需要升级到v3.4.1或以上)

用来实现我们的特殊需求场景,比如监测某个文件的大小,定期执行计划任务,某个文件夹下的文件数量,文件被篡改后自动恢复,甚至监控GPU数值等
1、其原理就是agent会定时(默认10分钟)执行用户输入的脚本或指令,脚本或指令最后一行返回一个数字(整型或浮点型都可)即可,不返回也可以
定时扫描时间也可以修改,在agent/config/application.properties,找到如下配置
#自定义监控项监控间隔时间,单位秒,默认10分钟,此功能需要升级到专业版
customDataSeconds=600
修改后,重启agent生效
2、server会对数字存贮,逐渐形成趋势图表,也支持对返回结果的告警表达式,只要告警表达式成立就会告警通知
agent上报时会对返回的值做一些符号处理,比如会把换行和空格替换为空,如果需要保留比如空格的话,我们可以自己处理下,比如把空格替换为冒号或下划线
在server/config/application.yml,找到如下配置
  #自定义监控项告警开关,yes开启,no关闭
  customInfoWarnMail: yes
修改后,重启server生效
3、执行的指令或脚本,不输出数值也可以,甚至输出字符串也可以的(那就不能使用告警表达式了),建议指令或脚本执行时间不要超过10s或直接后台运行
4、自定义监控项视频
5、一个例子,使用自定义监控项实现监测mysql主从节点同步状态是否正常
6、如下例子是使用shell脚本实时统计server运行中产生的日志文件数量,bat脚本也是可以的
/wgcloud/countServerLogs.sh,内容如下
#!/bin/sh
cd /wgcloud/wgcloud-v3.4.1/server/log
ls -l | grep "^-" | wc -l
自定义监控项,添加页面内容如下
自定义监控项列表页面内容如下