告警信息多怎么办

我们可以调整下告警策略,减少告警通知数量,有时候告警消息多了,确实有些困扰,以下几种方式可以根据自己实际场景做调整
1、提高告警级别(v3.4.7或以上版本支持)
系统的默认告警级别defaultWarn为INFO(会发送告警级别INFO、WARN、ERROR的告警通知),我们可以提升告警级别为WARN(会发送告警级别WARN、ERROR的告警通知),甚至ERROR(会发送告警级别ERROR的告警通知)
如下配置文件server/config/application.yml,修改如下配置defaultWarn后,重启server生效
2、延长告警静默时间,默认是2小时,我们可以延长设置为4小时,或者6小时,或者8小时
告警静默时间,是指在该时间段同一条告警不会重复发送
如下配置文件server/config/application.yml,修改如下配置项warnCacheTimes后,重启server生效
若某个下线的告警资源恢复上线,则会清除该资源的告警缓存,再次下线后会继续告警
比如一个服务接口,下线后,2小时内不会重复发告警通知,但是如果它在2小时内上线了,再次下线,还是会发告警通知
如果它在2小时内一直处于下线状态,没有变化,则不会重复发告警通知
3、配置告警时间段(v3.3.9或以上版本支持)
比如我们想在周一到周五的早上8点到晚上8点,这个时间段接收告警通知,其他时间不接受告警
我们在配置文件server/config/application.yml,修改如下配置项后,重启server生效
如上是cron表达式,也可以进行其他配置,比如'* * 8-20 * * ?'表示每天的8点-20点发送告警,记得带单引号
4、我们可以把告警阈值设置大些,也可以关闭某些不重要的告警开关
告警阈值、开关、时间段、规则在哪儿配置修改
5、或者我们可以直接关闭告警总开关,关闭后,相当于关闭所有告警通知
6、也可以针对某个主机单独配置告警策略
针对一个或多个主机的告警阈值配置,点击此处查看