告警信息多怎么办

我们可以调整下告警策略,减少告警通知数量,有时候告警消息多了,确实有些困扰,以下几种方式可以根据自己实际场景做调整
1、延长告警静默时间,默认是2小时,我们可以延长设置为4小时,或者6小时,或者8小时
告警静默时间,是指在该时间段同一条告警不会重复发送
如下配置文件server/config/application.yml,修改如下配置项warnCacheTimes后,重启server生效

#告警缓存时间间隔(此时间段内同一告警通知不再重复发),单位秒,默认120分钟。此期间只是不推送告警到第三方(邮件钉钉微信等)了,系统监控扫描工作仍正常进行
  warnCacheTimes: 7200
	
若某个下线的告警资源恢复上线,则会清除该资源的告警缓存,再次下线后会继续告警。
比如一个服务接口,下线后,2小时内不会重复发告警通知,但是如果它在2小时内上线了,再次下线,还是会发告警通知
如果它在2小时内一直处于下线状态,没有变化,则不会重复发告警通知
2、配置告警时间段(v3.3.9或以上版本支持)
比如我们想在周一到周五的早上8点到晚上8点,这个时间段接收告警通知,其他时间不接受告警
我们在配置文件server/config/application.yml,修改如下配置项后,重启server生效

#告警时间段cron表达式设置(在该时间段内发送告警,其他时间不发),默认为空会持续发送,如'* * 8-20 ? * MON-FRI'表示周1到周5的8点-20点发送告警,'* * 8-20 * * ?'表示每天的8点-20点发送告警,带单引号
  warnCronTime: '* * 8-20 ? * MON-FRI'
	
如上是cron表达式,也可以进行其他配置,比如'* * 8-20 * * ?'表示每天的8点-20点发送告警,记得带单引号
3、我们可以把告警阈值设置大些,也可以关闭某些不重要的告警开关
告警阈值、开关、时间段、规则在哪儿配置修改
4、或者我们可以直接关闭告警总开关,关闭后,相当于关闭所有告警通知

#告警总开关,yes开启,no关闭
  allWarnMail: yes
	
5、也可以针对某个主机单独配置告警策略
针对一个或多个主机的告警阈值配置,点击此处查看