更新时间:2024-06-20 GMT+08:00
磁盘监控告警阈值太低,告警频繁
问题现象
DWS集群磁盘使用率达到80%就出现告警,告警频繁。
原因分析
集群配置的告警监控阈值不合理。
处理方法
可在GaussDB(DWS)管理控制台设置告警的触发条件,指定达到磁盘使用率、告警持续时间及告警频次。
集群磁盘使用率达到90%就会触发集群只读,需要预留时间来处理问题,避免使用率达到只读阈值。
- 登录GaussDB(DWS) 管理控制台。
- 在左侧导航栏,单击“告警管理”,切换至“告警”页签。
- 单击左上角的“查看告警规则”按钮,进入告警规则页面。
- 在指定告警规则名称所在行操作列,单击“修改”按钮进入修改告警规则页面。将触发条件修改为平均值大于90%,抑制条件修改为“每1天告警一次”。(此处仅做举例,实际情况以业务诉求为准。)
- 触发条件:定义对监控指标做阈值判断的计算规则。目前主要使用一段时间内的平均值来降低告警震荡的几率。
- 抑制条件:在指定的时间段内,抑制同类型告警的反复触发和消除。
图1 设置告警规则
父主题: 集群异常