文档首页/ 数据仓库服务 GaussDB(DWS)/ 故障排除/ 集群异常/ 磁盘监控告警阈值太低,告警频繁
更新时间:2024-07-01 GMT+08:00

磁盘监控告警阈值太低,告警频繁

问题现象

DWS集群磁盘使用率达到80%就出现告警,告警频繁。

原因分析

集群配置的告警监控阈值不合理。

处理方法

可在GaussDB(DWS)管理控制台设置告警的触发条件,指定达到磁盘使用率、告警持续时间及告警频次。

集群磁盘使用率达到90%就会触发集群只读,需要预留时间来处理问题,避免使用率达到只读阈值。

  1. 登录GaussDB(DWS) 管理控制台。
  2. 在左侧导航栏,单击“告警管理”,切换至“告警”页签。
  3. 单击左上角的“查看告警规则”按钮,进入告警规则页面。
  4. 在指定告警规则名称所在行操作列,单击“修改”按钮进入修改告警规则页面。将触发条件修改为平均值大于90%,抑制条件修改为“每1天告警一次”。(此处仅做举例,实际情况以业务诉求为准。)
    • 触发条件:定义对监控指标做阈值判断的计算规则。目前主要使用一段时间内的平均值来降低告警震荡的几率。
    • 抑制条件:在指定的时间段内,抑制同类型告警的反复触发和消除。
    图1 设置告警规则