文档首页/ 数据仓库服务 GaussDB(DWS)/ 用户指南/ GaussDB(DWS)集群运维/ 查看GaussDB(DWS)集群告警/ 告警处理/ DWS_2000000012 节点数据盘时延超阈值(Node Data Disk Latency Exceeds the Threshold)
更新时间:2024-11-05 GMT+08:00
分享

DWS_2000000012 节点数据盘时延超阈值(Node Data Disk Latency Exceeds the Threshold)

告警解释

GaussDB(DWS)每30秒采集集群各节点的数据盘时延。如果某节点的某数据盘最近10分钟(可配置)内的平均时延超过400ms(可配置),则上报节点数据盘时延超阈值告警;如果平均使用率低于400ms,则消除告警。

如果节点数据盘时延一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。

告警属性

告警ID

告警归属

告警级别

告警类型

业务类型

是否可自动清除

DWS_2000000012

管理面

>400ms 重要

操作告警

数据仓库服务

告警参数

类别

参数名称

参数含义

定位信息

名称

DWS集群节点数据盘时延超阈值。

类型

操作告警。

发生时间

告警发生时间。

附加信息

集群ID

集群resourceId、domain_id等详细信息。

对系统的影响

磁盘时延高会导致集群性能下降,影响数据的读写速度,可能对业务产生影响。

可能原因

数据库处于业务高峰,存在大量的读写请求,导致磁盘响应慢,时延较高。

处理步骤

  1. 进入集群 > 专属集群页面,单击指定集群所在行操作列的“监控面板”按钮进入触发告警的集群的监控面板。
  2. 在左侧导航栏选择“监控>节点监控”,进入节点监控页面查看CPU使用率、磁盘使用率、内存使用率等信息。

    如果CPU使用率、磁盘I/O速率高,则说明集群处于业务高峰期,用户可结合自身业务情况调整时延阈值,请参见3

  3. 返回控制台首页,在左导航栏选择“监控 > 告警”,切换至“告警”页签,单击左上角的“告警规则管理”按钮,进入告警规则页面。
  4. 在“节点数据盘时延告警”规则所在行操作列,单击“修改”按钮进入修改告警规则页面,修改其阈值。

告警清除

数据盘时延下降后,自动消除告警。

相关文档