文档首页/ 数据仓库服务 GaussDB(DWS)/ 管理指南/ GaussDB(DWS)集群运维/ 查看GaussDB(DWS)集群告警/ 告警处理/ DWS_2000000020 集群的SQL探针耗时超阈值(SQL probe of the cluster Usage Exceeds the Threshold)
更新时间:2024-10-08 GMT+08:00

DWS_2000000020 集群的SQL探针耗时超阈值(SQL probe of the cluster Usage Exceeds the Threshold)

告警解释

GaussDB(DWS)每30秒采集集群各节点SQL探针的执行情况。如果存在任意集群的任意主机存在SQL探针执行耗时超过2倍阈值(可配置),则上报集群的SQL探针耗时超阈值的紧急告警;如果所有SQL探针执行耗时不超过该阈值,则消除该紧急告警。

如果存在SQL探针耗时一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。

告警属性

告警ID

告警归属

告警级别

告警类型

业务类型

是否可自动清除

DWS_2000000020

管理面

重要

操作告警

数据仓库服务

告警参数

类别

参数名称

参数含义

定位信息

名称

DWS集群的sql探针耗时超阈值。

类型

操作告警。

发生时间

告警发生时间。

附加信息

集群ID

集群resourceId、domain_id等详细信息。

对系统的影响

集群性能下降,或存在故障。

可能原因

集群业务负载高或存在故障,导致SQL探针的执行变慢。

处理步骤

  1. 进入上报告警集群的“监控面板”页面中,在左侧导航栏选择“工具 > SQL探针”,查看SQL探针执行情况。
  2. 在左侧导航栏选择“监控 > 性能监控”,查看CPU使用率、磁盘使用率、内存使用率等监控指标,判断是否存在业务负载高或指标异常情况。
  3. 在左侧导航栏选择“监控 > 实时查询”,查看是否存在长时间等待的查询或会话,导致集群业务无法运行,可对异常会话或查询单击“终止会话/查询”执行终止操作。

告警清除

当任意集群的任意主机上不再出现某个SQL探针耗时超过阈值时,自动消除告警。