文档首页> 数据仓库服务 GaussDB(DWS)> 管理指南> 监控与告警> 告警管理> 告警处理> DWS_2000000020 集群的SQL探针耗时超阈值(SQL probe of the cluster Usage Exceeds the Threshold)
更新时间:2024-03-28 GMT+08:00

DWS_2000000020 集群的SQL探针耗时超阈值(SQL probe of the cluster Usage Exceeds the Threshold)

告警解释

GaussDB(DWS)每30秒采集集群各节点SQL探针的执行情况。如果存在任意集群的任意主机存在SQL探针执行耗时超过2倍阈值(可配置),则上报集群的SQL探针耗时超阈值的紧急告警;如果所有SQL探针执行耗时不超过该阈值,则消除该紧急告警。

如果存在SQL探针耗时一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。

告警属性

告警ID

告警级别

是否可自动清除

DWS_2000000020

紧急

告警参数

参数名称

参数含义

告警源

产生告警的系统名称。例如:DWS。

集群名称

产生告警的集群名称。

定位信息

产生告警的集群ID、集群名称。例如,cluster_id: xxxx-xxxx-xxxx-xxxx,cluster_name: test_dws

详细信息

产生告警的详细信息,包括集群、阈值信息。例如:CloudService=DWS, resourceId: xxxx-xxxx-xxxx-xxxx, resourceIdName: test_dws, first_alarm_time: 2022-11-26 11:14:58; 集群 test_dws的SQL探针阈值为 2倍。该集群sql探针超过阈值的SQL探针有:'select xxx from xxxx'。

产生日期

产生告警的时间。

状态

当前告警的处理状态。

对系统的影响

集群性能下降,或存在故障。

可能原因

集群业务负载高或存在故障,导致SQL探针的执行变慢。

处理步骤

  1. 进入上报告警集群的“监控面板”页面中,在左侧导航栏选择“工具 > SQL探针”,查看SQL探针执行情况。
  2. 在左侧导航栏选择“监控 > 性能监控”,查看CPU使用率、磁盘使用率、内存使用率等监控指标,判断是否存在业务负载高或指标异常情况。
  3. 在左侧导航栏选择“监控 > 实时查询”,查看是否存在长时间等待的查询或会话,导致集群业务无法运行,可对异常会话或查询单击“终止会话/查询”执行终止操作。

告警清除

当任意集群的任意主机上不再出现某个SQL探针耗时超过阈值时,自动消除告警。