DWS_2000000020 集群的SQL探针耗时超阈值(SQL probe of the cluster Usage Exceeds the Threshold)
告警解释
GaussDB(DWS)每30秒采集集群各节点SQL探针的执行情况。如果存在任意集群的任意主机存在SQL探针执行耗时超过2倍阈值(可配置),则上报集群的SQL探针耗时超阈值的紧急告警;如果所有SQL探针执行耗时不超过该阈值,则消除该紧急告警。
如果存在SQL探针耗时一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。
告警属性
告警ID |
告警归属 |
告警级别 |
告警类型 |
业务类型 |
是否可自动清除 |
---|---|---|---|---|---|
DWS_2000000020 |
管理面 |
重要 |
操作告警 |
数据仓库服务 |
是 |
告警参数
类别 |
参数名称 |
参数含义 |
---|---|---|
定位信息 |
名称 |
DWS集群的sql探针耗时超阈值。 |
类型 |
操作告警。 |
|
发生时间 |
告警发生时间。 |
|
附加信息 |
集群ID |
集群resourceId、domain_id等详细信息。 |
对系统的影响
集群性能下降,或存在故障。
可能原因
集群业务负载高或存在故障,导致SQL探针的执行变慢。
处理步骤
- 进入上报告警集群的“监控面板”页面中,在左侧导航栏选择“工具 > SQL探针”,查看SQL探针执行情况。
- 在左侧导航栏选择“监控 > 性能监控”,查看CPU使用率、磁盘使用率、内存使用率等监控指标,判断是否存在业务负载高或指标异常情况。
- 在左侧导航栏选择“监控 > 实时查询”,查看是否存在长时间等待的查询或会话,导致集群业务无法运行,可对异常会话或查询单击“终止会话/查询”执行终止操作。
告警清除
当任意集群的任意主机上不再出现某个SQL探针耗时超过阈值时,自动消除告警。