更新时间:2025-07-30 GMT+08:00

DWS_2000000031 DWS集群活跃会话数量使用率超阈值

告警解释

DMS告警模块在指定周期内,检测到集群活跃会话数量使用率超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群活跃会话数量使用率低于当前设定阈值时,DMS告警模块将消除该告警。

告警属性

告警ID

告警归属

告警级别

告警类型

业务类型

是否可自动清除

DWS_2000000031

管理面

>90 紧急,>80 重要

业务告警

数据仓库服务

告警变更

变更类型

变更版本

变更描述

变更原因

新增

8.2.1.230

首次增加

首次增加

告警参数

类别

参数名称

参数含义

定位信息

集群名称

产生告警的集群名称。

租户名称

集群所属的租户名称。

告警级别

产生告警的级别。

附加信息

资源ID

产生告警的集群ID。

资源名称

产生告警的集群名称。

首次告警时间

告警首次发生事件,包含告警阈值与当前值。

对系统的影响

可使用会话数量不足,影响业务执行。

可能原因

max_active_statements参数设置过低。

处理步骤

  1. 登录DWS管理控制台
  2. 单击“专属集群 > 集群列表
  3. 在集群列表中找到所需要的集群,单击集群名称,进入“集群详情”页面。
  4. 在上侧导航栏切换至“参数修改”页签,在“参数列表”页面搜索并修改以下参数值,并单击“保存”

    1. “常用配置”中输入“resource_track_duration”,并设置“resource_track_duration”的CN/DN参数值为1
      图1 修改resource_track_duration参数

    2. “常用配置”中输入“topsql_retention_time”, 并设置“topsql_retention_time”的CN/DN参数值为14,可按需调整TopSQL记录保存天数。
      图2 修改topsql_retention_time参数

  5. 找到发生死锁的SQL语句。

    • 方法一
    1. 返回集群首页,单击集群所在行操作列的“监控面板”按钮进入集群监控页面。
    2. 左导航栏选择“监控 > 历史查询”,在历史查询页面右上角选择过滤条件:“取消原因”包含关键字“deadlock detected”
    3. 找到发生死锁的SQL语句,根据时间排序,可找到最近发生死锁的SQL语句。
      图3 查找死锁SQL语句1

    • 方法二
    1. 返回集群首页,左导航栏选择“监控 > 优化诊断”,进入优化诊断页面。
    2. 切换至“历史查询分析”界面,并在“历史查询详情”模块的搜索框选择过滤条件:“取消原因”包含关键字deadlock detected”
    3. 找到发生死锁的SQL语句,根据时间排序,可找到最近发生死锁的SQL语句。
      图4 查找死锁的SQL语句2

  6. 死锁问题解决:8.2.1及以上集群版本后会自动检测死锁,死锁检测会延迟1s进行,检测到死锁会自动释放锁。

告警清除

此告警修复后,自动清除。

参考信息

不涉及。