ALM-27009 正在运行的SQL执行平均耗时超过阈值

系统每30秒周期性检查DBServer数据库正在运行的SQL执行平均耗时，默认正在运行的SQL执行平均耗时大于10秒即认为该SQL超阈值。若采集的正在运行的SQL执行平均耗时连续n次（n为设定的平滑次数，默认值为3）超过设定阈值（默认阈值为10s）时，系统将产生此告警。

当平滑次数为1，DBServer正在运行的SQL执行平均耗时小于或等于阈值时，该告警恢复；当平滑次数大于1，DBServer正在运行的SQL执行平均耗时连续n次（n为设定的平滑次数）小于阈值的90%时，该告警恢复。

本章节仅适用于MRS 3.6.0-LTS.1及之后版本。

告警ID	告警级别	告警类型	业务类型	是否可自动清除
27009	重要	业务质量告警	FusionInsight Manager	是

检查阈值设置是否合理。

在FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > DBService > 数据库 > DBService正在运行的SQL执行平均耗时”，查看该告警阈值是否合理（默认值10为合理值）。
- 是，执行步骤 3。
- 否，执行步骤 2。
单击“操作”列的“修改”，根据实际服务的使用情况修改告警阈值。
选择“集群 > 服务 > DBService”，在“概览”页面查看“DBService正在运行的SQL执行平均耗时”图表，检查数据库SQL运行平均耗时是否低于设置的阈值。
- 是，执行步骤 4。
- 否，执行步骤 5。
等待2分钟查看告警是否自动恢复。
- 是，处理完毕。
- 否，执行步骤 5。

检查正在运行的SQL执行平均耗时。

以omm用户登录DBService主管理节点，执行以下命令登录DBService数据库。

gsql -p 20015 -U omm -W ${数据库密码}
执行以下SQL语句，查看数据库SQL运行平均耗时是否超过阈值。
1. 执行如下语句获取正在运行的SQL执行总耗时。
  select sum(EXTRACT(EPOCH FROM (now() - QUERY_START::timestamptz))) AS totalSeconds from pg_stat_activity where STATE = 'active' and pid <> pg_backend_pid();
2. 执行如下语句获取正在运行的SQL数量。
  select count(1) from pg_stat_activity where STATE = 'active' and pid <> pg_backend_pid();
3. 执行如下命令计算平均耗时，并确认平均耗时是否超过阈值。
  平均值=${任务总耗时} / ${任务总数量}
- 是，执行步骤 7。
- 否，执行步骤 8。
根据实际情况处理长耗时的SQL任务或者修改告警阈值，并等待2分钟，查看告警是否清除。
- 是，执行完毕。
- 否，执行步骤 8。