ALM-27011 DBService数据库死锁产生次数超过阈值

系统每30秒周期性检查DBService数据库死锁产生次数，若采集的死锁次数连续n次（n为设定的平滑次数，默认值为3）超过设定阈值（默认为1）时，系统将产生此告警。

当平滑次数为1，DBService数据库死锁产生次数小于或等于阈值时，该告警恢复；当平滑次数大于1，DBService数据库死锁产生次数连续n次（n为设定的平滑次数）小于阈值的90%时，该告警恢复。

本章节仅适用于MRS 3.6.0-LTS.1及之后版本。

告警ID	告警级别	告警类型	业务类型	是否可自动清除
27011	重要	业务质量告警	FusionInsight Manager	是

检查阈值设置是否合理。

在FusionInsight Manager，选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > DBService > 数据库 > DBService数据库死锁次数”，查看该告警阈值是否合理（默认值1为合理值）。
- 是，执行步骤 3。
- 否，执行步骤 2。
单击“操作”列的“修改”，根据实际服务的使用情况修改告警阈值。
选择“集群 > 服务 > DBService”，在“概览”页面查看“DBService数据库死锁次数”图表，检查数据库死锁产生次数是否低于设置的阈值。
- 是，执行步骤 4。
- 否，执行步骤 5。
等待2分钟查看告警是否自动恢复。
- 是，处理完毕。
- 否，执行步骤 5。

检查数据库死锁产生次数。

以omm用户登录DBService主管理节点，执行以下命令登录DBService数据库。

gsql -p 20015 -U omm -W ${数据库密码}
执行以下SQL语句，查看数据库是否存在死锁。

SELECT SUM(deadlocks) AS total_deadlocks FROM pg_stat_database;

查询结果大于0，表示存在死锁；查询结果等于0，表示不存在死锁。
- 是，执行步骤 7。
- 否，执行步骤 8。
根据实际情况处理死锁的任务或者修改告警阈值，并等待2分钟，查看告警是否清除。
- 是，执行完毕。
- 否，执行步骤 8。