ALM-12207 慢盘处理超时

当慢盘检测开关打开时，系统默认每隔10分钟检测一次慢盘处理情况，当磁盘或者节点处于如下状态且超过10小时状态未发生变更，则认为磁盘或者节点处理超时，上报该告警。

当处于处理超时的节点或者磁盘状态发生变更时，告警自动恢复。

该告警仅适用于MRS 3.3.1及之后版本。

告警ID	告警级别	是否可自动清除
12207	重要	是

处于隔离状态的磁盘或者节点不能及时恢复，可能会对大数据组件运行产生影响，进而影响用户业务使用。

磁盘或者节点隔离状态超过慢盘处理超时配置时间。

检查慢盘处理超时原因。

在FusionInsight Manager页面，选择“运维 > 告警 > 告警”，在告警列表中展开此告警的详细信息，查看并记录告警上报的主机或磁盘信息。
以root用户登录主OMS节点，执行以下命令查看controller日志中慢盘处理超时原因，并检查是否存在明显报错信息。

vi /var/log/Bigdata/controller/controller.log
- 是，执行步骤 4。
- 否，执行步骤 3。
以root用户登录告警上报节点，执行以下命令查看agent日志中慢盘处理超时原因，并检查是否存在明显报错信息。

vi /var/log/Bigdata/nodeagent/agentlog/agent.log
- 是，执行步骤 4。
- 否，执行步骤 5。
联系运维人员处理故障，并手动执行慢盘或者节点操作命令，等待命令执行完成后观察五分钟查看告警是否清除。
- 是，处理完毕。
- 否，执行步骤 5。

收集故障信息。

此告警修复后，系统会自动清除此告警，无需手工清除。

不涉及。

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消