ALM-14003 丢失的HDFS块数量超过阈值（2.x及以前版本）

系统每30秒周期性检测丢失的块数量，并把丢失的块数量和阈值相比较。丢失的块数量指标默认提供一个阈值范围。当检测到丢失的块数量超出阈值范围时产生该告警。

当丢失的块数量小于或等于阈值时，告警恢复。

告警ID	告警级别	可自动清除
14003	严重	是

HDFS存储数据丢失，HDFS可能会进入安全模式，无法提供写服务。丢失的块数据无法恢复。

检查DataNode实例。
1. 在MRS集群详情页面，单击“组件管理 > HDFS > 实例”。
2. 查看所有DataNode实例的状态是否为“良好”。
  - 是，执行步骤 3。
  - 否，执行1.c。
3. 重启DataNode实例，查看能否成功启动。
  - 是，执行2.b。
  - 否，执行2.a。
删除被破坏的文件。
1. 在集群节点使用客户端。执行hdfs fsck / -delete，删除丢失文件。然后再次写入文件，恢复数据。
2. 等待5分钟后，单击“告警管理”，查看该告警是否恢复。
  - 是，处理完毕。
  - 否，执行步骤 3。
收集故障信息。
1. 在MRS Manager界面，单击“系统设置 > 日志导出”。
2. 请联系运维人员，并发送已收集的故障日志信息。