更新时间:2024-01-04 GMT+08:00

ALM-14007 HDFS NameNode内存使用率超过阈值(2.x及以前版本)

告警解释

系统每30秒周期性检测HDFS NameNode内存使用率,并把实际的HDFS NameNode内存使用率和阈值相比较。HDFS NameNode内存使用率指标默认提供一个阈值范围。当HDFS NameNode内存使用率超出阈值范围时,产生该告警。

当HDFS NameNode内存使用率小于或等于阈值时,告警恢复。

告警属性

告警ID

告警级别

可自动清除

14007

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

产生告警的主机名。

Trigger condition

系统当前指标取值满足自定义的告警设置条件。

对系统的影响

HDFS NameNode内存使用率过高,会影响HDFS的数据读写性能。

可能原因

HDFS NameNode配置的内存不足。

处理步骤

  1. 清除无用文件。

    1. 在集群节点使用客户端,执行hdfs dfs -rm -r 文件或目录路径命令,确认删除无用的文件。
    2. 等待5分钟后,检查本告警是否恢复。
      • 是,处理完毕。
      • 否,执行2

  2. 收集故障信息。

    1. 在MRS Manager界面,单击“系统设置 > 日志导出”。
    2. 请联系运维人员,并发送已收集的故障日志信息。

参考信息

无。