更新时间:2024-09-04 GMT+08:00
ALM-14012 HDFS Journalnode数据不同步(2.x及以前版本)
告警解释
在主NameNode节点上,系统每5分钟检测一次集群中所有JournalNode节点的数据同步性。如果有JournalNode节点的数据不同步,系统产生该告警。
当Journalnode数据同步5分钟后,告警恢复。
告警属性
告警ID |
告警级别 |
可自动清除 |
---|---|---|
14012 |
严重 |
是 |
告警参数
参数名称 |
参数含义 |
---|---|
ServiceName |
产生告警的服务名称。 |
RoleName |
产生告警的角色名称。 |
IP |
产生告警的JournalNode实例的业务IP地址。 |
对系统的影响
当一个JournalNode节点工作状态异常时,其数据就会与其他JournalNode节点的数据不同步。如果超过一半的JournalNode节点的数据不同步时,NameNode将无法工作,导致HDFS服务不可用。
可能原因
- JournalNode实例未启动或已停止。
- JournalNode实例运行状态异常。
- JournalNode节点的网络不可达。
处理步骤
参考信息
无。
父主题: MRS集群告警处理参考