ALM-24000 Flume服务不可用(2.x及以前版本)
告警解释
告警模块按180秒周期检测Flume服务状态,当检测到Flume服务异常时,系统产生此告警。
当系统检测到Flume服务恢复正常,且告警处理完成时,告警恢复。
告警属性
告警ID |
告警级别 |
可自动清除 |
---|---|---|
24000 |
致命 |
是 |
告警参数
参数名称 |
参数含义 |
---|---|
ServiceName |
产生告警的服务名称。 |
RoleName |
产生告警的角色名称。 |
HostName |
产生告警的主机名。 |
对系统的影响
当Flume服务不可用时,Flume不能正常工作,数据传输业务中断。
可能原因
- HDFS服务不可用。
- LdapServer服务不可用。
处理步骤
- 检查HDFS的服务状态。
- 登录MRS集群详情页面,选择“告警管理”。
- 查看是否有“ALM-14000 HDFS服务不可用”告警产生。
- 是,参考ALM-14000 HDFS服务不可用(2.x及以前版本)的处理步骤处理该告警。
- 否,执行2。
- 检查LdapServer的服务状态。
查看是否有“ALM-25000 LdapServer服务不可用”告警产生。
- 是,参考ALM-25000 LdapServer服务不可用(2.x及以前版本)的处理步骤处理该告警。
- 否,执行3.b。
- 检查HDFS、LdapServer的服务是否已停止。
- 收集故障信息。
- 在MRS Manager界面,单击“系统设置 > 日志导出”。
- 请联系运维人员,并发送已收集的故障日志信息。
参考信息
无。