更新时间:2024-01-03 GMT+08:00
分享

ALM-24000 Flume服务不可用(2.x及以前版本)

告警解释

告警模块按180秒周期检测Flume服务状态,当检测到Flume服务异常时,系统产生此告警。

当系统检测到Flume服务恢复正常,且告警处理完成时,告警恢复。

告警属性

告警ID

告警级别

可自动清除

24000

致命

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

产生告警的主机名。

对系统的影响

当Flume服务不可用时,Flume不能正常工作,数据传输业务中断。

可能原因

  • HDFS服务不可用。
  • LdapServer服务不可用。

处理步骤

  1. 检查HDFS的服务状态。

    1. 登录MRS集群详情页面,选择“告警管理”。
    2. 查看是否有“ALM-14000 HDFS服务不可用”告警产生。
      • 是,参考“ALM-14000 HDFS服务不可用”的处理步骤处理该告警。
      • 否,执行2

  2. 检查LdapServer的服务状态。

    查看是否有“ALM-25000 LdapServer服务不可用”告警产生。
    • 是,参考“ALM-25000 LdapServer服务不可用”的处理步骤处理该告警。
    • 否,执行3.b

  3. 检查HDFS、LdapServer的服务是否已停止。

    1. 登录MRS集群详情页面,选择“组件管理”。
    2. 在MRS的服务列表中,查看HDFS、LdapServer服务是否已停止。
      • 是,启动HDFS、LdapServer服务,执行3.c
      • 否,执行4
    3. 在告警列表中查看“ALM-24000 Flume服务不可用”告警是否清除。
      • 是,处理完毕。
      • 否,执行4

  4. 收集故障信息。

    1. 在MRS Manager界面,单击“系统设置 > 日志导出”。
    2. 请联系运维人员,并发送已收集的故障日志信息。

参考信息

无。

分享:

    相关文档

    相关产品