更新时间:2024-11-29 GMT+08:00

ALM-24012 Flume证书文件已过期

告警解释

Flume每隔一个小时,检查当前系统中的证书文件是否已过期。如果服务端证书已过期,产生该告警。服务的证书文件恢复到有效期内,告警恢复。

告警属性

告警ID

告警级别

告警类型

业务类型

是否可自动清除

24012

重要

处理错误告警

Flume

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

Flume证书文件已过期,功能受限,Flume客户端将无法访问Flume服务端。

可能原因

Flume证书文件已过期。

处理步骤

查看告警信息。

  1. 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24012 Flume证书文件已过期 > 定位信息”。查看告警上报的实例的IP地址。

检查系统中合法证书文件的有效期,重新生成证书文件。

  1. root用户登录告警所在节点主机,并执行su - omm切换用户。
  2. 执行以下命令进入Flume服务证书目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/conf

  3. 执行以下命令查看HA用户证书的生效时间与失效时间,查看目前时间是否在有效期内。

    openssl x509 -noout -text -in flume_sChat.crt
    • 是,执行9
    • 否,执行5

  4. 执行以下命令进入Flume脚本目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/bin

  5. 执行以下命令重新生成证书,等待1小时,观察此告警是否被清除。

    sh geneJKS.sh -f Flume角色服务端的自定义证书密码 -g Flume角色客户端的自定义证书密码
    • 是,执行8
    • 否,执行7
      Flume角色服务端、客户端的自定义证书密码需满足以下复杂度要求:
      • 至少包含大写字母、小写字母、数字、特殊符号4种类型字符。
      • 至少8位,最多64位。
      • 出于安全考虑,建议用户定期更换自定义密码(例如三个月更换一次),并重新生成各项证书和信任列表。

  6. 使用omm用户在Flume实例产生告警的节点,重复执行5~6,等待1小时,观察此告警是否被清除。

    • 是,执行8
    • 否,执行9

  7. 查看系统在定时检查时是否会再次产生此告警。

    • 是,执行9
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的Flume。
  3. 单击右上角的时间编辑按钮,设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。