更新时间:2024-11-29 GMT+08:00

ALM-24011 Flume证书文件即将过期

告警解释

Flume每隔一个小时,检查当前Flume证书文件是否即将过期,如果剩余有效期小于或等于30天,产生该告警。证书文件剩余有效期大于30天,告警恢复。

告警属性

告警ID

告警级别

告警类型

业务类型

是否可自动清除

24011

重要

处理错误告警

Flume

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

Flume证书文件即将失效,对系统目前运行无影响。

可能原因

Flume证书文件即将到期。

处理步骤

查看告警信息

  1. 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24011 Flume证书文件即将过期 > 定位信息”。查看告警上报的实例的IP地址。

检查系统中合法证书文件的有效期,重新生成证书文件。

  1. root用户登录告警所在节点主机,并执行su - omm切换用户。
  2. 执行以下命令进入Flume服务证书目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/conf

  3. 执行以下命令查看Flume用户证书的生效时间与失效时间。

    openssl x509 -noout -text -in flume_sChat.crt

  4. 根据需要,选择业务空闲期,执行6~7更新证书。
  5. 执行以下命令进入Flume脚本目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/bin

  6. 执行命令重新生成证书,等待1小时,观察此告警是否被清除。

    sh geneJKS.sh -f Flume角色服务端的自定义证书密码 -g Flume角色客户端的自定义证书密码
    • 是,执行9
    • 否,执行8
    Flume角色服务端、客户端的自定义证书密码需满足以下复杂度要求:
    • 至少包含大写字母、小写字母、数字、特殊符号4种类型字符。
    • 至少8位,最多64位。
    • 出于安全考虑,建议用户定期更换自定义密码(例如三个月更换一次),并重新生成各项证书和信任列表。

  7. 使用omm用户在Flume实例产生告警的节点,重复执行6~7,等待1小时,观察此告警是否被清除。

    • 是,执行9
    • 否,执行10

  8. 查看系统在定时检查时是否会再次产生此告警。

    • 是,执行10
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的Flume。
  3. 单击右上角的时间编辑按钮,设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。