更新时间:2024-03-12 GMT+08:00

ALM-24014 Flume MonitorServer证书文件即将过期

告警解释

MonitorServer每隔一个小时,检查当前MonitorServer证书文件是否即将过期,如果剩余有效期小于或等于30天,产生该告警。剩余有效期大于30天,告警恢复。

告警属性

告警ID

告警级别

是否自动清除

24014

重要

告警参数

参数名称

参数含义

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

MonitorServer证书文件即将失效,对系统目前运行无影响。

可能原因

MonitorServer证书文件即将到期。

处理步骤

查看告警信息

  1. 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24014 MonitorServer证书文件即将过期 > 定位信息”。查看告警上报的实例的IP地址。

检查系统中合法证书文件的有效期,重新生成证书文件。

  1. root用户登录告警所在节点主机,并执行su - omm切换用户。
  2. 执行命令进入MonitorServer证书目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/conf

  3. 执行命令查看用户证书的生效时间与失效时间。

    openssl x509 -noout -text -in ms_sChat.crt

  4. 根据需要,选择业务空闲期,执行6~7更新证书。
  5. 执行以下命令进入Flume脚本目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/bin

  6. 执行以下命令重新生成证书,等待1小时,观察此告警是否被清除。

    sh geneJKS.sh -m 服务端的自定义MonitorServer证书密码 -n 客户端的自定义MonitorServer证书密码
    • 是,执行9
    • 否,执行8
      服务端客户端的自定义MonitorServer证书密码需满足以下复杂度要求:
      • 至少包含大写字母、小写字母、数字、特殊符号4种类型字符。
      • 至少8位,最多64位。
      • 出于安全考虑,建议用户定期更换自定义密码(例如三个月更换一次),并重新生成各项证书和信任列表。

  7. 使用omm用户在Flume实例产生告警的节点,重复执行6~7,等待1小时,观察此告警是否被清除。

    • 是,执行9
    • 否,执行10

  8. 查看系统在定时检查时是否会再次产生此告警。

    • 是,执行10
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的MonitorServer。
  3. 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

无。