文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-24015 Flume MonitorServer证书文件已过期
更新时间:2024-09-04 GMT+08:00

ALM-24015 Flume MonitorServer证书文件已过期

本章节适用于MRS 3.2.0及以后版本。

告警解释

MonitorServer每隔一个小时健康检查时,检查当前系统中的证书文件是否已过期。如果服务端证书已过期,产生该告警。服务端证书恢复的有效期内,告警恢复。

告警属性

告警ID

告警级别

是否自动清除

24015

重要

告警参数

参数名称

参数含义

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

MonitorServer证书文件已过期,功能受限,Flume客户端将无法访问Flume服务端。

可能原因

MonitorServer证书文件已过期。

处理步骤

查看告警信息。

  1. 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24015 MonitorServer证书文件已过期 > 定位信息”。查看告警上报的实例的IP地址。

检查系统中合法证书文件的有效期,重新生成证书文件。

  1. root用户登录告警所在节点主机,并执行su - omm切换用户。
  2. 执行以下命令进入MonitorServer证书目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/conf

  3. 执行以下命令查看用户证书的生效时间与失效时间,查看目前时间是否在有效期内。

    openssl x509 -noout -text -in ms_sChat.crt
    • 是,执行9
    • 否,执行5

  4. 执行以下命令进入Flume脚本目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/bin

  5. 执行以下命令重新生成证书,等待1小时,观察此告警是否被清除。

    sh geneJKS.sh -m 服务端的自定义MonitorServer证书密码 -n 客户端的自定义MonitorServer证书密码
    • 是,执行8
    • 否,执行7
      服务端客户端的自定义MonitorServer证书密码需满足以下复杂度要求:
      • 至少包含大写字母、小写字母、数字、特殊符号4种类型字符。
      • 至少8位,最多64位。
      • 出于安全考虑,建议用户定期更换自定义密码(例如三个月更换一次),并重新生成各项证书和信任列表。

  6. 使用omm用户在Flume实例产生告警的节点,重复执行5~6,等待1小时,观察此告警是否被清除。

    • 是,执行8
    • 否,执行9

  7. 查看系统在定时检查时是否会再次产生此告警。

    • 是,执行9
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的MonitorServer。
  3. 单击右上角的时间编辑按钮,设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

无。