文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-24013 Flume MonitorServer证书文件非法或已损坏
更新时间:2024-09-04 GMT+08:00

ALM-24013 Flume MonitorServer证书文件非法或已损坏

本章节适用于MRS 3.2.0及以后版本。

告警解释

MonitorServer每隔一个小时,检查当前MonitorServer证书文件是否合法(证书是否存在,证书格式是否正确),如果证书文件非法或已损坏,产生该告警。证书文件恢复合法,告警恢复。

告警属性

告警ID

告警级别

是否自动清除

24013

重要

告警参数

参数名称

参数含义

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

MonitorServer证书文件已经非法或损坏,功能受限,Flume客户端将无法访问Flume服务端。

可能原因

MonitorServer证书文件非法或损坏。

处理步骤

查看告警信息。

  1. 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24013 MonitorServer证书文件非法或已损坏 > 定位信息”。查看告警上报的实例的IP地址。

检查系统中证书文件是否有效,重新生成证书文件

  1. root用户登录告警所在节点主机,并执行su - omm切换用户。
  2. 执行以下命令进入MonitorServer证书目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/conf

  3. 执行命令ls -l,查看ms_sChat.crt文件是否存在。

    • 是,执行5
    • 否,执行6

  4. 执行命令openssl x509 -in ms_sChat.crt -text -noout,查看是否正常显示证书具体信息

    • 是,执行9
    • 否,执行6

  5. 执行以下命令进入Flume脚本目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/bin

  6. 执行以下命令重新生成证书,等待一个小时,观察此告警是否被清除。

    sh geneJKS.sh -m 服务端的自定义MonitorServer证书密码 -n 客户端的自定义MonitorServer证书密码
    • 是,执行8
    • 否,执行9
      服务端客户端的自定义MonitorServer证书密码需满足以下复杂度要求:
      • 至少包含大写字母、小写字母、数字、特殊符号4种类型字符。
      • 至少8位,最多64位。
      • 出于安全考虑,建议用户定期更换自定义密码(例如三个月更换一次),并重新生成各项证书和信任列表。

  7. 查看系统在定时检查时是否会再次产生此告警。

    • 是,执行9
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的MonitorServer。
  3. 单击右上角的时间编辑按钮,设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

无。