文档首页/ MapReduce服务 MRS/ 用户指南(安卡拉区域)/ 告警参考/ ALM-24010 Flume证书文件非法或已损坏
更新时间:2024-11-29 GMT+08:00

ALM-24010 Flume证书文件非法或已损坏

告警解释

Flume每隔一个小时,检查当前Flume证书文件是否合法(证书是否存在,证书格式是否正确),如果证书文件非法或已损坏,产生该告警。证书文件恢复合法时,告警恢复。

告警属性

告警ID

告警级别

告警类型

业务类型

是否可自动清除

24010

重要

处理错误告警

Flume

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

Flume证书文件已经非法或损坏,功能受限,Flume客户端将无法访问Flume服务端。

可能原因

Flume证书文件非法或损坏。

处理步骤

查看告警信息。

  1. 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24010 Flume证书文件非法或已损坏 > 定位信息”。查看告警上报的实例的IP地址。

检查系统中证书文件是否有效,重新生成证书文件

  1. root用户登录告警所在节点主机,并执行su - omm切换用户。
  2. 执行以下命令进入Flume服务证书目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/conf

  3. 执行命令ls -l,查看“flume_sChat.crt”文件是否存在。

    • 是,执行5
    • 否,执行6

  4. 执行命令openssl x509 -in flume_sChat.crt -text -noout,查看是否正常显示证书具体信息

    • 是,执行9
    • 否,执行6

  5. 执行以下命令进入Flume脚本目录。

    cd ${BIGDATA_HOME}/FusionInsight_Porter_*/install/FusionInsight-Flume-*/flume/bin

  6. 执行以下令重新生成证书,等待一个小时,观察此告警是否被清除。

    sh geneJKS.sh -f Flume角色服务端的自定义证书密码 -g Flume角色客户端的自定义证书密码
    • 是,执行8
    • 否,执行9
    Flume角色服务端、客户端的自定义证书密码需满足以下复杂度要求:
    • 至少包含大写字母、小写字母、数字、特殊符号4种类型字符。
    • 至少8位,最多64位。
    • 出于安全考虑,建议用户定期更换自定义密码(例如三个月更换一次),并重新生成各项证书和信任列表。

  7. 查看系统在定时检查时是否会再次产生此告警。

    • 是,执行9
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的Flume。
  3. 单击右上角的时间编辑按钮,设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。