更新时间:2024-09-05 GMT+08:00
ALM-45654 Flink HA证书文件即将过期
本章节适用于MRS 3.3.0及以后版本。
告警解释
Flink首次或者每天01:00:00开始健康检查时,检查当前系统中的HA证书文件是否即将过期。如果剩余有效期小于或等于30天,产生该告警。剩余有效期大于30天,告警恢复。
告警属性
告警ID |
告警级别 |
是否可自动清除 |
---|---|---|
45654 |
重要 |
是 |
告警参数
参数名称 |
参数含义 |
---|---|
来源 |
产生告警的集群名称。 |
服务名 |
产生告警的服务名称。 |
角色名 |
产生告警的角色名称。 |
主机名 |
产生告警的主机名。 |
对系统的影响
HA证书即将过期,如果过期,主备模式下FlinkServer的HA功能会受到影响,将导致主备模式下FlinkServer提交Flink作业功能无法正常使用,双主模式不受影响。
可能原因
用户HA证书文件即将到期。
处理步骤
查看告警信息。
- 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-45654 Flink HA证书文件即将过期 > 定位信息”,查看告警上报的主机名,单击“主机”,查看主机名对应的IP地址。
检查系统中合法HA证书文件的有效期,重新生成HA证书文件。
- 以omm用户登录告警所在节点主机。
- 执行命令cd ${BIGDATA_HOME}/FusionInsight_Flink_*/install/FusionInsight-Flink-*/ha/local/cert,进入HA证书目录。
- 执行命令openssl x509 -noout -text -in server.crt查看HA用户证书的生效时间与失效时间。
- 根据需要,选择业务空闲期,执行6~7更新HA证书。
- 执行命令cd ${BIGDATA_HOME}/FusionInsight_Flink_*/install/FusionInsight-Flink-*/flink/sbin,进入Flink脚本目录。
- 执行命令sh proceed_ha_ssl_cert.sh,重新生成HA证书,等待1分钟,观察此告警是否被清除。
- 在备FlinkServer实例所在节点,重复执行6~7,等待1分钟,观察此告警是否被清除。
- 查看系统在定时检查时是否会再次产生此告警。
- 是,执行10。
- 否,处理完毕。
收集故障信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
父主题: MRS集群告警处理参考