ALM-45655 Flink HA证书文件已过期
本章节适用于MRS 3.3.0及以后版本。
告警解释
Flink首次或者每天01:00:00开始健康检查时,检查当前系统中的HA证书文件是否已过期。如果HA证书已过期,产生该告警。证书恢复到有效期内,告警恢复。
告警属性
告警ID |
告警级别 |
是否可自动清除 |
---|---|---|
45655 |
重要 |
是 |
告警参数
参数名称 |
参数含义 |
---|---|
来源 |
产生告警的集群名称。 |
服务名 |
产生告警的服务名称。 |
角色名 |
产生告警的角色名称。 |
主机名 |
产生告警的主机名。 |
对系统的影响
用户HA证书文件已过期,会导致主备模式下FlinkServer将无法正常对外提供服务,FlinkServer提交Flink作业功能无法正常使用。
可能原因
用户HA证书文件已过期。
处理步骤
查看告警信息。
- 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-45655 Flink HA证书文件已过期 > 定位信息”,查看告警上报的主机名,单击“主机”,查看主机名对应的IP地址。
检查系统中合法HA证书文件的有效期,重新生成HA证书文件。
- 以omm用户登录告警所在节点主机。
- 执行命令cd ${BIGDATA_HOME}/FusionInsight_Flink_*/install/FusionInsight-Flink-*/ha/local/cert,进入HA证书目录。
- 执行命令openssl x509 -noout -text -in server.crt,查看HA用户证书的生效时间与失效时间,查看目前时间是否在有效期内。
- 执行命令cd ${BIGDATA_HOME}/FusionInsight_Flink_*/install/FusionInsight-Flink-*/flink/sbin,进入Flink脚本目录。
- 执行命令sh proceed_ha_ssl_cert.sh,重新生成HA证书,等待1分钟,观察此告警是否被清除。
- 在备FlinkServer实例所在节点,重复执行5~6,等待1分钟,观察此告警是否被清除。
- 查看系统在定时检查时是否会再次产生此告警。
- 是,执行9。
- 否,处理完毕。
收集故障信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。