ALM-45653 Flink HA证书文件失效
本章节适用于MRS 3.3.0及以后版本。
告警解释
Flink首次或者每天01:00:00开始健康检查时,检查当前系统中的HA证书文件是否失效(证书是否存在,证书格式是否正确),如果证书文件失效,产生该告警。证书文件恢复,告警恢复。
告警属性
告警ID |
告警级别 |
是否可自动清除 |
---|---|---|
45653 |
重要 |
是 |
告警参数
参数名称 |
参数含义 |
---|---|
来源 |
产生告警的集群名称。 |
服务名 |
产生告警的服务名称。 |
角色名 |
产生告警的角色名称。 |
主机名 |
产生告警的主机名。 |
对系统的影响
用户HA证书文件已经失效,会导致主备模式下FlinkServer将无法正常对外提供服务,FlinkServer提交Flink作业功能无法正常使用。
可能原因
用户HA证书文件失效。
处理步骤
查看告警信息。
- 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-45653 Flink HA证书文件失效 > 定位信息”,查看告警上报的主机名,单击“主机”,查看主机名对应的IP地址。
检查系统中HA证书文件是否有效。
- 以omm用户登录告警所在节点主机。
- 执行命令cd ${BIGDATA_HOME}/FusionInsight_Flink_*/install/FusionInsight-Flink-*/ha/local/cert,进入HA证书目录。
- 执行命令ls -l,查看server.crt文件是否存在。
- 执行命令openssl x509 -in server.crt -text -noout,查看是否正常显示。
- 执行命令cd ${BIGDATA_HOME}/FusionInsight_Flink_*/install/FusionInsight-Flink-*/flink/sbin,进入Flink脚本目录。
- 执行命令sh proceed_ha_ssl_cert.sh,重新生成HA证书,等待1分钟,观察此告警是否被清除。
- 查看系统在定时检查时是否会再次产生此告警。
- 是,执行9。
- 否,处理完毕。
收集故障信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。