更新时间:2026-06-11 GMT+08:00
Flink支持配置作业失败重启时是否从SavePoint恢复
操作场景
当Flink作业运行异常失败重启时,通常需要使用快照(SavePoint、CheckPoint)来恢复作业状态,以确保数据的一致性和准确性。然而,在某些情况下,使用快照(SavePoint、CheckPoint)可能会导致恢复过程复杂且耗时,尤其是在作业频繁失败的情况下。Flink允许作业在重启时不使用快照(SavePoint、CheckPoint)恢复作业,以减少恢复时间,提高作业的可用性和响应速度。
约束与限制
- 本章节仅适用于MRS 3.6.0-LTS.1及之后版本。
- 该特性必须配合Flink作业重启策略使用,具体操作可参考配置Flink作业重启策略。
- Flink作业使用快照(SavePoint、CheckPoint)启动。
- Flink作业运行过程中没有开启CheckPoint,可参考创建作业在作业开发界面,查看是否勾选了“开启CheckPoint”。
操作步骤
- 根据使用场景参考配置Flink作业重启策略配置合适的Flink作业重启策略。
- 使用具有FlinkServer管理员权限的用户,登录Manager界面,选择“集群 > 服务 > Flink”,在“Flink WebUI”右侧,单击链接,访问Flink的WebUI。
- 单击“作业管理”进入作业管理页面。
- 在FlinkServer作业管理界面,可参考集群连接模式创建Flink SQL作业新建作业或选择已有作业,进入作业开发界面。
- 在作业开发界面的“自定义参数”配置“execution.state-recovery.restart-from-savepoint”的参数值为“false”允许作业在重启时不使用快照(SavePoint、CheckPoint)恢复作业。参数配置完成后,提交Flink作业即可生效。 图1 自定义参数配置
父主题: Flink运维管理