文档首页/ MapReduce服务 MRS/ 组件操作指南(LTS版)/ 使用Flink/ Flink运维管理/ Flink支持配置作业失败重启时是否从SavePoint恢复
更新时间:2026-06-11 GMT+08:00
分享

Flink支持配置作业失败重启时是否从SavePoint恢复

操作场景

当Flink作业运行异常失败重启时,通常需要使用快照(SavePoint、CheckPoint)来恢复作业状态,以确保数据的一致性和准确性。然而,在某些情况下,使用快照(SavePoint、CheckPoint)可能会导致恢复过程复杂且耗时,尤其是在作业频繁失败的情况下。Flink允许作业在重启时不使用快照(SavePoint、CheckPoint)恢复作业,以减少恢复时间,提高作业的可用性和响应速度。

约束与限制

  • 本章节仅适用于MRS 3.6.0-LTS.1及之后版本。
  • 该特性必须配合Flink作业重启策略使用,具体操作可参考配置Flink作业重启策略
  • Flink作业使用快照(SavePoint、CheckPoint)启动。
  • Flink作业运行过程中没有开启CheckPoint,可参考创建作业在作业开发界面,查看是否勾选了“开启CheckPoint”。

操作步骤

  1. 根据使用场景参考配置Flink作业重启策略配置合适的Flink作业重启策略。
  2. 使用具有FlinkServer管理员权限的用户,登录Manager界面,选择“集群 > 服务 > Flink”,在“Flink WebUI”右侧,单击链接,访问Flink的WebUI。
  3. 单击“作业管理”进入作业管理页面。
  4. 在FlinkServer作业管理界面,可参考集群连接模式创建Flink SQL作业新建作业或选择已有作业,进入作业开发界面。
  5. 在作业开发界面的“自定义参数”配置“execution.state-recovery.restart-from-savepoint”的参数值为“false”允许作业在重启时不使用快照(SavePoint、CheckPoint)恢复作业。参数配置完成后,提交Flink作业即可生效。

    图1 自定义参数配置

相关文档