更新时间:2025-07-10 GMT+08:00
Flink作业重启后,如何判断是否可以从checkpoint恢复
什么是从checkpoint恢复?
Flink Checkpoint 是一种容错恢复机制。这种机制保证了实时程序运行时,遇到异常或者机器问题时能够进行自我恢复。
从checkpoint恢复的原则
- 通常当作业执行失败、资源异常重启等非人为触发的异常场景时,支持从checkpoint恢复。
- 但是如果修改了作业的运算逻辑,作业的计算逻辑已发生更改,不支持从checkpoint恢复。
相关操作:怎样从checkpoint恢复作业
由于Flink Checkpoint和Savepoint生成机制及格式一致,因此可以通过Flink作业列表“操作”列中的“更多 > 导入保存点”,导入OBS中最新成功的Checkpoint,并从中恢复。
- 登录DLI管理控制台,选择“作业管理 > Flink作业”。
- 在对应Flink作业所在行,选择“操作 > 导入保存点”。
- 在导入保存点界面选择Checkpoint的OBS桶路径,Checkpoint保存路径为:“桶名/jobs/checkpoint/作业id开头的目录”。单击“确定”完成导入操作。
- 再次启动Flink作业,即从对应的检查点路径恢复作业。
父主题: Flink作业性能调优类