AI开发平台ModelArtsAI开发平台ModelArts

文档首页> AI开发平台ModelArts> 常见问题> 预置算法> 如何使用预置算法断点训练模型?
更新时间:2021/03/18 GMT+08:00
分享

如何使用预置算法断点训练模型?

如果使用ModelArts预置算法训练模型,可以使用其断点训练的能力。

基于TensorFlow的预置AI算法在训练模型时,会定期将“checkpoint”文件保存到“模型输出”的OBS路径。如图1所示。

图1 模型输出OBS路径

在对应路径下找到输出文件,其中,“checkpoint”文件和“.data”“.index”“.meta”文件组成一套checkpoint,如图2勾选的文件所示。

当使用相同的算法再次训练时,可以将已有训练作业的checkpoint复制到新的训练作业的“模型输出”路径下,这样新的训练作业就可以基于已有的checkpoint断点进行训练了。

图2 checkpoint文件输出
分享:

预置算法 所有常见问题

more