文档首页 > > AI工程师用户指南> 训练管理> 管理训练作业版本

管理训练作业版本

分享
更新时间:2020/09/02 GMT+08:00

在模型构建过程中,您可能需要根据训练结果,不停的调整数据、训练参数或模型,以获得一个满意的模型。因此,ModelArts为了方便用户在调整内容后快速高效的训练模型,提供了管理训练作业版本的能力。每训练一次,生成一个版本,不同的作业版本之间,能快速进行对比,获得对比结果。

查看训练作业版本

  1. 登录ModelArts管理控制台,在左侧导航栏中选择“训练管理 > 训练作业”,默认进入“训练作业”列表。
  2. 在训练作业列表中,单击训练作业名称,进入训练作业的详情页面。
    默认打开最近一个版本的基本信息。当版本较多时,您可以单击左上角“版本过滤”过滤某几个版本进行查看。单击版本左侧的小三角打开作业的详细信息。训练作业的详细信息说明请参见训练作业详情
    图1 查看训练作业版本

版本对比

“版本管理”页面中,针对当前训练作业的所有版本,或者使用过滤功能筛选后的版本,单击右侧“查看对比结果”,可查看训练版本之间的对比,包含“运行参数”“F1值”“召回率”“精确率”“准确率”

使用预置算法创建的训练作业,才会显示其对应的“F1值”“召回率”“精确率”“准确率”。针对使用常用框架、或自定义镜像创建的训练作业,请在您的训练脚本代码中定义好这些参数的输出,暂不支持在界面中查看。

图2 训练版本对比

基于训练作业版本的快捷操作

在训练作业的版本管理页面,ModelArts提供了一些快捷操作的入口,方便您在模型训练结束后,快速进行下一步操作。

表1 快捷操作说明

操作

说明

创建可视化作业

基于当前训练版本创建可视化作业(TensorBoard),详细参见管理可视化作业

说明:

TensorBoard目前只支持TensorFlow和MXNet引擎,只有使用TensorFlow或MXNet引擎的训练作业才可以创建TensorBoard作业。

创建模型

基于当前训练版本创建模型,详细参见导入模型。只有“运行成功”的训练作业,支持此操作。

修改训练作业

如果当前版本的训练结果不满足业务需求时,或者训练作业“运行失败”时,您可以单击“修改”,跳转至训练作业参数设置页面,训练作业的参数说明请参见“创建训练作业”。根据实际情况调整作业参数后,单击“确定”启动新版本的训练作业。

保存作业参数

将此版本的作业参数可保存为新的作业参数。单击“更多操作>保存作业参数”,进入“作业参数”页面,确认信息无误后的,单击确定完成操作。作业参数管理详情请参见管理作业参数

停止

单击“更多操作>停止”可停止当前版本的训练作业。只有“运行中”的训练作业版本才支持停止操作。

删除

单击“更多操作>删除”可停止当前版本的训练作业。

图3 快捷操作
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问