更新时间:2021-09-18 GMT+08:00
分享

创建工程

创建训练工程是从创建模型训练工程、编辑模型训练代码到调试模型训练代码的端到端的代码开发过程。

  • 创建模型训练工程:创建模型训练代码编辑和调试的环境。
  • 编辑模型训练代码:在线编辑模型训练代码。
  • 调试模型训练代码:在线调试编辑好的模型训练代码。

创建训练工程步骤如下。

  1. 单击“创建”,弹出“创建训练”对话框。
  2. 配置训练工程参数,如表1所示。

    表1 新建训练工程参数说明

    参数名称

    参数说明

    请选择模型训练方式

    模型训练方式。包含如下选项:

    • 新建模型训练工程
    • 新建联邦学习工程
    • 新建训练服务
    • 新建超参优化服务

    请选择:新建模型训练工程。

    模型训练名称

    模型训练名称。

    只能以字母(A~Z a~z)开头,由字母、数字(0~9)、下划线(_)组成,不能以下划线结尾,长度范围为[1,26]。

    描述

    对新建模型训练工程的描述。

    模型试验算法

    通用算法选择:分类算法、拟合算法、聚类算法、其他类型。如果选择分类算法,可以看到“创建入门模型训练代码”,如果勾选,则自动生成鸢尾花分类建模的样例代码。

    开发环境

    训练工程使用的开发环境,支持:

    • WebIDE

      WebIDE提供类似本地VSCode的编码体验,支持代码自动补齐、调试等功能,适用于大量代码编写场景。创建在线IDE版训练模型时选择“WebIDE”开发环境。

    • 简易编辑器

      简易编辑器提供代码查看和编辑能力,不支持调试,适用于少量代码修改场景。创建WEB版训练模型时,选择“简易编辑器”开发环境。

    规格

    当“开发环境”选择“WebIDE”时展示,用于设置WebIDE资源的规格。请根据实际需求选择具体规格。

    实例

    当“开发环境”选择“WebIDE”时展示,用于设置当前环境规格对应的环境实例。

    • 如果当前选定的规格有环境实例,可选择已存在的实例。
    • 如果当前选定的规格没有可用的实例,可选择“新建一个新环境”。

  3. 单击“确定”。

    进入模型训练工程详情页面,如图1所示。界面介绍如表2所示。
    图1 模型训练工程详情界面
    表2 模型训练工程详情界面说明

    区域

    参数名称

    参数说明

    1(训练工程)

    创建时间

    训练工程创建时间

    类型

    模型训练的类型

    创建者

    创建训练工程的用户

    活动时间

    最近一次模型训练执行的时间

    开发环境

    模型训练运行环境信息,可通过下拉框切换当前环境。

    进入模型训练编辑界面

    创建训练任务,详细请参考:

    删除训练工程

    模型训练工程描述

    模型训练工程的描述信息,支持单击“”编辑描述信息。

    对训练任务的训练报告进行对比,输出训练任务在不同超参下的评估指标,同时显示各训练任务的任务系统参数。

    说明:

    最多支持3个模型报告对比。

    切换到其他的训练工程、训练服务或超参优化服务的模型训练页面中。

    Web IDE环境资源配置与管理,包括创建环境、暂停运行中的环境以及删除已有环境。还可查看当前所有配置了Web IDE环境资源的项目的环境信息。

    新建训练工程、联邦学习工程、训练服务或超参优化服务。

    2(模型训练任务)

    根据训练状态快速检索训练任务。

    仅展示关注的任务。

    用户可以单击任务名称左侧的关注指定任务,再次单击取消关注。

    根据任务创建时间、任务名称检索训练任务。

    默认按任务创建时间检索。

    按任务创建时间或者任务名称检索训练任务,检索结果按正序或者倒序排列展示。

    默认按倒序排序。

    任务名称

    模型训练任务的名称

    任务描述

    模型训练任务的描述信息

    任务创建时间

    模型训练任务创建的时间

    训练用时

    模型训练耗时时长

    Tensorboard

    Tensorboard状态

    训练状态

    显示训练任务当前的状态。

    包括如下状态:

    • ALL显示所有训练任务。
    • WAITING表示训练任务准备中。
    • RUNNING表示正在训练。
    • FINISHED表示训练成功
    • FAILED表示训练失败。
    • STOPPED表示停止训练任务。

    评估报告

    单击可查看训练评估报告详情。

    资源占用

    显示训练算法CPU、GPU和RAM的占用情况。

    峰值

    显示训练算法CPU、GPU和RAM使用过程中的峰值。

    训练状态为RUNNING时,可以执行此按钮停止训练任务。

    查看验证任务的详细情况,包括系统日志、运行日志、运行图和Tensorboard。

    删除训练任务。

    查看优化报告。

    打包训练模型。

    说明:

    仅训练成功的模型支持打包。

相关文档