更新时间:2021-09-18 GMT+08:00
分享

创建工程

创建联邦学习工程,编写代码,进行模型训练,生成模型包。此联邦学习模型包可以导入至联邦学习部署服务,作为联邦学习实例的基础模型包。

在联邦学习部署服务创建联邦学习实例时,将“基础模型配置”选择为“从NAIE平台中导入”,自动匹配模型训练服务的联邦学习工程及其训练任务和模型包。

创建联邦学习工程步骤如下。

  1. 单击“创建”,弹出“创建训练”对话框。

    配置联邦学习工程参数,如表1所示。
    表1 参数说明

    参数名称

    参数说明

    请选择模型训练方式

    模型训练方式。包含如下选项:

    • 新建模型训练工程
    • 新建联邦学习工程
    • 新建训练服务
    • 新建超参优化服务

    请选择:新建联邦学习工程。

    模型训练名称

    模型训练名称。

    只能以字母(A~Z a~z)开头,由字母、数字(0~9)、下划线(_)组成,不能以下划线结尾,长度范围为[1,26]。

    描述

    对新建联邦学习工程的描述。

    开发环境

    训练工程使用的开发环境,支持:

    • WebIDE

      WebIDE提供类似本地VSCode的编码体验,支持代码自动补齐、调试等功能,适用于大量代码编写场景。创建在线IDE版联邦学习训练模型时选择“WebIDE”开发环境。

    • 简易编辑器

      简易编辑器提供代码查看和编辑能力,不支持调试,适用于少量代码修改场景。创建WEB版联邦学习训练模型时,选择“简易编辑器”开发环境。

    规格

    当“开发环境”选择“WebIDE”时展示,用于设置WebIDE资源的规格。请根据实际需求选择具体规格。

    实例

    当“开发环境”选择“WebIDE”时展示,用于设置当前环境规格对应的环境实例。

    • 如果当前选定的规格有环境实例,可选择已存在的实例。
    • 如果当前选定的规格没有可用的实例,可选择“新建一个新环境”。

  2. 单击“确定”。

    进入联邦学习工程详情界面,如图1所示。界面说明如表2所示。
    图1 联邦学习工程详情界面
    表2 界面说明

    区域

    参数名称

    参数说明

    1(训练工程)

    创建时间

    联邦学习工程创建时间

    类型

    模型训练的类型

    创建者

    创建联邦学习工程的用户

    活动时间

    最近一次模型训练执行的时间

    开发环境

    联邦学习模型训练运行环境信息,可通过下拉框切换当前环境。

    进入代码编辑界面

    创建联邦学习训练任务,详细请参考:

    删除联邦学习训练工程

    模型训练工程描述

    描述信息,支持单击图标,编辑描述信息。

    对训练任务的训练报告进行对比,输出训练任务在不同超参下的评估指标,同时显示各训练任务的任务系统参数。

    说明:

    最多支持3个模型报告对比。

    切换到其他模型训练工程、联邦学习工程、训练服务或超参优化服务详情界面。

    Web IDE环境资源配置与管理,包括创建环境、暂停运行中的环境以及删除已有环境。还可查看当前所有配置了Web IDE环境资源的项目的环境信息。

    新建训练工程、联邦学习工程、训练服务或超参优化服务。

    2(模型训练任务)

    根据训练状态快速检索训练任务。

    仅展示关注的任务。

    用户可以单击任务名称左侧的关注指定任务,再次单击取消关注。

    根据任务创建时间、任务名称检索训练任务。

    默认按任务创建时间检索。

    按任务创建时间或者任务名称检索训练任务,检索结果按正序或者倒序排列展示。

    默认按倒序排序。

    任务名称

    模型训练任务的名称

    任务描述

    模型训练任务的描述信息

    任务创建时间

    模型训练任务创建的时间

    训练用时

    模型训练耗时时长

    Tensorboard

    Tensorboard状态

    训练状态

    显示训练任务当前的状态。

    包括如下状态:

    • ALL显示所有训练任务。
    • WAITING表示训练任务准备中。
    • RUNNING表示正在训练。
    • FINISHED表示训练成功
    • FAILED表示训练失败。
    • STOPPED表示停止训练任务。

    评估报告

    单击可查看训练评估报告详情。

    资源占用

    显示训练算法CPU、GPU和RAM的占用情况。

    峰值

    显示训练算法CPU、GPU和RAM使用过程中的峰值。

    训练状态为RUNNING时,可以执行此按钮停止训练任务。

    查看验证任务的详细情况,包括系统日志、运行日志、运行图和Tensorboard。

    删除训练任务。

    查看优化报告。

    打包训练模型。

    说明:

    仅训练成功的模型支持打包。

相关文档