更新时间:2024-01-23 GMT+08:00
分享

选择数据

在使用云状识别工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。

训练数据集可以选择创建一个新的数据集,也可以选择导入基于云状识别工作流创建的其他应用中已创建的数据集。

前提条件

  • 云状识别工作流支持将服务一键部署至边缘设备,如果将服务部署至边缘设备,请提前在华为HiLens控制台注册Atlas 500设备,详细注册方式请前往华为云论坛参与讨论。
  • 已在视觉套件控制台选择“云状识别工作流”新建应用,详情请见新建应用
  • 已准备数据并上传至OBS,详情请见准备数据

进入应用开发页面

  • 方式一:首次进入

    基于预置工作流新建应用后,直接进入“应用开发”v1版本页面。

  • 方式二:新建应用后进入
    1. 登录“ModelArts Pro>视觉套件”控制台。

      默认进入“应用开发>工作台”页面。

    2. 选择已新建的应用名称,单击“操作”列的“查看”

      进入“应用总览”页面。

      图1 进入应用总览
    3. 在开发版本列表中单击“操作”列的“查看”

      进入“应用开发”页面。

      图2 进入应用开发

新建训练数据集

“数据选择”页面,单击“新建训练数据集”,右侧弹出“新建数据集”页面,根据数据存储位置和数据标注情况,按表1填写数据集基本信息,然后单击“确定”

图3 新建数据集
表1 新建训练数据集参数说明

参数

说明

数据集名称

待新建的数据集名称。

描述

数据集简要描述。

数据集输入位置

训练数据存储至OBS的位置。

单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”“文件夹”,然后单击“确定”

数据集输出位置

待新建的数据集存储至OBS的位置。

待新建的数据集有一个默认存储位置。如果需要修改数据集存储位置,请单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”“文件夹”,然后单击“确定”

说明:

“数据集输出位置”不能与“数据集输入位置”为同一路径,且不能是“数据集输入位置”的子目录。“数据集输出位置”建议选择一个空目录。

新建训练数据集后,勾选当前应用开发所需的训练数据集。

由于模型训练过程需要有标签的数据,针对已上传的数据集,手动添加或修改标签。

单击数据集操作列的“标注”,进入数据集概览页单击右上角的“开始标注”,在“数据标注”页面手动标注数据。

导入数据集

  1. “数据选择”页面,单击“导入数据集”

    弹出“导入数据集”对话框。

    “导入数据集”对话框会显示您在云状识别工作流创建的其他应用中已使用的数据集信息,包括“数据集名称”“标注进度”

    图4 导入数据集
  2. 勾选数据集,然后单击“确定”

    数据集导入后,“数据选择”页面右上角会显示“数据集导入成功”

  3. 导入勾选数据集后,在数据选择页面勾选当前应用开发所需的训练数据集。

    由于模型训练过程需要有标签的数据,针对已上传的数据集,手动添加或修改标签。

    单击数据集操作列的“标注”,进入数据集概览页单击右上角的“开始标注”,在“数据标注”页面手动标注数据。

查看标签解析

新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”

图5 标签解析

后续操作

选择训练数据集后,单击右下角的“下一步”,进入应用开发的“模型训练”步骤,详细操作指引请参见训练模型

相关文档