更新时间:2024-01-23 GMT+08:00
分享

选择数据

在使用通用图像分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。

训练数据集可以选择创建一个新的数据集,也可以选择导入基于通用图像分类工作流创建的其他应用中已创建的数据集。

前提条件

  • 通用图像分类工作流支持将服务一键部署至边缘设备,如果将服务部署至边缘设备,请提前在华为HiLens控制台注册HiLens Kit设备,详细注册方式请前往华为云论坛参与讨论。
  • 已在“工业智能体控制台>工业AI开发>工业AI开发工作流”选择“通用图像分类工作流”新建应用,详情请见新建应用
  • 准备好数据并上传至OBS,详情请见准备数据

进入应用开发页面

  • 方式一:首次进入

    基于预置工作流新建应用后,直接进入“应用开发”v1版本页面。

  • 方式二:新建应用后进入
    1. 登录工业智能体控制台,左侧导航栏选择“工业AI开发>工业AI开发工作流”
    2. 选择已新建的应用名称,单击“操作”列的“查看”

      进入“应用总览”页面。

      图1 进入应用总览页面
    3. 在开发版本列表中单击“操作”列的“查看”

      进入“应用开发”页面。

      图2 进入应用开发

新建训练数据集

“数据选择”页面,单击“新建训练数据集”,右侧弹出“新建数据集”页面,根据数据存储位置和数据标注情况,按表1填写数据集基本信息,然后单击“确定”

图3 新建数据集
表1 新建训练数据集参数说明

参数

说明

数据集名称

待新建的数据集名称。

描述

数据集简要描述。

数据集输入位置

训练数据存储至OBS的位置。

单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”对话框中,选择“OBS桶”“文件夹”,然后单击“确定”

数据集输出位置

待新建的数据集存储至OBS的位置。

待新建的数据集有一个默认存储位置。如果需要修改数据集存储位置,请单击“数据集输出位置”右侧的“修改”,在弹出的“数据集输出位置”对话框中,选择“OBS桶”“文件夹”,然后单击“确定”

说明:

“数据集输出位置”不能与“数据集输入位置”为同一路径,且不能是“数据集输入位置”的子目录。“数据集输出位置”建议选择一个空目录。

新建训练数据集后,勾选当前应用开发所需的训练数据集。

由于模型训练过程需要有标签的数据,针对已上传的数据集,手动添加或修改标签。详情请见创建标注任务

导入已有数据集

  1. “数据选择”页面,单击“导入数据集”

    弹出“导入数据集”对话框。

    “导入数据集”对话框会显示您在通用图像分类工作流创建的数据集信息,包括“数据集名称”“创建时间”等信息。

    图4 导入数据集
  2. 勾选数据集,然后单击“确定”

    数据集导入后,“数据选择”页面会显示已导入的数据。

创建标注任务

由于模型训练过程需要有标签的数据,针对未标注的数据集,您可以创建标注任务,然后前往Modelarts页面对数据进行手工标注。

  1. 创建标注任务

    单击数据集操作列的“创建标注任务”,在对话框中输入“标注任务名称”“添加标签集”,然后单击“确定”,创建新的标注任务。

    图5 创建标注任务
  2. 标注数据

    单击下拉箭头选项会显示该数据集的标注任务。

    单击标注任务操作列的“标注”,进入Modelarts的数据标注页面,开始手动标注数据。

    图6 数据集标注任务

查看标签解析

新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”

图7 标签解析

后续操作

选择训练数据集后,单击右下角的“下一步”,进入应用开发的“模型训练”步骤,详细操作指引请参见4.11.4-训练模型

相关文档