更新时间:2023-06-02 GMT+08:00

数据标注

由于模型训练过程需要大量有标签的图片数据,因此在模型训练之前需对没有标签的图片添加标签。通过ModelArts您可对图片进行一键式批量添加标签,快速完成对图片的标注操作,也可以对已标注图片修改或删除标签进行重新标注。用于训练的图片,至少有2种以上的分类,每种分类的图片数不少于5张,建议至少50张图片,则效果会更佳,若图像分类相似度较高,则需要更多的图片。

图片标注

  1. “数据标注”页面单击“未标注”页签,此页面展示所有未标注的图片数据。依次单击选中待标注的图片,或勾选“选择当前页”选中该页面所有图片,在页面右侧进行图片标注。
    图1 图片标注
  2. 选中图片后,在页面右侧“添加标签”,输入“标签名”或从下拉列表中选择已添加的标签。单击“确定”,完成选中图片的标注操作。例如,您可以选择多张图片,按照花朵种类将图片标注为“tulips”。同样选择其他未标注分类图片,将其标注为“sunflowers”、“roses”等。标注完成后,图片将存储至“已标注”页签下。
    1. 图片标注支持多标签,即一张图片可添加多个标签。
    2. 标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。
    图2 图像分类图片标注
  3. 当图片目录中所有图片都完成标注后,您可以在“已标注”页签下查看已完成标注的图片,或者通过右侧的“全部标签”列表,了解当前已完成的标签名称和标签数量。

同步或添加图片

“自动学习”页面,单击项目名称,进入“自动学习 > 数据标注”页面。项目创建时,数据标注的图片来源有两种,通过本地添加图片和同步OBS中的图片数据。

图3 添加本地图片
图4 同步OBS图片数据
  • 添加图片:您可以将本地图片快速添加到ModelArts,同时自动上传至创建项目时所选择的OBS路径中。单击“添加图片”,在弹出的对话框中单击“添加图片”并添加。一次上传所有图片的总大小不能超过8MB。单张图片大小不能超过5MB。
  • 同步数据源:将图片数据上传至创建项目时指定的OBS目录,然后单击“同步数据源”,快速将通过OBS目录中的图片数据添加到ModelArts。
  • 删除图片:您可以依次单击选中图片进行删除,也可以勾选“选择当前页”对该页面所有图片进行删除。

    所有的删除操作均不可恢复,请谨慎操作。

修改标注

当数据完成标注后,您还可以进入已标注页签,对已标注的数据进行修改。

  • 基于图片修改

    在数据标注页面,单击“已标注”页签,然后在图片列表中选中待修改的图片(选择一个或多个)。在右侧标签信息区域中对图片信息进行修改。

    • 添加标签:在“标签名”右侧文本框中,选择已有标签或输入新的标签名,然后单击“确定”,为选中图片增加标签。
    • 修改标签:在“选中文件标签”区域中,单击操作列的编辑图标,然后在文本框中输入正确的标签名,然后单击图标完成修改。
      图5 编辑标签
    • 删除标签:在“选中文件标签”区域中,单击操作列的删除该标签。
  • 基于标签修改

    在数据标注页面,单击“已标注”页签,在图片列表右侧,显示全部标签的信息。

    图6 全部标签的信息
    • 修改标签:单击操作列的编辑按钮,然后在弹出的对话框中输入修改后的标签名,然后单击“确定”完成修改。修改后,之前添加了此标签的图片,都将被标注为新的标签名称。
    • 删除标签:单击操作列的删除按钮,在弹出的对话框中,选择“仅删除标签”“删除标签及仅包含此标签的图片(不删除源文件)”“删除标签及仅包含此标签的图片(同时删除源文件)”,然后单击“确定”
      图7 删除标签