更新时间:2024-03-26 GMT+08:00

数据标注

物体检测之前,首先需考虑如何设计标签,标签设计需要对应所检测图片的明显特征,并且选择的标签最好比较容易识别(画面主体物与背景区分度较高),每个标签就是对所检测图片期望识别的全部结果。物体的标签设计完成之后,基于设计好的标签准备该图片的数据,每种需识别出的标签,建议应在所有图片个数相加超过100张,若某些图片的标签具有相似性,则需要更多的图片。

  • 标注时,类内方差尽量要小。即相同类别的标注,尽量近似;不同类别的标注,尽量保持差距较大。
  • 标记的每个标签尽量和背景有较大的区分度。
  • 物体检测标注,需要保证目标框内物体的完整性;针对图片中存在多个物体的情形,做到不重标、不漏标。

图片标注

  1. “数据标注”页面单击“未标注”页签,此页面展示所有未标注的图片数据。单击任意一张图片,进入图片标注界面。
  2. 用鼠标框选图片中的物体所在区域,然后在弹出的对话框中选择标签颜色,输入标签名称,例如此示例中的“yunbao”,按“Enter”键完成此标签的添加。标注完成后,左侧图片目录中此图片的状态将显示为“已标注”
    数据标注的更多说明:
    • 您可以在图片上方或下方单击左右切换键,或者按键盘的左右方向键,选择其他图片,重复上述操作继续进行图片标注。如果一张图片有多个物体,您可以标注多处。
    • 同一个物体检测自动学习项目内,可以增加多个标签,且标签可选择不同颜色,方便识别。使用鼠标完成物体框选后,在弹出的对话框中,选择新的颜色,输入新的标签名称,即可添加一个新的标签。
    • 自动学习项目中,物体检测仅支持矩形标注框。在“数据管理”功能中,物体检测类型的数据集,支持更多类型的标注框。
    • 在标注窗口中,您可以滚动鼠标,放大或缩小图片,方便您快速定位到物体位置。
    图1 物体检测图片标注

  3. 当图片目录中所有图片都完成标注后,单击左上角“自动学习”,在弹出的对话框中单击“确定”保存标注信息。页面将进入数据标注页面,可以在“已标注”页签下查看已完成标注的图片,或者通过右侧的标签信息,了解当前已完成的标签名称和标签数量。

同步或添加图片

“自动学习”页面,单击项目名称,进入“自动学习 > 数据标注”页面。项目创建时,数据标注的图片来源有两种,通过本地添加图片和同步OBS中的图片数据。

图2 添加本地图片
图3 同步OBS图片数据
  • 添加图片:您可以将本地图片快速添加到ModelArts,同时自动上传至创建项目时所选择的OBS路径中。单击“添加图片”,在弹出的对话框中单击“添加图片”并添加。一次上传所有图片的总大小不能超过8MB。单张图片大小不能超过5MB。
  • 同步数据源:将图片数据上传至创建项目时指定的OBS目录,然后单击“同步数据源”,快速将通过OBS目录中的图片数据添加到ModelArts。
  • 删除图片:您可以依次单击选中图片进行删除,也可以勾选“选择当前页”对该页面所有图片进行删除。

    所有的删除操作均不可恢复,请谨慎操作。

修改标注

当数据完成标注后,您还可以进入已标注页签,对已标注的数据进行修改。

  • 基于图片修改

    在数据集详情页面,单击“已标注”页签,然后在图片列表中选中待修改的图片,单击该图片跳转到标注页面,在右侧“标注”信息区域中对图片信息进行修改。

    • 修改标签:“标注”区域中,单击编辑按钮,在文本框中输入正确的标签名,然后单击按钮完成修改。标签颜色不支持修改。
    • 删除标签:在“标注”区域中,单击删除按钮,即可删除此图片中的标签。

      标签删除后,单击页面左上角的项目名称离开标注页面。该图片会重新回到“未标注”页签。

      图4 编辑物体检测标签
  • 基于标签修改

    在数据集详情页面,单击“已标注”页签,在图片列表右侧,显示全部标签的信息。单击操作列的编辑按钮,然后在弹出的对话框中输入修改后的标签名,然后单击“确定”完成修改。修改后,之前添加了此标签的图片,都将被标注为新的标签名称。

    图5 物体检测的全部标签