图像分割
由于模型训练过程需要大量有标签的图片数据,因此在模型训练之前需对没有标签的图片添加标签。您可以通过在ModelArts控制台进行标注,也可以对已标注图片修改或删除标签进行重新标注。
针对图像分割场景,开始标注前,您需要了解:
- 图片中需要提取轮廓的物体都要标注。
- 支持使用多边形标注。
- 多边形标注,根据目标物体的轮廓绘制多边形。
- 多边形标注或极点标注时,标注框必须在图片范围内,超出图片将导致后续作业异常。
开始标注
- 登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理> 数据标注”,进入“数据标注”管理页面。
数据管理模块在重构升级中,对未使用过数据管理的用户不可见。如果要使用数据管理相关功能,建议提交工单开通权限。
- 在标注作业列表右侧“所有类型”页签下拉选择标注类型。基于“标注类型”选择需要进行标注的标注作业,单击标注作业名称进入标注作业标注详情页。
图1 下拉选择标注类型
- 在标注作业标注详情中,展示此标注作业下全部数据。
同步新数据
ModelArts会自动将数据集中新增的数据同步至标注作业,包含数据及当前标注作业支持的标注信息。
为了快速获取数据集中最新数据,可在标注作业详情页的“全部”、“未标注”或“已标注”页签中,单击“同步新数据”,快速将数据集中的数据添加到标注作业中。
问题现象:
将已标注好的数据上传至OBS,同步数据后,显示为未标注。
原因分析:
可能是OBS桶设置了自动加密导致此问题。
解决方法:
需要新建OBS桶重新上传数据,或者取消桶加密后,重新上传数据。
筛选数据
在标注作业详情页面,默认展示作业中“未标注”数据,您可以在“全部”、“未标注”或页签下,在筛选条件区域,单击,添加筛选条件,快速过滤出您想要查看的数据。
支持的筛选条件如下所示,您可以设置一个或多个选项进行筛选。
- 难例集:难例或非难例。
- 标签:您可以选择全部标签,或者基于您指定的标签,选中其中一个或多个。
- 文件名或目录:根据文件名称或者文件存储目录筛选。
- 标注人:选择执行标注操作的账号名称。
- 样本属性:表示自动分组生成的属性。只有启用了自动分组任务后才可使用此筛选条件。
- 数据属性:筛选数据的来源,选择“全部”或“推理”。
标注图片(手工标注)
标注作业详情页中,展示了此标注作业中“全部”、“未标注”和“已标注”的图片,默认显示“未标注”的图片列表。
- 在“未标注”页签图片列表中,单击图片,自动跳转到标注页面。在标注页面,常用按钮的使用可参见表2。
- 选择标注方式。
- 标注物体。
识别图片中的物体,单击左键分别定位物体的最上、最左、最下、最右的位置点。确定位置后,单击标注区域,将弹出对话框,填入标签名称,单击“确定”。完成一张图片标注后,可单击图片下方展开缩略图,查看图片列表,快速选中其他未标注的图片,然后在标注页面中执行标注操作。
- 单击页面上方“返回数据标注预览”查看标注信息,在弹框中单击“确定”保存当前标注并离开标注页面。
选中的图片被自动移动至“已标注”页签,且在“未标注”和“全部”页签中,标签的信息也将随着标注步骤进行更新,如增加的标签名称、标签对应的图片数量。
查看已标注图片
在标注作业详情页中,单击“已标注”页签,您可以查看已完成标注的图片列表。单击图片进入图片标注详情,可在右侧的“当前文件标签”中了解当前图片的标签信息。
快速复核
当前的标注作业无法实现批量复核,如果有某一样本的标签修改或者删除,只能进入到标注页面详情进行,操作繁琐。为了简化用户操作,实现此功能,用户可以批量进行标注信息的审核或者修改,提升用户效率。
- 登录ModelArts管理控制台,在总览页选择“数据管理>数据标注”,进入“我创建的”页签,在右上方的作业类型中下拉选择对应类型的标注作业。(仅物体检测与图像分割支持快速复核功能)
- 在物体检测类型的标注作业列表,单击标注作业名称,进入标注详情页。
- 单击“已标注”页签的“快速复核”,进入复核页面,对标注结果进行确认。
图3 进入快速复核
- 快速复核,支持您按照标签批量复核。
- 在复核页面,单击“按照标签过滤”,选择需要复核的标签类型图片。
- 在当前页面,您可以选择对当前的标签类型的图片,按照标注面积排序,或按照宽高比排序。
- 依次单击需要复核的图片,在标注页面拖动图片的标注框,即可重新完成标注。(修改后的图片会带有“已修改”的信息。)
- 您也可以选中需要删除标签的图片,单击右上方的,删除原始的标注信息。(删除后的图片会带有“已删除”的信息)
图4 已修改
图5 已删除
- 您也可以对当前已标注的图片标签信息进行修改。
- 选中待复核的图片,单击右侧的“全部标签”区域的按钮。
- 输入新的标签,单击“确定”。
图6 全部标签
图7 添加标签
- 标注页面和标签都修改完成后,单击“应用所有修改”,在弹出的对话框单击“确定”,自动返回至标注概览页,同时会覆盖原始的标注数据。
图8 应用所有修改
- 如果您对修改后的数据不满意,也可以单击“放弃修改”选择放弃本次修改,保持原有的标注数据。
图9 放弃修改
表3 快速复核界面的常用按钮 按钮图标
功能说明
删除原有的标注数据,删除后可重新标注。
还原本页所有操作至未复核页面。
撤销上一步操作。
重做上一步操作。
修改标注信息
当数据完成标注后,您还可以进入已标注页签,对已标注的数据进行修改。
在数据标注详情页面,单击“已标注”页签,然后在图片列表中选中待修改的图片,单击图片跳转到标注页面,在右侧标签信息区域中单击此图片已添加的标注信息。
- 修改标签:“标注”区域中,单击编辑图标,在弹出框中输入正确的标签名或标签颜色,然后单击完成修改。也可以单击标签,在图片标注区域,调整标注框的位置和大小,完成调整后,单击其他标签即可保存修改。
- 删除标签:在“标注”区域中,单击删除图标即可删除此图片中的标签。图片的标签全部删除后,该图片会重新回到“未标注”页签。
标注信息修改后,单击页面左上角的“返回数据标注预览”离开标注页面,在弹出对话框中单击“确定”保存修改。
添加数据
除了同步数据集中的新数据外,您还可以在标注作业中,直接添加图片,用于数据标注。添加的数据将先导入至标注任务关联的数据集中,然后标注任务会自动同步数据集中最新的数据。
- 在标注作业详情页面,单击“全部”、“已标注”或“未标注”页签,然后单击左上角“添加数据”,选择添加数据。
图10 添加数据
- 在弹出的导入对话框中,选择数据来源和导入方式,选择导入的数据路径和数据标注状态。
图11 添加图片
- 在导入对话框中,单击“确定”,完成添加数据的操作。
您添加的图片将自动呈现在“全部”的图片列表中,也可单击“添加数据>查看历史记录”,进入“任务历史”界面,可查看相应的导入历史。
图12 查看历史数据
删除图片
通过数据删除操作,可将需要丢弃的图片数据快速删除。
在“全部”、“未标注”或“已标注”页面中,依次选中需要删除的图片,或者选择“选择当前页”选中该页面所有图片,然后单击左上角“删除图片”。在弹出的对话框中,根据实际情况选择是否勾选“同时删除OBS源文件”,确认信息无误后,单击“确定”完成图片删除操作。
其中,被选中的图片,其左上角将显示为勾选状态。如果当前页面无选中图片时,“删除图片”按钮为灰色,无法执行删除操作。
如果勾选了“同时删除OBS源文件”,删除图片操作将删除对应OBS目录下存储的图片,此操作可能会影响已使用此源文件的其他数据集或数据集版本,有可能导致展示异常或训练/推理异常。删除后,数据将无法恢复,请谨慎操作。