文档首页 > > AI工程师用户指南> 管理数据> 自动分组

自动分组

分享
更新时间: 2020/02/14 GMT+08:00

为了提升智能标注算法精度,可以均衡标注多个类别,有助于提升智能标注算法精度。ModelArts内置了分组算法,您可以针对您选中的数据,执行自动分组,提升您的数据标注效率。

自动分组可以理解为数据标注的预处理,先使用聚类算法对未标注图片进行聚类,再根据聚类结果进行处理,可以分组打标或者清洗图片。

例如,用户通过搜索引擎搜索XX,将相关图片下载并上传到数据集,然后再使用自动分组,可以将XX图片分类,比如论文、宣传海报、确认为XX的图片、其他。用户可以根据分组结果,快速剔除调不想要的,或者将某一类直接全选后添加标签。

目前只有“图像分类”和“物体检测”类型的数据集支持自动分组功能。

启动自动分组任务

  1. 登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理(Beta) > 数据集”,进入“数据集”管理页面。
  2. 在数据集列表中,选择“物体检测”或“图像分类”类型的数据集,单击数据集名称进入“数据集概览页”
  3. “数据集概览页”,单击右上角“开始标注”,进入数据集详情页。
  4. 在数据集详情页的“全部”页签中,单击“自动分组 > 启动任务”

    只能在“全部”页签下启动自动分组任务或查看任务历史。

  5. 在弹出的“自动分组”对话框中,填写参数信息,然后单击“确定”
    • “分组数”:填写2~200之间的整数,指将图片分为多少组。
    • “结果处理方式”“更新属性到当前样本中”,或者“保存到对象存储服务(OBS)”
    • “属性名称”:当选择“更新属性到当前样本中”时,需输入一个属性名称。
    • “结果存储目录”:当选择“保存到对象存储服务(OBS)”时,需指定一个用于存储的OBS路径。
    • “高级特征选项”:启用此功能后,可选择“清晰度”“亮度”“图像色彩”等维度为自动分组功能增加选项,使得分组着重于图片亮度、色彩和清晰度等特征进行分组。支持多选。
    图1 自动分组
  6. 启动任务提交成功后,界面右上角显示此任务的进度。等待任务执行完成后,您可以查看自动分组任务的历史记录,了解任务状态。

查看自动分组结果

在数据集详情页面的“全部”页签中,展开“筛选条件”,将“样本属性”设置为自动分组任务中的“属性名称”,并通过设置样本属性值,筛选出分组结果。

图2 查看自动分组结果

查看自动分组的历史任务

在数据集详情页面的 “全部”页签中,单击 “自动分组 > 任务历史”。在弹出的 “任务历史”对话框中,展示当前数据集之前执行的自动分组任务的基本信息。
图3 自动分组任务历史
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区