更新时间:2023-09-06 GMT+08:00

智能标注

除了人工标注外,ModelArts还提供了智能标注功能,快速完成数据标注,为您节省70%以上的标注时间。智能标注是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。

背景信息

  • 目前只有“图像分类”和“物体检测”类型的数据集支持智能标注功能。
  • 启动智能标注时,需数据集存在至少2种标签,且每种标签已标注的图片不少于5张。
  • 启动智能标注时,必须存在未标注图片。
  • 启动智能标注前,保证当前系统中不存在正在进行中的智能标注任务。
  • 检查用于标注的图片数据,确保您的图片数据中,不存在RGBA四通道图片。如果存在四通道图片,智能标注任务将运行失败,因此,请从数据集中删除四通道图片后,再启动智能标注。

智能标注

  1. 登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理 > 数据集”,进入“数据集”管理页面。
  2. 在数据集列表中,选择“物体检测”或“图像分类”类型的数据集,单击操作列的“智能标注”启动智能标注作业。
  3. 在弹出的“启动智能标注”对话框中,选择智能标注类型,可选“主动学习”或者“预标注”,详见表1表2
    表1 主动学习

    参数

    说明

    智能标注类型

    “主动学习”“主动学习”表示系统将自动使用半监督学习、难例筛选等多种手段进行智能标注,降低人工标注量,帮助用户找到难例。

    算法类型

    针对“图像分类”类型的数据集,您需要选择以下参数。

    “快速型”:仅使用已标注的样本进行训练。

    “精准型”:会额外使用未标注的样本做半监督训练,使得模型精度更高。

    表2 预标注

    参数

    说明

    智能标注类型

    “预标注”“预标注”表示选择用户AI应用管理里面的AI应用,选择模型时需要注意模型类型和数据集的标注类型相匹配。预标注结束后,如果标注结果符合平台定义的标准标注格式,系统将进行难例筛选,该步骤不影响预标注结果。

    选择模型及版本

    • “我的AI应用”。您可以根据实际需求选择您的AI应用。您需要在目标AI应用的左侧单击下拉三角标,选择合适的版本。您的AI应用导入参见创建AI应用

    计算节点规格

    在下拉框中,您可以选择目前ModelArts支持的节点规格选项。

    计算节点个数

    默认为1。您可以根据您的实际情况选择,最大为5。

    • 针对“物体检测”类型的数据集,选择“主动学习”时,只支持识别和标注矩形框。
    • 当系统中智能标注作业过多时,可能会出现排队的情况,导致作业一直处于“标注中”的状态。请您耐心等待,系统会按照顺序完成标注作业。
    图1 启动智能标注(图像分类)
    图2 启动智能标注(物体检测)
    图3 启动智能标注(预标注)
  4. 完成参数设置后,单击“提交”,即可启动智能标注。
  5. 在数据集列表中,单击数据集名称进入“数据集概览”页。
  6. “数据集概览页”,单击右上角“开始标注”,进入数据集详情页。
  7. 在数据集详情页,单击“待确认”页签,即可查看智能标注进度。
    您也可以在该页签,“启动智能标注”或者查看“智能标注历史”
    图4 标注进度
  8. 智能标注完成后,“待确认”页面将呈现所有标注后的图片列表。
    • 图像分类数据集

      “待确认”页面查看标签是否准确,勾选标注准确的图片,然后单击“确认”完成智能标注结果的确认。确认完成后的图片将被归类至“已标注”页面下。

      针对标为“难例”的图片,您可以根据实际情况判断,手工修正标签。详细操作及示例请参见•针对“图像分类”数据集

    • 物体检测数据集

      “待确认”页面,单击图片查看标注详情,查看标签及目标框是否准确,针对标注准确的图片单击“确认标注”完成智能标注结果的确认。确认完成后的图片将被归类至“已标注”页面下。

      针对标为“难例”的图片,您可以根据实际情况判断,手工修正标签或目标框。详细操作及示例请参见•针对“物体检测”数据集