更新时间:2022-05-13 GMT+08:00
分享

团队标注使用教程

当需要标注的数据较多,且无法使用智能标注完成时,可联合多人一起标注。本案例指导您使用ModelArts团队标注功能,将多人组成一个标注团队,针对同一数据集进行标注。

数据集的管理者在ModelArts管理控制台发起并分发任务,必须完成准备工作,而被分发了标注任务的标注人员,无需华为云帐号,其仅需进入“ModelArts数据标注平台”(任务邮件将提供详细访问地址),完成数据标注即可。团队标注的完整操作流程如下所示,其中蓝色部分为数据集管理者所需执行的任务,黄色部分为标注成员需执行的任务。

图1 团队标注流程

本案例当前仅支持华北-北京一、华东-上海一、华南-广州区域。

准备工作

在使用 ModelArts 进行 AI 开发前,需先完成以下基础操作(如有已完成部分,请忽略)。
  • 使用手机号注册华为云帐号。
  • 完成实名认证,账号类型选“个人”,个人认证类型推荐使用“扫码认证”。
  • 进入ModelArts控制台数据管理页面,上方会提示访问授权,单击“服务授权”按钮,按下图顺序操作。
    图2 访问授权

准备数据

本案例需要的数据集介绍。

  • 人车检测数据集
    • 用于物体检测,包含150张未标注样本
    • 数据集一共包含两类:行人,车辆
  1. 创建OBS桶

    OBS可以简单的理解成一个在线网盘,因为ModelArts本身目前没有数据存储的功能,所以需要从OBS里调用ModelArts上传的数据进行训练,进入OBS控制台,进入后单击右上角“创建桶”按钮。进入新建桶界面, 按照如下示例进行填写:

    • 区域:华北-北京一
    • 数据冗余存储策略:单AZ存储
    • 桶名称:自定义,需要全局唯一,即在整个华为云上的名字唯一。
    • 其它选项保持默认即可
      图3 填写桶参数

      填写完成后,单击右下角的“立即创建”按钮并确认,稍等几秒钟即可完成 OBS桶的创建。

  2. 导入数据

    单击访问下载页面《人车检测数据集》,单击“下载”。

    图4 下载数据集
    • 下载方式:ModelArts数据集
    • 目标区域: 华北-北京一
    • 名称:自定义
    • 目标位置:单击图标进入自己的OBS桶进行选择
      图5 参数填写

      确认目标位置选择正确后,单击 “确定” 开始启动数据集下载并进入下载列表,查看下载进度。

      图6 查看下载进度

      此页面需要自己手动刷新页面查看最新下载进度,因数据集较大,下载预计要花费3~5分钟左右。

      此处下载完成后,并不代表数据集完全创建成功,回到数据集管理页面,可以看到此处自动创建了一个数据集,并且正在运行中,我们需要等待它导入完成。

      图7 等待数据集导入完成

添加团队标注

  1. 登录ModelArts管理控制台,单击左侧导航栏的“数据管理”> “标注团队”,进入“标注团队”管理页面。
  2. 单击“添加团队”按钮,在弹出的“添加团队”对话框中,填写团队“名称”和“描述”,然后单击“确定”,完成标注团队的添加。
    图8 添加标注团队
  3. 单击“添加成员”按钮,在弹出的“添加成员”对话框中,选择当前华为云账号下的子账号,并设置成员“角色”,然后单击”确定“。
    图9 添加成员

    为了您能更好的体验团队标注的全部功能,建议您准备至少添加两个团队成员,其中一个可设置为Labeler角色,另一个为Team Manager角色。若您只有一个账号,请务必设置成员角色为Labeler。

    成员角色及功能介绍

    • Team manager:支持添加、删除、更新团队成员。支持审核和标注功能。
    • Reviewer:支持审核和标注功能功能。
    • Labeler:支持标注功能。

创建标注任务

  1. 登录ModelArts管理控制台,单左侧导航栏的“数据管理 > 数据标注”,进入“数据标注”管理页面。
  2. 单击左上角的“创建标注作业”,在弹出的“创建标注任务”对话框中,按如下提示填写团队标注任务内容:

    名称:自定义。

    描述:自定义。

    标注类型:物体检测。

    数据集名称:选择刚才从AI市场订阅的数据集。

    标签集:团队标注任务创建前数据集必须指定标签集,如没有,则单击“添加标签”,创建标签集。

    启用团队标注:启动团队标注标注,选择刚创建的团队,至少选中一个labeler 。

    选中“自动将新增文件同步给标注团队”、“团队标注的文件自动加载智能标注结果选项”。

    图10 创建标注作业

  3. 单击“创建”,完成团队标注任务的创建。

数据标注

  1. 登录ModelArts数据标注平台,新用户首次登录可参考华为云用户登录ModelArts数据标注平台。单击左侧导航栏的标注任务管理,进入标注任务管理页,选择刚才创建的标注任务,单击右侧的“标注”操作,进入数据标注预览页。
  2. 单击未标注,选中一张未标注的图片,开始标注数据集。
    图11 标注数据集
  3. 在左侧工具栏中选择标注工具框,对选中的图片进行标注,并添加相应的标签。
    图12 图片标注
  4. 单击上方的“下一张”按钮,以同样方式继续继续标注。
  5. 标注若干张图片后,单击左上角的“返回数据标注预览”,返回数据标注预览页面。

验收

  1. 登录ModelArts管理控制台,单击左侧导航栏的“数据管理 > 数据标注”,进入“数据标注”管理页面。
  2. 选择标注任务,单击进入标注任务详情页,单击右上角“验收”,在弹出的发起验收对话框中,按如下提示设置抽样策略,单击“确定”,等待验收采样任务完成,右上角”继续验收“可用,点击“继续验收”进入验收页面。
    图13 发起验收
  3. 在验收页面查看当前图片的标注结果,如下,在右侧验收结果中单击“通过”按钮并选择“验收评分”,单击“确认为通过”。
    图14 查看标注结果
  4. 单击“下一张”,继续验收,如下,在右侧验收结果中单击“不通过”按钮,并输入验收建议,单击“确认为不通过”。
    图15 验收不通过
  5. 验收完成后,单击右上角“完成验收”,查看验收报告,并选择如下参数:

    “对已标注数据修改”:选择不覆盖

    “验收范围”:剩余全部通过,表示对已验收通过的和未验收的执行通过操作,已验收不通过的执行驳回操作。

    图16 完成验收
  6. 在标注任务详情页选择标注页签,选择“已标注”,查看已验收通过的标注结果。
    图17 查看已验收通过的标注结果

发布数据集版本

  1. 登录ModelArts管理控制台,单击左侧导航栏的“数据管理 > 数据标注”,进入“标注作业”管理页面。选择已标注完成的标注任务,单击右侧操作列的“发布”按钮, 在弹出的“发布新版本”弹窗中,设置如下参数:

    版本名称:自定义

    图18 发布数据集版本
  2. 单击“确定”后,进入数据集版本管理页面,可以查看已发布版本的数据信息及标注信息。
    图19 查看版本数据信息
分享:

    相关文档

    相关产品

close