更新时间:2024-12-03 GMT+08:00
分享

创建文本类数据集标注任务

创建文本类数据集标注任务前,请先完成创建文本类数据集加工任务

创建文本类数据集标注任务步骤如下:

  1. 登录ModelArts Studio大模型开发平台,进入所需操作空间。
    图1 进入操作空间
  2. 在左侧导航栏中选择“数据工程 > 数据标注 > 标注管理”,单击页面右上角“创建标注任务”。
    图2 标注管理
  3. 在“创建标注任务”页面选择需要标注的加工后的文本类数据集,并设置标注项。
    设置标注项时,不同类型的数据文件对应的标注项也有所差异,可基于页面提示进行设置。
    图3 创建标注任务
  4. 单击“下一步”设置标注人员及信息,单击“完成创建”。

    分配标注任务时,可以选择是否启用多人标注。启用多人标注后,可以指定参与标注的人员。

    标注任务可选择是否启用标注审核,可设置多人审核,详见审核文本类数据集标注结果。审核要求可以选择以下两种方式:
    • 选择“可部分审核”:审核人员确认部分数据达到标注要求后,可以一键通过所有的标注。
    • 选择“全部审核”:审核员在审核一部分数据后,发现标注质量均很高,则可以一键提交剩余待审核数据,默认审核通过,即可完成审核任务。
    图4 设置标注人员、标注信息示例
  5. 在“标注管理”页面,单击操作列“上线”,可执行后续标注操作。对于未上线的标注任务,可执行编辑和删除操作。
  6. 在“标注作业”页面,单击操作列“标注”可进行数据标注。如果需要将该标注任务移交给其他人员,可以单击操作列“移交”设置移交人员以及移交的数量。
    图5 标注作业
    图6 移交标注任务
  7. 进入标注页面后,逐一对数据进行标注。
    以标注单轮问答数据为例,需要逐一确认问题(Q)及答案(A)是否正确,如果问题或答案不正确,可以对其进行二次编辑,如图7
    图7 文本类数据集标注示例
  8. 一条数据标注完成后,单击“提交”可继续标注剩余数据。所有数据标注完成后,页面会出现标注任务成功的提示。

相关文档