解释说明
数据标注是数据工程中的关键步骤,旨在为无标签的数据集添加准确的标签,从而为模型训练提供有效的监督信号。
标注数据的质量直接影响模型的训练效果和精度,因此高效、准确的标注过程至关重要。
数据标注功能支持创建标注任务、标注数据集(标注作业)、审核标注后的数据集(审核作业)与管理标注任务(任务管理)。其中,不同角色权限支持的功能及展示的前端界面略有差异,详见表1。
表1 不同角色支持的数据标注任务权限清单
|
角色名称 |
创建标注任务 |
标注作业任务 |
审核作业任务 |
任务管理任务 |
|
超级管理员 |
√ |
√ |
- |
√ |
|
管理员 |
√ |
√ |
- |
√ |
|
标注管理员 |
√ |
√ |
- |
√ |
|
标注作业员 |
- |
√ |
- |
- |
|
标注审核员 |
- |
- |
√ |
- |
当前支持标注的数据集类型为:文本类、视频类、图片类。
创建文本类标注任务
- 在“创建标注任务”页面,选择需要标注的文本类数据集,并选择“标注项”。选择标注项时,不同类型的数据文件对应的标注项有所差异,可基于页面提示进行选择。
其中,“单轮问答”标注项支持“AI辅助标注”功能,若开启该功能,需要选择已部署的NLP服务作为AI辅助标注模型。
- 可选择开启“多人作业”功能,开启后,可选择多人协同完成作业,并增加审核功能可供选择。参考表2配置标注分配与审核。
表2 标注分配与审核配置
|
参数类型 |
参数名称 |
参数说明 |
|
标注分配 |
标注员 |
添加标注人员与数量。 |
|
标注审核 |
是否审核 |
- 否,标注后不进行审核操作。
- 是,审核员会检查标注员的标注内容,若发现问题,审核员可注明原因并驳回标注数据,标注员需重新标注。
|
|
审核员 |
添加审核人员与数量。 |
|
审核要求 |
- 全部审核:要求审核员对全部数据,逐条进行人工审核,才能完成审核任务。
- 可部分审核:审核员在审核一部分数据后,发现标注质量均很高,则可以一键提交剩余待审核数据,默认审核通过,即可完成审核任务。
|
- 配置完成后,单击“完成创建”。
创建视频类标注任务
- 在“创建标注任务”页面,选择需要标注的视频类数据集,并选择“标注项”。选择标注项时,不同类型的数据文件对应的标注项有所差异,可基于页面提示进行选择。
如果选择“视频Caption”标注项,则可开启“AI预标注”功能。AI预标注将自动生成标注内容,不会覆盖原始数据集,供标注人员参考,以提高标注效率。
- 可选择开启“多人作业”功能,开启后,可选择多人协同完成作业,并增加审核功能可供选择。参考表3配置标注分配与审核。
表3 标注分配与审核配置
|
参数类型 |
参数名称 |
参数说明 |
|
标注分配 |
标注员 |
添加标注人员与数量。 |
|
标注要求 |
选择标注项为“图片Caption”且开启AI预标注功能时,可设置以下两种方式的“标注要求”:
- 选择“全部标注”:要求标注人员需要对全部的数据进行人工标注后才可提交标注结果。
- 选择“可部分标注”:允许标注人员在确认AI预标注满足要求后,直接使用AI预标注功能完成数据集的标注并提交标注结果。
|
|
标注审核 |
是否审核 |
- 否,标注后不进行审核操作。
- 是,审核员会检查标注员的标注内容,若发现问题,审核员可注明原因并驳回标注数据,标注员需重新标注。
|
|
审核员 |
添加审核人员与数量。 |
|
审核要求 |
- 全部审核:要求审核员对全部数据,逐条进行人工审核,才能完成审核任务。
- 可部分审核:审核员在审核一部分数据后,发现标注质量均很高,则可以一键提交剩余待审核数据,默认审核通过,即可完成审核任务。
|
- 配置完成后,单击“完成创建”。
创建图片类标注任务
- 在“创建标注任务”页面,选择需要标注的图片类数据集,并选择“标注项”。选择标注项时,不同类型的数据文件对应的标注项有所差异,可基于页面提示进行选择。
如果选择“图片Caption”或“物体检测”标注项,则可开启“AI预标注”功能。AI预标注将自动生成标注内容,不会覆盖原始数据集,供标注人员参考,以提高标注效率。
- 可选择开启“多人作业”功能,开启后,可选择多人协同完成作业,并增加审核功能可供选择。参考表4配置标注分配与审核。
表4 标注分配与审核配置
|
参数类型 |
参数名称 |
参数说明 |
|
标注分配 |
标注员 |
添加标注人员与数量。 |
|
标注要求 |
选择标注项为“图片Caption”且开启AI预标注功能时,可设置以下两种方式的“标注要求”:
- 选择“全部标注”:要求标注人员需要对全部的数据进行人工标注后才可提交标注结果。
- 选择“可部分标注”:允许标注人员在确认AI预标注满足要求后,直接使用AI预标注功能完成数据集的标注并提交标注结果。
|
|
标注审核 |
是否审核 |
- 否,标注后不进行审核操作。
- 是,审核员会检查标注员的标注内容,若发现问题,审核员可注明原因并驳回标注数据,标注员需重新标注。
|
|
审核员 |
添加审核人员与数量。 |
|
审核要求 |
- 全部审核:要求审核员对全部数据,逐条进行人工审核,才能完成审核任务。
- 可部分审核:审核员在审核一部分数据后,发现标注质量均很高,则可以一键提交剩余待审核数据,默认审核通过,即可完成审核任务。
|
- 配置完成后,单击“完成创建”。