数据标注场景介绍
由于模型训练过程需要大量有标签的数据,因此在模型训练之前需对没有标签的数据添加标签。您可以通过创建单人标注作业或团队标注作业对数据进行手工标注,或对任务启动智能标注添加标签,快速完成对图片的标注操作,也可以对已标注图片修改或删除标签进行重新标注。
ModelArts为用户提供了标注数据的能力:
- 人工标注:用户创建单人标注作业,对数据进行手工标注。
- 智能标注:在标注一定量的数据情况下,用户可以通过启动智能标注任务对数据进行自动标注,提高标注的效率。
- 团队标注:对于大批量的数据,用户可以通过创建团队标注作业,进行多人协同标注。
智能标注
除了人工标注外,ModelArts还提供了智能标注功能,快速完成数据标注,为您节省70%以上的标注时间。智能标注是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。
目前只有“图像分类”和“物体检测”类型的数据集支持智能标注功能。
团队标注
数据标注任务中,一般由一个人完成,但是针对数据集较大时,需要多人协助完成。ModelArts提供了团队标注功能,可以由多人组成一个标注团队,针对同一个数据集进行标注管理。
团队标注功能当前仅支持“图像分类”、“物体检测”、“文本分类”、“命名实体”、“文本三元组”、“语音分割”类型的数据集。
不同类型数据集支持的功能列表
其中,不同类型的数据集,支持不同的功能,详细信息请参见表1。