更新时间:2024-04-12 GMT+08:00
数据标注简介
数据管理模块在重构升级中,对未使用过数据管理的用户不可见。如果要使用数据管理相关功能,建议提交工单开通权限。
模型训练过程中需要大量已标注的数据,因此在模型训练之前需要进行数据标注作业。ModelArts为用户提供了标注数据的能力:
- 人工标注:用户创建单人标注作业,对数据进行手工标注。
- 智能标注:在标注一定量的数据情况下,用户可以通过启动智能标注任务对数据进行自动标注,提高标注的效率。
- 团队标注:对于大批量的数据,用户可以通过创建团队标注作业,进行多人协同标注。
人工标注
对于不同类型的数据,用户可以选择不同的标注类型。当前ModelArts支持如下类型的标注作业:
智能标注
除了人工标注外,ModelArts还提供了智能标注功能,快速完成数据标注,为您节省70%以上的标注时间。智能标注是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。
目前只有“图像分类”和“物体检测”类型的数据集支持智能标注功能。
团队标注
数据标注任务中,一般由一个人完成,但是针对数据集较大时,需要多人协助完成。ModelArts提供了团队标注功能,可以由多人组成一个标注团队,针对同一个数据集进行标注管理。
团队标注功能当前仅支持“图像分类”、“物体检测”、“文本分类”、“命名实体”、“文本三元组”、“语音分割”类型的数据集。
不同类型数据集支持的功能列表
其中,不同类型的数据集,支持不同的功能,详细信息请参见表1。