更新时间:2024-12-03 GMT+08:00
创建盘古图片类数据集标注任务
场景描述
此示例演示了如何快速创建图片Caption数据标注任务。您将学习如何设置任务参数、配置标注要求并进行标注。
准备工作
请提前准备数据并上传至OBS服务,上传步骤请详见通过控制台快速使用OBS。
操作流程
- 登录ModelArts Studio大模型开发平台,进入所需空间。
- 选择左侧“数据工程 > 数据获取”,单击右上角“创建原始数据集”。
- 在“创建原始数据集”页面,选择“图片 > 图片+Caption”,选择文件格式、文件来源,填写数据集名称及描述,单击“立即创建”。
- 创建成功的数据集的任务状态为“成功”,单击操作列的“上线”按钮,将该数据集上线,用于后续标注操作。
- 选择左侧“数据工程 > 数据标注 > 标注管理”,单击右上角“创建标注任务”。
- 在“来源数据集”分页,选择“文件内容”为“图片+Caption”的数据集,选择标注项,可开启“AI预标注”功能,单击“下一步”。
图1 选择标注数据集
- 在“创建标注任务”页面,可配置标注分配、标注审核和标注任务的基本信息,单击“完成创建”。
图2 配置标注分配、标注审核、基本信息
- 当标注任务状态为“已创建”时,在操作列单击“上线”按钮。
- 进入“数据标注 > 标注作业”页面,单击标注任务操作列的“标注”按钮,进入“标注”页面。
- 在“标注”页面的右下角展示了AI预标注的结果,可参考其内容进行标注。
图3 标注页面
- 一条数据标注完成后,单击“提交”按钮可继续标注剩余数据,直至所有数据标注完成。