配比视频类数据集
数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程,确保数据的多样性、平衡性和代表性。
如果单个数据集已满足您的需求,可跳过此章节至发布视频类数据集。
创建视频类数据集配比任务
创建视频类数据集配比任务步骤如下:
- 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。
图1 我的空间
- 支持“视频+标注”配比,在左侧导航栏中选择“数据工程 > 数据加工 > 配比任务”,单击界面右上角“创建配比任务”。
- 在“数据选择”页签选择需要配比的视频类数据集(至少选择两个),单击“下一步”。
- 在“配比数据集”页面,可以设置不同数据集的配比数量,单击“下一步”。
- 数据配比完成后,单击右下角“下一步”,进行任务配置,并选择是否勾选自动生成加工数据集。
- 自动生成加工数据集
勾选,配置生成加工数据集的信息,如图2;单击右下角“确定”,平台将启动配比任务。配比任务运行成功后自动生成加工数据集。
- 扩展信息(可选)
- 自动生成加工数据集
- 单击“确定”,页面将返回至“数据配比”页面,配比任务运行成功后,状态将显示为“运行成功”。
- 加工数据集可在配比任务栏-“已生成数据集”中查看,亦可在“数据工程 > 数据管理 > 数据集 > 加工数据集”中查看。