更新时间:2024-10-24 GMT+08:00
导出ModelArts数据集中的数据
针对数据集中的数据,用户可以选中部分数据或者通过条件筛选出需要的数据,导出成新的数据集。用户可以通过任务历史查看数据导出的历史记录。
目前只有“图像分类”、“物体检测”、“图像分割”类型的数据集支持导出功能。
- “图像分类”只支持导出txt格式的标注文件。
- “物体检测”只支持导出Pascal VOC格式的XML标注文件。
- “图像分割”只支持导出Pascal VOC格式的XML标注文件以及Mask图像。
导出数据为新数据集
- 登录ModelArts管理控制台,在左侧菜单栏中选择“资产管理>数据集”,进入“数据集”管理页面。
- 在数据集列表中,选择“图片”类型的数据集,单击数据集名称进入“数据集概览页”。
- 在“数据集概览页”,单击右上角“导出 ”。在弹出的“导出”对话框中,填写相关信息,然后单击“确定”,开始执行导出操作。
“数据来源”:选择新数据集。
“名称”:新数据集名称。
“保存路径”:表示新数据集的输入路径,即当前数据导出后存储的OBS路径。
“输出路径”:表示新数据集的输出路径,即新数据集在完成标注后输出的路径。“输出路径”不能与“保存路径”为同一路径,且“输出路径”不能是“保存路径”的子目录。
图1 导出新数据集
- 数据导出成功后,您可以前往您设置的保存路径,查看到存储的数据。当导出方式选择为新数据集时,在导出成功后,您可以前往“数据集”列表中,查看到新的数据集。
- 在“数据集概览页”,单击右上角“导出历史”,在弹出的“任务历史”对话框中,可以查看该数据集之前的导出任务历史。