更新时间:2024-10-15 GMT+08:00
分享

导出ModelArts数据集中的数据为新数据集

针对数据集中的数据,用户可以选中部分数据或者通过条件筛选出需要的数据,导出成新的数据集。用户可以通过任务历史查看数据导出的历史记录。本章主要介绍将ModelArts数据集中的数据为新数据集的方式,新导出的数据集可直接在ModelArts控制台数据集列表中显示。

目前只有“图像分类”、“物体检测”、“图像分割”类型的数据集支持导出功能。

  • “图像分类”只支持导出txt格式的标注文件。
  • “物体检测”只支持导出Pascal VOC格式的XML标注文件。
  • “图像分割”只支持导出Pascal VOC格式的XML标注文件以及Mask图像。

导出数据为新数据集

  1. 登录ModelArts管理控制台,在左侧菜单栏中选择“资产管理>数据集”,进入“数据集”管理页面。
  2. 在数据集列表中,选择“图片”类型的数据集,单击数据集名称进入“数据集概览页”
  3. “数据集概览页”,单击右上角“导出 ”。在弹出的“导出”对话框中,填写相关信息,然后单击“确定”,开始执行导出操作。

    “数据来源”:选择新数据集。

    “名称”:新数据集名称。

    “保存路径”:表示新数据集的输入路径,即当前数据导出后存储的OBS路径。

    “输出路径”:表示新数据集的输出路径,即新数据集在完成标注后输出的路径。“输出路径”不能与“保存路径”为同一路径,且“输出路径”不能是“保存路径”的子目录。

    图1 导出新数据集
  4. 数据导出成功后,您可以前往您设置的保存路径,查看到存储的数据。当导出方式选择为新数据集时,在导出成功后,您可以前往“数据集”列表中,查看到新的数据集。
  5. “数据集概览页”,单击右上角“导出历史”,在弹出的“任务历史”对话框中,可以查看该数据集之前的导出任务历史。

相关文档