更新时间:2024-10-24 GMT+08:00

导出ModelArts数据集中的数据到OBS

针对数据集中的数据,用户可以选中部分数据或者通过条件筛选出需要的数据,当需要将数据集中的数据存储至OBS用于后续导出使用时,可通过此种方式导出成新的数据集。用户可以通过任务历史查看数据导出的历史记录。

目前只有“图像分类”、“物体检测”、“图像分割”类型的数据集支持导出功能。

  • “图像分类”只支持导出txt格式的标注文件。
  • “物体检测”只支持导出Pascal VOC格式的XML标注文件。
  • “图像分割”只支持导出Pascal VOC格式的XML标注文件以及Mask图像。

导出数据到OBS

  1. 登录ModelArts管理控制台,在左侧菜单栏中选择“资产管理>数据集”,进入“数据集”管理页面。
  2. 在数据集列表中,选择“图片”类型的数据集,单击数据集名称进入“数据集概览页”
  3. “数据集概览页”,单击右上角“导出 ”。在弹出的“导出”对话框中,填写相关信息,然后单击“确定”,开始执行导出操作。

    “数据来源”:选择OBS。

    “保存路径”:即导出数据存储的路径。建议不要将数据存储至当前数据集所在的输入路径或输出路径。

    图1 导出到OBS
  4. 数据导出成功后,您可以前往您设置的保存路径,查看到存储的数据。
  5. “数据集概览页”,单击右上角“导出历史”,在弹出的“任务历史”对话框中,可以查看该数据集之前的导出任务历史。
    图2 任务历史