文档首页 > > AI工程师用户指南> 管理数据> 导入数据> 从OBS目录导入的规范说明

从OBS目录导入的规范说明

分享
更新时间: 2020/01/20 GMT+08:00

导入数据集时,使用存储在OBS的数据时,数据的存储目录以及文件名称需满足ModelArts的规范要求。

当前只有“图像分类”“物体检测”“文本分类”“声音分类”4种类型的数据集,支持从OBS目录导入数据。因此,如下内容,仅罗列此4种类型数据集规范。

图像分类

图像分类的数据要求将相同标签的图片放在一个目录里,并且目录名字即为标签名。

示例如下所示,其中Cat和Dog分别为标签名。

dataset-import-example 
├─Cat 
│      10.jpg 
│      11.jpg 
│      12.jpg 
│ 
└─Dog 
        1.jpg 
        2.jpg 
        3.jpg
  • 如果导入位置为OBS,用户需具备此OBS路径的读取权限。
  • 只支持单标签。
  • 只支持JPG、JPEG、PNG、BMP格式的图片。单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。

物体检测

物体检测的简易模式要求用户将标注对象和标注文件存储在同一目录,并且一一对应,如标注对象文件名为“IMG_20180919_114745.jpg”,那么标注文件的文件名应为“IMG_20180919_114745.xml”

物体检测的标注文件需要满足PASCAL VOC格式,格式详细说明请参见表5

示例:

├─dataset-import-example 
│      IMG_20180919_114732.jpg 
│      IMG_20180919_114732.xml 
│      IMG_20180919_114745.jpg 
│      IMG_20180919_114745.xml 
│      IMG_20180919_114945.jpg 
│      IMG_20180919_114945.xml
  • 如果导入位置为OBS,用户需具备此OBS路径的读取权限。
  • 只支持JPG、JPEG、PNG、BMP格式的图片,单张图片大小不能超过5MB,且单次上传的图片总大小不能超过8MB。

文本分类

文本分类的标注对象和标注文件均为文本文件,并且以行数进行对应,如标注文件中的第一行表示的是标注对象文件中的第一行的标注。

例如,标注对象“COMMENTS_20180919_114745.txt”的内容如下所示。

手感很好,反应速度很快,不知道以后怎样
三个月前买了一个用的非常好果断把旧手机替换下来尤其在待机方面秒杀
没充一会电源怎么也会发热呢音量健不好用回弹不好
算是给自己的父亲节礼物吧物流很快下单不到24小时就到货了耳机更赞有些低音炮的感觉入耳很紧不会掉棒棒哒

标注文件“COMMENTS_20180919_114745_result.txt”的内容。

positive positive
negative
negative 
positive

简易模式要求用户将标注对象和标注文件存储在同一目录,并且一一对应,如标注对象文件名为“COMMENTS_20180919_114745.txt”,那么标注文件名为“COMMENTS _20180919_114745_result.txt”

数据文件存储示例:

├─dataset-import-example 
│      COMMENTS_20180919_114732.txt 
│      COMMENTS _20180919_114732_result.txt 
│      COMMENTS _20180919_114745.txt 
│      COMMENTS _20180919_114745_result.txt 
│      COMMENTS _20180919_114945.txt 
│      COMMENTS _20180919_114945_result.txt

声音分类

声音分类的简易模式要求用户将相同标签的声音文件放在一个目录里,并且目录名字即为标签名。

示例:

dataset-import-example 
├─Cat 
│      10.wav 
│      11.wav 
│      12.wav 
│ 
└─Dog 
        1.wav 
        2.wav 
        3.wav
  • 如果导入位置为OBS,用户需具备此OBS路径的读取权限。
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区