modelarts
准备数据
更新时间:2020/12/14 GMT+08:00
使用ModelArts自动学习构建模型时,您需要将数据上传至对象存储服务(OBS)中。OBS桶需要与ModelArts在同一区域。
数据上传至OBS
由于OBS管理控制台使用限制较多,因此本次操作将使用OBS客户端上传数据。OBS创建桶以及上传文件的更多操作方式及指导,请参见创建桶和上传对象。
执行如下操作,将数据导入到您的数据集中,以便用于模型训练和构建。
OBS上传文件规范
- 如不需要提前上传训练数据,请创建一个空文件夹用于存放工程后期生成的文件。
- 如需要提前上传待标注的文件,请创建一个空文件夹,然后将文本文件保存在该文件夹下,文本文件的目录结构如:“/bucketName/data/text.csv”。
- 标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。
- 如您将已标注好的文本文件上传至OBS桶,请按照如下规范上传。
- 要求将标注对象和标注文件存储在同一目录,并且一一对应,如标注对象文件名为“COMMENTS_20180919_114745.txt”,那么标注文件名为“COMMENTS _20180919_114745_result.txt”。
数据文件存储示例:
├─<dataset-import-path> │ COMMENTS_20180919_114732.txt │ COMMENTS _20180919_114732_result.txt │ COMMENTS _20180919_114745.txt │ COMMENTS _20180919_114745_result.txt │ COMMENTS _20180919_114945.txt │ COMMENTS _20180919_114945_result.txt
- 文本分类的标注对象和标注文件均为文本文件,并且以行数进行对应,如标注文件中的第一行表示的是标注对象文件中的第一行的标注。
例如,标注对象“COMMENTS_20180919_114745.txt”的内容如下所示。
手感很好,反应速度很快,不知道以后怎样 三个月前买了一个用的非常好果断把旧手机替换下来尤其在待机方面秒杀 没充一会电源怎么也会发热呢音量健不好用回弹不好 算是给自己的父亲节礼物吧物流很快下单不到24小时就到货了耳机更赞有些低音炮的感觉入耳很紧不会掉棒棒哒
标注文件“COMMENTS_20180919_114745_result.txt”的内容。
positive negative negative positive
- 要求将标注对象和标注文件存储在同一目录,并且一一对应,如标注对象文件名为“COMMENTS_20180919_114745.txt”,那么标注文件名为“COMMENTS _20180919_114745_result.txt”。
父主题: 文本分类
