文档首页 > > AI工程师用户指南> 数据管理(旧版)> 数据集

数据集

分享
更新时间: 2020/01/08 GMT+08:00

数据管理“数据集”界面主要分为四部分内容,如图1所示,四个区域内容介绍如表1所示。

图1 数据集界面
表1 界面内容介绍

区域

说明

1

数据集列表,列举用户所创建的数据集,同时可进行如下操作:

  • 查询:输入数据集名称单击查询。
  • 修改:鼠标移动到相应数据集,然后单击可修改数据集名称、描述。
  • 删除:鼠标移动到相应数据集,然后单击可“删除当前数据集”,或者“删除数据集同时删除桶内文件”。
  • 创建:单击“创建”可创建数据集,详细步骤参见创建数据集

2

当前版本数据集信息,包括当前目录内容来源、数据数量、版本状态及桶路径。

同时可进行如下操作:

  • 添加文件:单击“添加文件”,在弹出的对话框中选择文件,您可设置添加文件的存储位置,单击“上传文件”,完成文件的添加操作。
    说明:
    • 上传文件的总大小一次不能超过了8MB。
    • 如不设置存储位置,添加的文件将存储在当前OBS路径下。路径中任何单个斜杠(/)表示分隔并创建多层级的文件夹。
    • 文件夹名称不能包含“\”、“:” 、“*”、“?”、“"”、“<”、“>”、“|”,文件夹名称不能以英文句号“.”或斜杠“/”开头或结尾,文件夹的绝对路径总长度不能超过1023字符,文件夹名称不能包含两个以上相邻的斜杠“/”。
  • 删除:选中想要删除的文件,单击“删除”,完成文件的删除操作。
  • 发布新版本:单击“发布新版本”,可在弹出的对话框中填写描述,单击“确定”,完成新版本发布操作。
  • 数据源同步:单击“数据源同步”,可快速将通过OBS上传的文件数据添加到ModelArts。

3

可选择“详细信息”和“图标”两种显示方式。在“详细信息”显示模式下,可单击文件名称对图片文件、txt类型文件进行预览。

可输入文件名称进行简单搜索,或者输入文件大小范围、格式、上传时间段进行高级搜索。

4

当前版本数据集文件列表,包含文件名称、文件大小、格式及上传时间。

创建数据集

  1. 单击数据集页面左上角“创建”。
  2. 在弹出的对话框中输入名称、描述,并选择数据集存储路径。

    由于创建数据集需要开启多版本控制功能,选择数据集存储路径后,如所选择OBS桶没有开启多版本控制时,会弹出对话框提示启动多版本控制

  3. 单击“确定”,完成数据集的创建。

版本管理

在“数据集>版本管理”页签,您可查看当前数据集版本的演进过程,如图2所示。版本名称自动生成,规则为“数据集名称_版本号”。数据集创建成功后,会自动生成一个临时版本,版本名称为“数据集名称_obs_temp_version”。如要切换目录,将鼠标移动到相应的版本名称上,然后单击“设置为当前目录”,即可将该版本设置为当前目录。

在当前数据集目录进行的“添加文件”、“删除”操作会自动保存到临时版本中,您可以在版本管理中查看增加和删除的文件数量。

图2 数据集版本管理

数据集版本对比

单击版本管理页面右侧的“对比”,可进入数据集版本对比界面,如图3所示。

图3 数据集版本对比
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区