更新时间:2024-04-30 GMT+08:00

数据接入简介

数据集创建完成后,您还可以通过导入数据的操作,接入更多数据。ModelArts支持从不同数据源导入数据。

ModelArts的AI Gallery中预置了大量的数据集,用户可以从AI Gallery下载使用预置的数据集。您也可以将您自己的数据导入到ModelArts中。

文件型数据来源

除了从AI Gallery下载预置数据集外,文件型数据集还支持从两种数据源导入数据:“OBS”“本地上传”。导入后,导入目录下的数据会复制至数据集的数据源路径下。

  • OBS:又分为从OBS目录或从Manifest文件两种导入方式,需要将导入的数据或Manifest文件提前存储至OBS目录中。
  • 本地上传:将本地数据直接通过Internet上传至OBS指定目录后,再导入数据集。

表格型数据来源

除了从AI Gallery下载预置数据集外,表格数据集还支持从5种数据源导入数据,分别为对象存储服务(OBS)、数据仓库服务(DWS)、数据湖探索服务(DLI)、MapReduce服务(MRS)和本地上传。

数据集中的数据导入入口

数据集中的数据导入有5个入口。

  • 创建数据集时直接从设置的数据导入路径中自动同步数据。
  • 创建完数据集后,在数据集列表页面的操作栏单击“导入”,导入数据。
    图1 在数据集列表页导入数据
  • 在数据集列表页面,单击某个数据集的名称,进入数据集详情页中,单击“导入>导入”,导入数据。
    图2 在数据集详情页中导入数据
  • 在数据集列表页面,单击某个数据集的名称,进入数据集详情页中,单击“同步数据源”,同步OBS中的数据。
    图3 在数据集详情页中同步数据源
  • 在数据标注的标注作业详情中添加数据。
    图4 标注作业详情中添加数据