更新时间:2022-05-07 GMT+08:00
分享

新建数据集

数据服务提供了直接将本地数据文件发布为数据集的能力(也称为一键式发布数据集的能力)。

  • 通过一键式发布的数据集密级级别默认为秘密,并且显示在数据服务的首页>我的数据集以及数据资产>数据目录>自建数据集页签。
  • 一键式发布数据集不需要审批。

前提条件

登录用户为具有“Data Operation Engineer”角色的用户。

操作步骤

  1. 新建数据集的入口。

    • 在数据服务左侧导航,选择首页>我的资产>数据集> > 新建数据集
    • 在数据服务左侧导航,选择数据资产>数据目录>新数据集

  2. 在弹出界面,输入数据集的名称,设置数据集的过期时间。

    在这里以本地上传数据为例。
    • :通过上传本地数据快速发布数据集。
    • :通过获取已建模的数据发布数据集。具体操作请参见申请发布数据集

  3. 上传数据。

    • 单击“上传文件”, 选择在本地已准备好需要发布成数据集的数据文件,单击“打开”
    • 拖动本地已准备好的文件至虚线框内。

  4. (可选)设置是否自动建模。

    自动建模开关默认为关闭状态。
    • 打开自动建模开关:单击
      • 单个文件:文件格式为“csv”,且文件分隔符为“,”。
      • 多个文件:文件格式为“csv”,且所有文件表头名称相同,文件分隔符为“,”。
    • 关闭自动建模开关:单击

      创建非结构化的OBS模型。

  5. 单击“确认”,在“确认”对话框单击“确认”

    数据集发布完成后,自动显示在“首页>我的资产>数据集”以及“数据资产>数据目录>自建数据集”页签下。在“数据资产>数据目录>自建数据集”页签的目录中,按照自然月存放在“Native”目录下。

    发布的数据集可以进行解析、处理、探索、标注、敏感检测、脱敏处理及水印加解密。具体介绍请参考对应章节。

相关文档