托管数据集到AI Gallery
AI Gallery上每个资产的文件都会存储在线上的AI Gallery存储库(简称AI Gallery仓库)里面。每一个数据集实例视作一个资产仓库,数据集实例与资产仓库之间是一一对应的关系。例如,模型名称为“Test”,则AI Gallery仓库有个名为“Test”的仓库,其中只存放Test模型实例的全部文件。
功能说明
- 支持本地文件托管至AI Gallery仓库且支持多个文件同时上传。
- 支持管理托管的资产文件,例如在线预览、下载、删除文件。
- 支持编辑资产介绍。每个资产介绍可分为基础设置和使用描述。
- 基础设置部分包含了该资产所有重要的结构化元数据信息。选择填入的信息将会变成该模型资产的标签,并且自动同步在模型描述部分,保存到“README.md”文件里。
- 模型描述部分是一个可在线编辑、预览的Markdown文件,里面包含该模型的简介、能力描述、训练情况、引用等信息。编辑内容会自动保存在“README.md”文件里。
更新后的“README.md”文件自动存放在数据集详情页的“文件版本”页签或者是模型详情页的“模型文件”页签。
创建数据集资产
- 登录AI Gallery,单击右上角“我的Gallery”进入我的Gallery页面。
- 单击左上方“创建资产”,选择“数据集”。
- 在“创建数据集”弹窗中配置参数,单击“创建”。
表1 创建数据集 参数名称
说明
英文名称
必填项,数据集的英文名称。
如果没有填写“中文名称”,则资产发布后,在数据集页签上会显示该“英文名称”。
中文名称
数据集的中文名称。
如果填写了“中文名称”,则资产发布后,在数据集页签上会显示该“中文名称”。
许可证
数据集资产遵循的使用协议,根据业务需求选择合适的许可证类型。
描述
填写资产简介,数据集发布后将作为副标题显示在数据集页签上,方便用户快速了解资产。
支持0~90个字符,请勿在描述中输入涉政、迷信、违禁等相关敏感词,否则发布审核无法通过。
创建完成后,跳转至数据集详情页。
上传数据集文件
- 在数据集详情页,选择“数据集文件”页签。
- 单击“添加文件”,进入上传文件页面,选择本地的数据文件单击“点击上传”或拖动文件,单击“确认上传”启动上传。
- 上传单个超过5GB的文件时,请使用Gallery CLI工具。CLI工具的获取和使用请参见Gallery CLI配置工具指南。
- 文件合集大小不超过50GB。
- 文件上传完成前,请不要刷新或关闭上传页面,防止意外终止上传任务,导致数据缺失。
- 当文件状态变成“上传成功”表示数据文件成功上传至AI Gallery仓库进行托管。单击“完成”返回数据集文件页面。
图1 上传成功
文件上传过程中请耐心等待,不要关闭当前上传页面,关闭页面会中断上传进程。