托管数据集资产
创建数据集资产
- 登录AI Gallery,单击右上角“我的Gallery”进入我的Gallery页面。
- 单击左上方“创建资产”,选择“数据集”。
- 在“创建数据集”弹窗中配置参数,单击“创建”。
表1 创建数据集 参数名称
说明
数据集英文名称
必填项,数据集的英文名称。
如果没有填写“数据集中文名称”,则资产发布后,在数据集页签上会显示该“数据集英文名称”。
数据集中文名称
数据集的中文名称。
如果填写了“数据集中文名称”,则资产发布后,在数据集页签上会显示该“数据集中文名称”。
许可证
数据集资产遵循的使用协议,根据业务需求选择合适的许可证类型。
描述
填写资产简介,数据集发布后将作为副标题显示在数据集页签上,方便用户快速了解资产。
支持0~90个字符,请勿在描述中输入涉政、迷信、违禁等相关敏感词,否则发布审核无法通过。
创建完成后,跳转至数据集详情页。
上传数据集文件
- 在数据集详情页,选择“文件版本”页签。
- 单击“添加文件”,进入上传文件页面,选择本地的数据文件单击“点击上传”或拖动文件,单击“确认上传”启动上传。
- 上传单个超过5GB的文件时,请使用Gallery CLI工具。CLI工具的获取和使用请参见Gallery CLI配置工具介绍。
- 文件合集大小不超过50GB。
- 文件上传完成前,请不要刷新或关闭上传页面,防止意外终止上传任务,导致数据缺失。
- 当文件状态变成“上传成功”表示数据文件成功上传至AI Gallery仓库进行托管。单击“完成”返回文件版本页面。
图1 上传成功
文件上传过程中请耐心等待,不要关闭当前上传页面,关闭页面会中断上传进程。
编辑数据集介绍
资产发布上架后,准确、完整的资产介绍有助于提升资产的排序位置和访问量,能更好的支撑用户使用该资产。
- 在数据集详情页,选择“数据集介绍”页签,单击右侧“编辑”。
- 编辑数据集基础设置和数据集描述。
表2 数据集介绍的参数说明 参数名称
说明
基础设置
数据集名称
显示数据集的名称,不可编辑。
许可证
数据集遵循的使用许可协议,根据业务需求选择活修改合适的许可证类型。
语言
选择使用数据集时支持的输入输出语言。
任务类型
选择数据集支持用于什么类型的训练模型。
运行平台
选择数据集额外支持的运行平台。
- 设置运行平台后,当资产上架后,该资产支持通过订阅的方式同步到所选运行平台使用。
- 设置运行平台后,单击“设置”,在弹窗中可以自定义设置运行平台的资产标签,且标签可以被一起同步至运行平台。
数据集描述
-
资产的README内容,支持添加资产的简介、使用场景、使用方法等信息。
- 编辑完成后,单击“确认”保存修改。
管理数据集文件
- 预览文件
在数据集详情页,选择“文件版本”页签。单击文件名称即可在线预览文件内容。
仅支持预览大小不超过10MB、格式为文本类或图片类的文件。
- 下载文件
在数据集详情页,选择“文件版本”页签。单击操作列的“下载”,选择保存路径单击“确认”,即可下载文件到本地。
- 删除文件
在数据集详情页,选择“文件版本”页签。单击操作列的“删除”,确认后即可将已经托管的文件从AI Gallery仓库中删除。
文件删除后不可恢复,请谨慎操作。