发布数据
在AI Gallery中,您可以将个人数据集分享给他人使用。
ModelArts数据管理模块在重构升级中,对未使用过数据管理的用户不可见。建议新用户选择发布OBS或本地的数据集。
前提条件
- 本地或对象存储服务(OBS)中已准备好待发布的数据集,或ModelArts的数据集列表存在待发布的数据集。
发布数据集
- 进入AI Gallery首页,选择“资产集市 > 数据集”,进入数据页面。
- 单击“发布”弹出“选择云服务区域”,选择区域后单击“确定”进入发布数据集页面,填写相关信息。
- 如果选择ModelArts已有的数据集发布,则参见表1配置数据集信息。
图1 发布数据集(ModelArts)
表1 参数说明(ModelArts) 参数
说明
资产标题
在AI Gallery显示的资产名称,建议按照您的目的设置。
来源
选择“ModelArts”。
单个数据集最多支持20000个文件,总大小不超过30G。
ModelArts区域
选择数据集所在的区域,以控制台实际可选值为准。
选择数据集
从下拉列表中选择当前区域中需要发布的目标数据集。
选择版本
选择目标数据集需要发布的版本。
许可证类型
根据业务需求和数据集类型选择合适的许可证类型。
单击许可证类型后面的可以查看许可证详情。
谁可以看
设置此数据集的公开权限。可选值有:
- “公开”:表示所有使用AI Gallery的用户都可以查看且使用该资产。
- “指定用户”:表示仅特定用户可以查看及使用该资产。
- “仅自己可见”:表示只有当前账号可以查看并使用该资产。
发布来源为“ModelArts”的数据集,发布后在AI Gallery 不会立即显示,需要刷新该页面才能看到新发布的数据集。
- 如果选择对象存储服务(OBS)中已有的数据集发布,则参见表2配置数据集信息。
图2 发布数据集(OBS)
表2 参数说明(OBS) 参数
说明
资产标题
在AI Gallery显示的资产名称,建议按照您的目的设置。
来源
选择“对象存储服务(OBS)”。
单个数据集最多支持20000个文件,总大小不超过30G。
OBS区域
选择数据所在OBS桶的存储区域,以控制台实际可选值为准。
存储位置
选择待发布数据集所在对象存储服务(OBS)的路径。
数据类型
至少选择一个数据集类型的标签。
可选标签:图片、音频、视频、文本、表格、其他
许可证类型
根据业务需求和数据集类型选择合适的许可证类型。
单击许可证类型后面的可以查看许可证详情。
谁可以看
设置此数据集的公开权限。可选值有:
- “公开”:表示所有使用AI Gallery的用户都可以查看且使用该资产。
- “指定用户”:表示仅特定用户可以查看及使用该资产。
- “仅自己可见”:表示只有当前账号可以查看并使用该资产。
- 如果选择本地的数据集发布,则参见表3配置数据集信息。
表3 参数说明(本地上传) 参数
说明
资产标题
在AI Gallery显示的资产名称,建议按照您的目的设置。
来源
选择“本地上传”。
单次最多支持100个文件同时上传,总大小不超过5GB。
上传数据
从本地文件中选择需要发布的数据集。
数据类型
至少选择一个数据集类型的标签。
可选标签:图片、音频、视频、文本、表格、其他
许可证类型
根据业务需求和数据集类型选择合适的许可证类型。
单击许可证类型后面的可以查看许可证详情。
谁可以看
设置此数据集的公开权限。可选值有:
- “公开”:表示所有使用AI Gallery的用户都可以查看且使用该资产。
- “指定用户”:表示仅特定用户可以查看及使用该资产。
- “仅自己可见”:表示只有当前账号可以查看并使用该资产。
- 如果选择ModelArts已有的数据集发布,则参见表1配置数据集信息。
- 阅读并同意《华为云AI Gallery数字内容发布协议》和《华为云AI Gallery服务协议》。
- 单击“发布”。
发布数据时,数据集文件所在的OBS文件夹不能增加或删除文件,否则会引起发布前后文件数量或大小不一致,从而导致发布失败。
编辑资产详情
数据集发布成功后,发布者可以进入数据集的详情页修改该数据集“描述”、“版本”和“限制”等信息。
- 在发布的资产详情页面,单击右侧的“编辑”,选择上传新的封面图,为资产编辑独特的主副标题。
- 编辑完成之后单击“保存”。封面图和二级标题内容自动同步,您可以直接在资产详情页查看修改结果。
- 在发布的资产详情页面,单击右侧的“编辑”。
- 在许可证类型右侧的下拉框中选择需要更新的许可证,单击“保存”完成修改。
单击许可证类型后面的感叹号可以了解许可证详情。
- 单击右侧的“编辑”,在编辑框中输入资产的描述内容,包含但不局限于背景、简介、使用方法、约束条件等。支持发布者以Markdown形式自由编辑。
- 编辑完成之后单击“保存”。
预览
预览可以查看数据集文件夹下所有文件,单击某个文件,可以查看文件内容。预览功能支持查看的文件类型请以界面显示为准。
- 选择“版本”页签,单击右上方的“编辑”进入编辑模式。
- 单击“版本说明”列的,添加版本说明,单击完成添加。
编辑数据集的版本信息便于区分数据集信息。
- 选择“限制”页签,单击右上方的“编辑”进入编辑模式。
- 在“谁可以看”右侧的下拉框中选择公开权限,单击“保存”完成修改。
- “公开”:表示所有使用AI Gallery的用户都可以查看且使用该资产。
- “指定用户”:表示仅特定用户可以查看及使用该资产。
- “仅自己可见”:表示只有当前账号可以查看并使用该资产。
- 单击“保存”,完成修改。
关联资产
数据集可以关联Notebook和算法。当数据集关联了Notebook或算法时,Notebook或算法页面也显示关联了数据集。
- 选择“关联资产”页签,单击右上方的“编辑”,在搜索框中输入待关联资产的ID,单击“关联”。
- 在弹出的“资产信息”页面,单击“确定”即可关联资产。
对已经关联的资产,单击“取消关联”即可取消资产的关联。
发表评论
重试发布数据集
如果数据集发布异常,您可以重试发布。
- 在AI Gallery页面的右上角选择 ,进入“我的数据”。
- 在“我的发布”页签,查看发布异常的数据集。
图5 查看发布异常的数据集
- 根据异常状态的错误提示修改源数据后,单击目标数据集右侧的“重试”重新发布数据集。
删除发布的数据集
当您需要删除发布在AI Gallery中的数据集时,可以执行如下步骤进行删除。
- 在AI Gallery页面的右上角选择 ,进入“我的数据”。
- 在“我的发布”页签,单击目标数据集右侧的“删除”,在弹窗中确认删除。
由于数据集是下载至OBS使用的,所以删除已发布的数据集对使用者无影响。