使用数据工程构建三方大模型数据集
构建三方大模型数据集流程
在ModelArts Studio平台中,使用数据工程构建三方大模型数据集流程见表1。
构建三方大模型数据集步骤
在ModelArts Studio大模型开发平台中,使用数据工程构建三方大模型数据集流程可参考表1。
创建导入任务
创建导入任务前,请先按照上文要求提前准备数据。
平台支持使用OBS服务导入数据,请详见通过控制台快速使用OBS。
创建导入任务步骤如下:
- 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击空间名称进入操作空间。
图1 我的空间
- 在左侧导航栏中选择“数据工程 > 数据获取 > 导入任务”,单击界面右上角“创建导入任务”。
- 选择“其他”类型的数据集,并选择训练数据所在的OBS存储位置。
- 单击“立即创建”创建数据集。
- 在左侧导航栏中选择“数据工程 > 数据发布 > 发布任务”,单击界面右上角“创建发布任务”。
- 选择“其他”类型的数据集,并勾选创建的数据集。单击“下一步”。设置数据用途、数据集可见性,填写数据集名称、描述,设置扩展信息后(可选),单击“确定”进行数据集发布操作。