更新时间:2024-12-02 GMT+08:00
分享

创建图片类数据集加工任务

创建图片类数据集加工任务前,请先完成“原始数据集”的创建与上线,具体步骤请参见导入数据至盘古平台

创建图片类数据集加工任务步骤如下:

  1. 登录ModelArts Studio大模型开发平台,进入所需操作空间。
    图1 进入操作空间
  2. 在左侧导航栏中选择“数据工程 > 数据加工”,单击界面右上角“创建加工数据集”。
    图2 数据加工
  3. 在“创建加工数据集”页面,选择需要加工的图片类数据集,并设置数据集的名称和描述信息。
    选择数据集时,默认选择当前空间的数据集。如果用户具备其他空间的访问权限,可以选择来自其他空间的数据集。
    图3 创建加工数据集
  4. 单击“下一步”进入“算子编排”页面。对于图片类数据集,可选择的加工算子及参数配置请参见表1表2
    1. 在左侧“添加算子”模块勾选所需算子。
    2. 在右侧“加工步骤编排”页面配置各算子的参数,可通过右侧按钮,拖拽算子的上下顺序来调整算子在加工任务流中的执行顺序。
    3. 算子编排过程中,可以单击右上角“保存为新模板”将当前算子编排流程保存为模板,后续创建新的数据加工任务时,可以直接单击“选择加工模板”进行使用。

      若选择使用加工模板,将删除当前已编排的加工步骤。

    图4 算子编排
    图5 选择加工模板
  5. 算子编排完成后,单击“立即执行”,平台会直接启动数据加工任务。若单击“保存”,数据集列表页中将新增一个任务状态为“待处理”的数据加工任务,可单击操作列“执行”启动加工。
    图6 数据加工
    图7 执行加工
  6. 当加工数据集任务运行成功后,状态将从“处理中”变为“成功”,表示数据已经完成加工,加工完成的数据集支持上线、编辑与删除操作。
  7. 平台支持查看加工后的数据集。单击加工完成的数据集名称,在“数据文件”页签的文件操作列单击“下载”,再单击“确定”,下载完成后即可查看。

相关文档