更新时间:2026-05-15 GMT+08:00
分享

管理数据精炼任务

在数据精炼任务工作区列举了所有的数据精炼任务列表,可以查看数据精炼任务的名称/ID、关联数据集、最近运行状态、最近生成数据集、最近运行时间、创建者以及支持的一些操作。本文将详细介绍如何管理数据精炼任务。

数据精炼任务管理

登录ModelArts管理控制台,在左侧导航栏选择数据准备 > 数据精炼,可查看已创建的数据精炼任务。

数据精炼任务支持过滤、搜索、启动、停止、重试、编辑、删除等操作。以下分别讲解如何操作。

  • 数据精炼任务过滤和搜索。在数据精炼任务很多的情况下,支持按照ID、最近运行状态、创建者等维度过滤想要的任务,便于快速找到目标任务。也可单击“我创建的”按钮,只列举当前登录用户创建的数据连接任务。
    图1 数据集过滤

  • 数据精炼任务启动。

    最近运行状态数据集生成成功、未启动、已停止的数据精炼任务,如果想再次运行该任务,可单击操作列“启动”按钮或任务详情页右上角“启动”按钮,在页面右侧弹出的对话框,重新修改精炼配置,启动该精炼任务。具体可参考创建智能精炼

    图2 启动智能精炼

    配置完成后,单击“确定”,启动智能精炼任务。

  • 数据精炼任务停止。

    创建好的数据精炼任务,如果任务还在运行中,可单击操作列“停止”按钮或任务详情页右上角“停止”按钮,在弹出的对话框中“确认”后,该任务停止运行。

  • 数据精炼任务重试。

    对于运行失败的任务,支持“重试”操作重新运行该任务。可以在“操作”列单击“重试”按钮或任务详情页面右上角单击“重试”后,在页面右侧弹出的对话框,重新修改精炼配置,重试该精炼任务。具体可参考创建智能精炼

    配置完成后,单击“确定”,启动智能精炼任务。

  • 数据精炼任务编辑。

    最近运行状态不是“运行中”状态的数据精炼任务,均可单击编辑,重新编辑该数据任务的数据算子参数或调整顺序。单击“编辑”后,弹出编辑智能精炼配置页,调整算子顺序或参数后,单击“保存”完成任务的编辑。也可单击“取消”按钮,取消编辑。

  • 数据精炼任务删除。

    对于列表中创建的数据精炼任务,支持“删除”操作。可以在“操作”列单击“删除”按钮,在弹出删除对话框选择“确定”后,该任务将被删除。删除后的任务不是彻底删除,为避免误删,如果还想再继续使用,可以恢复任务。已删除的任务在工作区右上角单击“显示已删除项”后,在任务清单有可以看到已删除的任务名称后有“已删除”标签。对于已删除的任务,可以选择“彻底删除”。彻底删除后的任务不可恢复。

    图3 已删除任务的“已删除”标签

    图4 任务“彻底删除”

  • 数据精炼任务批量删除

    勾选数据精炼任务名称前的复选框,选择要删除的任务后,单击右上角“删除”按钮,可以批量删除数据。

    图5 批量删除

数据精炼任务详情管理

数据精炼任务详情页面展示了当前任务详细信息。在数据精炼工作区,单击任意任务名称,就进入该精炼任务的任务详情页面。在该页面右上角可以根据任务的不同状态选择启动、重试、删除、停止等按钮,单击后操作参见数据精炼任务管理对应操作。

数据任务详情有基本信息运行详情、精炼结果、操作记录四个子页面。以下分别说明页面的作用和涉及的操作。

基本信息

基本信息左侧列举了精炼详情,包含任务名称、ID、任务描述、创建时间、创建人、最近编辑时间、编辑人等信息。任务名称任务描述支持修改。

基本信息右侧列举了该任务的使用的数据算子的编排详情。

图6 基本信息

运行详情

运行详情左侧列举了该任务运行记录,包含运行时间及运行结果状态。

运行详情右侧列举运行任务的概览、报告、日志。分别说明如下:

  • 概览。展示每次运行记录的任务耗时、任务步骤、精炼前样本数量、精炼后样本数量。运行详情包含了操作人、操作时间、任务使用的资源的详情。生成数据集包含了生成数据集的链接及其余信息,如图7所示。
    图7 概览

  • 报告。展示每次运行记录的编排步骤各数据算子运行状态,算子运行时长、算子处理前后数据的样本数量及算子优化命中数量。如图8所示。通过报告可以直观定位各个算子处理的数据是否符合预期。
    图8 报告

  • 日志。展示每次运行记录的数据精炼任务运行过程中的日志记录,通过日志能够快速定位数据精炼任务出现的问题。日志界面支持按照正则匹配关键字,查找关键日志。如图9所示。
    图9 日志

精炼结果

展示通过数据精炼任务生成的数据集信息,包含数据集在数据资产中的链接。具体如图10所示。

图10 精炼结果

操作记录

记录数据精炼任务所有的操作记录,便于查看当前任务的操作状态。具体如图11所示。

图11 操作记录

相关文档