更新时间:2022-02-24 GMT+08:00

实例监控

数据开发模块控制台的左侧导航栏,选择 运维调度,进入实例监控列表页面,用户可以在该页面中查看作业的实例信息,并根据需要对实例和节点进行更多操作,请参见批处理:查看所有实例

当作业实例的运行状态为“失败”时,您可以通过“失败”旁边的提示信息查看作业实例失败的原因。如图1

图1 作业实例失败提示

重跑作业实例

您可以对运行成功或失败的作业实例设置重跑,配置重跑开始位置。

  1. 登录DLF管理控制台。
  2. DLF控制台的左侧导航栏,选择运维调度 > 实例监控
  3. 选择作业名称,在作业的“操作”列,单击“重跑”设置重跑作业实例;或单击作业名称左边的复选框,再选择“重跑”按钮设置作业重跑。

    图2 设置作业重跑
    表1 参数说明

    参数

    说明

    重跑开始位置

    选择作业实例重跑的开始位置:

    • 从错误节点开始重跑:作业实例执行失败时,从实例执行失败的错误节点开始重跑。
    • 从第一个节点开始重跑:从作业实例的第一个节点开始重跑。
    • 从指定的节点开始重跑:从作业实例中指定的节点开始重跑。
    说明:

    以下两种情况,系统运行会从第一个节点开始重跑。

    • 如果作业中节点个数或者名称发生变化,从第一个节点开始重跑。
    • 如果重跑成功状态的作业实例,从第一个节点开始重跑。