更新时间:2024-07-23 GMT+08:00
分享

ModelArts Train

功能

通过编排ModelArts Train算子,实现在DataArts Studio中调度ModelArts工作流。

前提条件

  1. 已在ModelArts平台中完成工作空间的创建,具体请参考创建工作空间
  2. 已在ModelArts平台中完成工作流的创建,具体请参考创建工作流

参数

用户可参考表1表2配置ModelArts Train节点的参数。

表1 属性参数

参数

是否必选

说明

ModelArts工作空间

选择ModelArts工作空间。该工作空间必须与DataArts Studio在同一区域、同一Region。

工作流版本

选择ModelArts工作流版本。

  • V1
  • V2

ModelArts工作流

选择ModelArts工作流。该工作流必须是与DataArts Studio在同一区域,同一Region的ModelArts 工作流。

节点名称

节点名称,只能包含英文字母、数字、中文字符、中划线、下划线、/、<>和点号,且长度小于等于128个字符。

表2 高级参数

参数

是否必选

说明

节点执行的最长时间

设置节点执行的超时时间,如果节点配置了重试,在超时时间内未执行完成,该节点将会再次重试。

失败重试

节点执行失败后,是否重新执行节点

  • 是:重新执行节点,请配置以下参数。
    • 超时重试
    • 最大重试次数
    • 重试间隔时间(秒)
  • 否:默认值,不重新执行节点
    说明:

    如果作业节点配置了重试,并且配置了超时时间,该节点执行超时后,系统支持再重试。

    当节点运行超时导致的失败不会重试时,您可前往“默认项设置”修改此策略。

    当“失败重试”配置为“是”才显示“超时重试”。

当前节点失败后,后续节点处理策略

节点执行失败后的操作:

  • 终止后续节点执行计划:停止后续节点的运行,当前作业实例状态显示为“失败”。
  • 终止当前作业执行计划:停止当前作业运行,当前作业实例状态显示为“失败”。
  • 继续执行下一节点:忽略当前节点失败,当前作业实例状态显示为“忽略失败”。
  • 挂起当前作业执行计划:当前作业实例的状态为运行异常,该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。

是否空跑

如果勾选了空跑,该节点不会实际执行,将直接返回成功。

任务组

选择任务组。任务组配置好后,可以更细粒度的进行当前任务组中的作业节点的并发数控制,比如作业中包含多个节点、补数据、重跑等场景。

相关文档