文档首页/ AI开发平台ModelArts/ API参考/ 训练管理/ 查询训练诊断任务列表 - ListTrainingJobDiagnosisTasks
更新时间:2026-02-25 GMT+08:00
分享

查询训练诊断任务列表 - ListTrainingJobDiagnosisTasks

功能介绍

查询训练诊断任务接口用于在ModelArts平台上指定训练作业的诊断任务详细信息。

该接口适用于以下场景:当用户需要查看特定训练作业的诊断任务的运行状态和诊断结果时,可以通过此接口获取诊断任务详情。使用该接口的前提条件是用户已知训练作业ID,并已创建过对应的诊断任务。若作业ID不存在、状态不允许或用户无权限操作,接口将返回相应的错误信息

调试

您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。

授权信息

账号具备所有API的调用权限,如果使用账号下的IAM用户调用当前API,该IAM用户需具备调用API所需的权限。

  • 如果使用角色与策略授权,具体权限要求请参见权限和授权项
  • 如果使用身份策略授权,需具备如下身份策略权限。

    授权项

    访问级别

    资源类型(*为必须)

    条件键

    别名

    依赖的授权项

    modelarts:trainJob:list

    List

    -

    -

    -

    -

URI

GET /v2/{project_id}/training-jobs/{job_id}/diagnosis-tasks

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

参数解释:用户项目ID。获取方法请参见获取项目ID和名称

约束限制:1 - 64字符,字母、数字和中划线。

取值范围:不涉及。

默认取值:不涉及。

job_id

String

参数解释:作业ID。

约束限制:不涉及。

取值范围:长度为32的英文字符、数字的组合。

默认取值:不涉及。

请求参数

响应参数

状态码:200

表2 响应Body参数

参数

参数类型

描述

total

Integer

参数解释:诊断作业总数,每个类型的诊断作业只返回最新的一次诊断结果。

tasks

Array of TrainJobDiagnosisTask objects

参数解释:各个类型的诊断作业详情。

表3 TrainJobDiagnosisTask

参数

参数类型

描述

created_at

String

参数解释:诊断任务创建时间。

取值范围:不涉及。

updated_at

String

参数解释:诊断任务更新时间。

取值范围:不涉及。

type

String

参数解释:诊断任务类型。

取值范围

  • standard:标准诊断

task_id

String

参数解释:诊断任务ID。

取值范围:不涉及。

training_job_id

String

参数解释:诊断任务对应的训练作业ID。

取值范围:不涉及。

status

String

参数解释:诊断任务状态。

取值范围

  • CREATING:创建中

  • PENDING:排队中

  • RUNNING:运行中

  • FAILED:任务失败

  • CREATE_FAILED:任务创建失败

  • TIMEOUT:任务超时

  • SUCCEEDED:任务创建成功

  • PARTIALLY_SUCCEEDED:任务部分成功

  • TERMINATING:终止中

  • TERMINATED:任务终止

  • ABNORMAL:异常

estimated_time

Integer

参数解释:诊断任务预估耗时,单位为分钟。

取值范围:不涉及。

cost_time

Integer

参数解释:诊断任务实际耗时,单位为秒。

取值范围:不涉及。

sub_tasks

TrainJobDiagnosisSubTasks object

参数解释:子项诊断任务详情列表。

表4 TrainJobDiagnosisSubTasks

参数

参数类型

描述

log_diagnosis_task

TrainJobLogDiagnosisTask object

参数解释:子项诊断任务日志诊断详情。

表5 TrainJobLogDiagnosisTask

参数

参数类型

描述

task_id

String

参数解释:子项诊断任务ID。

取值范围:不涉及。

status

String

参数解释:子项任务状态。

取值范围

  • CREATING:创建中

  • PENDING:排队中

  • RUNNING:运行中

  • FAILED:任务失败

  • CREATE_FAILED:任务创建失败

  • TIMEOUT:任务超时

  • SUCCEEDED:任务成功

  • PARTIALLY_SUCCEEDED:任务部分成功

  • TERMINATING:终止中

  • TERMINATED:任务终止

conclusion

String

参数解释:子项诊断任务诊断结论。

取值范围

  • ABNORMAL:异常

  • NORMAL:正常

cost_time

Integer

参数解释:诊断任务实际耗时,单位为秒。 取值范围:不涉及。

result

String

参数解释:子项诊断任务源数据。

取值范围:不涉及。

请求示例

GET https://endpoint/v2/{project_id}/training-jobs/{job_id}/diagnosis-tasks

响应示例

状态码:200

OK

{
  "tasks" : [ {
    "created_at" : "2025-11-28T15:33:27+08:00",
    "updated_at" : "2025-11-28T15:36:01.5603+08:00",
    "task_id" : "033b54da-7db6-48ba-8dd0-d509de0f5db3",
    "training_job_id" : "74d29d18-4319-403b-ac9c-b8915770b9fa",
    "status" : "SUCCEEDED",
    "cost_time" : 127,
    "type" : "standard",
    "sub_tasks" : {
      "log_diagnosis_task" : {
        "task_id" : "89e971ae-11c6-4d58-b308-1e8c332e7332",
        "status" : "SUCCEEDED",
        "conclusion" : "NORMAL",
        "cost_time" : 126,
        "result" : ""
      }
    }
  } ]
}

状态码

状态码

描述

200

OK

错误码

请参见错误码

相关文档