文档首页/ AI开发平台ModelArts/ API参考/ 训练管理/ 查询训练作业指定任务的运行指标
更新时间:2024-10-23 GMT+08:00
分享

查询训练作业指定任务的运行指标

功能介绍

查询训练作业指定任务的运行指标。

调试

您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。

URI

GET /v2/{project_id}/training-jobs/{training_job_id}/metrics/{task_id}

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

用户项目ID。获取方法请参见获取项目ID和名称

training_job_id

String

训练作业ID。获取方法请参见查询训练作业列表

task_id

String

训练作业的任务名称。可从训练作业详情中的status.tasks字段中获取。

project_id

String

用户项目ID。获取方法请参见获取项目ID和名称

training_job_id

String

训练作业ID。获取方法请参见查询训练作业列表

task_id

String

训练作业的任务名称。可从训练作业详情中的status.tasks字段中获取。

请求参数

响应参数

状态码: 200

表2 响应Body参数

参数

参数类型

描述

metrics

Array of MetricObject objects

运行指标。

表3 MetricObject

参数

参数类型

描述

metric

String

运行指标,可选值如下:

  • cpuUsage:CPU使用率

  • memUsage:物理内存使用率

  • gpuUtil:GPU使用率

  • gpuMemUsage:显存使用率

  • npuUtil:NPU使用率

  • npuMemUsage:NPU显存使用率

value

Array of doubles

运行指标对应数值,1min统计一个平均值。

请求示例

如下以查询uuid为2cd88daa-31a4-40a8-a58f-d186b0e93e4f的训练作业对应worker-0运行指标为例

GET https://endpoint/v2/{project_id}/training-jobs/2cd88daa-31a4-40a8-a58f-d186b0e93e4f/metrics/worker-0

响应示例

状态码: 200

ok

{
  "metrics" : [ {
    "metric" : "cpuUsage",
    "value" : [ -1, -1, 2.43, 4.524, 6.714, 12.422, 9.214, 5.36, 7.5, 10.088, 8.975, 11.423, 11.548, 14.563, 16.833 ]
  }, {
    "metric" : "memUsage",
    "value" : [ -1, -1, 0.04, 0.521, 1.652, 4.252, 6.433, 7.384, 7.982, 8.718, 9.365, 9.881, 10.192, 9.994, 9.005 ]
  }, {
    "metric" : "gpuUtil",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "gpuMemUsage",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "npuUtil",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "npuMemUsage",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  } ]
}

状态码

状态码

描述

200

ok

错误码

请参见错误码

相关文档