更新时间:2022-05-25 GMT+08:00
分享

查询训练作业指定任务的运行指标

功能介绍

查询训练作业指定任务的运行指标。

调试

您可以在API Explorer中调试该接口。

URI

GET /v2/{project_id}/training-jobs/{training_job_id}/metrics/{task_id}

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

用户项目ID。获取方法请参见获取项目ID

training_job_id

String

训练作业ID。

task_id

String

训练作业的任务名称。

请求参数

响应参数

状态码: 200

表2 响应Body参数

参数

参数类型

描述

metrics

Array of metrics objects

运行指标。

表3 metrics

参数

参数类型

描述

metric

String

运行指标,可选值如下: cpuUsage(CPU使用率), memUsage(物理内存使用率), gpuUtil(GPU使用率), gpuMemUsage(显存使用率), npuUtil(NPU使用率), npuMemUsage(NPU显存使用率)。

value

Array of numbers

运行指标对应数值,1min统计一个平均值。

请求示例

如下以查询uuid为2cd88daa-31a4-40a8-a58f-d186b0e93e4f的训练作业对应worker-0运行指标为例

GET   https://endpoint/v2/{project_id}/training-jobs/2cd88daa-31a4-40a8-a58f-d186b0e93e4f/metrics/worker-0

响应示例

状态码: 200

ok

{
  "metrics" : [ {
    "metric" : "cpuUsage",
    "value" : [ -1, -1, 2.43, 4.524, 6.714, 12.422, 9.214, 5.36, 7.5, 10.088, 8.975, 11.423, 11.548, 14.563, 16.833 ]
  }, {
    "metric" : "memUsage",
    "value" : [ -1, -1, 0.04, 0.521, 1.652, 4.252, 6.433, 7.384, 7.982, 8.718, 9.365, 9.881, 10.192, 9.994, 9.005 ]
  }, {
    "metric" : "gpuUtil",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "gpuMemUsage",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "npuUtil",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "npuMemUsage",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  } ]
}

状态码

状态码

描述

200

ok

错误码

请参见错误码

分享:

    相关文档

    相关产品

close