Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> ModelArts> Referencia de la API> Gestión de la formación (recomendada)> Gestión de trabajos de entrenamiento> Consulta de las métricas en ejecución de una tarea especificada en un trabajo de entrenamiento
Actualización más reciente 2022-11-14 GMT+08:00

Consulta de las métricas en ejecución de una tarea especificada en un trabajo de entrenamiento

Función

Esta API se utiliza para consultar las métricas en ejecución de una tarea especificada en un trabajo de entrenamiento.

URI

GET /v2/{project_id}/training-jobs/{training_job_id}/metrics/{task_id}

Tabla 1 Parámetros de ruta

Parámetro

Obligatorio

Tipo

Descripción

project_id

String

ID del proyecto. Para obtener más información, consulte Obtención de un ID de proyecto.

training_job_id

String

ID de un trabajo de entrenamiento.

task_id

String

Nombre de un trabajo de entrenamiento.

Parámetros de solicitud

No hay

Parámetros de respuesta

Código de estado: 200

Tabla 2 Parámetros del cuerpo de respuesta

Parámetro

Tipo

Descripción

metrics

Array of metrics objects

Métrica de ejecución.

Tabla 3 metrics

Parámetro

Tipo

Descripción

metric

String

Métrica de ejecución. Opciones: cpuUsage: uso de la CPU memUsage: uso de la memoria física gpuUtil: uso de la GPU gpuMemUsage: uso de la memoria de la GPU npuUtil: uso de la NPU npuMemUsage: uso de la memoria de la NPU

value

Array of numbers

Valor de una métrica en ejecución. Se recoge un valor promedio cada minuto.

Ejemplo de las solicitudes

A continuación se muestra cómo consultar las métricas en ejecución de la tarea work-0 del trabajo de entrenamiento cuyo UUID es 2cd88daa-31a4-40a8-a58f-d186b0e93e4f.

GET   https://endpoint/v2/{project_id}/training-jobs/2cd88daa-31a4-40a8-a58f-d186b0e93e4f/metrics/worker-0

Ejemplo de las respuestas

Código de estado: 200

Aceptar

{
  "metrics" : [ {
    "metric" : "cpuUsage",
    "value" : [ -1, -1, 2.43, 4.524, 6.714, 12.422, 9.214, 5.36, 7.5, 10.088, 8.975, 11.423, 11.548, 14.563, 16.833 ]
  }, {
    "metric" : "memUsage",
    "value" : [ -1, -1, 0.04, 0.521, 1.652, 4.252, 6.433, 7.384, 7.982, 8.718, 9.365, 9.881, 10.192, 9.994, 9.005 ]
  }, {
    "metric" : "gpuUtil",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "gpuMemUsage",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "npuUtil",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  }, {
    "metric" : "npuMemUsage",
    "value" : [ -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 ]
  } ]
}

Códigos de estado

Código de estado

Descripción

200

Aceptar

Códigos de error

Consulte Códigos de error.