Consulta de los detalles de un trabajo de formación
Función
Esta API se utiliza para consultar los detalles sobre un trabajo de entrenamiento.
URI
GET /v2/{project_id}/training-jobs/{training_job_id}
|
Parámetro |
Obligatorio |
Tipo |
Descripción |
|---|---|---|---|
|
project_id |
Sí |
String |
ID del proyecto. Para obtener más información, consulte Obtención de un ID de proyecto. |
|
training_job_id |
Sí |
String |
ID de un trabajo de formación. |
Parámetros de solicitud
No hay
Parámetros de respuesta
Código de estado: 200
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
kind |
String |
Tipo de trabajo de formación, que es job de forma predeterminada. Opciones:
|
|
metadata |
JobMetadata object |
Metadatos de un trabajo de formación. |
|
status |
Status object |
Estado de un trabajo de formación. No es necesario establecer este parámetro al crear un trabajo. |
|
algorithm |
JobAlgorithmResponse object |
Algoritmo para trabajos de entrenamiento. Se soportan los siguientes formatos:
|
|
tasks |
Array of TaskResponse objects |
Lista de tareas en trabajos de formación heterogéneos. |
|
spec |
spec object |
Especificaciones de un trabajo de formación. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
id |
String |
ID del trabajo de entrenamiento, que es generado y devuelto por ModelArts después de crear el trabajo de entrenamiento. |
|
name |
String |
Nombre de un trabajo de entrenamiento. El valor debe contener de 1 a 64 caracteres que consisten solo en dígitos, letras, guiones bajos (_) y guiones (-). |
|
workspace_id |
String |
Espacio de trabajo donde se encuentra un trabajo. El valor predeterminado es 0. |
|
description |
String |
Descripción del trabajo de entrenamiento. El valor debe contener de 0 a 256 caracteres. El valor predeterminado es NULL. |
|
create_time |
Long |
Marca de tiempo cuando se crea un trabajo de entrenamiento, en milisegundos. El valor es generado y devuelto por ModelArts después de crear el trabajo. |
|
user_name |
String |
Nombre de usuario para crear un trabajo de formación. El nombre de usuario es generado y devuelto por ModelArts después de crear el trabajo de entrenamiento. |
|
annotations |
Map<String,String> |
Plantilla de declaración de un trabajo de formación. Para trabajos heterogéneos, el valor predeterminado de job_template es Template RL. Para otros trabajos, el valor predeterminado es Template DL. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
phase |
String |
Nivel 1 de un trabajo de formación. El valor es estable. Opciones: Creating Pending Running Failed Completed, Terminating Terminated Abnormal |
|
secondary_phase |
String |
Nivel 2 de un trabajo de entrenamiento. El valor es inestable. Opciones: Creating Queuing Running Failed Completed Terminating Terminated CreateFailed TerminatedFailed Unknown Lost |
|
duration |
Long |
Duración de un trabajo de entrenamiento, en milisegundos |
|
node_count_metrics |
Array<Array<Integer>> |
Cambios en el recuento de nodos durante el período de ejecución del trabajo de entrenamiento. |
|
tasks |
Array of strings |
Tareas de un trabajo de entrenamiento. |
|
start_time |
String |
Hora de inicio de un trabajo de entrenamiento. El valor está en formato de marca de tiempo. |
|
task_statuses |
Array of task_statuses objects |
Estado de una tarea de trabajo de entrenamiento. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
task |
String |
Nombre de una tarea de trabajo de entrenamiento. |
|
exit_code |
Integer |
Código de salida de una tarea de trabajo de entrenamiento. |
|
message |
String |
Mensaje de error de una tarea de trabajo de entrenamiento. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
id |
String |
Algoritmo para trabajos de entrenamiento. Opciones:
|
|
name |
String |
Nombre del algoritmo. |
|
subscription_id |
String |
ID de suscripción del algoritmo de suscripción. Este parámetro debe usarse junto con item_version_id. |
|
item_version_id |
String |
ID de versión del algoritmo de suscripción. Este parámetro se debe usar junto con subscription_id. |
|
code_dir |
String |
Directorio de código de un trabajo de formación, por ejemplo, /usr/app/. Este parámetro debe usarse junto con boot_file. Si se establece id o subscription_id+item_version_id, déjelo en blanco. |
|
boot_file |
String |
Archivo de arranque de un trabajo de entrenamiento, que debe almacenarse en el directorio de código, por ejemplo, /usr/app/boot.py. Este parámetro debe usarse junto con code_dir. Si se establece id o subscription_id+item_version_id, déjelo en blanco. |
|
autosearch_config_path |
String |
Ruta de configuración YAML de los trabajos de búsqueda automática. Se requiere una URL OBS. |
|
autosearch_framework_path |
String |
Directorio de código de marco de trabajos de búsqueda automática. Se requiere una URL OBS. |
|
command |
String |
Comando de arranque utilizado para iniciar el contenedor de la imagen personalizada utilizada por un trabajo de entrenamiento. Puede establecer este parámetro en code_dir. |
|
parameters |
Array of Parameter objects |
Parámetros de ejecución de un trabajo de entrenamiento. |
|
policies |
policies object |
Políticas apoyadas por puestos de trabajo. |
|
inputs |
Array of Input objects |
Aportación de un trabajo de formación. |
|
outputs |
Array of Output objects |
Salida de un trabajo de formación. |
|
engine |
engine object |
Motor de un trabajo de entrenamiento. Deje este parámetro en blanco si el trabajo se crea mediante id de la API de gestión del algoritmo o subscription_id+item_version_id de la API del algoritmo de suscripción. |
|
environments |
Array of Map<String,String> objects |
Variables de entorno de un trabajo de entrenamiento. El formato es key: value. Deje este parámetro en blanco. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
name |
String |
Nombre del parámetro. |
|
value |
String |
Valor del parámetro. |
|
description |
String |
Descripción del parámetro. |
|
constraint |
constraint object |
Restricción de parámetro. |
|
i18n_description |
i18n_description object |
Descripción de la internacionalización. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
type |
String |
Tipo de parámetro. |
|
editable |
Boolean |
Si el parámetro es editable. |
|
required |
Boolean |
Si el parámetro es obligatorio. |
|
sensitive |
Boolean |
Si el parámetro es sensible. |
|
valid_type |
String |
Tipo válido. |
|
valid_range |
Array of strings |
Rango válido. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
language |
String |
Internacionalización idioma. |
|
description |
String |
Descripción. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
auto_search |
auto_search object |
Configuración de búsqueda de hiperparámetros. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
skip_search_params |
String |
Parámetros hiperparamétricos que deben omitirse. |
|
reward_attrs |
Array of reward_attrs objects |
Lista de métricas de búsqueda. |
|
search_params |
Array of search_params objects |
Parámetros de búsqueda. |
|
algo_configs |
Array of algo_configs objects |
Configuraciones de algoritmos de búsqueda. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
name |
String |
Nombre de la métrica |
|
mode |
String |
Dirección de búsqueda.
|
|
regex |
String |
Expresión regular de una métrica. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
name |
String |
Nombre de hiperparámetro. |
|
param_type |
String |
Tipo de parámetro.
|
|
lower_bound |
String |
Límite inferior del hiperparámetro. |
|
upper_bound |
String |
Límite superior del hiperparámetro. |
|
discrete_points_num |
String |
Número de puntos discretos de un hiperparámetro continuo. |
|
discrete_values |
Array of strings |
Lista de valores de hiperparámetro discretos. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
name |
String |
Nombre del algoritmo de búsqueda. |
|
params |
Array of AutoSearchAlgoConfigParameter objects |
Parámetros del algoritmo de búsqueda. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
key |
String |
Clave de parámetro. |
|
value |
String |
Valor del parámetro. |
|
type |
String |
Tipo de parámetro. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
name |
String |
Nombre del canal de entrada de datos. |
|
description |
String |
Descripción del canal de entrada de datos. |
|
local_dir |
String |
Directorio local del contenedor al que se asigna el canal de entrada de datos. |
|
remote |
InputDataInfo object |
Entrada de datos. Opciones:
|
|
remote_constraint |
Array of remote_constraint objects |
Restricciones de entrada de datos. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
dataset |
dataset object |
Conjunto de datos como entrada de datos. |
|
obs |
obs object |
OBS en el que se almacenan los datos de entrada y salida. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
id |
String |
ID de conjunto de datos de un trabajo de entrenamiento. |
|
version_id |
String |
ID de versión del conjunto de datos de un trabajo de entrenamiento. |
|
obs_url |
String |
OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. ModelArts analiza y genera automáticamente la URL basándose en los ID de versión del conjunto de datos y del conjunto de datos. Por ejemplo, /usr/data/. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
obs_url |
String |
OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. Por ejemplo, /usr/data/. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
data_type |
String |
Tipo de entrada de datos, incluida la ubicación de almacenamiento de datos y el conjunto de datos. |
|
attributes |
String |
Atributos si se utiliza un conjunto de datos como entrada de datos. Opciones:
|
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
name |
String |
Nombre del canal de salida de datos. |
|
description |
String |
Descripción del canal de salida de datos. |
|
local_dir |
String |
Directorio local del contenedor al que se asigna el canal de salida de datos. |
|
remote |
remote object |
Descripción de la salida de datos real. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
obs_url |
String |
URL OBS a la que se exportan los datos. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
engine_id |
String |
ID del motor seleccionado para un trabajo de entrenamiento. Puede establecer este parámetro en engine_id, engine_name + engine_version, o image_url. |
|
engine_name |
String |
Nombre del motor seleccionado para un trabajo de entrenamiento. Si se establece engine_id, deje este parámetro en blanco. |
|
engine_version |
String |
Nombre de la versión del motor seleccionada para un trabajo de entrenamiento. Si se establece engine_id, deje este parámetro en blanco. |
|
image_url |
String |
URL de imagen personalizada seleccionada para un trabajo de entrenamiento. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
role |
String |
Papel de un trabajo de entrenamiento heterogéneo. Opciones:
|
|
algorithm |
algorithm object |
Gestión y configuración de algoritmos. |
|
task_resource |
FlavorResponse object |
Variantes de un trabajo de entrenamiento o un algoritmo. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
code_dir |
String |
Ruta absoluta del directorio donde se almacena el archivo de arranque del algoritmo. |
|
boot_file |
String |
Ruta absoluta del archivo de arranque del algoritmo. |
|
inputs |
inputs object |
Canal de entrada de algoritmo. |
|
outputs |
outputs object |
Canal de salida del algoritmo. |
|
engine |
engine object |
Motor del que depende un trabajo heterogéneo. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
name |
String |
Nombre del canal de entrada de datos. |
|
local_dir |
String |
Ruta local del contenedor al que se asignan los canales de entrada y salida de datos. |
|
remote |
remote object |
Entrada de datos real. Los trabajos heterogéneos solo admiten OBS. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
obs |
obs object |
OBS en el que se almacenan los datos de entrada y salida. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
obs_url |
String |
OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. Por ejemplo, /usr/data/. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
name |
String |
Nombre del canal de salida de datos. |
|
local_dir |
String |
Directorio local del contenedor al que se asigna el canal de salida de datos. |
|
remote |
remote object |
Descripción de la salida de datos real. |
|
mode |
String |
Modo de transmisión de datos. El valor predeterminado es upload_periodically. |
|
period |
String |
Periodo de transmisión de datos. El valor predeterminado es 30s. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
obs |
obs object |
OBS a la que se exportan los datos. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
obs_url |
String |
URL OBS a la que se exportan los datos. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
engine_id |
String |
ID del motor de un trabajo heterogéneo, por ejemplo, caffe-1.0.0-python2.7. |
|
engine_name |
String |
Nombre del motor de un trabajo heterogéneo, por ejemplo, Caffe. |
|
engine_version |
String |
Versión del motor de un trabajo heterogéneo. |
|
v1_compatible |
Boolean |
Si se utiliza el modo de compatibilidad v1. |
|
run_user |
String |
UID de usuario iniciado por defecto por el motor. |
|
image_url |
String |
URL de imagen personalizada seleccionada por un algoritmo. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
flavor_id |
String |
ID of the resource flavor. |
|
flavor_name |
String |
Nombre de la variante de recurso. |
|
max_num |
Integer |
Número máximo de nodos en una variante de recurso. |
|
flavor_type |
String |
Tipo de variante de recurso. Opciones:
|
|
billing |
billing object |
Información de facturación de una variante de recurso. |
|
flavor_info |
flavor_info object |
Detalles de la variante del recurso. |
|
attributes |
Map<String,String> |
Otros atributos de especificación. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
code |
String |
Código de facturación. |
|
unit_num |
Integer |
Número de unidades de facturación. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
max_num |
Integer |
Número máximo de nodos que se pueden seleccionar. El valor 1 indica que el modo distribuido no es compatible. |
|
cpu |
cpu object |
Especificaciones de la CPU. |
|
gpu |
gpu object |
Especificaciones de GPU. |
|
npu |
npu object |
Variantes de Ascend. |
|
memory |
memory object |
Información de memoria. |
|
disk |
disk object |
Información del disco. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
arch |
String |
Arquitectura de CPU. |
|
core_num |
Integer |
Cantidad de núcleos. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
unit_num |
Integer |
Número de GPUs. |
|
product_name |
String |
Nombre del producto. |
|
memory |
String |
Memoria. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
unit_num |
String |
Número de NPU. |
|
product_name |
String |
Nombre del producto. |
|
memory |
String |
Memoria. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
size |
Integer |
Tamaño de la memoria. |
|
unit |
String |
Número de unidades de memoria. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
size |
Integer |
Tamaño del disco. |
|
unit |
String |
Unidad del tamaño del disco. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
resource |
Resource object |
Variantes de recursos de un trabajo de entrenamiento. Seleccione flavor_id o pool_id+[flavor_id]. |
|
volumes |
Array of volumes objects |
Volúmenes adjuntos a un trabajo de entrenamiento. |
|
log_export_path |
log_export_path object |
Exportar la ruta de los registros de trabajos de entrenamiento. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
policy |
String |
Variante de recursos de un trabajo de entrenamiento. Opciones: regular |
|
flavor_id |
String |
ID de variante de recurso de un trabajo de entrenamiento. Este parámetro no es compatible con los grupos de recursos dedicados alimentados por CPU. |
|
flavor_name |
String |
Nombre de variante de sólo lectura devuelto por ModelArts cuando se utiliza flavor_id. |
|
node_count |
Integer |
Número de réplicas de recursos seleccionadas para un trabajo de formación. Mínimo: 1 |
|
pool_id |
String |
ID del fondo de recursos seleccionado para un trabajo de formación. |
|
flavor_detail |
flavor_detail object |
Variantes de un trabajo de entrenamiento o un algoritmo. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
flavor_type |
String |
Tipo de variante de recurso. Opciones:
|
|
billing |
billing object |
Información de facturación de una variante de recurso. |
|
flavor_info |
flavor_info object |
Detalles de la variante del recurso. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
code |
String |
Código de facturación. |
|
unit_num |
Integer |
Número de unidades de facturación. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
max_num |
Integer |
Número máximo de nodos que se pueden seleccionar. El valor 1 indica que el modo distribuido no es compatible. |
|
cpu |
cpu object |
Especificaciones de la CPU. |
|
gpu |
gpu object |
Especificaciones de GPU. |
|
npu |
npu object |
Variantes de Ascend. |
|
memory |
memory object |
Información de memoria. |
|
disk |
disk object |
Información del disco. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
arch |
String |
Arquitectura de CPU. |
|
core_num |
Integer |
Cantidad de núcleos. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
unit_num |
Integer |
Número de GPU. |
|
product_name |
String |
Nombre del producto. |
|
memory |
String |
Memoria. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
unit_num |
String |
Número de NPU. |
|
product_name |
String |
Nombre del producto. |
|
memory |
String |
Memoria. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
size |
Integer |
Tamaño de la memoria. |
|
unit |
String |
Número de unidades de memoria. |
|
Parámetro |
Tipo |
Descripción |
|---|---|---|
|
size |
String |
Tamaño del disco. |
|
unit |
String |
Unidad del tamaño del disco. Generalmente, el valor es GB. |
Ejemplo de las solicitudes
A continuación se muestra cómo consultar un trabajo de entrenamiento cuyo UUID es 3faf5c03-aaa1-4cbe-879d-24b05d997347.
GET https://endpoint/v2/{project_id}/training-jobs/3faf5c03-aaa1-4cbe-879d-24b05d997347
Ejemplo de las respuestas
Código de estado: 200
Aceptar
{
"kind" : "job",
"metadata" : {
"id" : "3faf5c03-aaa1-4cbe-879d-24b05d997347",
"name" : "trainjob--py14_mem06-108",
"description" : "",
"create_time" : 1636447346315,
"workspace_id" : "0",
"user_name" : ""
},
"status" : {
"phase" : "Abnormal",
"secondary_phase" : "CreateFailed",
"duration" : 0,
"start_time" : 0,
"node_count_metrics" : [ [ 1636447746000, 0 ], [ 1636447755000, 0 ], [ 1636447756000, 0 ] ],
"tasks" : [ "worker-0" ]
},
"algorithm" : {
"code_dir" : "obs://test/economic_test/py_minist/",
"boot_file" : "obs://test/economic_test/py_minist/minist_common.py",
"inputs" : [ {
"name" : "data_url",
"local_dir" : "/home/ma-user/modelarts/inputs/data_url_0",
"remote" : {
"obs" : {
"obs_url" : "/test/data/py_minist/"
}
}
} ],
"outputs" : [ {
"name" : "train_url",
"local_dir" : "/home/ma-user/modelarts/outputs/train_url_0",
"remote" : {
"obs" : {
"obs_url" : "/test/train_output/"
}
}
} ],
"engine" : {
"engine_id" : "pytorch-cp36-1.4.0-v2",
"engine_name" : "PyTorch",
"engine_version" : "PyTorch-1.4.0-python3.6-v2"
}
},
"spec" : {
"resource" : {
"flavor_id" : "modelarts.vm.p100.large.eco",
"node_count" : 1,
"flavor_detail" : {
"flavor_type" : "GPU",
"billing" : {
"code" : "modelarts.vm.gpu.p100.eco",
"unit_num" : 1
},
"flavor_info" : {
"cpu" : {
"arch" : "x86",
"core_num" : 8
},
"gpu" : {
"unit_num" : 1,
"memory" : "8GB"
},
"memory" : {
"size" : 64,
"unit" : "GB"
}
}
}
}
}
}
Códigos de estado
|
Código de estado |
Descripción |
|---|---|
|
200 |
Aceptar |
Códigos de error
Consulte Códigos de error.