Consulta de los detalles de un trabajo de formación
Función
Esta API se utiliza para consultar los detalles sobre un trabajo de entrenamiento.
URI
GET /v2/{project_id}/training-jobs/{training_job_id}
Parámetro | Obligatorio | Tipo | Descripción |
|---|---|---|---|
project_id | Sí | String | ID del proyecto. Para obtener más información, consulte Obtención de un ID de proyecto. |
training_job_id | Sí | String | ID de un trabajo de formación. |
Parámetros de solicitud
No hay
Parámetros de respuesta
Código de estado: 200
Parámetro | Tipo | Descripción |
|---|---|---|
kind | String | Tipo de trabajo de formación, que es job de forma predeterminada. Opciones:
|
metadata | JobMetadata object | Metadatos de un trabajo de formación. |
status | Status object | Estado de un trabajo de formación. No es necesario establecer este parámetro al crear un trabajo. |
algorithm | JobAlgorithmResponse object | Algoritmo para trabajos de entrenamiento. Se soportan los siguientes formatos:
|
tasks | Array of TaskResponse objects | Lista de tareas en trabajos de formación heterogéneos. |
spec | spec object | Especificaciones de un trabajo de formación. |
Parámetro | Tipo | Descripción |
|---|---|---|
id | String | ID del trabajo de entrenamiento, que es generado y devuelto por ModelArts después de crear el trabajo de entrenamiento. |
name | String | Nombre de un trabajo de entrenamiento. El valor debe contener de 1 a 64 caracteres que consisten solo en dígitos, letras, guiones bajos (_) y guiones (-). |
workspace_id | String | Espacio de trabajo donde se encuentra un trabajo. El valor predeterminado es 0. |
description | String | Descripción del trabajo de entrenamiento. El valor debe contener de 0 a 256 caracteres. El valor predeterminado es NULL. |
create_time | Long | Marca de tiempo cuando se crea un trabajo de entrenamiento, en milisegundos. El valor es generado y devuelto por ModelArts después de crear el trabajo. |
user_name | String | Nombre de usuario para crear un trabajo de formación. El nombre de usuario es generado y devuelto por ModelArts después de crear el trabajo de entrenamiento. |
annotations | Map<String,String> | Plantilla de declaración de un trabajo de formación. Para trabajos heterogéneos, el valor predeterminado de job_template es Template RL. Para otros trabajos, el valor predeterminado es Template DL. |
Parámetro | Tipo | Descripción |
|---|---|---|
phase | String | Nivel 1 de un trabajo de formación. El valor es estable. Opciones: CreatingPendingRunningFailedCompleted, TerminatingTerminatedAbnormal |
secondary_phase | String | Nivel 2 de un trabajo de entrenamiento. El valor es inestable. Opciones: CreatingQueuingRunningFailedCompletedTerminatingTerminatedCreateFailedTerminatedFailedUnknownLost |
duration | Long | Duración de un trabajo de entrenamiento, en milisegundos |
node_count_metrics | Array<Array<Integer>> | Cambios en el recuento de nodos durante el período de ejecución del trabajo de entrenamiento. |
tasks | Array of strings | Tareas de un trabajo de entrenamiento. |
start_time | String | Hora de inicio de un trabajo de entrenamiento. El valor está en formato de marca de tiempo. |
task_statuses | Array of task_statuses objects | Estado de una tarea de trabajo de entrenamiento. |
Parámetro | Tipo | Descripción |
|---|---|---|
task | String | Nombre de una tarea de trabajo de entrenamiento. |
exit_code | Integer | Código de salida de una tarea de trabajo de entrenamiento. |
message | String | Mensaje de error de una tarea de trabajo de entrenamiento. |
Parámetro | Tipo | Descripción |
|---|---|---|
id | String | Algoritmo para trabajos de entrenamiento. Opciones:
|
name | String | Nombre del algoritmo. |
subscription_id | String | ID de suscripción del algoritmo de suscripción. Este parámetro debe usarse junto con item_version_id. |
item_version_id | String | ID de versión del algoritmo de suscripción. Este parámetro se debe usar junto con subscription_id. |
code_dir | String | Directorio de código de un trabajo de formación, por ejemplo, /usr/app/. Este parámetro debe usarse junto con boot_file. Si se establece id o subscription_id+item_version_id, déjelo en blanco. |
boot_file | String | Archivo de arranque de un trabajo de entrenamiento, que debe almacenarse en el directorio de código, por ejemplo, /usr/app/boot.py. Este parámetro debe usarse junto con code_dir. Si se establece id o subscription_id+item_version_id, déjelo en blanco. |
autosearch_config_path | String | Ruta de configuración YAML de los trabajos de búsqueda automática. Se requiere una URL OBS. |
autosearch_framework_path | String | Directorio de código de marco de trabajos de búsqueda automática. Se requiere una URL OBS. |
command | String | Comando de arranque utilizado para iniciar el contenedor de la imagen personalizada utilizada por un trabajo de entrenamiento. Puede establecer este parámetro en code_dir. |
parameters | Array of Parameter objects | Parámetros de ejecución de un trabajo de entrenamiento. |
policies | policies object | Políticas apoyadas por puestos de trabajo. |
inputs | Array of Input objects | Aportación de un trabajo de formación. |
outputs | Array of Output objects | Salida de un trabajo de formación. |
engine | engine object | Motor de un trabajo de entrenamiento. Deje este parámetro en blanco si el trabajo se crea mediante id de la API de gestión del algoritmo o subscription_id+item_version_id de la API del algoritmo de suscripción. |
environments | Array of Map<String,String> objects | Variables de entorno de un trabajo de entrenamiento. El formato es key: value. Deje este parámetro en blanco. |
Parámetro | Tipo | Descripción |
|---|---|---|
name | String | Nombre del parámetro. |
value | String | Valor del parámetro. |
description | String | Descripción del parámetro. |
constraint | constraint object | Restricción de parámetro. |
i18n_description | i18n_description object | Descripción de la internacionalización. |
Parámetro | Tipo | Descripción |
|---|---|---|
type | String | Tipo de parámetro. |
editable | Boolean | Si el parámetro es editable. |
required | Boolean | Si el parámetro es obligatorio. |
sensitive | Boolean | Si el parámetro es sensible. |
valid_type | String | Tipo válido. |
valid_range | Array of strings | Rango válido. |
Parámetro | Tipo | Descripción |
|---|---|---|
language | String | Internacionalización idioma. |
description | String | Descripción. |
Parámetro | Tipo | Descripción |
|---|---|---|
auto_search | auto_search object | Configuración de búsqueda de hiperparámetros. |
Parámetro | Tipo | Descripción |
|---|---|---|
skip_search_params | String | Parámetros hiperparamétricos que deben omitirse. |
reward_attrs | Array of reward_attrs objects | Lista de métricas de búsqueda. |
search_params | Array of search_params objects | Parámetros de búsqueda. |
algo_configs | Array of algo_configs objects | Configuraciones de algoritmos de búsqueda. |
Parámetro | Tipo | Descripción |
|---|---|---|
name | String | Nombre de la métrica |
mode | String | Dirección de búsqueda.
|
regex | String | Expresión regular de una métrica. |
Parámetro | Tipo | Descripción |
|---|---|---|
name | String | Nombre de hiperparámetro. |
param_type | String | Tipo de parámetro.
|
lower_bound | String | Límite inferior del hiperparámetro. |
upper_bound | String | Límite superior del hiperparámetro. |
discrete_points_num | String | Número de puntos discretos de un hiperparámetro continuo. |
discrete_values | Array of strings | Lista de valores de hiperparámetro discretos. |
Parámetro | Tipo | Descripción |
|---|---|---|
name | String | Nombre del algoritmo de búsqueda. |
params | Array of AutoSearchAlgoConfigParameter objects | Parámetros del algoritmo de búsqueda. |
Parámetro | Tipo | Descripción |
|---|---|---|
key | String | Clave de parámetro. |
value | String | Valor del parámetro. |
type | String | Tipo de parámetro. |
Parámetro | Tipo | Descripción |
|---|---|---|
name | String | Nombre del canal de entrada de datos. |
description | String | Descripción del canal de entrada de datos. |
local_dir | String | Directorio local del contenedor al que se asigna el canal de entrada de datos. |
remote | InputDataInfo object | Entrada de datos. Opciones:
|
remote_constraint | Array of remote_constraint objects | Restricciones de entrada de datos. |
Parámetro | Tipo | Descripción |
|---|---|---|
dataset | dataset object | Conjunto de datos como entrada de datos. |
obs | obs object | OBS en el que se almacenan los datos de entrada y salida. |
Parámetro | Tipo | Descripción |
|---|---|---|
id | String | ID de conjunto de datos de un trabajo de entrenamiento. |
version_id | String | ID de versión del conjunto de datos de un trabajo de entrenamiento. |
obs_url | String | OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. ModelArts analiza y genera automáticamente la URL basándose en los ID de versión del conjunto de datos y del conjunto de datos. Por ejemplo, /usr/data/. |
Parámetro | Tipo | Descripción |
|---|---|---|
obs_url | String | OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. Por ejemplo, /usr/data/. |
Parámetro | Tipo | Descripción |
|---|---|---|
data_type | String | Tipo de entrada de datos, incluida la ubicación de almacenamiento de datos y el conjunto de datos. |
attributes | String | Atributos si se utiliza un conjunto de datos como entrada de datos. Opciones:
|
Parámetro | Tipo | Descripción |
|---|---|---|
name | String | Nombre del canal de salida de datos. |
description | String | Descripción del canal de salida de datos. |
local_dir | String | Directorio local del contenedor al que se asigna el canal de salida de datos. |
remote | remote object | Descripción de la salida de datos real. |
Parámetro | Tipo | Descripción |
|---|---|---|
obs_url | String | URL OBS a la que se exportan los datos. |
Parámetro | Tipo | Descripción |
|---|---|---|
engine_id | String | ID del motor seleccionado para un trabajo de entrenamiento. Puede establecer este parámetro en engine_id, engine_name + engine_version, o image_url. |
engine_name | String | Nombre del motor seleccionado para un trabajo de entrenamiento. Si se establece engine_id, deje este parámetro en blanco. |
engine_version | String | Nombre de la versión del motor seleccionada para un trabajo de entrenamiento. Si se establece engine_id, deje este parámetro en blanco. |
image_url | String | URL de imagen personalizada seleccionada para un trabajo de entrenamiento. |
Parámetro | Tipo | Descripción |
|---|---|---|
role | String | Papel de un trabajo de entrenamiento heterogéneo. Opciones:
|
algorithm | algorithm object | Gestión y configuración de algoritmos. |
task_resource | FlavorResponse object | Variantes de un trabajo de entrenamiento o un algoritmo. |
Parámetro | Tipo | Descripción |
|---|---|---|
code_dir | String | Ruta absoluta del directorio donde se almacena el archivo de arranque del algoritmo. |
boot_file | String | Ruta absoluta del archivo de arranque del algoritmo. |
inputs | inputs object | Canal de entrada de algoritmo. |
outputs | outputs object | Canal de salida del algoritmo. |
engine | engine object | Motor del que depende un trabajo heterogéneo. |
Parámetro | Tipo | Descripción |
|---|---|---|
name | String | Nombre del canal de entrada de datos. |
local_dir | String | Ruta local del contenedor al que se asignan los canales de entrada y salida de datos. |
remote | remote object | Entrada de datos real. Los trabajos heterogéneos solo admiten OBS. |
Parámetro | Tipo | Descripción |
|---|---|---|
obs | obs object | OBS en el que se almacenan los datos de entrada y salida. |
Parámetro | Tipo | Descripción |
|---|---|---|
obs_url | String | OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. Por ejemplo, /usr/data/. |
Parámetro | Tipo | Descripción |
|---|---|---|
name | String | Nombre del canal de salida de datos. |
local_dir | String | Directorio local del contenedor al que se asigna el canal de salida de datos. |
remote | remote object | Descripción de la salida de datos real. |
mode | String | Modo de transmisión de datos. El valor predeterminado es upload_periodically. |
period | String | Periodo de transmisión de datos. El valor predeterminado es 30s. |
Parámetro | Tipo | Descripción |
|---|---|---|
obs | obs object | OBS a la que se exportan los datos. |
Parámetro | Tipo | Descripción |
|---|---|---|
obs_url | String | URL OBS a la que se exportan los datos. |
Parámetro | Tipo | Descripción |
|---|---|---|
engine_id | String | ID del motor de un trabajo heterogéneo, por ejemplo, caffe-1.0.0-python2.7. |
engine_name | String | Nombre del motor de un trabajo heterogéneo, por ejemplo, Caffe. |
engine_version | String | Versión del motor de un trabajo heterogéneo. |
v1_compatible | Boolean | Si se utiliza el modo de compatibilidad v1. |
run_user | String | UID de usuario iniciado por defecto por el motor. |
image_url | String | URL de imagen personalizada seleccionada por un algoritmo. |
Parámetro | Tipo | Descripción |
|---|---|---|
flavor_id | String | ID of the resource flavor. |
flavor_name | String | Nombre de la variante de recurso. |
max_num | Integer | Número máximo de nodos en una variante de recurso. |
flavor_type | String | Tipo de variante de recurso. Opciones:
|
billing | billing object | Información de facturación de una variante de recurso. |
flavor_info | flavor_info object | Detalles de la variante del recurso. |
attributes | Map<String,String> | Otros atributos de especificación. |
Parámetro | Tipo | Descripción |
|---|---|---|
code | String | Código de facturación. |
unit_num | Integer | Número de unidades de facturación. |
Parámetro | Tipo | Descripción |
|---|---|---|
max_num | Integer | Número máximo de nodos que se pueden seleccionar. El valor 1 indica que el modo distribuido no es compatible. |
cpu | cpu object | Especificaciones de la CPU. |
gpu | gpu object | Especificaciones de GPU. |
npu | npu object | Variantes de Ascend. |
memory | memory object | Información de memoria. |
disk | disk object | Información del disco. |
Parámetro | Tipo | Descripción |
|---|---|---|
arch | String | Arquitectura de CPU. |
core_num | Integer | Cantidad de núcleos. |
Parámetro | Tipo | Descripción |
|---|---|---|
unit_num | Integer | Número de GPUs. |
product_name | String | Nombre del producto. |
memory | String | Memoria. |
Parámetro | Tipo | Descripción |
|---|---|---|
unit_num | String | Número de NPU. |
product_name | String | Nombre del producto. |
memory | String | Memoria. |
Parámetro | Tipo | Descripción |
|---|---|---|
size | Integer | Tamaño de la memoria. |
unit | String | Número de unidades de memoria. |
Parámetro | Tipo | Descripción |
|---|---|---|
size | Integer | Tamaño del disco. |
unit | String | Unidad del tamaño del disco. |
Parámetro | Tipo | Descripción |
|---|---|---|
resource | Resource object | Variantes de recursos de un trabajo de entrenamiento. Seleccione flavor_id o pool_id+[flavor_id]. |
volumes | Array of volumes objects | Volúmenes adjuntos a un trabajo de entrenamiento. |
log_export_path | log_export_path object | Exportar la ruta de los registros de trabajos de entrenamiento. |
Parámetro | Tipo | Descripción |
|---|---|---|
policy | String | Variante de recursos de un trabajo de entrenamiento. Opciones: regular |
flavor_id | String | ID de variante de recurso de un trabajo de entrenamiento. Este parámetro no es compatible con los grupos de recursos dedicados alimentados por CPU. |
flavor_name | String | Nombre de variante de sólo lectura devuelto por ModelArts cuando se utiliza flavor_id. |
node_count | Integer | Número de réplicas de recursos seleccionadas para un trabajo de formación. Mínimo: 1 |
pool_id | String | ID del fondo de recursos seleccionado para un trabajo de formación. |
flavor_detail | flavor_detail object | Variantes de un trabajo de entrenamiento o un algoritmo. |
Parámetro | Tipo | Descripción |
|---|---|---|
flavor_type | String | Tipo de variante de recurso. Opciones:
|
billing | billing object | Información de facturación de una variante de recurso. |
flavor_info | flavor_info object | Detalles de la variante del recurso. |
Parámetro | Tipo | Descripción |
|---|---|---|
code | String | Código de facturación. |
unit_num | Integer | Número de unidades de facturación. |
Parámetro | Tipo | Descripción |
|---|---|---|
max_num | Integer | Número máximo de nodos que se pueden seleccionar. El valor 1 indica que el modo distribuido no es compatible. |
cpu | cpu object | Especificaciones de la CPU. |
gpu | gpu object | Especificaciones de GPU. |
npu | npu object | Variantes de Ascend. |
memory | memory object | Información de memoria. |
disk | disk object | Información del disco. |
Parámetro | Tipo | Descripción |
|---|---|---|
arch | String | Arquitectura de CPU. |
core_num | Integer | Cantidad de núcleos. |
Parámetro | Tipo | Descripción |
|---|---|---|
unit_num | Integer | Número de GPU. |
product_name | String | Nombre del producto. |
memory | String | Memoria. |
Parámetro | Tipo | Descripción |
|---|---|---|
unit_num | String | Número de NPU. |
product_name | String | Nombre del producto. |
memory | String | Memoria. |
Parámetro | Tipo | Descripción |
|---|---|---|
size | Integer | Tamaño de la memoria. |
unit | String | Número de unidades de memoria. |
Parámetro | Tipo | Descripción |
|---|---|---|
size | String | Tamaño del disco. |
unit | String | Unidad del tamaño del disco. Generalmente, el valor es GB. |
Ejemplo de las solicitudes
A continuación se muestra cómo consultar un trabajo de entrenamiento cuyo UUID es 3faf5c03-aaa1-4cbe-879d-24b05d997347.
GET https://endpoint/v2/{project_id}/training-jobs/3faf5c03-aaa1-4cbe-879d-24b05d997347 Ejemplo de las respuestas
Código de estado: 200
Aceptar
{
"kind" : "job",
"metadata" : {
"id" : "3faf5c03-aaa1-4cbe-879d-24b05d997347",
"name" : "trainjob--py14_mem06-108",
"description" : "",
"create_time" : 1636447346315,
"workspace_id" : "0",
"user_name" : ""
},
"status" : {
"phase" : "Abnormal",
"secondary_phase" : "CreateFailed",
"duration" : 0,
"start_time" : 0,
"node_count_metrics" : [ [ 1636447746000, 0 ], [ 1636447755000, 0 ], [ 1636447756000, 0 ] ],
"tasks" : [ "worker-0" ]
},
"algorithm" : {
"code_dir" : "obs://test/economic_test/py_minist/",
"boot_file" : "obs://test/economic_test/py_minist/minist_common.py",
"inputs" : [ {
"name" : "data_url",
"local_dir" : "/home/ma-user/modelarts/inputs/data_url_0",
"remote" : {
"obs" : {
"obs_url" : "/test/data/py_minist/"
}
}
} ],
"outputs" : [ {
"name" : "train_url",
"local_dir" : "/home/ma-user/modelarts/outputs/train_url_0",
"remote" : {
"obs" : {
"obs_url" : "/test/train_output/"
}
}
} ],
"engine" : {
"engine_id" : "pytorch-cp36-1.4.0-v2",
"engine_name" : "PyTorch",
"engine_version" : "PyTorch-1.4.0-python3.6-v2"
}
},
"spec" : {
"resource" : {
"flavor_id" : "modelarts.vm.p100.large.eco",
"node_count" : 1,
"flavor_detail" : {
"flavor_type" : "GPU",
"billing" : {
"code" : "modelarts.vm.gpu.p100.eco",
"unit_num" : 1
},
"flavor_info" : {
"cpu" : {
"arch" : "x86",
"core_num" : 8
},
"gpu" : {
"unit_num" : 1,
"memory" : "8GB"
},
"memory" : {
"size" : 64,
"unit" : "GB"
}
}
}
}
}
} Códigos de estado
Código de estado | Descripción |
|---|---|
200 | Aceptar |
Códigos de error
Consulte Códigos de error.

