Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2022-11-14 GMT+08:00

Creación de un trabajo de entrenamiento

Función

Esta API se utiliza para crear un trabajo de entrenamiento

URI

POST /v2/{project_id}/training-jobs

Tabla 1 Parámetros de ruta

Parámetro

Obligatorio

Tipo

Descripción

project_id

String

ID del proyecto. Para obtener más información, consulte Obtención de un ID de proyecto.

Parámetros de solicitud

Tabla 2 Parámetros del cuerpo de solicitud

Parámetro

Obligatorio

Tipo

Descripción

kind

String

Tipo de trabajo de formación, que es job de forma predeterminada. Opciones:

  • job: Trabajo de entrenamiento
  • hetero_job: Trabajo heterogéneo
  • autosearch_job: Trabajo de búsqueda automática
  • mrs_job: MRS job [- edge_job: Edge job] (tag:hk,hc,fcs,fcs-super)

metadata

JobMetadata object

Metadatos de un trabajo de entrenamiento.

algorithm

No

JobAlgorithm object

Algoritmo para trabajos de formación. Se soportan los siguientes formatos:

  • id: Solo se utiliza el ID del algoritmo.
  • subscription_id+item_version_id: Se utilizan el ID de suscripción y el ID de versión del algoritmo.
  • code_dir+boot_file: Se utiliza el directorio de código y el archivo de arranque de un trabajo de entrenamiento.

tasks

No

Array of Task objects

Lista de tareas en trabajos de formación heterogéneos. Si se especifica este parámetro, deje el parámetro spec en blanco.

spec

No

spec object

Especificaciones de un trabajo de entrenamiento. Si se especifica este parámetro, deje en blanco el parámetro tasks.

Tabla 3 JobMetadata

Parámetro

Obligatorio

Tipo

Descripción

id

No

String

ID del trabajo de entrenamiento, que es generado y devuelto por ModelArts después de crear el trabajo de entrenamiento.

name

String

Nombre de un trabajo de entrenamiento. El valor debe contener de 1 a 64 caracteres que consisten solo en dígitos, letras, guiones bajos (_) y guiones (-).

workspace_id

No

String

Espacio de trabajo donde se encuentra un trabajo. El valor predeterminado es 0.

description

No

String

Descripción del trabajo de entrenamiento. El valor debe contener de 0 a 256 caracteres. El valor predeterminado es NULL.

create_time

No

Long

Marca de tiempo cuando se crea un trabajo de entrenamiento, en milisegundos. El valor es generado y devuelto por ModelArts después de crear el trabajo.

user_name

No

String

Nombre de usuario para crear un trabajo de formación. El nombre de usuario es generado y devuelto por ModelArts después de crear el trabajo de entrenamiento.

annotations

No

Map<String,String>

Plantilla de declaración de un trabajo de formación. Para trabajos heterogéneos, el valor predeterminado de job_template es Template RL. Para otros trabajos, el valor predeterminado es Template DL.

Tabla 4 JobAlgorithm

Parámetro

Obligatorio

Tipo

Descripción

id

No

String

ID del algoritmo.

name

No

String

Nombre del algoritmo. Déjelo en blanco.

subscription_id

No

String

ID de suscripción del algoritmo de suscripción. Este parámetro debe usarse junto con item_version_id.

item_version_id

No

String

ID de versión del algoritmo de suscripción. Este parámetro se debe usar junto con subscription_id.

code_dir

No

String

Directorio de código de un trabajo de formación, por ejemplo, /usr/app/. Este parámetro debe usarse junto con boot_file. Si se establece id o subscription_id+item_version_id, déjelo en blanco.

boot_file

No

String

Archivo de arranque de un trabajo de entrenamiento, que debe almacenarse en el directorio de código, por ejemplo, /usr/app/boot.py. Este parámetro debe usarse junto con code_dir. Si se establece id o subscription_id+item_version_id, déjelo en blanco.

autosearch_config_path

No

String

Ruta de configuración YAML de los trabajos de búsqueda automática. Se requiere una URL OBS.

autosearch_framework_path

No

String

Directorio de código de marco de trabajos de búsqueda automática. Se requiere una URL OBS.

command

No

String

Comando para iniciar el contenedor de la imagen personalizada de un trabajo de entrenamiento en el escenario de imagen personalizada.

parameters

No

Array of parameters objects

Parámetros de ejecución de un trabajo de entrenamiento.

policies

No

policies object

Políticas admitidas por trabajos, que se utilizan para la búsqueda de hiperparámetros.

inputs

No

Array of Input objects

Aportación de un trabajo de formación.

outputs

No

Array of Output objects

Salida de un trabajo de formación.

engine

No

engine object

Motor de un trabajo de entrenamiento. Deje este parámetro en blanco si el trabajo se crea mediante id de la API de gestión del algoritmo o subscription_id+item_version_id de la API del algoritmo de suscripción.

environments

No

Array of Map<String,String> objects

Variables de entorno de un trabajo de entrenamiento. El formato es key: value. Deje este parámetro en blanco.

Tabla 5 parameters

Parámetro

Obligatorio

Tipo

Descripción

name

No

String

Nombre del parámetro.

value

No

String

Valor del parámetro.

description

No

String

Descripción del parámetro.

constraint

No

constraint object

Restricción de parámetro.

i18n_description

No

i18n_description object

Descripción de la internacionalización.

Tabla 6 constraint

Parámetro

Obligatorio

Tipo

Descripción

type

No

String

Tipo de parámetro.

editable

No

Boolean

Si el parámetro es editable.

required

No

Boolean

Si el parámetro es obligatorio.

sensitive

No

Boolean

Si el parámetro es sensible.

valid_type

No

String

Tipo válido.

valid_range

No

Array of strings

Rango válido.

Tabla 7 i18n_description

Parámetro

Obligatorio

Tipo

Descripción

language

No

String

Internacionalización idioma.

description

No

String

Descripción.

Tabla 8 policies

Parámetro

Obligatorio

Tipo

Descripción

auto_search

No

auto_search object

Configuración de búsqueda de hiperparámetros.

Tabla 10 reward_attrs

Parámetro

Obligatorio

Tipo

Descripción

name

No

String

Nombre de la métrica

mode

No

String

Dirección de búsqueda.

  • max: Un valor métrico mayor indica un mejor rendimiento.
  • min: Un valor métrico más pequeño indica un mejor rendimiento.

regex

No

String

Expresión regular de una métrica.

Tabla 11 search_params

Parámetro

Obligatorio

Tipo

Descripción

name

No

String

Nombre de hiperparámetro.

param_type

No

String

Tipo de parámetro.

  • continuous: el parámetro es un valor continuo.
  • discreate: el parámetro es un valor discreto.

lower_bound

No

String

Límite inferior del hiperparámetro.

upper_bound

No

String

Límite superior del hiperparámetro.

discrete_points_num

No

String

Número de puntos discretos de un hiperparámetro continuo.

discrete_values

No

Array of strings

Lista de valores de hiperparámetro discretos.

Tabla 12 algo_configs

Parámetro

Obligatorio

Tipo

Descripción

name

No

String

Nombre del algoritmo de búsqueda.

params

No

Array of AutoSearchAlgoConfigParameter objects

Parámetros del algoritmo de búsqueda.

Tabla 13 AutoSearchAlgoConfigParameter

Parámetro

Obligatorio

Tipo

Descripción

key

No

String

Clave de parámetro.

value

No

String

Valor del parámetro.

type

No

String

Tipo de parámetro.

Tabla 14 engine

Parámetro

Obligatorio

Tipo

Descripción

engine_id

No

String

ID del motor seleccionado para un trabajo de entrenamiento. Puede establecer este parámetro en engine_id, engine_name + engine_version, o image_url.

engine_name

No

String

Nombre del motor seleccionado para un trabajo de entrenamiento. Si se establece engine_id, deje este parámetro en blanco.

engine_version

No

String

Nombre de la versión del motor seleccionada para un trabajo de entrenamiento. Si se establece engine_id, deje este parámetro en blanco.

image_url

No

String

URL de imagen personalizada seleccionada para un trabajo de entrenamiento.

Tabla 15 Task

Parámetro

Obligatorio

Tipo

Descripción

role

No

String

Papel de un trabajo de entrenamiento heterogéneo. Opciones:

  • learner: soporta GPUs o CPUs.
  • worker: soporta CPUs.

algorithm

No

algorithm object

Gestión y configuración de algoritmos.

task_resource

No

task_resource object

Variantes de recursos de un trabajo de entrenamiento.

Tabla 16 algorithm

Parámetro

Obligatorio

Tipo

Descripción

job_config

No

job_config object

Configuración del algoritmo, como el archivo de arranque.

code_dir

No

String

Directorio de código de algoritmo, por ejemplo, /usr/app/. Este parámetro debe usarse junto con boot_file.

boot_file

No

String

Archivo de arranque de código del algoritmo, que debe almacenarse en el directorio de código, por ejemplo, /usr/app/boot.py. Este parámetro debe usarse junto con code_dir.

engine

No

engine object

Motor de un algoritmo de trabajo heterogéneo.

inputs

No

Array of inputs objects

Entrada de datos de un algoritmo.

outputs

No

Array of outputs objects

Salida de datos de un algoritmo.

Tabla 17 job_config

Parámetro

Obligatorio

Tipo

Descripción

parameters

No

Array of Parameter objects

Parámetro de ejecución de un algoritmo.

inputs

No

Array of Input objects

Entrada de datos de un algoritmo.

outputs

No

Array of Output objects

Salida de datos de un algoritmo.

engine

No

engine object

Motor de algoritmo.

Tabla 18 Parameter

Parámetro

Obligatorio

Tipo

Descripción

name

No

String

Nombre del parámetro.

value

No

String

Valor del parámetro.

description

No

String

Descripción del parámetro.

constraint

No

constraint object

Restricción de parámetro.

i18n_description

No

i18n_description object

Descripción de la internacionalización.

Tabla 19 constraint

Parámetro

Obligatorio

Tipo

Descripción

type

No

String

Tipo de parámetro.

editable

No

Boolean

Si el parámetro es editable.

required

No

Boolean

Si el parámetro es obligatorio.

sensitive

No

Boolean

Si el parámetro es sensible.

valid_type

No

String

Tipo válido.

valid_range

No

Array of strings

Rango válido.

Tabla 20 i18n_description

Parámetro

Obligatorio

Tipo

Descripción

language

No

String

Internacionalización idioma.

description

No

String

Descripción.

Tabla 21 Input

Parámetro

Obligatorio

Tipo

Descripción

name

String

Nombre del canal de entrada de datos.

description

No

String

Descripción del canal de entrada de datos.

local_dir

No

String

Directorio local del contenedor al que se asigna el canal de entrada de datos.

remote

InputDataInfo object

Entrada de datos. Opciones:

  • dataset: Conjunto de datos como entrada de datos
  • obs: ruta OBS como entrada de datos

remote_constraint

No

Array of remote_constraint objects

Restricciones de entrada de datos.

Tabla 22 InputDataInfo

Parámetro

Obligatorio

Tipo

Descripción

dataset

No

dataset object

Conjunto de datos como entrada de datos.

obs

No

obs object

OBS en el que se almacenan los datos de entrada y salida.

Tabla 23 dataset

Parámetro

Obligatorio

Tipo

Descripción

id

String

ID de conjunto de datos de un trabajo de entrenamiento.

version_id

String

ID de versión del conjunto de datos de un trabajo de entrenamiento.

obs_url

No

String

OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. ModelArts analiza y genera automáticamente la URL basándose en los ID de versión del conjunto de datos y del conjunto de datos. Por ejemplo, /usr/data/.

Tabla 24 obs

Parámetro

Obligatorio

Tipo

Descripción

obs_url

String

OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. Por ejemplo, /usr/data/.

Tabla 25 remote_constraint

Parámetro

Obligatorio

Tipo

Descripción

data_type

No

String

Tipo de entrada de datos, incluida la ubicación de almacenamiento de datos y el conjunto de datos.

attributes

No

String

Atributos si se utiliza un conjunto de datos como entrada de datos. Opciones:

  • data_format: Formato de datos
  • data_segmentation: Segmentación de datos
  • dataset_type: Tipo de etiquetado
Tabla 26 Output

Parámetro

Obligatorio

Tipo

Descripción

name

String

Nombre del canal de salida de datos.

description

No

String

Descripción del canal de salida de datos.

local_dir

No

String

Directorio local del contenedor al que se asigna el canal de salida de datos.

remote

remote object

Descripción de la salida de datos real.

Tabla 27 remote

Parámetro

Obligatorio

Tipo

Descripción

obs

obs object

OBS a la que se exportan los datos.

Tabla 28 obs

Parámetro

Obligatorio

Tipo

Descripción

obs_url

String

URL OBS a la que se exportan los datos.

Tabla 29 engine

Parámetro

Obligatorio

Tipo

Descripción

engine_id

No

String

ID del motor seleccionado para un algoritmo.

engine_name

No

String

Nombre de la versión del motor seleccionado para un algoritmo. Si se especifica engine_id, deje este parámetro en blanco.

engine_version

No

String

Nombre de la versión del motor seleccionado para un algoritmo. Si se especifica engine_id, deje este parámetro en blanco.

image_url

No

String

URL de imagen personalizada seleccionada por un algoritmo.

Tabla 30 engine

Parámetro

Obligatorio

Tipo

Descripción

engine_id

No

String

ID del motor de un trabajo heterogéneo, por ejemplo, caffe-1.0.0-python2.7.

engine_name

No

String

Nombre del motor de un trabajo heterogéneo, por ejemplo, Caffe.

engine_version

No

String

Versión del motor de un trabajo heterogéneo.

image_url

No

String

URL de imagen personalizada seleccionada por un algoritmo.

Tabla 31 inputs

Parámetro

Obligatorio

Tipo

Descripción

name

String

Nombre del canal de entrada de datos.

description

No

String

Descripción del canal de entrada de datos.

local_dir

No

String

Directorio local del contenedor al que se asigna el canal de entrada de datos.

remote

remote object

Entrada de datos. Opciones:

  • dataset: Conjunto de datos como entrada de datos
  • obs: ruta OBS como entrada de datos
Tabla 32 remote

Parámetro

Obligatorio

Tipo

Descripción

obs

No

obs object

OBS en el que se almacenan los datos de entrada y salida.

Tabla 33 obs

Parámetro

Obligatorio

Tipo

Descripción

obs_url

String

OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. Por ejemplo, /usr/data/.

Tabla 34 outputs

Parámetro

Obligatorio

Tipo

Descripción

name

String

Nombre del canal de salida de datos.

description

No

String

Descripción del canal de salida de datos.

local_dir

No

String

Directorio local del contenedor al que se asigna el canal de salida de datos.

remote

remote object

Descripción de la salida de datos real.

Tabla 35 remote

Parámetro

Obligatorio

Tipo

Descripción

obs

obs object

OBS a la que se exportan los datos.

Tabla 36 obs

Parámetro

Obligatorio

Tipo

Descripción

obs_url

String

URL OBS a la que se exportan los datos.

Tabla 37 task_resource

Parámetro

Obligatorio

Tipo

Descripción

flavor_id

No

String

ID de variante de recurso de un trabajo de entrenamiento.

node_count

Integer

Número de réplicas de recursos seleccionadas para un trabajo de formación.

Mínimo: 1

Tabla 38 spec

Parámetro

Obligatorio

Tipo

Descripción

resource

No

resource object

Variantes de recursos de un trabajo de entrenamiento. Seleccione flavor_id o pool_id+[flavor_id].

volumes

No

Array of volumes objects

Volúmenes adjuntos a un trabajo de entrenamiento.

log_export_path

No

log_export_path object

Exportar la ruta de los registros de trabajos de entrenamiento.

Tabla 39 resource

Parámetro

Obligatorio

Tipo

Descripción

flavor_id

String

ID de los tipos de recursos para un trabajo de entrenamiento. Este parámetro no es compatible con los grupos de recursos dedicados alimentados por CPU.

node_count

No

Integer

Número de nodos utilizados para crear un trabajo de formación en un grupo. De forma predeterminada, se utiliza un solo nodo.

pool_id

No

String

ID del grupo de recursos dedicado.

Tabla 40 volumes

Parámetro

Obligatorio

Tipo

Descripción

nfs

No

nfs object

Volúmenes adjuntos en modo NFS.

Tabla 41 nfs

Parámetro

Obligatorio

Tipo

Descripción

nfs_server_path

No

String

Ruta del servidor NFS.

local_path

No

String

Ruta para conectar volúmenes al contenedor de entrenamiento.

read_only

No

Boolean

Si los volúmenes conectados al contenedor en modo NFS son de sólo lectura.

Tabla 42 log_export_path

Parámetro

Obligatorio

Tipo

Descripción

obs_url

No

String

URL OBS para almacenar registros de trabajos de entrenamiento.

host_path

No

String

Ruta del host donde se almacenan los registros de trabajos de entrenamiento.

Parámetros de respuesta

Código de estado: 201

Tabla 43 Parámetros del cuerpo de respuesta

Parámetro

Tipo

Descripción

kind

String

Tipo de trabajo de formación, que es job de forma predeterminada. Opciones:

  • job: Trabajo de entrenamiento
  • hetero_job: Trabajo heterogéneo
  • autosearch_job: Trabajo de búsqueda automática
  • mrs_job: MRS job [- edge_job: Edge job] (tag:hk,hc,fcs,fcs-super)

metadata

JobMetadata object

Metadatos de un trabajo de entrenamiento.

status

Status object

Estado de un trabajo de formación. No es necesario establecer este parámetro al crear un trabajo.

algorithm

JobAlgorithmResponse object

Algoritmo para trabajos de formación. Se soportan los siguientes formatos:

  • id: Solo se utiliza el ID del algoritmo.
  • subscription_id+item_version_id: Se utilizan el ID de suscripción y el ID de versión del algoritmo.
  • code_dir+boot_file: Se utiliza el directorio de código y el archivo de arranque de un trabajo de entrenamiento.

tasks

Array of TaskResponse objects

Lista de tareas en trabajos de formación heterogéneos.

spec

spec object

Especificaciones de un trabajo de entrenamiento.

Tabla 44 JobMetadata

Parámetro

Tipo

Descripción

id

String

ID del trabajo de entrenamiento, que es generado y devuelto por ModelArts después de crear el trabajo de entrenamiento.

name

String

Nombre de un trabajo de entrenamiento. El valor debe contener de 1 a 64 caracteres que consisten solo en dígitos, letras, guiones bajos (_) y guiones (-).

workspace_id

String

Espacio de trabajo donde se encuentra un trabajo. El valor predeterminado es 0.

description

String

Descripción del trabajo de entrenamiento. El valor debe contener de 0 a 256 caracteres. El valor predeterminado es NULL.

create_time

Long

Marca de tiempo cuando se crea un trabajo de entrenamiento, en milisegundos. El valor es generado y devuelto por ModelArts después de crear el trabajo.

user_name

String

Nombre de usuario para crear un trabajo de formación. El nombre de usuario es generado y devuelto por ModelArts después de crear el trabajo de entrenamiento.

annotations

Map<String,String>

Plantilla de declaración de un trabajo de formación. Para trabajos heterogéneos, el valor predeterminado de job_template es Template RL. Para otros trabajos, el valor predeterminado es Template DL.

Tabla 45 Status

Parámetro

Tipo

Descripción

phase

String

Nivel 1 de un trabajo de formación. El valor es estable. Opciones: Creating Pending Running Failed Completed, Terminating Terminated Abnormal

secondary_phase

String

Nivel 2 de un trabajo de entrenamiento. El valor es inestable. Opciones: Creating Queuing Running Failed Completed Terminating Terminated CreateFailed TerminatedFailed Unknown Lost

duration

Long

Duración de un trabajo de entrenamiento, en milisegundos

node_count_metrics

Array<Array<Integer>>

Cambios en el recuento de nodos durante el período de ejecución del trabajo de entrenamiento.

tasks

Array of strings

Tareas de un trabajo de entrenamiento.

start_time

String

Hora de inicio de un trabajo de entrenamiento. El valor está en formato de marca de tiempo.

task_statuses

Array of task_statuses objects

Estado de una tarea de trabajo de entrenamiento.

Tabla 46 task_statuses

Parámetro

Tipo

Descripción

task

String

Nombre de una tarea de trabajo de entrenamiento.

exit_code

Integer

Código de salida de una tarea de trabajo de entrenamiento.

message

String

Mensaje de error de una tarea de trabajo de entrenamiento.

Tabla 47 JobAlgorithmResponse

Parámetro

Tipo

Descripción

id

String

Algoritmo para trabajos de formación. Opciones:

  • id: Solo se utiliza el ID del algoritmo.
  • subscription_id+item_version_id: Se utilizan el ID de suscripción y el ID de versión del algoritmo.
  • code_dir+boot_file: Se utiliza el directorio de código y el archivo de arranque de un trabajo de entrenamiento.

name

String

Nombre del algoritmo.

subscription_id

String

ID de suscripción del algoritmo de suscripción. Este parámetro debe usarse junto con item_version_id.

item_version_id

String

ID de versión del algoritmo de suscripción. Este parámetro se debe usar junto con subscription_id.

code_dir

String

Directorio de código de un trabajo de formación, por ejemplo, /usr/app/. Este parámetro debe usarse junto con boot_file. Si se establece id o subscription_id+item_version_id, déjelo en blanco.

boot_file

String

Archivo de arranque de un trabajo de entrenamiento, que debe almacenarse en el directorio de código, por ejemplo, /usr/app/boot.py. Este parámetro debe usarse junto con code_dir. Si se establece id o subscription_id+item_version_id, déjelo en blanco.

autosearch_config_path

String

Ruta de configuración YAML de los trabajos de búsqueda automática. Se requiere una URL OBS.

autosearch_framework_path

String

Directorio de código de marco de trabajos de búsqueda automática. Se requiere una URL OBS.

command

String

Comando de arranque utilizado para iniciar el contenedor de la imagen personalizada utilizada por un trabajo de entrenamiento. Puede establecer este parámetro en code_dir.

parameters

Array of Parameter objects

Parámetros de ejecución de un trabajo de entrenamiento.

policies

policies object

Políticas apoyadas por puestos de trabajo.

inputs

Array of Input objects

Aportación de un trabajo de formación.

outputs

Array of Output objects

Salida de un trabajo de formación.

engine

engine object

Motor de un trabajo de entrenamiento. Deje este parámetro en blanco si el trabajo se crea mediante id de la API de gestión del algoritmo o subscription_id+item_version_id de la API del algoritmo de suscripción.

environments

Array of Map<String,String> objects

Variables de entorno de un trabajo de formación. El formato es key: value. Deje este parámetro en blanco.

Tabla 48 Parámetro

Parámetro

Tipo

Descripción

name

String

Nombre del parámetro.

value

String

Valor del parámetro.

description

String

Descripción del parámetro.

constraint

constraint object

Restricción de parámetro.

i18n_description

i18n_description object

Descripción de la internacionalización.

Tabla 49 constraint

Parámetro

Tipo

Descripción

type

String

Tipo de parámetro.

editable

Boolean

Si el parámetro es editable.

required

Boolean

Si el parámetro es obligatorio.

sensitive

Boolean

Si el parámetro es sensible.

valid_type

String

Tipo válido.

valid_range

Array of strings

Rango válido.

Tabla 50 i18n_description

Parámetro

Tipo

Descripción

language

String

Internacionalización idioma.

description

String

Descripción.

Tabla 51 policies

Parámetro

Tipo

Descripción

auto_search

auto_search object

Configuración de búsqueda de hiperparámetros.

Tabla 53 reward_attrs

Parámetro

Tipo

Descripción

name

String

Nombre de la métrica

mode

String

Dirección de búsqueda.

  • max: Un valor métrico mayor indica un mejor rendimiento.
  • min: Un valor métrico más pequeño indica un mejor rendimiento.

regex

String

Expresión regular de una métrica.

Tabla 54 search_params

Parámetro

Tipo

Descripción

name

String

Nombre de hiperparámetro.

param_type

String

Tipo de parámetro.

  • continuous: el parámetro es un valor continuo.
  • discreate: el parámetro es un valor discreto.

lower_bound

String

Límite inferior del hiperparámetro.

upper_bound

String

Límite superior del hiperparámetro.

discrete_points_num

String

Número de puntos discretos de un hiperparámetro continuo.

discrete_values

Array of strings

Lista de valores de hiperparámetro discretos.

Tabla 55 algo_configs

Parámetro

Tipo

Descripción

name

String

Nombre del algoritmo de búsqueda.

params

Array of AutoSearchAlgoConfigParameter objects

Parámetros del algoritmo de búsqueda.

Tabla 56 AutoSearchAlgoConfigParameter

Parámetro

Tipo

Descripción

key

String

Clave de parámetro.

value

String

Valor del parámetro.

type

String

Tipo de parámetro.

Tabla 57 Input

Parámetro

Tipo

Descripción

name

String

Nombre del canal de entrada de datos.

description

String

Descripción del canal de entrada de datos.

local_dir

String

Directorio local del contenedor al que se asigna el canal de entrada de datos.

remote

InputDataInfo object

Entrada de datos. Opciones:

  • dataset: Conjunto de datos como entrada de datos
  • obs: ruta OBS como entrada de datos

remote_constraint

Array of remote_constraint objects

Restricciones de entrada de datos.

Tabla 58 InputDataInfo

Parámetro

Tipo

Descripción

dataset

dataset object

Conjunto de datos como entrada de datos.

obs

obs object

OBS en el que se almacenan los datos de entrada y salida.

Tabla 59 dataset

Parámetro

Tipo

Descripción

id

String

ID de conjunto de datos de un trabajo de entrenamiento.

version_id

String

ID de versión del conjunto de datos de un trabajo de entrenamiento.

obs_url

String

OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. ModelArts analiza y genera automáticamente la URL basándose en los ID de versión del conjunto de datos y del conjunto de datos. Por ejemplo, /usr/data/.

Tabla 60 obs

Parámetro

Tipo

Descripción

obs_url

String

OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. Por ejemplo, /usr/data/.

Tabla 61 remote_constraint

Parámetro

Tipo

Descripción

data_type

String

Tipo de entrada de datos, incluida la ubicación de almacenamiento de datos y el conjunto de datos.

attributes

String

Atributos si se utiliza un conjunto de datos como entrada de datos. Opciones:

  • data_format: Formato de datos
  • data_segmentation: Segmentación de datos
  • dataset_type: Tipo de etiquetado
Tabla 62 Output

Parámetro

Tipo

Descripción

name

String

Nombre del canal de salida de datos.

description

String

Descripción del canal de salida de datos.

local_dir

String

Directorio local del contenedor al que se asigna el canal de salida de datos.

remote

remote object

Descripción de la salida de datos real.

Tabla 63 remote

Parámetro

Tipo

Descripción

obs

obs object

OBS a la que se exportan los datos.

Tabla 64 obs

Parámetro

Tipo

Descripción

obs_url

String

URL OBS a la que se exportan los datos.

Tabla 65 engine

Parámetro

Tipo

Descripción

engine_id

String

ID del motor seleccionado para un trabajo de entrenamiento. Puede establecer este parámetro en engine_id, engine_name + engine_version, o image_url.

engine_name

String

Nombre del motor seleccionado para un trabajo de entrenamiento. Si se establece engine_id, deje este parámetro en blanco.

engine_version

String

Nombre de la versión del motor seleccionada para un trabajo de entrenamiento. Si se establece engine_id, deje este parámetro en blanco.

image_url

String

URL de imagen personalizada seleccionada para un trabajo de entrenamiento.

Tabla 66 TaskResponse

Parámetro

Tipo

Descripción

role

String

Papel de un trabajo de entrenamiento heterogéneo. Opciones:

  • learner: soporta GPUs o CPUs.
  • worker: soporta CPUs.

algorithm

algorithm object

Gestión y configuración de algoritmos.

task_resource

FlavorResponse object

Variantes de un trabajo de entrenamiento o un algoritmo.

Tabla 67 algorithm

Parámetro

Tipo

Descripción

code_dir

String

Ruta absoluta del directorio donde se almacena el archivo de arranque del algoritmo.

boot_file

String

Ruta absoluta del archivo de arranque del algoritmo.

inputs

inputs object

Canal de entrada de algoritmo.

outputs

outputs object

Canal de salida del algoritmo.

engine

engine object

Motor del que depende un trabajo heterogéneo.

Tabla 68 inputs

Parámetro

Tipo

Descripción

name

String

Nombre del canal de entrada de datos.

local_dir

String

Ruta local del contenedor al que se asignan los canales de entrada y salida de datos.

remote

remote object

Entrada de datos real. Los trabajos heterogéneos solo admiten OBS.

Tabla 69 remote

Parámetro

Tipo

Descripción

obs

obs object

OBS en el que se almacenan los datos de entrada y salida.

Tabla 70 obs

Parámetro

Tipo

Descripción

obs_url

String

OBS URL del conjunto de datos requerido por un trabajo de entrenamiento. Por ejemplo, /usr/data/.

Tabla 71 outputs

Parámetro

Tipo

Descripción

name

String

Nombre del canal de salida de datos.

local_dir

String

Directorio local del contenedor al que se asigna el canal de salida de datos.

remote

remote object

Descripción de la salida de datos real.

mode

String

Modo de transmisión de datos. El valor predeterminado es upload_periodically.

period

String

Periodo de transmisión de datos. El valor predeterminado es 30s.

Tabla 72 remote

Parámetro

Tipo

Descripción

obs

obs object

OBS a la que se exportan los datos.

Tabla 73 obs

Parámetro

Tipo

Descripción

obs_url

String

URL OBS a la que se exportan los datos.

Tabla 74 engine

Parámetro

Tipo

Descripción

engine_id

String

ID del motor de un trabajo heterogéneo, por ejemplo, caffe-1.0.0-python2.7.

engine_name

String

Nombre del motor de un trabajo heterogéneo, por ejemplo, Caffe.

engine_version

String

Versión del motor de un trabajo heterogéneo.

v1_compatible

Boolean

Si se utiliza el modo de compatibilidad v1.

run_user

String

UID de usuario iniciado por defecto por el motor.

image_url

String

URL de imagen personalizada seleccionada por un algoritmo.

Tabla 75 FlavorResponse

Parámetro

Tipo

Descripción

flavor_id

String

ID de la variante de recurso.

flavor_name

String

Nombre de la variante de recurso.

max_num

Integer

Número máximo de nodos en una variante de recurso.

flavor_type

String

Tipo de variante de recurso. Opciones:

  • CPU
  • GPU
  • Ascend

billing

billing object

Información de facturación de una variante de recurso.

flavor_info

flavor_info object

Detalles de la variante del recurso.

attributes

Map<String,String>

Otros atributos de especificación.

Tabla 76 billing

Parámetro

Tipo

Descripción

code

String

Código de facturación.

unit_num

Integer

Número de unidades de facturación.

Tabla 77 flavor_info

Parámetro

Tipo

Descripción

max_num

Integer

Número máximo de nodos que se pueden seleccionar. El valor 1 indica que el modo distribuido no es compatible.

cpu

cpu object

Especificaciones de la CPU.

gpu

gpu object

Especificaciones de GPU.

npu

npu object

Variantes de Ascend.

memory

memory object

Información de memoria.

disk

disk object

Información del disco.

Tabla 78 cpu

Parámetro

Tipo

Descripción

arch

String

Arquitectura de CPU.

core_num

Integer

Cantidad de núcleos.

Tabla 79 gpu

Parámetro

Tipo

Descripción

unit_num

Integer

Número de GPU.

product_name

String

Nombre del producto.

memory

String

Memoria.

Tabla 80 npu

Parámetro

Tipo

Descripción

unit_num

String

Número de NPU.

product_name

String

Nombre del producto.

memory

String

Memoria.

Tabla 81 memory

Parámetro

Tipo

Descripción

size

Integer

Tamaño de la memoria.

unit

String

Número de unidades de memoria.

Tabla 82 disk

Parámetro

Tipo

Descripción

size

Integer

Tamaño del disco.

unit

String

Unidad del tamaño del disco.

Tabla 83 spec

Parámetro

Tipo

Descripción

resource

Resource object

Variantes de recursos de un trabajo de entrenamiento. Seleccione flavor_id o pool_id+[flavor_id].

volumes

Array of volumes objects

Volúmenes adjuntos a un trabajo de entrenamiento.

log_export_path

log_export_path object

Exportar la ruta de los registros de trabajos de entrenamiento.

Tabla 84 Resource

Parámetro

Tipo

Descripción

policy

String

Variante de recursos de un trabajo de entrenamiento. Opciones: regular

flavor_id

String

ID de variante de recurso de un trabajo de entrenamiento. Este parámetro no es compatible con los grupos de recursos dedicados alimentados por CPU.

flavor_name

String

Nombre de variante de sólo lectura devuelto por ModelArts cuando se utiliza flavor_id.

node_count

Integer

Número de réplicas de recursos seleccionadas para un trabajo de formación.

Mínimo: 1

pool_id

String

ID del fondo de recursos seleccionado para un trabajo de formación.

flavor_detail

flavor_detail object

Variantes de un trabajo de entrenamiento o un algoritmo.

Tabla 85 flavor_detail

Parámetro

Tipo

Descripción

flavor_type

String

Tipo de variante de recurso. Opciones:

  • CPU
  • GPU
  • Ascend

billing

billing object

Información de facturación de una variante de recurso.

flavor_info

flavor_info object

Detalles de la variante del recurso.

Tabla 86 billing

Parámetro

Tipo

Descripción

code

String

Código de facturación.

unit_num

Integer

Número de unidades de facturación.

Tabla 87 flavor_info

Parámetro

Tipo

Descripción

max_num

Integer

Número máximo de nodos que se pueden seleccionar. El valor 1 indica que el modo distribuido no es compatible.

cpu

cpu object

Especificaciones de la CPU.

gpu

gpu object

Especificaciones de GPU.

npu

npu object

Variantes de Ascend.

memory

memory object

Información de memoria.

disk

disk object

Información del disco.

Tabla 88 cpu

Parámetro

Tipo

Descripción

arch

String

Arquitectura de CPU.

core_num

Integer

Cantidad de núcleos.

Tabla 89 gpu

Parámetro

Tipo

Descripción

unit_num

Integer

Número de GPU.

product_name

String

Nombre del producto.

memory

String

Memoria.

Tabla 90 npu

Parámetro

Tipo

Descripción

unit_num

String

Número de NPU.

product_name

String

Nombre del producto.

memory

String

Memoria.

Tabla 91 memory

Parámetro

Tipo

Descripción

size

Integer

Tamaño de la memoria.

unit

String

Número de unidades de memoria.

Tabla 92 disk

Parámetro

Tipo

Descripción

size

String

Tamaño del disco.

unit

String

Unidad del tamaño del disco. Generalmente, el valor es GB.

Tabla 93 volumes

Parámetro

Tipo

Descripción

nfs

nfs object

Volúmenes adjuntos en modo NFS.

Tabla 94 nfs

Parámetro

Tipo

Descripción

nfs_server_path

String

Ruta del servidor NFS.

local_path

String

Ruta para conectar volúmenes al contenedor de entrenamiento.

read_only

Boolean

Si los volúmenes conectados al contenedor en modo NFS son de sólo lectura.

Tabla 95 log_export_path

Parámetro

Tipo

Descripción

obs_url

String

URL OBS para almacenar registros de trabajos de entrenamiento.

host_path

String

Ruta del host donde se almacenan los registros de trabajos de entrenamiento.

Ejemplo de las solicitudes

  • A continuación se muestra cómo crear un trabajo de formación denominado TestModelArtsJob. El trabajo de entrenamiento se describe como This is a ModelArts job el ID del algoritmo de dependencia es 3f5d6706-7b67-408d-8ba0-ec08048c45ed, no se especifica ninguna entrada o salida, y se utiliza un tipo de GPU libre.
    POST https://endpoint/v2/{project_id}/training-jobs
    
    {
      "kind" : "job",
      "metadata" : {
        "name" : "TestModelArtsJob",
        "description" : "This is a ModelArts job"
      },
      "algorithm" : {
        "id" : "3f5d6706-7b67-408d-8ba0-ec08048c45ed",
        "parameters" : [ {
          "name" : "input_dir",
          "value" : "obs://cn-north-4-rse/test/moxingtest-dir/"
        }, {
          "name" : "input_file",
          "value" : "obs://cn-north-4-rse/test/moxingtest/"
        }, {
          "name" : "large_file_method",
          "value" : "1"
        } ],
        "policies" : {
          "auto_search" : null
        },
        "environments" : { }
      },
      "spec" : {
        "resource" : {
          "flavor_id" : "modelarts.p3.large.public.free",
          "node_count" : 1
        },
        "log_export_path" : {
          "obs_url" : ""
        }
      }
    }
  • A continuación se muestra cómo utilizar una imagen personalizada para crear un trabajo de formación denominado TestModelArtsJob2 descrito como This is a ModelArts job2. La instancia de destino se implementa en un grupo de recursos dedicado y se adjunta con un NFS.
    POST https://endpoint/v2/{project_id}/training-jobs
    
    {
      "kind" : "job",
      "metadata" : {
        "name" : "TestModelArtsJob2",
        "description" : "This is a ModelArts job2"
      },
      "algorithm" : {
        "engine" : {
          "image_url" : "hwstaff_z00424192/fastseq:1.2"
        },
        "command" : "cd /home/ma-user/ddp_demo && sh run_ddp.sh",
        "parameters" : [ ],
        "policies" : {
          "auto_search" : null
        },
        "environments" : {
          "NCCL_DEBUG" : "INFO",
          "NCCL_IB_DISABLE" : "0"
        }
      },
      "spec" : {
        "resource" : {
          "flavor_id" : "modelarts.pool.visual.xlarge",
          "node_count" : 1,
          "pool_id" : "poolfaf38d76"
        },
        "log_export_path" : {
          "obs_url" : "/cn-north-4-training-test/limou/ddp-demo-log/"
        },
        "volumes" : [ {
          "nfs" : {
            "nfs_server_path" : "192.168.0.82:/",
            "local_path" : "/home/ma-user/nfs/",
            "read_only" : false
          }
        } ]
      }
    }

Ejemplo de las respuestas

Código de estado: 201

ok

{
  "kind" : "job",
  "metadata" : {
    "id" : "425b7087-83de-49ed-9e40-5bb642be956f",
    "name" : "TestModelArtsJob",
    "description" : "This is a ModelArts job",
    "create_time" : 1637045545982,
    "workspace_id" : "0",
    "ai_project" : "default-ai-project",
    "user_name" : ""
  },
  "status" : {
    "phase" : "Creating",
    "secondary_phase" : "Creating",
    "duration" : 0,
    "start_time" : 0,
    "node_count_metrics" : null,
    "tasks" : [ "worker-0", "server-0" ]
  },
  "algorithm" : {
    "id" : "3f5d6706-7b67-408d-8ba0-ec08048c45ed",
    "name" : "ttt-obs-gpu",
    "code_dir" : "/cn-north-4-rse/test/moxingtest-code/",
    "boot_file" : "/cn-north-4-rse/test/moxingtest-code/test_obs_gpu.py",
    "parameters" : [ {
      "name" : "input_dir",
      "description" : "",
      "i18n_description" : null,
      "value" : "s://cn-north-4-rse/test/moxingtest-dir/",
      "constraint" : {
        "type" : "String",
        "editable" : true,
        "required" : true,
        "sensitive" : false,
        "valid_type" : "None",
        "valid_range" : [ ]
      }
    }, {
      "name" : "input_file",
      "description" : "",
      "i18n_description" : null,
      "value" : "obs://cn-north-4-rse/test/moxingtest/",
      "constraint" : {
        "type" : "String",
        "editable" : true,
        "required" : true,
        "sensitive" : false,
        "valid_type" : "None",
        "valid_range" : [ ]
      }
    }, {
      "name" : "large_file_method",
      "description" : "",
      "i18n_description" : null,
      "value" : "1",
      "constraint" : {
        "type" : "Integer",
        "editable" : true,
        "required" : true,
        "sensitive" : false,
        "valid_type" : "None",
        "valid_range" : [ ]
      }
    } ],
    "parameters_customization" : false,
    "engine" : {
      "engine_id" : "horovod-cp36-tf-1.16.2",
      "engine_name" : "Horovod",
      "engine_version" : "0.16.2-TF-1.13.1-python3.6",
      "usage" : "training",
      "support_groups" : "public,roma",
      "v1_compatible" : true,
      "run_user" : ""
    },
    "policies" : { }
  },
  "spec" : {
    "resource" : {
      "policy" : "regular",
      "turbo_range" : [ 1, 2 ],
      "flavor_id" : "modelarts.p3.large.public.free",
      "flavor_name" : "Computing GPU(V100) instance",
      "node_count" : 1,
      "flavor_detail" : {
        "flavor_type" : "GPU",
        "billing" : {
          "code" : "modelarts.vm.gpu.free",
          "unit_num" : 1
        },
        "attributes" : {
          "is_free" : "true",
          "max_free_job_count" : "10"
        },
        "flavor_info" : {
          "cpu" : {
            "arch" : "x86",
            "core_num" : 8
          },
          "gpu" : {
            "unit_num" : 1,
            "product_name" : "NVIDIA-V100",
            "memory" : "32GB"
          },
          "memory" : {
            "size" : 64,
            "unit" : "GB"
          }
        }
      }
    },
    "log_export_path" : { },
    "is_hosted_log" : true
  }
}

Códigos de estado

Código de estado

Descripción

201

Aceptar

Códigos de error

Consulte Códigos de error.