Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ ModelArts/ Referencia de la API/ Gestión de servicios/ Consulta de los detalles sobre un servicio
Actualización más reciente 2022-11-14 GMT+08:00

Consulta de los detalles sobre un servicio

Función

Esta API se utiliza para consultar los detalles sobre un servicio de modelo basado en el ID de servicio.

URI

GET /v1/{project_id}/services/{service_id}

Tabla 1 describe los parámetros requeridos.
Tabla 1 Parámetros

Parámetro

Obligatorio

Tipo

Descripción

project_id

String

ID del proyecto. Para obtener más información sobre cómo obtener un ID de proyecto, consulte Obtención de un ID y un nombre de proyecto.

service_id

String

ID de servicio

Cuerpo de la solicitud

No hay

Cuerpo de respuesta

Tabla 2 describe los parámetros de respuesta.
Tabla 2 Parámetros

Parámetro

Tipo

Descripción

service_id

String

ID de servicio

service_name

String

Nombre servicio

description

String

Descripción del Servicio

tenant

String

Tenant al que pertenece un servicio

project

String

Proyecto al que pertenece un servicio

owner

String

Usuario al que pertenece un servicio

publish_at

Number

Tiempo de lanzamiento del servicio más reciente, en milisegundos calculado a partir de 1970.1.1 0:0:0 UTC

infer_type

String

Tipo de inferencia, que puede ser real-time o batch

workspace_id

String

ID del espacio de trabajo.

cluster_id

String

ID del grupo de recursos dedicado utilizado por el servicio en tiempo real o por lotes. Este parámetro sólo está disponible cuando se utiliza un fondo de recursos dedicado.

vpc_id

String

ID de la VPC a la que pertenece la instancia de servicio en tiempo real. Este parámetro está disponible cuando se personaliza la configuración de red.

subnet_network_id

String

ID de la subred a la que pertenece la instancia de servicio en tiempo real. Este parámetro está disponible cuando se personaliza la configuración de red.

security_group_id

String

Grupo de seguridad al que pertenece la instancia de servicio en tiempo real. Este parámetro está disponible cuando se personaliza la configuración de red.

status

String

Estado del servicio, que puede ser running, deploying, concerning, failed, stopped, o finished

progress

Integer

Progreso del despliegue. Este parámetro está disponible cuando el estado es deploying.

error_msg

String

Mensaje de error. Cuando status es failed, se devuelve un mensaje de error que contiene la causa del error.

config

config array corresponding to infer_type

Configuración del servicio (Si un servicio es compartido, solo se devuelven model_id, model_name, y model_version.)

  • Si infer_type se establece en real-time, consulte Tabla 3.
  • Si infer_type se establece en batch, consulte Tabla 4.

access_address

String

Dirección de acceso de una solicitud de inferencia. Este parámetro está disponible cuando infer_type se establece en real-time.

bind_access_address

String

Solicitar la dirección de un nombre de dominio personalizado. Este parámetro está disponible después de que se enlaza un nombre de dominio.

invocation_times

Number

Número total de llamadas de servicio

failed_times

Number

Número de llamadas de servicio fallidas

is_shared

Boolean

Si un servicio está suscrito

shared_count

Number

Número de servicios suscritos

schedule

schedule array

Configuración de programación de servicio. Si este parámetro no está definido, no se devolverá ningún valor. Para más detalles, consulte Tabla 5.

update_time

Number

Tiempo en que se actualiza la configuración utilizada por un servicio, en milisegundos calculados a partir de 1970.1.1 0:0:0 UTC

debug_url

String

Dirección de depuración en línea de un servicio en tiempo real. Este parámetro solo está disponible cuando el modelo admite la depuración en línea y solo hay una instancia.

due_time

number

Tiempo cuando un servicio en tiempo real se detiene automáticamente, en milisegundos calculados a partir de 1970.1.1 0:0:0 UTC.

operation_time

number

Tiempo de funcionamiento de una solicitud

transition_at

number

Hora en que cambia el estado del servicio

is_free

Boolean

Si se utiliza un variante gratuito

additional_properties

Map<String, Object>

Atributo de servicio adicional.

Tabla 3 parámetros config de real-time

Parámetro

Tipo

Descripción

model_id

String

ID del modelo

model_name

String

Nombre del modelo

model_version

String

Versión modelo

source_type

String

Fuente del modelo. Este parámetro se devuelve cuando se crea un modelo a través de ExeML. El valor es auto.

status

String

Estado del modelo. Opciones:

  • ready: preparado (Se han iniciado todas las instancias)
  • concerning: parcialmente listo (algunas instancias se inician y otras no.)
  • notReady: no ha preparado (No se inician todas las instancias)

weight

Integer

Peso de tráfico asignado a un modelo

specification

String

Variante de recursos.Options: modelarts.vm.cpu.2u, modelarts.vm.gpu.p4, and modelarts.vm.ai1.a310

custom_spec

Object

Personalizado Para obtener más información, consulte Tabla 6.

envs

Map<String, String>

(Opcional) Par de clave-valor de variable de entorno requerido para ejecutar un modelo

Para garantizar la seguridad de los datos, no introduzca información confidencial, como contraseñas de texto sin formato, en las variables de entorno.

instance_count

Integer

Número de instancias implementadas en un modelo

scaling

Boolean

Si está habilitado el escalado automático

cluster_id

String

ID de un grupo de recursos dedicado utilizado por una instancia de servicio. Este parámetro solo se devuelve cuando se configura un grupo de recursos dedicado.

support_debug

Boolean

Si un modelo admite la depuración en línea

additional_properties

Map<String, Object>

Atributo de implementación de modelo adicional

Tabla 4 parámetros config del batch

Parámetro

Tipo

Descripción

model_id

String

ID del modelo

model_name

String

Nombre del modelo

model_version

String

Versión modelo

specification

String

Variante de recursos. Opciones: modelarts.vm.cpu.2u, modelarts.vm.gpu.p4, and modelarts.vm.ai1.a310

custom_spec

Object

Personalizado Para obtener más información, consulte Tabla 6.

envs

Map<String, String>

(Opcional) Par de clave-valor de variable de entorno requerido para ejecutar un modelo

Para garantizar la seguridad de los datos, no introduzca información confidencial, como contraseñas de texto sin formato, en las variables de entorno.

instance_count

Integer

Número de instancias implementadas en un modelo

src_type

String

Tipo de origen de datos. Este parámetro sólo se devuelve cuando se especifica el valor de la función ManifestFile.

src_path

String

Ruta OBS de los datos de entrada de un trabajo por lotes

dest_path

String

Ruta OBS de los datos de salida de un trabajo por lotes

req_uri

String

Ruta de inferencia de un trabajo por lotes

mapping_type

String

Tipo de asignación de los datos de entrada. El valor puede ser file o csv.

mapping_rule

Map

Mapeo entre los parámetros de entrada y los datos CSV. Este parámetro es obligatorio solo cuando mapping_type se establece en csv.

start_time

Number

Tiempo de inicio de la tarea, en milisegundos calculado a partir de 1970.1.1 0:0:0 UTC. Este parámetro no se devuelve hasta que se inicia la tarea.

finished_time

Number

Tiempo de finalización de la tarea, en milisegundos calculado a partir de 1970.1.1 0:0:0 UTC. Este parámetro no se devuelve hasta que finaliza la tarea.

Tabla 5 Parámetros schedule

Parámetro

Tipo

Descripción

type

String

Tipo de programación. Solo se admite el valor stop.

time_unit

String

Unidad de tiempo de programación. Opciones:

  • DAYS
  • HOURS
  • MINUTES

duration

Integer

Valor que se asigna a la unidad de tiempo. Por ejemplo, si la tarea se detiene después de dos horas, establezca time_unit en HOURS y duration en 2.

Tabla 6 Parámetros custom_spec

Parámetro

Tipo

Descripción

cpu

Float

Cantidad de CPU

memory

Integer

Capacidad de memoria en MB

gpu_p4

Float

Número de GPU

ascend_a310

Integer

Número de chips Ascend

Muestras

A continuación se muestra cómo consultar los detalles sobre un servicio en tiempo real basado en el ID de servicio.

  • Modelo de solicitud
    GET    https://endpoint/v1/{project_id}/services/{service_id}
  • Modelo de respuesta
    {
    	"service_id": "f76f20ba-78f5-44e8-893a-37c8c600c02f",
    	"service_name": "service-demo",
    	"tenant": "xxxxx",
    	"project": "xxxxx",
    	"owner": "xxxxx",
    	"publish_at": 1585809231902,
    	"update_time": 1585809358259,
    	"infer_type": "real-time",
    	"status": "running",
    	"progress": 100,
    	"access_address": "https://xxxxx.apigw.cn-north-7.myhuaweicloud.com/v1/infers/088458d9-5755-4110-97d8-1d21065ea10b/f76f20ba-78f5-44e8-893a-37c8c600c02f",
    	"cluster_id": "088458d9-5755-4110-97d8-1d21065ea10b",
    	"workspace_id": "0",
    	"additional_properties": {},
    	"is_shared": false,
    	"invocation_times": 0,
    	"failed_times": 0,
    	"shared_count": 0,
    	"operation_time": 1586249085447,
    	"config": [{
    		"model_id": "044ebf3d-8bf4-48df-bf40-bad0e664c1e2",
    		"model_name": "jar-model",
    		"model_version": "1.0.1",
    		"specification": "custom",
    		"custom_spec": {},
    		"status": "notReady",
    		"weight": 100,
    		"instance_count": 1,
    		"scaling": false,
    		"envs": {},
    		"additional_properties": {},
    		"support_debug": false
    	}],
    	"transition_at": 1585809231902,
    	"is_free": false
           
    }

Código de estado

Para obtener más información sobre el código de estado, consulte Tabla 1.