Consulta de los detalles sobre un servicio
Función
Esta API se utiliza para consultar los detalles sobre un servicio de modelo basado en el ID de servicio.
URI
GET /v1/{project_id}/services/{service_id}
Parámetro |
Obligatorio |
Tipo |
Descripción |
---|---|---|---|
project_id |
Sí |
String |
ID del proyecto. Para obtener más información sobre cómo obtener un ID de proyecto, consulte Obtención de un ID y un nombre de proyecto. |
service_id |
Sí |
String |
ID de servicio |
Cuerpo de la solicitud
No hay
Cuerpo de respuesta
Parámetro |
Tipo |
Descripción |
---|---|---|
service_id |
String |
ID de servicio |
service_name |
String |
Nombre servicio |
description |
String |
Descripción del Servicio |
tenant |
String |
Tenant al que pertenece un servicio |
project |
String |
Proyecto al que pertenece un servicio |
owner |
String |
Usuario al que pertenece un servicio |
publish_at |
Number |
Tiempo de lanzamiento del servicio más reciente, en milisegundos calculado a partir de 1970.1.1 0:0:0 UTC |
infer_type |
String |
Tipo de inferencia, que puede ser real-time o batch |
workspace_id |
String |
ID del espacio de trabajo. |
cluster_id |
String |
ID del grupo de recursos dedicado utilizado por el servicio en tiempo real o por lotes. Este parámetro sólo está disponible cuando se utiliza un fondo de recursos dedicado. |
vpc_id |
String |
ID de la VPC a la que pertenece la instancia de servicio en tiempo real. Este parámetro está disponible cuando se personaliza la configuración de red. |
subnet_network_id |
String |
ID de la subred a la que pertenece la instancia de servicio en tiempo real. Este parámetro está disponible cuando se personaliza la configuración de red. |
security_group_id |
String |
Grupo de seguridad al que pertenece la instancia de servicio en tiempo real. Este parámetro está disponible cuando se personaliza la configuración de red. |
status |
String |
Estado del servicio, que puede ser running, deploying, concerning, failed, stopped, o finished |
progress |
Integer |
Progreso del despliegue. Este parámetro está disponible cuando el estado es deploying. |
error_msg |
String |
Mensaje de error. Cuando status es failed, se devuelve un mensaje de error que contiene la causa del error. |
config |
config array corresponding to infer_type |
Configuración del servicio (Si un servicio es compartido, solo se devuelven model_id, model_name, y model_version.) |
access_address |
String |
Dirección de acceso de una solicitud de inferencia. Este parámetro está disponible cuando infer_type se establece en real-time. |
bind_access_address |
String |
Solicitar la dirección de un nombre de dominio personalizado. Este parámetro está disponible después de que se enlaza un nombre de dominio. |
invocation_times |
Number |
Número total de llamadas de servicio |
failed_times |
Number |
Número de llamadas de servicio fallidas |
is_shared |
Boolean |
Si un servicio está suscrito |
shared_count |
Number |
Número de servicios suscritos |
schedule |
schedule array |
Configuración de programación de servicio. Si este parámetro no está definido, no se devolverá ningún valor. Para más detalles, consulte Tabla 5. |
update_time |
Number |
Tiempo en que se actualiza la configuración utilizada por un servicio, en milisegundos calculados a partir de 1970.1.1 0:0:0 UTC |
debug_url |
String |
Dirección de depuración en línea de un servicio en tiempo real. Este parámetro solo está disponible cuando el modelo admite la depuración en línea y solo hay una instancia. |
due_time |
number |
Tiempo cuando un servicio en tiempo real se detiene automáticamente, en milisegundos calculados a partir de 1970.1.1 0:0:0 UTC. |
operation_time |
number |
Tiempo de funcionamiento de una solicitud |
transition_at |
number |
Hora en que cambia el estado del servicio |
is_free |
Boolean |
Si se utiliza un variante gratuito |
additional_properties |
Map<String, Object> |
Atributo de servicio adicional. |
Parámetro |
Tipo |
Descripción |
---|---|---|
model_id |
String |
ID del modelo |
model_name |
String |
Nombre del modelo |
model_version |
String |
Versión modelo |
source_type |
String |
Fuente del modelo. Este parámetro se devuelve cuando se crea un modelo a través de ExeML. El valor es auto. |
status |
String |
Estado del modelo. Opciones:
|
weight |
Integer |
Peso de tráfico asignado a un modelo |
specification |
String |
Variante de recursos.Options: modelarts.vm.cpu.2u, modelarts.vm.gpu.p4, and modelarts.vm.ai1.a310 |
custom_spec |
Object |
Personalizado Para obtener más información, consulte Tabla 6. |
envs |
Map<String, String> |
(Opcional) Par de clave-valor de variable de entorno requerido para ejecutar un modelo Para garantizar la seguridad de los datos, no introduzca información confidencial, como contraseñas de texto sin formato, en las variables de entorno. |
instance_count |
Integer |
Número de instancias implementadas en un modelo |
scaling |
Boolean |
Si está habilitado el escalado automático |
cluster_id |
String |
ID de un grupo de recursos dedicado utilizado por una instancia de servicio. Este parámetro solo se devuelve cuando se configura un grupo de recursos dedicado. |
support_debug |
Boolean |
Si un modelo admite la depuración en línea |
additional_properties |
Map<String, Object> |
Atributo de implementación de modelo adicional |
Parámetro |
Tipo |
Descripción |
---|---|---|
model_id |
String |
ID del modelo |
model_name |
String |
Nombre del modelo |
model_version |
String |
Versión modelo |
specification |
String |
Variante de recursos. Opciones: modelarts.vm.cpu.2u, modelarts.vm.gpu.p4, and modelarts.vm.ai1.a310 |
custom_spec |
Object |
Personalizado Para obtener más información, consulte Tabla 6. |
envs |
Map<String, String> |
(Opcional) Par de clave-valor de variable de entorno requerido para ejecutar un modelo Para garantizar la seguridad de los datos, no introduzca información confidencial, como contraseñas de texto sin formato, en las variables de entorno. |
instance_count |
Integer |
Número de instancias implementadas en un modelo |
src_type |
String |
Tipo de origen de datos. Este parámetro sólo se devuelve cuando se especifica el valor de la función ManifestFile. |
src_path |
String |
Ruta OBS de los datos de entrada de un trabajo por lotes |
dest_path |
String |
Ruta OBS de los datos de salida de un trabajo por lotes |
req_uri |
String |
Ruta de inferencia de un trabajo por lotes |
mapping_type |
String |
Tipo de asignación de los datos de entrada. El valor puede ser file o csv. |
mapping_rule |
Map |
Mapeo entre los parámetros de entrada y los datos CSV. Este parámetro es obligatorio solo cuando mapping_type se establece en csv. |
start_time |
Number |
Tiempo de inicio de la tarea, en milisegundos calculado a partir de 1970.1.1 0:0:0 UTC. Este parámetro no se devuelve hasta que se inicia la tarea. |
finished_time |
Number |
Tiempo de finalización de la tarea, en milisegundos calculado a partir de 1970.1.1 0:0:0 UTC. Este parámetro no se devuelve hasta que finaliza la tarea. |
Parámetro |
Tipo |
Descripción |
---|---|---|
type |
String |
Tipo de programación. Solo se admite el valor stop. |
time_unit |
String |
Unidad de tiempo de programación. Opciones:
|
duration |
Integer |
Valor que se asigna a la unidad de tiempo. Por ejemplo, si la tarea se detiene después de dos horas, establezca time_unit en HOURS y duration en 2. |
Muestras
A continuación se muestra cómo consultar los detalles sobre un servicio en tiempo real basado en el ID de servicio.
- Modelo de solicitud
GET https://endpoint/v1/{project_id}/services/{service_id}
- Modelo de respuesta
{ "service_id": "f76f20ba-78f5-44e8-893a-37c8c600c02f", "service_name": "service-demo", "tenant": "xxxxx", "project": "xxxxx", "owner": "xxxxx", "publish_at": 1585809231902, "update_time": 1585809358259, "infer_type": "real-time", "status": "running", "progress": 100, "access_address": "https://xxxxx.apigw.cn-north-7.myhuaweicloud.com/v1/infers/088458d9-5755-4110-97d8-1d21065ea10b/f76f20ba-78f5-44e8-893a-37c8c600c02f", "cluster_id": "088458d9-5755-4110-97d8-1d21065ea10b", "workspace_id": "0", "additional_properties": {}, "is_shared": false, "invocation_times": 0, "failed_times": 0, "shared_count": 0, "operation_time": 1586249085447, "config": [{ "model_id": "044ebf3d-8bf4-48df-bf40-bad0e664c1e2", "model_name": "jar-model", "model_version": "1.0.1", "specification": "custom", "custom_spec": {}, "status": "notReady", "weight": 100, "instance_count": 1, "scaling": false, "envs": {}, "additional_properties": {}, "support_debug": false }], "transition_at": 1585809231902, "is_free": false }
Código de estado
Para obtener más información sobre el código de estado, consulte Tabla 1.