Consulta de detalles del servicio
Después de implementar una aplicación de IA como servicio en tiempo real, puede acceder a la página del servicio para ver sus detalles.
- Inicie sesión en la consola de gestión ModelArts y elija Service Deployment > Real-Time Services.
- En la página Real-Time Services, haga clic en el nombre del servicio de destino. Se muestra la página de detalles del servicio.
Puede ver el nombre del servicio, el estado y otra información. Para más detalles, véase Tabla 1.
Tabla 1 Parámetros de servicio en tiempo real Parámetro
Descripción
Name
Nombre del servicio en tiempo real.
Status
Estado del servicio en tiempo real.
Source
Fuente de aplicación de IA del servicio en tiempo real.
Service ID
ID de servicio en tiempo real
Description
Descripción del servicio, que se puede editar después de hacer clic en el botón de edición en el lado derecho.
Resource Pool
Especificaciones de grupo de recursos utilizadas por el servicio. Si se utiliza el grupo de recursos públicos para el despliegue, no se muestra este parámetro.
Custom Settings
Configuraciones personalizadas basadas en versiones de servicio en tiempo real. Esto permite configuraciones y políticas de distribución de tráfico basadas en versiones. Active esta opción y haga clic en View Settings para personalizar la configuración. Para más detalles, véase Modificación de parámetros personalizados.
Traffic Limit
Número máximo de veces que se puede acceder a un servicio en un segundo.
Runtime Log Output
Esta función está deshabilitada por defecto. Los logs de tiempo de ejecución de los servicios en tiempo real se almacenan solo en el sistema de logs de ModelArts.
Si esta función está habilitada, los logs de tiempo de ejecución de los servicios en tiempo real se exportarán y almacenarán en Log Tank Service (LTS). LTS crea automáticamente grupos de logs y flujos de logs y cachés ejecuta logs generados en un plazo de siete días de forma predeterminada. Para obtener más detalles sobre la función de gestión de logs LTS, véase Log Tank Service.
NOTA:- Esto no se puede deshabilitar una vez que está habilitado.
- Se le facturarán las funciones de consulta de logs y almacenamiento de logs proporcionadas por LTS. Para obtener más detalles, véase la sección Detalles de precios de LTS.
WebSocket
Si se debe actualizar al servicio de WebSocket.
- Cambie entre las pestañas de la página de detalles de un servicio en tiempo real para ver más detalles. Para más detalles, véase Tabla 2.
Tabla 2 Detalles de un servicio en tiempo real Parámetro
Descripción
Usage Guides
Esta página muestra la URL de la API, la información de la aplicación de IA, los parámetros de entrada y los parámetros de salida. Puede hacer clic en para copiar la URL de API para invocar al servicio. Si se admite la autenticación de aplicaciones, en las Guías de uso puede ver los detalles de URL de la API y de gestión de autorizaciones, incluidos el nombre de la aplicación, AppKey y AppSecret. También puede agregar o cancelar la autorización para una aplicación.
Prediction
Puede realizar la predicción en tiempo real en esta página. Para más detalles, véase Prueba del servicio desplegado.
Configuration Updates
Esta página muestra Current Configurations y Update History.
- Current Configurations: nombre, versión, estado, especificaciones de nodo de cómputo, relación de tráfico, número de nodos de cómputo, intervalo de tiempo de espera de despliegue, variables de entorno, montaje de almacenamiento e información de grupo de recursos de aplicación de IA (para servicios desplegados en un grupo de recursos dedicado)
- Update History: información histórica de aplicaciones de IA.
Monitoring
Esta página muestra el uso de recursos y las llamadas de aplicaciones de IA.
- Resource Usage: incluye las CPU usadas y disponibles, la memoria y la GPU.
- AI Application Calls: indica el número de llamadas de aplicación de IA. La recopilación de estadísticas comienza después de que el estado de la aplicación de IA cambie a Ready. (Este parámetro no se muestra para los servicios de WebSocket)
Event
Esta página muestra operaciones clave durante el uso del servicio, como el progreso de despliegue del servicio, causas detalladas de excepciones de despliegue y puntos en el tiempo cuando se inicia, para o modifica un servicio.
Los eventos se guardan durante un mes y luego se borran automáticamente.
Para obtener detalles sobre cómo ver los eventos de un servicio, véase Consulta de eventos de servicio.
Logs
Esta página muestra la información de log de cada aplicación de IA del servicio. Puede ver los registros generados en los últimos 5 minutos, los últimos 30 minutos, las últimas 1 hora y el segmento de tiempo definido por el usuario.
Puede seleccionar la hora de inicio y la hora de finalización al definir el segmento de tiempo.
Si esta función está habilitada, se mostrarán los logs almacenados en LTS. Puede hacer clic en View Complete Logs on LTS para ver todos los logs.
Cumpla las siguientes reglas para buscar logs:
- No introduzca cadenas que contengan los siguientes delimitadores: ,'";=() [] {}@&<>/:\n\t\r.
- Ingrese palabras clave para la búsqueda exacta. Una palabra clave es una palabra entre dos delimitadores adyacentes.
- Ingrese palabras clave para búsqueda difusa. Por ejemplo, puede escribir error, er?or, rro* o er*r.
- Ingrese las frases para la búsqueda exacta. Por ejemplo, Start to refresh.
- Antes de habilitar esta función, puede combinar las palabras clave con AND (&&) u OR (||). Por ejemplo, query logs&&erro* o query logs||erro*. Una vez habilitada esta función, se pueden combinar palabras clave con AND u OR. Por ejemplo, query logs AND erro* o query logs OR erro*.
Tags
Etiquetas que se han agregado al servicio. Las etiquetas se pueden agregar, modificar y eliminar.
Para obtener más información sobre cómo usar etiquetas, véase ¿Cómo usa ModelArts etiquetas para gestionar recursos por grupo?
Modificación de parámetros personalizados
Una regla de configuración personalizada consiste en la condición de configuración (Setting), la versión de acceso (Version) y los parámetros de ejecución personalizados (incluidos Setting Name y Setting Value).
Puede configurar diferentes ajustes con parámetros de ejecución personalizados para diferentes versiones de un servicio en tiempo real.
Las prioridades de las reglas de configuración personalizadas están en orden descendente. Puede cambiar las prioridades arrastrando la secuencia de reglas de configuración personalizadas.
Una vez coincidente una regla, el sistema ya no coincidirá con las reglas posteriores. Se puede configurar un máximo de 10 reglas de configuración.
Parámetro |
Obligatorio |
Descripción |
---|---|---|
Setting |
Sí |
Expresión de la regla Spring Expression Language (SPEL). Solo se admiten las expresiones igual, coinciden y hashCode del tipo de carácter. |
Version |
Sí |
Versión de acceso para una regla de configuración de servicio personalizada. Cuando se coincide con una regla, se solicita el servicio en tiempo real de la versión. |
Setting Name |
No |
Clave de un parámetro de ejecución personalizado, que consta de un máximo de 128 caracteres. Configure este parámetro si el encabezado del mensaje HTTP se utiliza para llevar parámetros de ejecución personalizados a un servicio en tiempo real. |
Setting Value |
No |
Valor de un parámetro de ejecución personalizado, que consta de un máximo de 256 caracteres. Configure este parámetro si el encabezado del mensaje HTTP se utiliza para llevar parámetros de ejecución personalizados a un servicio en tiempo real. |
La configuración personalizada se puede utilizar en los siguientes escenarios:
- Si se despliegan varias versiones de un servicio en tiempo real para la versión intermedia, se pueden utilizar los ajustes personalizados para distribuir el tráfico por usuario.
Tabla 4 Variables incorporadas Variable incorporada
Descripción
DOMAIN_NAME
Nombre de cuenta que se utiliza para invocar a una solicitud de inferencia
DOMAIN_ID
ID de cuenta que se utiliza para invocar a una solicitud de inferencia
PROJECT_NAME
Nombre del proyecto que se utiliza para invocar a una solicitud de inferencia
PROJECT_ID
ID de proyecto que invoca la solicitud de inferencia
USER_NAME
Nombre de usuario que se utiliza para invocar a una solicitud de inferencia
USER_ID
ID de usuario que se utiliza para invocar a una solicitud de inferencia
La clave Pound (#) indica que se hace referencia a una variable. La string de caracteres coincidentes debe estar entre comillas simples.
#{Built-in variable} == 'Character string' #{Built-in variable} matches 'Regular expression'
- Ejemplo 1:
Si el nombre de cuenta para invocar la solicitud de inferencia es User A, la versión especificada coincide.
#DOMAIN_NAME == 'User A'
- Ejemplo 2:
Si el nombre de cuenta en la solicitud de inferencia comienza con op, la versión especificada coincide.
#DOMAIN_NAME matches 'op.*'
Tabla 5 Expresiones regulares comunes Carácter
Descripción
.
Coincide con cualquier carácter, excepto \n. Para que coincida con cualquier carácter, incluido \n, utilice (.|\n).
*
Coincide con la subexpresión que sigue para cero o varias veces. Por ejemplo, zo* puede coincidir con z y zoo.
+
Coincide con la subexpresión que sigue una o varias veces. Por ejemplo, zo+ puede coincidir con zo y zoo, pero no puede igualar z.
?
Coincide con la subexpresión que sigue durante cero o una vez. Por ejemplo, do(es)? puede igualar does o do en does.
^
Coincide con el inicio de la string de entrada.
$
Coincide con el final de la string de entrada.
{n}
n es un entero no negativo que coincide exactamente con el número n de apariciones de una expresión. Por ejemplo, o{2} no puede coincidir con o en Bob, pero puede coincidir con dos o en food.
x|y
Coincide con x o y. Por ejemplo, z|food puede coincidir con z o food, y (z|f)ood puede coincidir con zood o food.
[xyz]
Conjuntos de caracteres, en el que se puede hacer coincidir cualquier carácter. Por ejemplo, [abc] puede coincidir con a en plain.
Figura 1 Distribución del tráfico por usuario
- Ejemplo 1:
- Si se desplieguen varias versiones de un servicio en tiempo real para el inicio cerrado, se pueden usar configuraciones personalizadas para acceder a diferentes versiones a través del encabezado.
Comience con #HEADER_ para indicar que se hace referencia al encabezado como condición.
#HEADER_{key} == '{value}' #HEADER_{key} matches '{value}'
- Ejemplo 1:
Si el encabezado de una solicitud HTTP de inferencia contiene una versión y el valor es 0.0.1, se cumple la condición. De lo contrario, la condición no se cumple.
#HEADER_version == '0.0.1'
- Ejemplo 2:
Si el encabezado de una solicitud HTTP de inferencia contiene testheader y el valor comienza con mock, la regla coincide.
#HEADER_testheader matches 'mock.*'
- Ejemplo 3:
Si el encabezado de una solicitud HTTP de inferencia contiene uid y el valor del código hash cumple las condiciones descritas en el siguiente algoritmo, la regla coincide.
#HEADER_uid.hashCode() % 100 < 10
Figura 2 Usar el encabezado para acceder a diferentes versiones
- Ejemplo 1:
- Si una versión de servicio en tiempo real admite diferentes configuraciones de tiempo de ejecución, puede utilizar Setting Name y Setting Value para especificar parámetros de tiempo de ejecución personalizados para que diferentes usuarios puedan utilizar diferentes configuraciones de ejecución.
Por ejemplo:
Cuando el usuario A accede a la aplicación de IA, el usuario utiliza la configuración A. Cuando el usuario B accede a la aplicación de IA, el usuario utiliza la configuración B. Cuando se coincide con una configuración en ejecución, el ModelArts agrega un encabezado a la solicitud y también los parámetros de ejecución personalizados especificados por Setting Name y Setting Value.Figura 3 Parámetros de ejecución personalizados agregados para una regla de configuración personalizada