Implementación como servicio en tiempo real
Después de preparar una aplicación de IA, puede implementar la aplicación de IA como un servicio en tiempo real y predecir y llamar al servicio.
![](https://support.huaweicloud.com/intl/es-us/inference-modelarts/public_sys-resources/note_3.0-es-us.png)
Un usuario puede implementar un máximo de 20 servicios en tiempo real.
Prerrequisitos
- Se han preparado los datos. Específicamente, ha creado una aplicación de IA en el estado Normal de ModelArts.
- Asegúrese de que la cuenta no está en mora. Los recursos se consumen cuando los servicios se están ejecutando.
Procedimiento
- Inicie sesión en la consola de gestión del ModelArts. En el panel de navegación izquierdo, elija Service Deployment > Real-Time Services. De forma predeterminada, el sistema cambia a la página Real-Time Services.
- En la lista de servicios en tiempo real, haga clic en Deploy en la esquina superior izquierda. Se muestra la página Deploy.
- Establezca parámetros para un servicio en tiempo real.
- Establezca información básica acerca de la implementación del modelo. Para obtener más información sobre los parámetros, consulte Tabla 1.
Tabla 1 Parámetros básicos del despliegue del modelo Parámetro
Descripción
Name
Nombre del servicio en tiempo real. Establezca este parámetro como se le solicite.
Auto Stop
Después de activar este parámetro y establecer el tiempo de parada automática, un servicio se detiene automáticamente a la hora especificada. Si este parámetro está desactivado, un servicio en tiempo real se mantiene en ejecución y facturación. La función puede ayudarlo a evitar la facturación innecesaria. La función de parada automática está habilitada de forma predeterminada y el valor predeterminado es 1 hour later.
Las opciones son 1 hour later, 2 hours later, 4 hours later, 6 hours later, y Custom. Si selecciona Custom, puede escribir cualquier entero de 1 a 24 horas en el cuadro de texto de la derecha.
Description
Breve descripción del servicio en tiempo real.
- Ingrese la información clave, incluidas las configuraciones del grupo de recursos y de la aplicación de IA. Para más detalles, consulte Tabla 2.
Tabla 2 Parámetros Parámetro
Subparámetro
Descripción
Resource Pool
Public resource pools
Las instancias del grupo de recursos públicos pueden ser del tipo CPU o GPU. Los estándares de fijación de precios para los grupos de recursos con diferentes tipos de instancia son diferentes. Para obtener más información, consulte Detalles de precios del producto. El fondo de recursos públicos solo admite el modo de facturación de pago por uso.
AI Application and Configuration
AI Application Source
Seleccione My AI Applications o My Subscriptions según sus requisitos.
AI Application and Version
Seleccione la aplicación de IA y la versión que están en el estado Normal.
Traffic Ratio (%)
Establezca la proporción de tráfico del nodo de instancia actual. Las solicitudes de llamadas de servicio se asignan a la versión actual en función de esta proporción.
Si implementa solo una versión de una aplicación de IA, establezca este parámetro en 100%. Si selecciona varias versiones para el lanzamiento cerrado, asegúrese de que la suma de los ratios de tráfico de varias versiones sea del 100%.
Specifications
Seleccione las especificaciones disponibles según la lista mostrada en la consola. Las especificaciones en gris no se pueden utilizar en el entorno actual.
Compute Nodes
Establezca el número de instancias para la versión actual de la aplicación de IA. Si establece Instances en 1, se utiliza el modo de cómputo independiente. Si establece Instances en un valor mayor que 1, se utiliza el modo de cómputo distribuida. Seleccione un modo de cómputo basado en los requisitos reales.
Environment Variable
Establezca las variables de entorno e inyéctelas en el pod. Para garantizar la seguridad de los datos, no introduzca información confidencial, como contraseñas de texto sin formato, en las variables de entorno.
Add AI Application Version and Configuration
Si la aplicación de IA seleccionada tiene varias versiones, puede agregar varias versiones y configurar una relación de tráfico. Puede utilizar el inicio gris para actualizar sin problemas la versión de la aplicación de IA.
NOTA:Las especificaciones de cómputo libre no admiten el lanzamiento gris de varias versiones.
Traffic Limit
N/A
Número máximo de veces que se puede acceder a un servicio en un segundo. Puede establecer este parámetro según sea necesario.
Application Authentication
Application
Deshabilitada por defecto. Para habilitar esta función, consulte Acceso autenticado mediante una aplicación para obtener más detalles y establezca los parámetros según sea necesario.
Figura 1 Establecer la información de la aplicación de IA.
- Establezca información básica acerca de la implementación del modelo. Para obtener más información sobre los parámetros, consulte Tabla 1.
- Después de confirmar la información introducida, complete la implementación del servicio como se le solicite. En general, los trabajos de implementación de servicios se ejecutan durante un período de tiempo, que puede ser de varios minutos o decenas de minutos, dependiendo de la cantidad de datos y recursos seleccionados.
Después de implementar un servicio en tiempo real, se inicia inmediatamente. Durante la carrera, se le cobrará en función de los recursos seleccionados.During the running, you will be charged based on your selected resources.
Puede ir a la lista de servicios en tiempo real para comprobar si se ha completado la implementación del servicio en tiempo real. En la lista de servicios en tiempo real, después de que el estado del servicio recién implementado cambie de Deploying a Running, el servicio se implementa correctamente.