Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ ModelArts/ Prácticas recomendadas/ Inferencia del modelo/ O&M de extremo a extremo para servicios de inferencia
Actualización más reciente 2024-09-20 GMT+08:00

O&M de extremo a extremo para servicios de inferencia

El O&M de extremo a extremo de los servicios de inferencia de ModelArts implica todo el proceso de IA, incluido el desarrollo de algoritmos, el O&M del servicio y la ejecución del servicio.

Descripción general

Proceso de O&M de extremo a extremo

  • Durante el desarrollo del algoritmo, almacene los datos del servicio en Object Storage Service (OBS) y luego etiquete y gestione los datos mediante la gestión de datos de ModelArts. Después de entrenar los datos, obtenga un modelo de IA y cree imágenes de aplicaciones de IA con un entorno de desarrollo.
  • Durante el O&M de servicio, utilice una imagen para crear una aplicación de IA y desplegar la aplicación de IA como un servicio en tiempo real. Puede obtener los datos de monitoreo del servicio de ModelArts en tiempo real en la consola de gestión de Cloud Eye. Configure las reglas de alarmas para que pueda recibir notificaciones de alarmas en tiempo real.
  • Durante la ejecución del servicio, acceda a las solicitudes de servicio en tiempo real en el sistema de servicio y luego configure la lógica y el monitoreo del servicio.
Figura 1 Proceso de O&M de extremo a extremo para servicios de inferencia

Durante todo el proceso de O&M, se monitorean las fallas en las solicitudes de servicio y el alto uso de recursos. Cuando se alcance el umbral de uso de recursos, el sistema le enviará una notificación de alarma.

Figura 2 Proceso de alarma

Ventajas

El O&M de servicio de extremo a extremo le permite verificar fácilmente el funcionamiento de los servicios tanto en horas punta como en horas valle y detectar el estado de salud de los servicios en tiempo real.

Restricciones

Cloud Eye no supervisa los servicios de inferencia por lotes o de borde.

Procedimiento

Esta sección utiliza un algoritmo de seguridad de los ocupantes en viajes como ejemplo para describir cómo utilizar ModelArts para desplegar y actualizar servicios basados en procesos, así como para O&M y monitoreo automáticos de servicios.

Figura 3 Implementación del algoritmo de seguridad de los ocupantes
  1. Utilice un modelo desarrollado localmente para crear una imagen personalizada y utilice la imagen para crear una aplicación de AI en ModelArts. Para obtener más detalles, consulte Creación de una imagen personalizada y su uso para crear una aplicación de IA.
  2. En la consola de gestión de ModelArts, despliegue la aplicación de IA creada como un servicio en tiempo real.
  3. Inicie sesión en la consola de gestión de Cloud Eye, configure las reglas de alarmas de ModelArts y habilite notificaciones con un tema relacionado. Para obtener más detalles, consulte Configuración de reglas de alarma.

    Después de la configuración, seleccione Cloud Service Monitoring > ModelArts en el panel de navegación de la izquierda para ver las solicitudes y el uso de recursos del servicio en tiempo real.

    Figura 4 Consulta de las métricas de supervisión del servicio

    Cuando se activa una alarma basada en los datos supervisados, el objeto que se ha suscrito al tema de destino recibirá una notificación de mensaje.

    Figura 5 Alarm-triggered message notification