Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2024-06-25 GMT+08:00

Implementación como servicio en tiempo real

Después de preparar una aplicación de IA, puede implementar la aplicación de IA como un servicio en tiempo real y predecir y llamar al servicio.

Un usuario puede implementar un máximo de 20 servicios en tiempo real.

Prerrequisitos

  • Se han preparado los datos. Específicamente, ha creado una aplicación de IA en el estado Normal de ModelArts.
  • Asegúrese de que la cuenta no está en mora. Los recursos se consumen cuando los servicios se están ejecutando.

Procedimiento

  1. Inicie sesión en la consola de gestión del ModelArts. En el panel de navegación izquierdo, elija Service Deployment > Real-Time Services. De forma predeterminada, el sistema cambia a la página Real-Time Services.
  2. En la lista de servicios en tiempo real, haga clic en Deploy en la esquina superior izquierda. Se muestra la página Deploy.
  3. Establezca parámetros para un servicio en tiempo real.
    1. Establezca información básica acerca de la implementación del modelo. Para obtener más información sobre los parámetros, consulte Tabla 1.
      Tabla 1 Parámetros básicos del despliegue del modelo

      Parámetro

      Descripción

      Name

      Nombre del servicio en tiempo real. Establezca este parámetro como se le solicite.

      Auto Stop

      Después de activar este parámetro y establecer el tiempo de parada automática, un servicio se detiene automáticamente a la hora especificada. Si este parámetro está desactivado, un servicio en tiempo real se mantiene en ejecución y facturación. La función puede ayudarlo a evitar la facturación innecesaria. La función de parada automática está habilitada de forma predeterminada y el valor predeterminado es 1 hour later.

      Las opciones son 1 hour later, 2 hours later, 4 hours later, 6 hours later, y Custom. Si selecciona Custom, puede escribir cualquier entero de 1 a 24 horas en el cuadro de texto de la derecha.

      Description

      Breve descripción del servicio en tiempo real.

    2. Ingrese la información clave, incluidas las configuraciones del grupo de recursos y de la aplicación de IA. Para más detalles, consulte Tabla 2.
      Tabla 2 Parámetros

      Parámetro

      Subparámetro

      Descripción

      Resource Pool

      Public resource pools

      Las instancias del grupo de recursos públicos pueden ser del tipo CPU o GPU. Los estándares de fijación de precios para los grupos de recursos con diferentes tipos de instancia son diferentes. Para obtener más información, consulte Detalles de precios del producto. El fondo de recursos públicos solo admite el modo de facturación de pago por uso.

      AI Application and Configuration

      AI Application Source

      Seleccione My AI Applications o My Subscriptions según sus requisitos.

      AI Application and Version

      Seleccione la aplicación de IA y la versión que están en el estado Normal.

      Traffic Ratio (%)

      Establezca la proporción de tráfico del nodo de instancia actual. Las solicitudes de llamadas de servicio se asignan a la versión actual en función de esta proporción.

      Si implementa solo una versión de una aplicación de IA, establezca este parámetro en 100%. Si selecciona varias versiones para el lanzamiento cerrado, asegúrese de que la suma de los ratios de tráfico de varias versiones sea del 100%.

      Specifications

      Seleccione las especificaciones disponibles según la lista mostrada en la consola. Las especificaciones en gris no se pueden utilizar en el entorno actual.

      Compute Nodes

      Establezca el número de instancias para la versión actual de la aplicación de IA. Si establece Instances en 1, se utiliza el modo de cómputo independiente. Si establece Instances en un valor mayor que 1, se utiliza el modo de cómputo distribuida. Seleccione un modo de cómputo basado en los requisitos reales.

      Environment Variable

      Establezca las variables de entorno e inyéctelas en el pod. Para garantizar la seguridad de los datos, no introduzca información confidencial, como contraseñas de texto sin formato, en las variables de entorno.

      Add AI Application Version and Configuration

      Si la aplicación de IA seleccionada tiene varias versiones, puede agregar varias versiones y configurar una relación de tráfico. Puede utilizar el inicio gris para actualizar sin problemas la versión de la aplicación de IA.

      NOTA:

      Las especificaciones de cómputo libre no admiten el lanzamiento gris de varias versiones.

      Traffic Limit

      N/A

      Número máximo de veces que se puede acceder a un servicio en un segundo. Puede establecer este parámetro según sea necesario.

      Application Authentication

      Application

      Deshabilitada por defecto. Para habilitar esta función, consulte Acceso autenticado mediante una aplicación para obtener más detalles y establezca los parámetros según sea necesario.

      Figura 1 Establecer la información de la aplicación de IA.
  4. Después de confirmar la información introducida, complete la implementación del servicio como se le solicite. En general, los trabajos de implementación de servicios se ejecutan durante un período de tiempo, que puede ser de varios minutos o decenas de minutos, dependiendo de la cantidad de datos y recursos seleccionados.

    Después de implementar un servicio en tiempo real, se inicia inmediatamente. Durante la carrera, se le cobrará en función de los recursos seleccionados.During the running, you will be charged based on your selected resources.

    Puede ir a la lista de servicios en tiempo real para comprobar si se ha completado la implementación del servicio en tiempo real. En la lista de servicios en tiempo real, después de que el estado del servicio recién implementado cambie de Deploying a Running, el servicio se implementa correctamente.