Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2024-09-25 GMT+08:00

Importación de un metamodelo desde una imagen de contenedor

Para los motores de IA que no son compatibles con ModelArts puede importar los modelos que compila a ModelArts desde imágenes personalizadas.

Restricciones

Requisitos previos

El directorio de OBS seleccionado a usar y ModelArts están en la misma región.

Creación de una aplicación de IA

  1. Inicie sesión en la consola de gestión ModelArts y elija AI Application Management > AI Applications en el panel de navegación izquierdo. Se muestra la página AI Applications.
  2. Haga clic en Create en la esquina superior izquierda.
  3. En la página mostrada, establezca los parámetros.
    1. Establezca información básica sobre la aplicación de IA. Para obtener detalles sobre los parámetros, véase Tabla 1.
      Tabla 1 Parámetros de la información básica de la aplicación de IA

      Parámetro

      Descripción

      Name

      Nombre de la aplicación. El valor puede contener de 1 a 64 caracteres visibles. Solo se permiten letras, dígitos, guiones medios (-) y guiones bajos (_).

      Version

      Versión de la aplicación de IA a crear. Para la primera importación, el valor predeterminado es 0.0.1.

      NOTA:

      Después de crear una aplicación de IA, puede crear las nuevas versiones con diferentes metamodelos para la optimización.

      Description

      Breve descripción de una aplicación de IA

    2. Seleccione el origen del metamodelo y establezca los parámetros relacionados. Establezca Meta Model Source en Container image. Para obtener detalles sobre los parámetros, véase Tabla 2.
      Figura 1 Establecer una imagen contenedora como fuente del metamodelo
      Tabla 2 Parámetros de la fuente del metamodelo

      Parámetro

      Descripción

      Container Image Path

      Haga clic en para importar la imagen del modelo desde la imagen del contenedor. El modelo es del tipo Imagen y no es necesario usar swr_location en el archivo de configuración para especificar la ubicación de la imagen.

      Para obtener detalles sobre la guía de operación y los requisitos para crear una imagen personalizada, véase Especificaciones de imagen personalizada para crear aplicaciones con IA.

      NOTA:

      La imagen del modelo que seleccione se compartirá con el administrador del sistema, así que asegúrese de tener permiso para compartir la imagen (no se admiten imágenes compartidas con otras cuentas). Cuando se despliega un servicio, ModelArts despliega la imagen como un servicio de inferencia. Asegúrese de que la imagen se pueda iniciar correctamente y proporcione una API de inferencia.

      Container API

      Protocolo y número de puerto para iniciar una aplicación de IA

      NOTA:

      El protocolo de solicitud predeterminado y el número de puerto proporcionado por ModelArts son HTTP y 8080, respectivamente. Establezcalos en función de la imagen personalizada real.

      Image Replication

      Indica si se debe copiar la imagen del modelo en la imagen del contenedor a ModelArts.

      • Cuando esta función está deshabilitada, la imagen del modelo no se copia, las aplicaciones de IA se pueden crear rápidamente, pero modificar o eliminar imágenes en el directorio de origen de SWR puede afectar al despliegue del servicio.
      • Cuando esta función está habilitada, se copia la imagen del modelo, las aplicaciones de IA no se pueden crear rápidamente, pero puede modificar o eliminar imágenes en el directorio de origen de SWR, ya que eso no afectaría al despliegue del servicio.
      NOTA:

      Debe habilitar esta función si desea utilizar imágenes compartidas por otros usuarios. De lo contrario, las aplicaciones de IA no se crearán.

      Health Check

      Comprobación de estado en una aplicación de IA. Este parámetro es configurable solo cuando la API de comprobación de estado está configurada en la imagen personalizada. De lo contrario, el despliegue de la aplicación de IA fallará.

      • Check Mode: seleccione HTTP request o Command.
      • Health Check URL: Este parámetro se muestra cuando Check Mode se establece en HTTP request. Ingrese la URL de comprobación de estado. El valor predeterminado es /health.
      • Health Check Command: Este parámetro se muestra cuando Check Mode se establece en Command. Ingrese el comando de comprobación de estado.
      • Health Check Period: Ingrese un número entero entre 1 y 2147483647. La unidad es segundo.
      • Delay(seconds): especifica el retraso para realizar la comprobación de estado después de iniciar la instancia. Ingrese un número entero entre 0 y 2147483647.
      • Maximum Failures: Ingrese un número entero entre 1 y 2147483647. Durante el inicio del servicio, si el número de fallos de comprobación de estado consecutivos alcanza el valor especificado, el servicio será anormal. Durante la ejecución del servicio, si el número de fallos de comprobación de estado consecutivos alcanza el valor especificado, el servicio ingresará el estado de alarma.
      NOTA:

      Si la comprobación de estado está configurada para una aplicación de IA, los servicios desplegados que utilizan esta aplicación de IA se detendrán 3 minutos después de recibir la instrucción de parada.

      Descripción de la aplicación de AI

      Proporcione las descripciones de aplicaciones de IA para ayudar a otros desarrolladores de aplicaciones de IA a comprender y usar mejor sus aplicaciones. Haga clic en Add AI Application Description y establezca Document name y URL. Puede agregar hasta tres descripciones de aplicaciones de IA.

      Deployment Type

      Seleccione los tipos de servicio que se pueden desplegar en la aplicación. Al desplegar un servicio, solo están disponibles los tipos de servicio seleccionados aquí. Por ejemplo, si solo selecciona Real-time services, solo puede deplegar la aplicación de IA como un servicio en tiempo real después de crearla.

      Start command

      Comando de inicio personalizable de un modelo

      Apis

      Cuando habilita esta función, puede editar las API de RESTful para definir los formatos de entrada y salida de aplicaciones de IA. Las API del modelo deben cumplir con las especificaciones de ModelArts. Para obtener más información, véase Especificaciones para editar un archivo de configuración de modelo. Para obtener detalles sobre el ejemplo de código, vea Ejemplo de código de parámetros de apis.

    3. Compruebe la información y haga clic en Next. Se crea la aplicación de IA.

      En la lista de aplicaciones de IA, puede ver la aplicación de IA creada y su versión. Cuando el estado cambia a Normal, la aplicación de IA se crea correctamente. En esta página, puede realizar operaciones como la creación de nuevas versiones y el despliegue rápido de servicios.

Procedimiento posterior

Despliegue de una aplicación de IA como servicio: En la lista de aplicaciones de IA, haga clic en el botón de opción a la izquierda del nombre de la aplicación de IA para mostrar la lista de versiones en la parte inferior de la página de lista. Busque la fila que contiene la versión de destino, haga clic en Deploy en la columna Operation para desplegar la aplicación de IA como un tipo de despliegue seleccionado durante la creación de la aplicación de IA.