Importación de un metamodelo desde una imagen de contenedor
Para los motores de IA que no son compatibles con ModelArts puede importar los modelos que compila a ModelArts desde imágenes personalizadas.
Restricciones
- Para obtener más información sobre las especificaciones y la descripción de las imágenes personalizadas, véase Especificaciones de imagen personalizada para crear aplicaciones con IA.
- El archivo de configuración debe proporcionarse para un modelo que haya desarrollado y entrenado. El archivo debe cumplir con las especificaciones de ModelArts. Para más detalles, véase Especificaciones para editar un archivo de configuración de modelo. Una vez completada la escritura, cargue el archivo en el directorio de OBS especificado.
- Si el metamodelo es de una imagen de contenedor, asegúrese de que el tamaño del metamodelo cumpla con Restricciones sobre el tamaño de una imagen para importar una aplicación de IA.
Requisitos previos
El directorio de OBS seleccionado a usar y ModelArts están en la misma región.
Creación de una aplicación de IA
- Inicie sesión en la consola de gestión ModelArts y elija AI Application Management > AI Applications en el panel de navegación izquierdo. Se muestra la página AI Applications.
- Haga clic en Create en la esquina superior izquierda.
- En la página mostrada, establezca los parámetros.
- Establezca información básica sobre la aplicación de IA. Para obtener detalles sobre los parámetros, véase Tabla 1.
Tabla 1 Parámetros de la información básica de la aplicación de IA Parámetro
Descripción
Name
Nombre de la aplicación. El valor puede contener de 1 a 64 caracteres visibles. Solo se permiten letras, dígitos, guiones medios (-) y guiones bajos (_).
Version
Versión de la aplicación de IA a crear. Para la primera importación, el valor predeterminado es 0.0.1.
NOTA:Después de crear una aplicación de IA, puede crear las nuevas versiones con diferentes metamodelos para la optimización.
Description
Breve descripción de una aplicación de IA
- Seleccione el origen del metamodelo y establezca los parámetros relacionados. Establezca Meta Model Source en Container image. Para obtener detalles sobre los parámetros, véase Tabla 2.
Figura 1 Establecer una imagen contenedora como fuente del metamodelo
Tabla 2 Parámetros de la fuente del metamodelo Parámetro
Descripción
Container Image Path
Haga clic en para importar la imagen del modelo desde la imagen del contenedor. El modelo es del tipo Imagen y no es necesario usar swr_location en el archivo de configuración para especificar la ubicación de la imagen.
Para obtener detalles sobre la guía de operación y los requisitos para crear una imagen personalizada, véase Especificaciones de imagen personalizada para crear aplicaciones con IA.
NOTA:La imagen del modelo que seleccione se compartirá con el administrador del sistema, así que asegúrese de tener permiso para compartir la imagen (no se admiten imágenes compartidas con otras cuentas). Cuando se despliega un servicio, ModelArts despliega la imagen como un servicio de inferencia. Asegúrese de que la imagen se pueda iniciar correctamente y proporcione una API de inferencia.
Container API
Protocolo y número de puerto para iniciar una aplicación de IA
NOTA:El protocolo de solicitud predeterminado y el número de puerto proporcionado por ModelArts son HTTP y 8080, respectivamente. Establezcalos en función de la imagen personalizada real.
Image Replication
Indica si se debe copiar la imagen del modelo en la imagen del contenedor a ModelArts.
- Cuando esta función está deshabilitada, la imagen del modelo no se copia, las aplicaciones de IA se pueden crear rápidamente, pero modificar o eliminar imágenes en el directorio de origen de SWR puede afectar al despliegue del servicio.
- Cuando esta función está habilitada, se copia la imagen del modelo, las aplicaciones de IA no se pueden crear rápidamente, pero puede modificar o eliminar imágenes en el directorio de origen de SWR, ya que eso no afectaría al despliegue del servicio.
NOTA:Debe habilitar esta función si desea utilizar imágenes compartidas por otros usuarios. De lo contrario, las aplicaciones de IA no se crearán.
Health Check
Comprobación de estado en una aplicación de IA. Este parámetro es configurable solo cuando la API de comprobación de estado está configurada en la imagen personalizada. De lo contrario, el despliegue de la aplicación de IA fallará.
- Check Mode: seleccione HTTP request o Command.
- Health Check URL: Este parámetro se muestra cuando Check Mode se establece en HTTP request. Ingrese la URL de comprobación de estado. El valor predeterminado es /health.
- Health Check Command: Este parámetro se muestra cuando Check Mode se establece en Command. Ingrese el comando de comprobación de estado.
- Health Check Period: Ingrese un número entero entre 1 y 2147483647. La unidad es segundo.
- Delay(seconds): especifica el retraso para realizar la comprobación de estado después de iniciar la instancia. Ingrese un número entero entre 0 y 2147483647.
- Maximum Failures: Ingrese un número entero entre 1 y 2147483647. Durante el inicio del servicio, si el número de fallos de comprobación de estado consecutivos alcanza el valor especificado, el servicio será anormal. Durante la ejecución del servicio, si el número de fallos de comprobación de estado consecutivos alcanza el valor especificado, el servicio ingresará el estado de alarma.
NOTA:Si la comprobación de estado está configurada para una aplicación de IA, los servicios desplegados que utilizan esta aplicación de IA se detendrán 3 minutos después de recibir la instrucción de parada.
Descripción de la aplicación de AI
Proporcione las descripciones de aplicaciones de IA para ayudar a otros desarrolladores de aplicaciones de IA a comprender y usar mejor sus aplicaciones. Haga clic en Add AI Application Description y establezca Document name y URL. Puede agregar hasta tres descripciones de aplicaciones de IA.
Deployment Type
Seleccione los tipos de servicio que se pueden desplegar en la aplicación. Al desplegar un servicio, solo están disponibles los tipos de servicio seleccionados aquí. Por ejemplo, si solo selecciona Real-time services, solo puede deplegar la aplicación de IA como un servicio en tiempo real después de crearla.
Start command
Comando de inicio personalizable de un modelo
Apis
Cuando habilita esta función, puede editar las API de RESTful para definir los formatos de entrada y salida de aplicaciones de IA. Las API del modelo deben cumplir con las especificaciones de ModelArts. Para obtener más información, véase Especificaciones para editar un archivo de configuración de modelo. Para obtener detalles sobre el ejemplo de código, vea Ejemplo de código de parámetros de apis.
- Compruebe la información y haga clic en Next. Se crea la aplicación de IA.
En la lista de aplicaciones de IA, puede ver la aplicación de IA creada y su versión. Cuando el estado cambia a Normal, la aplicación de IA se crea correctamente. En esta página, puede realizar operaciones como la creación de nuevas versiones y el despliegue rápido de servicios.
- Establezca información básica sobre la aplicación de IA. Para obtener detalles sobre los parámetros, véase Tabla 1.
Procedimiento posterior
Despliegue de una aplicación de IA como servicio: En la lista de aplicaciones de IA, haga clic en el botón de opción a la izquierda del nombre de la aplicación de IA para mostrar la lista de versiones en la parte inferior de la página de lista. Busque la fila que contiene la versión de destino, haga clic en Deploy en la columna Operation para desplegar la aplicación de IA como un tipo de despliegue seleccionado durante la creación de la aplicación de IA.