Importación de un metamodelo desde OBS
En escenarios donde se utilizan marcos de trabajo de uso frecuente para el desarrollo y el entrenamiento de modelos, puede importar el modelo a ModelArts y usarlo para crear una aplicación de IA para la gestión unificada.
Restricciones
- El modelo importado para crear una aplicación de IA, código de inferencia y archivo de configuración debe cumplir con los requisitos de ModelArts. Para obtener más información, véase Introducción a las especificaciones del paquete modelo, Especificaciones para editar un archivo de configuración de modelo y Especificaciones para escribir el código de inferencia de modelo.
- Si el metamodelo es de una imagen de contenedor, asegúrese de que el tamaño del metamodelo cumple con Restricciones sobre el tamaño de una imagen para importar una aplicación de IA.
Requisitos previos
- El modelo ha sido desarrollado y entrenado, y ModelArts admite el tipo y la versión del motor de IA utilizado. Para más detalles, véase Motores de IA compatibles para la inferencia de ModelArts.
- El paquete de modelo entrenado, el código de inferencia y el archivo de configuración se han subido a OBS.
- El directorio de OBS seleccionado a usar y ModelArts están en la misma región.
Creación de una aplicación de IA
- Inicie sesión en la consola de gestión ModelArts y elija AI Application Management > AI Applications en el panel de navegación izquierdo. Se muestra la página AI Applications.
- Haga clic en Create en la esquina superior izquierda.
- En la página mostrada, establezca los parámetros.
- Establezca información básica sobre la aplicación de IA. Para obtener detalles sobre los parámetros, véase Tabla 1.
Tabla 1 Parámetros de la información básica de la aplicación de IA Parámetro
Descripción
Name
Nombre de la aplicación. El valor puede contener de 1 a 64 caracteres visibles. Solo se permiten letras, dígitos, guiones medios (-) y guiones bajos (_).
Version
Versión de la aplicación de IA a crear. Para la primera importación, el valor predeterminado es 0.0.1.
NOTA:Después de crear una aplicación de IA, puede crear las nuevas versiones con diferentes metamodelos para la optimización.
Description
Breve descripción de una aplicación de IA
- Seleccione el origen del metamodelo y establezca los parámetros relacionados. Establezca Meta Model Source en OBS. Para obtener detalles sobre los parámetros, véase Tabla 2.
Para el metamodelo importado de OBS, edite el código de inferencia y los archivos de configuración siguiendo las especificaciones del paquete de model y coloque el código de inferencia y los archivos de configuración en la carpeta model que almacena el metamodelo. Si el directorio seleccionado no cumple con las especificaciones del paquete modelo, no se puede crear la aplicación de IA.
Tabla 2 Parámetros de la fuente del metamodelo Parámetro
Descripción
Meta Model
Ruta de OBS para almacenar el metamodelo.
La ruta de OBS no puede contener espacios. De lo contrario, no se puede crear la aplicación de IA.
AI Engine
El motor de IA se asocia automáticamente con la ruta de almacenamiento del metamodelo que seleccione.
Si AI Engine se establece en Custom, debe especificar el protocolo y el número de puerto de Container API para iniciar el modelo. El protocolo de solicitud debe ser HTTPS y el número de puerto debe ser 8080.
Health Check
Comprobación de estado de un modelo. Después de seleccionar un motor de IA que admita la comprobación de estado y el entorno de tiempo de ejecución, se muestra este parámetro. Cuando AI Engine se establece en Custom debe configurar la comprobación de estado en la imagen. De lo contrario, el despliegue del servicio fallará.- Check Mode: seleccione HTTP request o Command.
Cuando se utiliza un motor personalizado, puede seleccionar HTTP request o Command.
Cuando se utiliza un motor no personalizado, solo se puede seleccionar HTTP request.
- Health Check URL: Este parámetro se muestra cuando Check Mode se establece en HTTP request. Ingrese la URL de comprobación de estado. El valor predeterminado es /health.
- Health Check Command: Este parámetro se muestra cuando Check Mode se establece en Command. Ingrese el comando de comprobación de estado.
- Health Check Period: Ingrese un número entero entre 1 y 2147483647. La unidad es segundo.
- Delay( seconds ): especifica el retraso para realizar la comprobación de estado después de iniciar la instancia. Ingrese un número entero entre 0 y 2147483647.
- Maximum Failures: Ingrese un número entero entre 1 y 2147483647. Durante el inicio del servicio, si el número de fallos de comprobación de estado consecutivos alcanza el valor especificado, el servicio será anormal. Durante la ejecución del servicio, si el número de fallos de comprobación de estado consecutivos alcanza el valor especificado, el servicio ingresará el estado de alarma.
NOTA:Para usar un motor personalizado para crear una aplicación de IA, asegúrese de que el motor personalizado cumpla con las especificaciones para los motores personalizados. Para obtener más información, véase Creación de una aplicación de IA con un motor personalizado.
Si la comprobación de estado está configurada para una aplicación de IA, los servicios desplegados que utilizan esta aplicación de IA se detendrán 3 minutos después de recibir la instrucción de parada.
Dynamic Loading
Rápidamente despliegue y actualización de modelo. Si se selecciona, los archivos de modelo y las dependencias en tiempo de ejecución solo se extraen durante un despliegue real. Habilite esta función si un archivo de modelo singular tiene más de 5 GB.
Runtime Dependency
Enumere las dependencias del modelo seleccionado en el entorno. Por ejemplo, si se utiliza tensorflow y el método de instalación es pip, la versión debe ser 1.8.0 o posterior.
AI Application Description
Proporcione las descripciones de aplicaciones de IA para ayudar a otros desarrolladores de aplicaciones de IA a comprender y usar mejor sus aplicaciones. Haga clic en Add AI Application Description y establezca Document name y URL. Puede agregar hasta tres descripciones de aplicaciones de IA.
Configuration File
De forma predeterminada, el sistema asocia el archivo de configuración almacenado en OBS. Después de habilitar esta función, puede ver y editar el archivo de configuración del modelo.
NOTA:Esta función debe ser puesta fuera de línea. Luego, puede modificar la configuración del modelo configurando AI Engine, Runtime Dependency y Apis.
Deployment Type
Seleccione los tipos de servicio que se pueden desplegar en la aplicación. Al desplegar un servicio, solo están disponibles los tipos de servicio seleccionados aquí. Por ejemplo, si solo selecciona Real-time services aquí, solo podrá desplegar la aplicación de IA como servicio en tiempo real después de crearla.
API Configuration
Después de habilitar esta función, puede editar las API de RESTful para definir los formatos de entrada y salida de una aplicación de IA. Las API del modelo deben cumplir con las especificaciones de ModelArts. Para obtener más información, véase Especificaciones para editar un archivo de configuración de modelo. Para obtener detalles sobre el ejemplo de código, vea Ejemplo de código de parámetros de apis.
- Check Mode: seleccione HTTP request o Command.
- Verifique la información y haga clic en Create now. Se crea la aplicación de IA.
En la lista de aplicaciones de IA, puede ver la aplicación de IA creada y su versión. Cuando el estado cambia a Normal, la aplicación de IA se crea correctamente. En esta página, puede realizar operaciones como la creación de nuevas versiones y el despliegue rápido de servicios.
- Establezca información básica sobre la aplicación de IA. Para obtener detalles sobre los parámetros, véase Tabla 1.
Procedimiento posterior
Despliegue de una aplicación de IA como servicio: En la lista de aplicaciones de IA, haga clic en el botón de opción a la izquierda del nombre de la aplicación de IA para mostrar la lista de versiones en la parte inferior de la página de lista. Busque la fila que contiene la versión de destino, haga clic en Deploy en la columna Operation para desplegar la aplicación de IA como un tipo de despliegue seleccionado durante la creación de la aplicación de IA.