¿Qué hago si los recursos son insuficientes cuando se despliega, inicia, actualiza o modifica un servicio en tiempo real?
Causa posible
Las especificaciones de instancia configuradas están más allá de las especificaciones proporcionadas por el grupo de recursos.
Solución
Cuando los recursos son insuficientes, ModelArts vuelve a intentarlo tres veces. Si se liberan recursos durante estos reintentos, el servicio se puede desplegar correctamente.
Si los recursos siguen siendo insuficientes después de tres reintentos, el despliegue de servicio falla. En este caso, realice las siguientes operaciones para resolver este problema:
- Si el servicio se va a desplegar en un grupo de recursos públicos, espere hasta que otros usuarios liberen recursos.
- Si el servicio se va a desplegar en un grupo de recursos dedicado, seleccione especificaciones de contenedor inferiores o especificaciones personalizadas para desplegar el servicio con la premisa de que se cumplen los requisitos del modelo.
- Amplíe la capacidad del grupo de recursos actual antes de desplegar el servicio.
Servicios en tiempo real Preguntas frecuentes
- ¿Qué hago si se produce un conflicto en el paquete de dependencia de Python de un script de predicción personalizado cuando despliego un servio en tiempo real?
- ¿Cómo acelero la predicción en tiempo real?
- ¿Cuál es el formato de una API de servicio en tiempo real?
- ¿Cómo puedo comprobar si un modelo causa un error cuando se ejecuta un servicio en tiempo real pero la predicción ha fallado?
- ¿Cómo relleno el encabezado de solicitud y el cuerpo de solicitud de una solicitud de inferencia cuando se está ejecutando un servicio en tiempo real?
- ¿Por qué no puedo acceder a la dirección de solicitud de inferencia obtenida desde el cliente iniciador?
- ¿Qué hago si no se extrae una imagen cuando se despliega, inicia, actualiza o modifica un servicio en tiempo real?
- ¿Qué hago si una imagen se reinicia repetidamente cuando se despliega, inicia, actualiza o modifica un servicio en tiempo real?
- ¿Qué hago si falló la comprobación del estado de un contenedor cuando se despliega, inicia, actualiza o modifica un servicio en tiempo real?
- ¿Qué hago si los recursos son insuficientes cuando se despliega, inicia, actualiza o modifica un servicio en tiempo real?
- ¿Qué hago si falló el despliegue de un servicio debido a una cuota insuficiente?
- ¿Por qué falló el despliegue de mi servicio con el tiempo de espera deel despliegue adecuado configurado?
Comentarios
¿Le pareció útil esta página?
Deje algún comentariomore