Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda>
ModelArts>
Preguntas frecuentes>
Despliegue del servicio>
Servicios en tiempo real>
¿Cómo acelero la predicción en tiempo real?
Actualización más reciente 2023-10-09 GMT+08:00
¿Cómo acelero la predicción en tiempo real?
- Al desplegar un servicio en tiempo real, seleccione los nodos de procesamiento con especificaciones más altas para un mejor rendimiento. Por ejemplo, use GPU en lugar de CPU.
- Cuando despliegue un servicio en tiempo real, agregue el número de nodos informáticos.
Si establece Compute Nodes en 1, se utilizará el cómputo independiente. Si establece Compute Nodes en un valor mayor que 1, se utiliza el cómputo distribuido. Configure este parámetro en función de los requisitos del sitio.
- La velocidad de inferencia está estrechamente relacionada con la complejidad del modelo. Trate de optimizar el modelo para una predicción más rápida.
Tema principal: Servicios en tiempo real
Servicios en tiempo real Preguntas frecuentes
- ¿Qué hago si se produce un conflicto en el paquete de dependencia de Python de un script de predicción personalizado cuando despliego un servio en tiempo real?
- ¿Cómo acelero la predicción en tiempo real?
- ¿Cuál es el formato de una API de servicio en tiempo real?
- ¿Cómo puedo comprobar si un modelo causa un error cuando se ejecuta un servicio en tiempo real pero la predicción ha fallado?
- ¿Cómo relleno el encabezado de solicitud y el cuerpo de solicitud de una solicitud de inferencia cuando se está ejecutando un servicio en tiempo real?
- ¿Por qué no puedo acceder a la dirección de solicitud de inferencia obtenida desde el cliente iniciador?
- ¿Qué hago si no se extrae una imagen cuando se despliega, inicia, actualiza o modifica un servicio en tiempo real?
- ¿Qué hago si una imagen se reinicia repetidamente cuando se despliega, inicia, actualiza o modifica un servicio en tiempo real?
- ¿Qué hago si falló la comprobación del estado de un contenedor cuando se despliega, inicia, actualiza o modifica un servicio en tiempo real?
- ¿Qué hago si los recursos son insuficientes cuando se despliega, inicia, actualiza o modifica un servicio en tiempo real?
- ¿Qué hago si falló el despliegue de un servicio debido a una cuota insuficiente?
- ¿Por qué falló el despliegue de mi servicio con el tiempo de espera deel despliegue adecuado configurado?
Comentarios
¿Le pareció útil esta página?
Deje algún comentario
Muchas gracias por sus comentarios. Seguiremos trabajando para mejorar la documentación.
El sistema está ocupado. Vuelva a intentarlo más tarde.
more