Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.

Centro de ayuda/ ModelArts/ Preguntas frecuentes/ Despliegue del servicio/ Servicios en tiempo real/ ¿Cómo acelero la predicción en tiempo real?

Actualización más reciente 2025-12-16 GMT+08:00

Ver PDF

¿Cómo acelero la predicción en tiempo real?

Al desplegar un servicio en tiempo real, seleccione los nodos de procesamiento con especificaciones más altas para un mejor rendimiento. Por ejemplo, use GPU en lugar de CPU.
Cuando despliegue un servicio en tiempo real, agregue el número de nodos informáticos.
Si establece Compute Nodes en 1, se utilizará el cómputo independiente. Si establece Compute Nodes en un valor mayor que 1, se utiliza el cómputo distribuido. Configure este parámetro en función de los requisitos del sitio.
La velocidad de inferencia está estrechamente relacionada con la complejidad del modelo. Trate de optimizar el modelo para una predicción más rápida.
ModelArts ofrece gestión de versiones de modelo para facilitar el seguimiento de fuentes y el ajuste repetido del modelo.
Figura 1 Despliegue de un servicio en tiempo real

Tema principal: Servicios en tiempo real

Comentarios

¿Le pareció útil esta página?

Sí No

Deje algún comentario

Muchas gracias por sus comentarios. Seguiremos trabajando para mejorar la documentación.

El sistema está ocupado. Vuelva a intentarlo más tarde.