¿Cómo se ponen en cola los trabajos de entrenamiento?
El primero en entrar, el primero en salir (FIFO) se aplica a los trabajos de entrenamiento. Los trabajos posteriores solo se pueden ejecutar después de que se haya completado el trabajo anterior. Esto puede conducir a la inanición de trabajos pequeños.
![](https://support.huaweicloud.com/intl/es-us/modelarts_faq/public_sys-resources/note_3.0-es-us.png)
La falta de trabajo es la siguiente: Por ejemplo, un trabajo de entrenamiento de 64 tarjetas está en cola, y un trabajo de entrenamiento de 1 tarjeta sigue al de 64 tarjetas. El trabajo de entrenamiento de 1 tarjeta solo se puede ejecutar después de que los recursos de 64 tarjetas estén inactivos. Incluso si los recursos de 30 tarjetas están disponibles, el trabajo de entrenamiento de 1 tarjeta no se puede ejecutar.
Grupos de recursos Preguntas frecuentes
- ¿Puedo usar ECS para crear un grupo de recursos dedicado para ModelArts?
- ¿Puedo desplegar varios servicios en un nodo de grupo de recursos dedicado?
- ¿Cómo se factura un nodo recién agregado a un grupo de recursos dedicado?
- ¿Cuáles son las diferencias entre un grupo de recursos públicos y un grupo de recursos dedicado?
- How Do I Log In to a Dedicated Resource Pool Node Through SSH?
- ¿Cómo se ponen en cola los trabajos de entrenamiento?
- ¿Qué hago si los recursos son insuficientes para mirar un nuevo servicio en tiempo real después de detener un servicio en tiempo real en un grupo de recursos dedicado?
- ¿Se puede utilizar un grupo de recursos público para la conexión de red entre ModelArts y el servicio de autenticación para ejecutar algoritmos?
- ¿Por qué un grupo de recursos dedicado que no se crea todavía se muestra en la consola después de que se elimina?
- ¿Cómo agrego una interconexión de VPC entre un grupo de recursos dedicado y un SFS?
- ¿Qué debo hacer si un trabajo de entrenamiento siempre está esperando en una cola de recursos?
Comentarios
¿Le pareció útil esta página?
Deje algún comentariomore