¿Por qué el trabajo sigue en cola cuando los recursos son suficientes?
- Si se utiliza un grupo de recursos públicos, los recursos pueden ser utilizados por otros usuarios. Por favor, espere o encuentre soluciones en ¿Por qué un trabajo de entrenamiento siempre está en cola?.
- Si se utiliza un grupo de recursos dedicado, realice las siguientes operaciones:
- Compruebe si se están ejecutando otros trabajos (incluidos los trabajos de inferencia, los trabajos de entrenamiento y los trabajos de entorno de desarrollo) en el grupo de recursos dedicado.
En la página Dashboard, puede ir a la página de detalles de los trabajos o instancias en ejecución para comprobar si se utiliza el grupo de recursos dedicado. Puede detenerlos en función de sus necesidades para liberar recursos.
Figura 1 Panel
- Vaya a la página de detalles del grupo de recursos dedicado para comprobar si hay otros trabajos de cola.
En caso afirmativo, el nuevo trabajo debe estar en cola.
Figura 2 Trabajos de cola
- Compruebe si los recursos están fragmentados.
Por ejemplo, el clúster tiene dos nodos y hay cuatro tarjetas inactivas en cada nodo. Sin embargo, su trabajo requiere ocho tarjetas en un nodo. En este caso, los recursos inactivos no se pueden asignar a su trabajo.
- Compruebe si se están ejecutando otros trabajos (incluidos los trabajos de inferencia, los trabajos de entrenamiento y los trabajos de entorno de desarrollo) en el grupo de recursos dedicado.