¿Por qué el trabajo sigue en cola cuando los recursos son suficientes?
- Si se utiliza un grupo de recursos públicos, los recursos pueden ser utilizados por otros usuarios. Por favor, espere o encuentre soluciones en ¿Por qué un trabajo de entrenamiento siempre está en cola?.
- Si se utiliza un grupo de recursos dedicado, realice las siguientes operaciones:
- Compruebe si se están ejecutando otros trabajos (incluidos los trabajos de inferencia, los trabajos de entrenamiento y los trabajos de entorno de desarrollo) en el grupo de recursos dedicado.
En la página Dashboard, puede ir a la página de detalles de los trabajos o instancias en ejecución para comprobar si se utiliza el grupo de recursos dedicado. Puede detenerlos en función de sus necesidades para liberar recursos.
Figura 1 Panel - Vaya a la página de detalles del grupo de recursos dedicado para comprobar si hay otros trabajos de cola.
En caso afirmativo, el nuevo trabajo debe estar en cola.
Figura 2 Trabajos de cola - Compruebe si los recursos están fragmentados.
Por ejemplo, el clúster tiene dos nodos y hay cuatro tarjetas inactivas en cada nodo. Sin embargo, su trabajo requiere ocho tarjetas en un nodo. En este caso, los recursos inactivos no se pueden asignar a su trabajo.
- Compruebe si se están ejecutando otros trabajos (incluidos los trabajos de inferencia, los trabajos de entrenamiento y los trabajos de entorno de desarrollo) en el grupo de recursos dedicado.
Cuestiones generales Preguntas frecuentes
- ¿Qué es ModelArts?
- ¿Cuáles son las relaciones entre ModelArts y otros servicios?
- ¿Cuáles son las diferencias entre ModelArts y DLS?
- ¿Cómo puedo comprar o activar ModelArts?
- ¿Qué chips de Ascend son compatibles?
- ¿Cómo obtengo una clave de acceso?
- ¿Cómo subo datos a OBS?
- What Do I Do If the System Displays a Message Indicating that the AK/SK Pair Is Unavailable?
- ¿Qué debo hacer si se muestra un mensaje que indica permisos insuficientes cuando utilizo ModelArts?
- ¿Cómo uso ModelArts para entrenar modelos basados en datos estructurados?
- ¿Qué son las Regiones y las AZ?
- ¿Cómo puedo comprobar si ModelArts y un bucket de OBS están en la misma región?
- ¿Cómo puedo ver todos los archivos almacenados en OBS de ModelArts?
- ¿Por qué se muestra el error: 403 Forbidden cuando realizo operaciones en OBS?
- ¿Dónde se almacenan los conjuntos de datos de ModelArts en un contenedor?
- ¿Qué marcos de IA admite ModelArts?
- ¿Cuáles son las funciones del entrenamiento y la inferencia de ModelArts?
- ¿Cómo puedo ver un ID de cuenta y un ID de usuario de IAM?
- ¿Puede la identificación asistida por IA de ModelArts identificar una etiqueta específica?
- ¿Cómo utiliza ModelArts las etiquetas para gestionar recursos por grupo?
- ¿Cómo puedo ver todas las métricas de supervisión de ModelArts?
- ¿Por qué el trabajo sigue en cola cuando los recursos son suficientes?
Comentarios
¿Le pareció útil esta página?
Deje algún comentariomore