Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.

Central de ajuda/ Cloud Container Engine/ Perguntas frequentes/ Nó/ Execução de nó/ Como corrigir falhas quando o driver de NVIDIA é usado para iniciar contêineres em nós de GPU?

Atualizado em 2025-05-23 GMT+08:00

Ver PDF

Como corrigir falhas quando o driver de NVIDIA é usado para iniciar contêineres em nós de GPU?

Ocorreu um evento de falha de agendamento de recursos em um nó de cluster?

Sintoma

Um nó está sendo executado corretamente e possui recursos de GPU. However, the following error information is displayed:

0/9 nodes are available: 9 insufficient nvidia.com/gpu

Análise

Verifique se o nó está conectado com o rótulo NVIDIA.
Verifique se o driver de NVIDIA está funcionando corretamente.
Faça logon no nó onde o complemento está sendo executado e visualize o log de instalação do driver no seguinte caminho:
```
/opt/cloud/cce/nvidia/nvidia_installer.log
```
Visualize logs de saída padrão do contêiner de NVIDIA.

Filtre o ID do contêiner executando o seguinte comando:
```
docker ps –a | grep nvidia
```
Exiba logs executando o seguinte comando:
```
docker logs Container ID
```