Como configurar um pod para usar a capacidade de aceleração de um nó de GPU?
Descrição do problema
Eu comprei um nó de GPU, mas a velocidade de operação ainda é lenta. Como configuro o pod para usar a capacidade de aceleração do nó da GPU?
Solução
Solução 1:
Recomendamos que você remova os taints não programáveis dos nós da GPU no cluster, para que o driver de plug-in da GPU possa ser instalado corretamente. Além disso, você precisa instalar o driver da GPU de uma versão posterior.
Se um contêiner não for implantado em um nó da GPU no cluster, você poderá configurar políticas de afinidade e anti-afinidade para impedir que o contêiner seja agendado para o nó da GPU.
Solução 2:
Recomendamos que você instale o driver da GPU de uma versão posterior e use o kubectl para atualizar a configuração do plug-in da GPU. Adicione a seguinte configuração:
tolerations: - operator: "Exists"
Depois que a configuração é adicionada, o driver de plug-in da GPU pode ser instalado corretamente no nó da GPU com um taint.