Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.
Central de ajuda> Elastic Cloud Server> Guia de usuário> Instâncias> (Opcional) Instalação de um driver e um kit de ferramentas> Instalação de um driver Tesla e um kit de ferramentas CUDA em um ECS acelerado por GPU
Atualizado em 2022-11-18 GMT+08:00

Instalação de um driver Tesla e um kit de ferramentas CUDA em um ECS acelerado por GPU

Cenários

Antes de usar um ECS de acelerador de GPU, certifique-se de que o driver Tesla desejado e o kit de ferramentas CUDA foram instalados no ECS para aceleração de computação.

  • Um ECS acelerado por computação (série P) criado usando uma imagem pública teve um driver Tesla de uma versão especificada instalado por padrão.
  • Depois que um ECS de acelerador de GPU é criado usando uma imagem privada, ele deve ter um driver Tesla instalado. Caso contrário, a aceleração da computação não terá efeito.

Esta seção descreve como instalar um driver Tesla e um kit de ferramentas CUDA em uma ECS de acelerador de GPU.

Notas

  • O ECS alvo tem um EIP vinculado.
  • O driver Tesla e o kit de ferramentas CUDA não foram instalados no ECS.
  • Faça o download do kit de ferramentas CUDA no site oficial da NVIDIA e instale-o. Um driver Tesla correspondente à versão CUDA será instalado automaticamente. No entanto, se houver requisitos específicos ou dependências na versão do driver Tesla, baixe o driver Tesla correspondente no site oficial da NVIDIA primeiro e instale o driver antes de instalar o kit de ferramentas CUDA.
  • Se um driver Tesla tiver sido instalado no ECS, verifique a versão do driver. Antes de instalar uma nova versão do driver, desinstale o driver Tesla original para evitar uma falha de instalação devido a conflitos de driver.

Instalando um driver Tesla em um ECS de Linux

O seguinte usa o Ubuntu 16.04 64bit como um exemplo para descrever como instalar o driver Tesla correspondente ao CUDA 10.1 em um ECS acelerado por GPU.

A versão do kernel do Linux é compatível com a versão do driver. Se a instalação do driver falhar, verifique o log de instalação do driver, que geralmente é armazenado em /var/log/nvidia-installer.log. Se o log mostrar que a falha foi causada por um erro de compilação de driver, por exemplo, a configuração do parâmetro get_user_pages está incorreta, a versão do kernel é incompatível com a versão do driver. Nesse caso, selecione a versão desejada do kernel e a versão do driver e reinstale-os. Recomenda-se que o tempo de lançamento da versão do kernel e da versão do driver seja o mesmo.

  1. Faça login no ECS.
  2. Atualize o software do sistema baseado no sistema operacional.
    • O Ubuntu

      Actualizar a fonte de instalação do software: apt-get -y update

      Instale os programas necessários: apt-get install gcc g++ make

    • CentOS

      Actualize a fonte de instalação do software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*

      Instale o programa desejado: yum install -y kernel-devel-`uname -r` gcc gcc-c++

  3. Faça o download do pacote de driver NVIDIA.

    Selecione uma versão do driver em NVIDIA Driver Downloads com base no tipo de ECS. Clique em SEARCH.

    Figura 1 Selecionando uma versão do driver NVIDIA
  4. Selecione uma versão do driver conforme necessário. O seguinte usa Tesla 418.67 como um exemplo.
    Figura 2 Selecionando uma versão do driver
  5. Clique no driver a ser baixado. Na página TESLA DRIVER FOR LINUX X64 exibida, clique em DOWNLOAD.
  6. Copie o link de download.
    Figura 3 Copiando o link de download
  7. Execute o seguinte comando no ECS para baixar o driver:

    wget Copied link

    Por exemplo, wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run

    Figura 4 Obtenção do pacote de instalação
  8. Execute o seguinte comando para desinstalar o driver PV:

    sh NVIDIA-Linux-x86_64-418.67.run

  9. (Opcional) Se as seguintes informações forem exibidas após a execução do comando para instalar o driver, desative o driver Nouveau.
    Figura 5 Desativando o driver Nouveau
    1. Execute o seguinte comando para verificar se o driver Nouveau foi instalado:

      lsmod | grep nouveau

      • Se a saída do comando contiver informações sobre o driver Nouveau, o driver Nouveau foi instalado e deve ser desabilitado. Então vá para passo 9.b.
      • Se a saída do comando não contiver informações sobre o driver Nouveau, o driver Nouveau foi desabilitado. Então vá para passo 9.d.
    2. Edite o arquivo blacklist.conf.

      Se o arquivo /etc/modprobe.d/blacklist.conf não estiver disponível, crie-o.

      vi /etc/modprobe.d/blacklist.conf

      Adicione a seguinte instrução ao final do arquivo:

      blacklist nouveau
      options nouveau modeset=0
    1. Execute o seguinte comando para fazer backup e criar um aplicativo initramfs:
      • Ubuntu

        sudo update-initramfs -u

      • CentOS:

        mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

        dracut -v /boot/initramfs-$(uname -r).img $(uname -r)

    1. Reinicie o ECS:

      reboot

  10. Selecione OK por três vezes consecutivas, conforme solicitado, para concluir a instalação do driver.
    Figura 6 Concluindo a instalação do driver NVIDIA
  11. Execute o seguinte comando para definir systemd:

    systemctl set-default multi-user.target

  12. Execute o comando de reboot para reiniciar o ECS.
  13. Faça login no ECS e execute o comando nvidia-smi. Se a saída do comando contiver a versão do driver instalado, o driver foi instalado.
    Figura 7 Visualizando a versão do driver NVIDIA

Instalando um driver Tesla em um ECS de Windows

A seguir, o Windows Server 2016 Standard 64bit é usado como exemplo para descrever como instalar um driver Tesla em um ECS acelerado por GPU.

  1. Faça login no ECS.
  2. Faça o download do pacote de driver NVIDIA.

    Selecione uma versão do driver em NVIDIA Driver Downloads com base no tipo de ECS.

    Figura 8 Selecionando um tipo de driver (Windows)
  3. Selecione uma versão do driver conforme necessário. O seguinte usa Tesla 425.25 como um exemplo.
    Figura 9 Selecionando uma versão do driver (Windows)
  4. Clique no driver a ser baixado. Na página TESLA DRIVER FOR WINDOWS exibida, clique em DOWNLOAD.
  5. Clique em Agree & Download para baixar o pacote de instalação.
    Figura 10 Baixando o pacote de instalação do driver
  6. Clique duas vezes no driver e clique em Run.
    Figura 11 Executando o programa de instalação do driver NVIDIA
  7. Selecione um caminho de instalação e clique em OK.
    Figura 12 Selecionando um caminho de instalação
  8. Instale o programa NVIDIA conforme solicitado.
    Figura 13 Concluindo a instalação do driver
  9. Reinicie o ECS.
  10. Verifique se o driver NVIDIA foi instalado.
    1. Alterne para Device Manager e clique em Display adapters.
      Figura 14 Adaptadores de exibição
    1. Abra a window cmd no ECS e execute os seguintes comandos:

      cd C:\Program Files\NVIDIA Corporation\NVSMI

      nvidia-smi

      Se a saída do comando contiver a versão do driver instalado, o driver foi instalado.

      Figura 15 Visualizando a versão do driver NVIDIA

Instalando o CUDA Toolkit em um ECS Linux

O seguinte usa o Ubuntu 16.04 64bit como um exemplo para descrever como instalar o kit de ferramentas CUDA 10.1 em um ECS acelerado por GPU.

  1. Faça login no ECS.
  2. Atualize o software do sistema baseado no sistema operacional.
    • O Ubuntu

      Actualizar a fonte de instalação do software: apt-get -y update

      Instale os programas necessários: apt-get install gcc g++ make

    • CentOS

      Actualize a fonte de instalação do software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*

      Instale o programa desejado: yum install -y kernel-devel-`uname -r` gcc gcc-c++

  3. Na página de download do CUDA, defina os parâmetros de acordo com as informações mostradas em Obtenção de um driver Tesla e um kit de ferramentas CUDA.
    Figura 16 Selecionando uma versão do CUDA
  4. Encontre o link para baixar o CUDA 10.1 e copie o link.
    Figura 17 Copiando o link para baixar o CUDA
  1. Execute o seguinte comando no ECS para baixar o CUDA:

    wget Copied link

    Por exemplo, wget https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.105_418.39_linux.run

    Figura 18 Baixando CUDA
  1. Instale o CUDA.
    Siga as instruções fornecidas no site oficial da NVIDIA.
    Figura 19 Instalação do CUDA
  2. Execute o seguinte comando para instalar o CUDA:

    sh cuda_10.1.243_418.87.00_linux.run

  3. Selecione accept na página de instalação e pressione Enter.
    Figura 20 Instalando o CUDA_1
  4. Selecione Install e pressione Enter para iniciar a instalação.
    Figura 21 Instalação do CUDA_2
    Figura 22 Concluindo a instalação
  5. Execute o seguinte comando para alternar para /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery:

    cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery

  6. Execute o comando make para compilar automaticamente o programa deviceQuery.
  7. Execute o seguinte comando para verificar se o CUDA foi instalado:

    ./deviceQuery

    Se a saída do comando contiver a versão CUDA, o CUDA foi instalado.

    Figura 23 deviceQuery saída comum
  8. Verifique a versão do CUDA.

    /usr/local/cuda/bin/nvcc -V

    Figura 24 Verificando a versão do CUDA
  9. Execute o seguinte comando para ativar o modo persistente:

    sudo nvidia-smi -pm 1

    A ativação do modo persistente otimiza o desempenho da GPU nos ECS Linux.

Instalando o CUDA Toolkit em um ECS Windows

A seguir, o Windows Server 2016 Standard 64bit é usado como exemplo para descrever como instalar o kit de ferramentas CUDA 10.1 em um ECS acelerado por GPU.

  1. Faça login no ECS.
  2. Na página de download do CUDA, defina os parâmetros de acordo com as informações mostradas em Baixando um Kit de ferramentas CUDA.
    Figura 25 Selecionando uma versão do CUDA
  3. Encontre o link para baixar o CUDA 10.1.
    Figura 26 Encontrando o link para baixar o CUDA
  4. Clique em Download para baixar o kit de ferramentas CUDA.
  5. Clique duas vezes no arquivo de instalação e clique em Run para instalar o kit de ferramentas CUDA.
    Figura 27 Instalação do CUDA
  6. Na página CUDA Setup Package, selecione um caminho de instalação e clique em OK.
    Figura 28 Selecionando um caminho de instalação
  7. Instale o kit de ferramentas CUDA conforme solicitado.
    Figura 29 Concluindo a instalação
  1. Verifique se o CUDA foi instalado

    Abra a janela do cmd e execute o seguinte comando:

    nvcc -V

    Se a saída do comando contiver a versão CUDA, o CUDA foi instalado.

    Figura 30 Instalação bem-sucedida