Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.
Central de ajuda/ Bare Metal Server/ Guia de usuário/ Instância/ Instalação de drivers e kits de ferramentas/ Instalação do driver da GPU NVIDIA e o kit de ferramentas CUDA em um BMS P3
Atualizado em 2023-05-09 GMT+08:00

Instalação do driver da GPU NVIDIA e o kit de ferramentas CUDA em um BMS P3

Cenários

Depois que um P3 BMS acelerado por GPU (usando o flavor physical.p3.large) é criado, o driver da NVIDIA GPU e o kit de ferramentas CUDA devem ser instalados nele para aceleração de computação.

Pré-requisitos

O procedimento de instalação do driver da GPU NVIDIA e do kit de ferramentas CUDA varia dependendo do sistema operacional.

CentOS 7.4

  1. Faça logon no BMS de destino e execute o seguinte comando para alternar para o usuário root:

    su root

  2. (Opcional) Se os pacotes de dependência gcc, gcc-c++, make e kernel-devel não existirem, execute os seguintes comandos para instalar as ferramentas gcc, gcc-c++, make e kernel-devel:

    yum install gcc

    yum install gcc-c++

    yum install make

    yum install kernel-devel-`uname -r`

  3. (Opcional) Adicione o driver Nouveau à lista negra.

    Se o driver Nouveau tiver sido instalado e carregado, execute as seguintes operações para adicionar o driver Nouveau à lista negra para evitar conflitos:

    1. Adicione blacklist nouveau ao final do arquivo /etc/modprobe.d/blacklist.conf.
    2. Execute os seguintes comandos para fazer backup e reconstruir o initramfs:

      mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

      dracut -v /boot/initramfs-$(uname -r).img $(uname -r)

    3. Execute o comando reboot para reiniciar o BMS.

  4. (Opcional) Se o serviço X estiver em execução, execute o comando systemctl set-default multi-user.target e reinicie o BMS para entrar no modo multiusuário.
  5. (Opcional) Instale o driver da GPU NVIDIA.

    Se você selecionou uma versão especificada do driver da GPU NVIDIA em vez de uma versão contida no kit de ferramentas CUDA, execute esta etapa.

    1. Baixe o pacote de instalação do driver NVIDIA GPU NVIDIA-Linux-x86_64-xxx.yy.run do https://www.nvidia.com/Download/index.aspx?lang=en e carregue este pacote para o diretório /tmp no BMS.
      Figura 1 Procurar o pacote de driver da GPU NVIDIA (CentOS 7.4)
    2. Execute o seguinte comando para instalar o driver da GPU NVIDIA:

      sh ./NVIDIA-Linux-x86_64-xxx.yy.run

    3. Execute o seguinte comando para excluir os pacotes de instalação:

      rm -f NVIDIA-Linux-x86_64-xxx.yy.run

  6. Instale o kit de ferramentas CUDA.

    1. Baixe o pacote de instalação do kit de ferramentas CUDA cuda_a.b.cc_xxx.yy_linux.run do https://developer.nvidia.com/cuda-downloads e carregue este pacote para o diretório /tmp no BMS.
    2. Execute o seguinte comando para alterar a permissão para o pacote de instalação:

      chmod +x cuda_a.b.cc_xxx.yy_linux.run

    3. Execute o seguinte comando para instalar o kit de ferramentas CUDA:

      ./cuda_a.b.cc_xxx.yy_linux.run -toolkit -samples -silent -override --tmpdir=/tmp/

    4. Execute o seguinte comando para excluir os pacotes de instalação:

      rm -f cuda_a.b.cc_xxx.yy_linux.run

    5. Execute os seguintes comandos para verificar se a instalação foi bem-sucedida:

      cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv/

      make

      ./deviceQueryDrv

      Se a saída do comando contiver "Result = PASS", o kit de ferramentas CUDA e o driver da GPU NVIDIA foram instalados com sucesso.

Ubuntu 16.04

  1. Faça logon no BMS de destino e execute o seguinte comando para alternar para o usuário root:

    sudo root

  2. (Opcional) Se os pacotes de dependência gcc, g++ e make não existirem, execute os seguintes comandos para instalar as ferramentas gcc, g++ e make:

    apt-get install gcc

    apt-get install g++

    apt-get install make

  3. (Opcional) Adicione o driver Nouveau à lista negra.

    Se o driver Nouveau tiver sido instalado e carregado, execute as seguintes operações para adicionar o driver Nouveau à lista negra para evitar conflitos:

    1. Adicione as seguintes informações ao final do arquivo /etc/modprobe.d/blacklist.conf:
      blacklist nouveau
      options nouveau modeset=0
    2. Execute os seguintes comandos para fazer backup e reconstruir o initramfs:

      mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

      sudo update-initramfs -u

    3. Execute o comando sudoreboot para reiniciar o BMS.

  4. (Opcional) Se o serviço X estiver em execução, execute o comando systemctlset-defaultmulti-user.target e reinicie o BMS para entrar no modo multiusuário.
  5. (Opcional) Instale o driver da GPU NVIDIA.

    Se você selecionou uma versão especificada do driver da GPU NVIDIA em vez de uma versão contida no kit de ferramentas CUDA, execute esta etapa.

    1. Baixe o pacote de instalação do driver da NVIDIA GPU NVIDIA-Linux-x86_64-xxx.yy.run do https://www.nvidia.com/Download/index.aspx?lang=en e carregue este pacote para o diretório /tmp no BMS.
      Figura 2 Pesquisar o pacote de driver da GPU NVIDIA
    2. Execute o seguinte comando para instalar o driver da GPU NVIDIA:

      sh ./NVIDIA-Linux-x86_64-xxx.yy.run

    3. Execute o seguinte comando para excluir os pacotes de instalação:

      rm -f NVIDIA-Linux-x86_64-xxx.yy.run

  6. Instale o kit de ferramentas CUDA.

    1. Baixe o pacote de instalação do kit de ferramentas CUDA cuda_a.b.cc_xxx.yy_linux.run do https://developer.nvidia.com/cuda-downloads e carregue este pacote para o diretório /tmp no BMS.
    2. Execute o seguinte comando para alterar a permissão para o pacote de instalação:

      chmod +x cuda_a.b.cc_xxx.yy_linux.run

    3. Execute o seguinte comando para instalar o kit de ferramentas CUDA:

      ./cuda_a.b.cc_xxx.yy_linux.run -toolkit -samples -silent -override --tmpdir=/tmp/

    4. Execute o seguinte comando para excluir os pacotes de instalação:

      rm -f cuda_a.b.cc_xxx.yy_linux.run

    5. Execute os seguintes comandos para verificar se a instalação foi bem-sucedida:

      cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv/

      make

      ./deviceQueryDrv

      Se a saída do comando contiver "Result = PASS", o kit de ferramentas CUDA e o driver da GPU NVIDIA foram instalados com sucesso.

    6. Execute o seguinte comando para verificar se o driver está sendo executado corretamente:

      nvidia-smi topo -m

      Se as informações da GPU forem exibidas na saída do comando, o driver está sendo executado corretamente.