Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.

Central de ajuda/ Elastic Cloud Server/ Guia de usuário/ Instâncias/ (Opcional) Instalação de um driver e um kit de ferramentas/ Instalação de um driver Tesla e um kit de ferramentas CUDA em um ECS acelerado por GPU

Atualizado em 2025-01-24 GMT+08:00

Ver PDF

Instalação de um driver Tesla e um kit de ferramentas CUDA em um ECS acelerado por GPU

Cenários

Antes de usar um ECS de acelerador de GPU, certifique-se de que o driver Tesla desejado e o kit de ferramentas CUDA foram instalados no ECS para aceleração de computação.

Um ECS acelerado por computação (série P) criado usando uma imagem pública teve um driver Tesla de uma versão especificada instalado por padrão.
Depois que um ECS de acelerador de GPU é criado usando uma imagem privada, ele deve ter um driver Tesla instalado. Caso contrário, a aceleração da computação não terá efeito.

Esta seção descreve como instalar um driver Tesla e um kit de ferramentas CUDA em uma ECS de acelerador de GPU.

Notas

O ECS alvo tem um EIP vinculado.
O driver Tesla e o kit de ferramentas CUDA não foram instalados no ECS.

Faça o download do kit de ferramentas CUDA no site oficial da NVIDIA e instale-o. Um driver Tesla correspondente à versão CUDA será instalado automaticamente. No entanto, se houver requisitos específicos ou dependências na versão do driver Tesla, baixe o driver Tesla correspondente no site oficial da NVIDIA primeiro e instale o driver antes de instalar o kit de ferramentas CUDA.
Se um driver Tesla tiver sido instalado no ECS, verifique a versão do driver. Antes de instalar uma nova versão do driver, desinstale o driver Tesla original para evitar uma falha de instalação devido a conflitos de driver.

Processo de instalação:

Obtenção de um driver Tesla e um kit de ferramentas CUDA
Instalando um driver Tesla
- Instalando um driver Tesla em um ECS de Linux
- Instalando um driver Tesla em um ECS de Windows
Instalando um CUDA Toolkit
- Instalando o CUDA Toolkit em um ECS Linux
- Instalando o CUDA Toolkit em um ECS Windows

Instalando um driver Tesla em um ECS de Linux

O seguinte usa o Ubuntu 16.04 64bit como um exemplo para descrever como instalar o driver Tesla correspondente ao CUDA 10.1 em um ECS acelerado por GPU.

A versão do kernel do Linux é compatível com a versão do driver. Se a instalação do driver falhar, verifique o log de instalação do driver, que geralmente é armazenado em /var/log/nvidia-installer.log. Se o log mostrar que a falha foi causada por um erro de compilação de driver, por exemplo, a configuração do parâmetro get_user_pages está incorreta, a versão do kernel é incompatível com a versão do driver. Nesse caso, selecione a versão desejada do kernel e a versão do driver e reinstale-os. Recomenda-se que o tempo de lançamento da versão do kernel e da versão do driver seja o mesmo.

Faça login no ECS.
Atualize o software do sistema baseado no sistema operacional.
- O Ubuntu
  Actualizar a fonte de instalação do software: apt-get -y update
  
  Instale os programas necessários: apt-get install gcc g++ make
- CentOS
  Actualize a fonte de instalação do software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
  
  Instale o programa desejado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
Faça o download do pacote de driver NVIDIA.
Selecione uma versão do driver em NVIDIA Driver Downloads com base no tipo de ECS. Clique em SEARCH.

Figura 1 Selecionando uma versão do driver NVIDIA
Selecione uma versão do driver conforme necessário. O seguinte usa Tesla 418.67 como um exemplo.
Figura 2 Selecionando uma versão do driver
Clique no driver a ser baixado. Na página TESLA DRIVER FOR LINUX X64 exibida, clique em DOWNLOAD.
Copie o link de download.
Figura 3 Copiando o link de download
Execute o seguinte comando no ECS para baixar o driver:
wget Copied link

Por exemplo, wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run

Figura 4 Obtenção do pacote de instalação
Execute o seguinte comando para desinstalar o driver PV:
sh NVIDIA-Linux-x86_64-418.67.run
(Opcional) Se as seguintes informações forem exibidas após a execução do comando para instalar o driver, desative o driver Nouveau.
Figura 5 Desativando o driver Nouveau
1. Execute o seguinte comando para verificar se o driver Nouveau foi instalado:
  lsmod | grep nouveau
  - Se a saída do comando contiver informações sobre o driver Nouveau, o driver Nouveau foi instalado e deve ser desabilitado. Então vá para passo 9.b.
  - Se a saída do comando não contiver informações sobre o driver Nouveau, o driver Nouveau foi desabilitado. Então vá para passo 9.d.
2. Edite o arquivo blacklist.conf.
  Se o arquivo /etc/modprobe.d/blacklist.conf não estiver disponível, crie-o.
  
  vi /etc/modprobe.d/blacklist.conf
  
  Adicione a seguinte instrução ao final do arquivo:
```
blacklist nouveau
options nouveau modeset=0
```
1. Execute o seguinte comando para fazer backup e criar um aplicativo initramfs:
  - Ubuntu
    sudo update-initramfs -u
  - CentOS:
    mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
    
    dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
1. Reinicie o ECS:
  reboot
Selecione OK por três vezes consecutivas, conforme solicitado, para concluir a instalação do driver.
Figura 6 Concluindo a instalação do driver NVIDIA
Execute o seguinte comando para definir systemd:
systemctl set-default multi-user.target
Execute o comando de reboot para reiniciar o ECS.
Faça login no ECS e execute o comando nvidia-smi. Se a saída do comando contiver a versão do driver instalado, o driver foi instalado.
Figura 7 Visualizando a versão do driver NVIDIA

Instalando um driver Tesla em um ECS de Windows

A seguir, o Windows Server 2016 Standard 64bit é usado como exemplo para descrever como instalar um driver Tesla em um ECS acelerado por GPU.

Faça login no ECS.
Faça o download do pacote de driver NVIDIA.
Selecione uma versão do driver em NVIDIA Driver Downloads com base no tipo de ECS.

Figura 8 Selecionando um tipo de driver (Windows)
Selecione uma versão do driver conforme necessário. O seguinte usa Tesla 425.25 como um exemplo.
Figura 9 Selecionando uma versão do driver (Windows)
Clique no driver a ser baixado. Na página TESLA DRIVER FOR WINDOWS exibida, clique em DOWNLOAD.
Clique em Agree & Download para baixar o pacote de instalação.
Figura 10 Baixando o pacote de instalação do driver
Clique duas vezes no driver e clique em Run.
Figura 11 Executando o programa de instalação do driver NVIDIA
Selecione um caminho de instalação e clique em OK.
Figura 12 Selecionando um caminho de instalação
Instale o programa NVIDIA conforme solicitado.
Figura 13 Concluindo a instalação do driver
Reinicie o ECS.
Verifique se o driver NVIDIA foi instalado.
1. Alterne para Device Manager e clique em Display adapters.
  Figura 14 Adaptadores de exibição
1. Abra a window cmd no ECS e execute os seguintes comandos:
  cd C:\Program Files\NVIDIA Corporation\NVSMI
  
  nvidia-smi
  
  Se a saída do comando contiver a versão do driver instalado, o driver foi instalado.
  
  Figura 15 Visualizando a versão do driver NVIDIA

Instalando o CUDA Toolkit em um ECS Linux

O seguinte usa o Ubuntu 16.04 64bit como um exemplo para descrever como instalar o kit de ferramentas CUDA 10.1 em um ECS acelerado por GPU.

Faça login no ECS.
Atualize o software do sistema baseado no sistema operacional.
- O Ubuntu
  Actualizar a fonte de instalação do software: apt-get -y update
  
  Instale os programas necessários: apt-get install gcc g++ make
- CentOS
  Actualize a fonte de instalação do software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
  
  Instale o programa desejado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
Na página de download do CUDA, defina os parâmetros de acordo com as informações mostradas em Obtenção de um driver Tesla e um kit de ferramentas CUDA.
Figura 16 Selecionando uma versão do CUDA
Encontre o link para baixar o CUDA 10.1 e copie o link.
Figura 17 Copiando o link para baixar o CUDA

Execute o seguinte comando no ECS para baixar o CUDA:
wget Copied link

Por exemplo, wget https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.105_418.39_linux.run

Figura 18 Baixando CUDA

Instale o CUDA.
Siga as instruções fornecidas no site oficial da NVIDIA.
Figura 19 Instalação do CUDA
Execute o seguinte comando para instalar o CUDA:
sh cuda_10.1.243_418.87.00_linux.run
Selecione accept na página de instalação e pressione Enter.
Figura 20 Instalando o CUDA_1
Selecione Install e pressione Enter para iniciar a instalação.
Figura 21 Instalação do CUDA_2

Figura 22 Concluindo a instalação
Execute o seguinte comando para alternar para /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery:
cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery
Execute o comando make para compilar automaticamente o programa deviceQuery.
Execute o seguinte comando para verificar se o CUDA foi instalado:
./deviceQuery

Se a saída do comando contiver a versão CUDA, o CUDA foi instalado.

Figura 23 deviceQuery saída comum
Verifique a versão do CUDA.
/usr/local/cuda/bin/nvcc -V

Figura 24 Verificando a versão do CUDA
Execute o seguinte comando para ativar o modo persistente:
sudo nvidia-smi -pm 1

A ativação do modo persistente otimiza o desempenho da GPU nos ECS Linux.

Instalando o CUDA Toolkit em um ECS Windows

A seguir, o Windows Server 2016 Standard 64bit é usado como exemplo para descrever como instalar o kit de ferramentas CUDA 10.1 em um ECS acelerado por GPU.

Faça login no ECS.
Na página de download do CUDA, defina os parâmetros de acordo com as informações mostradas em Baixando um Kit de ferramentas CUDA.
Figura 25 Selecionando uma versão do CUDA
Encontre o link para baixar o CUDA 10.1.
Figura 26 Encontrando o link para baixar o CUDA
Clique em Download para baixar o kit de ferramentas CUDA.
Clique duas vezes no arquivo de instalação e clique em Run para instalar o kit de ferramentas CUDA.
Figura 27 Instalação do CUDA
Na página CUDA Setup Package, selecione um caminho de instalação e clique em OK.
Figura 28 Selecionando um caminho de instalação
Instale o kit de ferramentas CUDA conforme solicitado.
Figura 29 Concluindo a instalação

Verifique se o CUDA foi instalado
Abra a janela do cmd e execute o seguinte comando:

nvcc -V

Se a saída do comando contiver a versão CUDA, o CUDA foi instalado.

Figura 30 Instalação bem-sucedida