Instalação de um driver Tesla e um kit de ferramentas CUDA em um ECS acelerado por GPU
Cenários
Antes de usar um ECS de acelerador de GPU, certifique-se de que o driver Tesla desejado e o kit de ferramentas CUDA foram instalados no ECS para aceleração de computação.
- Um ECS acelerado por computação (série P) criado usando uma imagem pública teve um driver Tesla de uma versão especificada instalado por padrão.
 - Depois que um ECS de acelerador de GPU é criado usando uma imagem privada, ele deve ter um driver Tesla instalado. Caso contrário, a aceleração da computação não terá efeito.
 
Esta seção descreve como instalar um driver Tesla e um kit de ferramentas CUDA em uma ECS de acelerador de GPU.
Notas
- O ECS alvo tem um EIP vinculado.
 - O driver Tesla e o kit de ferramentas CUDA não foram instalados no ECS.
 
 
   - Faça o download do kit de ferramentas CUDA no site oficial da NVIDIA e instale-o. Um driver Tesla correspondente à versão CUDA será instalado automaticamente. No entanto, se houver requisitos específicos ou dependências na versão do driver Tesla, baixe o driver Tesla correspondente no site oficial da NVIDIA primeiro e instale o driver antes de instalar o kit de ferramentas CUDA.
 - Se um driver Tesla tiver sido instalado no ECS, verifique a versão do driver. Antes de instalar uma nova versão do driver, desinstale o driver Tesla original para evitar uma falha de instalação devido a conflitos de driver.
 
- Obtenção de um driver Tesla e um kit de ferramentas CUDA
 - Instalando um driver Tesla
 - Instalando um CUDA Toolkit
 
Instalando um driver Tesla em um ECS de Linux
O seguinte usa o Ubuntu 16.04 64bit como um exemplo para descrever como instalar o driver Tesla correspondente ao CUDA 10.1 em um ECS acelerado por GPU.
 
   A versão do kernel do Linux é compatível com a versão do driver. Se a instalação do driver falhar, verifique o log de instalação do driver, que geralmente é armazenado em /var/log/nvidia-installer.log. Se o log mostrar que a falha foi causada por um erro de compilação de driver, por exemplo, a configuração do parâmetro get_user_pages está incorreta, a versão do kernel é incompatível com a versão do driver. Nesse caso, selecione a versão desejada do kernel e a versão do driver e reinstale-os. Recomenda-se que o tempo de lançamento da versão do kernel e da versão do driver seja o mesmo.
- Faça login no ECS.
 - Atualize o software do sistema baseado no sistema operacional.
    
- O Ubuntu
      
Actualizar a fonte de instalação do software: apt-get -y update
Instale os programas necessários: apt-get install gcc g++ make
 - CentOS
      
Actualize a fonte de instalação do software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
Instale o programa desejado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
 
 - O Ubuntu
      
 - Faça o download do pacote de driver NVIDIA.
    
Selecione uma versão do driver em NVIDIA Driver Downloads com base no tipo de ECS. Clique em SEARCH.
Figura 1 Selecionando uma versão do driver NVIDIA
     - Selecione uma versão do driver conforme necessário. O seguinte usa Tesla 418.67 como um exemplo.
    Figura 2 Selecionando uma versão do driver
     - Clique no driver a ser baixado. Na página TESLA DRIVER FOR LINUX X64 exibida, clique em DOWNLOAD.
 - Copie o link de download.
    Figura 3 Copiando o link de download
     - Execute o seguinte comando no ECS para baixar o driver:
    
    
Por exemplo, wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run
Figura 4 Obtenção do pacote de instalação
     - Execute o seguinte comando para desinstalar o driver PV:
 - (Opcional) Se as seguintes informações forem exibidas após a execução do comando para instalar o driver, desative o driver Nouveau.
    Figura 5 Desativando o driver Nouveau
    - Execute o seguinte comando para verificar se o driver Nouveau foi instalado:
 - Edite o arquivo blacklist.conf.
      
Se o arquivo /etc/modprobe.d/blacklist.conf não estiver disponível, crie-o.
vi /etc/modprobe.d/blacklist.conf
Adicione a seguinte instrução ao final do arquivo:
blacklist nouveau options nouveau modeset=0
 
- Execute o seguinte comando para fazer backup e criar um aplicativo initramfs:
 
 - Selecione OK por três vezes consecutivas, conforme solicitado, para concluir a instalação do driver.
    Figura 6 Concluindo a instalação do driver NVIDIA
     - Execute o seguinte comando para definir systemd:
 - Execute o comando de reboot para reiniciar o ECS.
 - Faça login no ECS e execute o comando nvidia-smi. Se a saída do comando contiver a versão do driver instalado, o driver foi instalado.
    Figura 7 Visualizando a versão do driver NVIDIA
     
Instalando um driver Tesla em um ECS de Windows
A seguir, o Windows Server 2016 Standard 64bit é usado como exemplo para descrever como instalar um driver Tesla em um ECS acelerado por GPU.
- Faça login no ECS.
 - Faça o download do pacote de driver NVIDIA.
    
Selecione uma versão do driver em NVIDIA Driver Downloads com base no tipo de ECS.
Figura 8 Selecionando um tipo de driver (Windows)
     - Selecione uma versão do driver conforme necessário. O seguinte usa Tesla 425.25 como um exemplo.
    Figura 9 Selecionando uma versão do driver (Windows)
     - Clique no driver a ser baixado. Na página TESLA DRIVER FOR WINDOWS exibida, clique em DOWNLOAD.
 - Clique em Agree & Download para baixar o pacote de instalação.
    Figura 10 Baixando o pacote de instalação do driver
     - Clique duas vezes no driver e clique em Run.
    Figura 11 Executando o programa de instalação do driver NVIDIA
     - Selecione um caminho de instalação e clique em OK.
    Figura 12 Selecionando um caminho de instalação
     - Instale o programa NVIDIA conforme solicitado.
    Figura 13 Concluindo a instalação do driver
     - Reinicie o ECS.
 - Verifique se o driver NVIDIA foi instalado.
    
- Alterne para Device Manager e clique em Display adapters.
      Figura 14 Adaptadores de exibição
       
- Abra a window cmd no ECS e execute os seguintes comandos:
      
cd C:\Program Files\NVIDIA Corporation\NVSMI
nvidia-smi
Se a saída do comando contiver a versão do driver instalado, o driver foi instalado.
Figura 15 Visualizando a versão do driver NVIDIA
       
 - Alterne para Device Manager e clique em Display adapters.
      
 
Instalando o CUDA Toolkit em um ECS Linux
O seguinte usa o Ubuntu 16.04 64bit como um exemplo para descrever como instalar o kit de ferramentas CUDA 10.1 em um ECS acelerado por GPU.
- Faça login no ECS.
 - Atualize o software do sistema baseado no sistema operacional.
    
- O Ubuntu
      
Actualizar a fonte de instalação do software: apt-get -y update
Instale os programas necessários: apt-get install gcc g++ make
 - CentOS
      
Actualize a fonte de instalação do software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
Instale o programa desejado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
 
 - O Ubuntu
      
 - Na página de download do CUDA, defina os parâmetros de acordo com as informações mostradas em Obtenção de um driver Tesla e um kit de ferramentas CUDA.
    Figura 16 Selecionando uma versão do CUDA
     - Encontre o link para baixar o CUDA 10.1 e copie o link.
    Figura 17 Copiando o link para baixar o CUDA
     
- Execute o seguinte comando no ECS para baixar o CUDA:
    
    
Por exemplo, wget https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.105_418.39_linux.run
Figura 18 Baixando CUDA
     
- Instale o CUDA.
 - Execute o seguinte comando para instalar o CUDA:
 - Selecione accept na página de instalação e pressione Enter.
    Figura 20 Instalando o CUDA_1
     - Selecione Install e pressione Enter para iniciar a instalação.
    Figura 21 Instalação do CUDA_2
    Figura 22 Concluindo a instalação
     - Execute o seguinte comando para alternar para /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery:
    
cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery
 - Execute o comando make para compilar automaticamente o programa deviceQuery.
 - Execute o seguinte comando para verificar se o CUDA foi instalado:
    
    
Se a saída do comando contiver a versão CUDA, o CUDA foi instalado.
Figura 23 deviceQuery saída comum
     - Verifique a versão do CUDA.
    
    Figura 24 Verificando a versão do CUDA
     - Execute o seguinte comando para ativar o modo persistente:
    
    
A ativação do modo persistente otimiza o desempenho da GPU nos ECS Linux.
 
Instalando o CUDA Toolkit em um ECS Windows
A seguir, o Windows Server 2016 Standard 64bit é usado como exemplo para descrever como instalar o kit de ferramentas CUDA 10.1 em um ECS acelerado por GPU.
- Faça login no ECS.
 - Na página de download do CUDA, defina os parâmetros de acordo com as informações mostradas em Baixando um Kit de ferramentas CUDA.
    Figura 25 Selecionando uma versão do CUDA
     - Encontre o link para baixar o CUDA 10.1.
    Figura 26 Encontrando o link para baixar o CUDA
     - Clique em Download para baixar o kit de ferramentas CUDA.
 - Clique duas vezes no arquivo de instalação e clique em Run para instalar o kit de ferramentas CUDA.
    Figura 27 Instalação do CUDA
     - Na página CUDA Setup Package, selecione um caminho de instalação e clique em OK.
    Figura 28 Selecionando um caminho de instalação
     - Instale o kit de ferramentas CUDA conforme solicitado.
    Figura 29 Concluindo a instalação
     
    
      
