Instalação de um driver Tesla e um kit de ferramentas CUDA em um ECS acelerado por GPU
Cenários
Antes de usar um ECS de acelerador de GPU, certifique-se de que o driver Tesla desejado e o kit de ferramentas CUDA foram instalados no ECS para aceleração de computação.
- Um ECS acelerado por computação (série P) criado usando uma imagem pública teve um driver Tesla de uma versão especificada instalado por padrão.
- Depois que um ECS de acelerador de GPU é criado usando uma imagem privada, ele deve ter um driver Tesla instalado. Caso contrário, a aceleração da computação não terá efeito.
Esta seção descreve como instalar um driver Tesla e um kit de ferramentas CUDA em uma ECS de acelerador de GPU.
Notas
- O ECS alvo tem um EIP vinculado.
- O driver Tesla e o kit de ferramentas CUDA não foram instalados no ECS.
- Faça o download do kit de ferramentas CUDA no site oficial da NVIDIA e instale-o. Um driver Tesla correspondente à versão CUDA será instalado automaticamente. No entanto, se houver requisitos específicos ou dependências na versão do driver Tesla, baixe o driver Tesla correspondente no site oficial da NVIDIA primeiro e instale o driver antes de instalar o kit de ferramentas CUDA.
- Se um driver Tesla tiver sido instalado no ECS, verifique a versão do driver. Antes de instalar uma nova versão do driver, desinstale o driver Tesla original para evitar uma falha de instalação devido a conflitos de driver.
- Obtenção de um driver Tesla e um kit de ferramentas CUDA
- Instalando um driver Tesla
- Instalando um CUDA Toolkit
Instalando um driver Tesla em um ECS de Linux
O seguinte usa o Ubuntu 16.04 64bit como um exemplo para descrever como instalar o driver Tesla correspondente ao CUDA 10.1 em um ECS acelerado por GPU.
A versão do kernel do Linux é compatível com a versão do driver. Se a instalação do driver falhar, verifique o log de instalação do driver, que geralmente é armazenado em /var/log/nvidia-installer.log. Se o log mostrar que a falha foi causada por um erro de compilação de driver, por exemplo, a configuração do parâmetro get_user_pages está incorreta, a versão do kernel é incompatível com a versão do driver. Nesse caso, selecione a versão desejada do kernel e a versão do driver e reinstale-os. Recomenda-se que o tempo de lançamento da versão do kernel e da versão do driver seja o mesmo.
- Faça login no ECS.
- Atualize o software do sistema baseado no sistema operacional.
- O Ubuntu
Actualizar a fonte de instalação do software: apt-get -y update
Instale os programas necessários: apt-get install gcc g++ make
- CentOS
Actualize a fonte de instalação do software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
Instale o programa desejado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
- O Ubuntu
- Faça o download do pacote de driver NVIDIA.
Selecione uma versão do driver em NVIDIA Driver Downloads com base no tipo de ECS. Clique em SEARCH.
Figura 1 Selecionando uma versão do driver NVIDIA
- Selecione uma versão do driver conforme necessário. O seguinte usa Tesla 418.67 como um exemplo.
Figura 2 Selecionando uma versão do driver
- Clique no driver a ser baixado. Na página TESLA DRIVER FOR LINUX X64 exibida, clique em DOWNLOAD.
- Copie o link de download.
Figura 3 Copiando o link de download
- Execute o seguinte comando no ECS para baixar o driver:
Por exemplo, wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run
Figura 4 Obtenção do pacote de instalação
- Execute o seguinte comando para desinstalar o driver PV:
- (Opcional) Se as seguintes informações forem exibidas após a execução do comando para instalar o driver, desative o driver Nouveau.
Figura 5 Desativando o driver Nouveau
- Execute o seguinte comando para verificar se o driver Nouveau foi instalado:
- Edite o arquivo blacklist.conf.
Se o arquivo /etc/modprobe.d/blacklist.conf não estiver disponível, crie-o.
vi /etc/modprobe.d/blacklist.conf
Adicione a seguinte instrução ao final do arquivo:
blacklist nouveau options nouveau modeset=0
- Execute o seguinte comando para fazer backup e criar um aplicativo initramfs:
- Selecione OK por três vezes consecutivas, conforme solicitado, para concluir a instalação do driver.
Figura 6 Concluindo a instalação do driver NVIDIA
- Execute o seguinte comando para definir systemd:
- Execute o comando de reboot para reiniciar o ECS.
- Faça login no ECS e execute o comando nvidia-smi. Se a saída do comando contiver a versão do driver instalado, o driver foi instalado.
Figura 7 Visualizando a versão do driver NVIDIA
Instalando um driver Tesla em um ECS de Windows
A seguir, o Windows Server 2016 Standard 64bit é usado como exemplo para descrever como instalar um driver Tesla em um ECS acelerado por GPU.
- Faça login no ECS.
- Faça o download do pacote de driver NVIDIA.
Selecione uma versão do driver em NVIDIA Driver Downloads com base no tipo de ECS.
Figura 8 Selecionando um tipo de driver (Windows)
- Selecione uma versão do driver conforme necessário. O seguinte usa Tesla 425.25 como um exemplo.
Figura 9 Selecionando uma versão do driver (Windows)
- Clique no driver a ser baixado. Na página TESLA DRIVER FOR WINDOWS exibida, clique em DOWNLOAD.
- Clique em Agree & Download para baixar o pacote de instalação.
Figura 10 Baixando o pacote de instalação do driver
- Clique duas vezes no driver e clique em Run.
Figura 11 Executando o programa de instalação do driver NVIDIA
- Selecione um caminho de instalação e clique em OK.
Figura 12 Selecionando um caminho de instalação
- Instale o programa NVIDIA conforme solicitado.
Figura 13 Concluindo a instalação do driver
- Reinicie o ECS.
- Verifique se o driver NVIDIA foi instalado.
- Alterne para Device Manager e clique em Display adapters.
Figura 14 Adaptadores de exibição
- Abra a window cmd no ECS e execute os seguintes comandos:
cd C:\Program Files\NVIDIA Corporation\NVSMI
nvidia-smi
Se a saída do comando contiver a versão do driver instalado, o driver foi instalado.
Figura 15 Visualizando a versão do driver NVIDIA
- Alterne para Device Manager e clique em Display adapters.
Instalando o CUDA Toolkit em um ECS Linux
O seguinte usa o Ubuntu 16.04 64bit como um exemplo para descrever como instalar o kit de ferramentas CUDA 10.1 em um ECS acelerado por GPU.
- Faça login no ECS.
- Atualize o software do sistema baseado no sistema operacional.
- O Ubuntu
Actualizar a fonte de instalação do software: apt-get -y update
Instale os programas necessários: apt-get install gcc g++ make
- CentOS
Actualize a fonte de instalação do software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
Instale o programa desejado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
- O Ubuntu
- Na página de download do CUDA, defina os parâmetros de acordo com as informações mostradas em Obtenção de um driver Tesla e um kit de ferramentas CUDA.
Figura 16 Selecionando uma versão do CUDA
- Encontre o link para baixar o CUDA 10.1 e copie o link.
Figura 17 Copiando o link para baixar o CUDA
- Execute o seguinte comando no ECS para baixar o CUDA:
Por exemplo, wget https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.105_418.39_linux.run
Figura 18 Baixando CUDA
- Instale o CUDA.
- Execute o seguinte comando para instalar o CUDA:
- Selecione accept na página de instalação e pressione Enter.
Figura 20 Instalando o CUDA_1
- Selecione Install e pressione Enter para iniciar a instalação.
Figura 21 Instalação do CUDA_2
Figura 22 Concluindo a instalação
- Execute o seguinte comando para alternar para /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery:
cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery
- Execute o comando make para compilar automaticamente o programa deviceQuery.
- Execute o seguinte comando para verificar se o CUDA foi instalado:
Se a saída do comando contiver a versão CUDA, o CUDA foi instalado.
Figura 23 deviceQuery saída comum
- Verifique a versão do CUDA.
Figura 24 Verificando a versão do CUDA
- Execute o seguinte comando para ativar o modo persistente:
A ativação do modo persistente otimiza o desempenho da GPU nos ECS Linux.
Instalando o CUDA Toolkit em um ECS Windows
A seguir, o Windows Server 2016 Standard 64bit é usado como exemplo para descrever como instalar o kit de ferramentas CUDA 10.1 em um ECS acelerado por GPU.
- Faça login no ECS.
- Na página de download do CUDA, defina os parâmetros de acordo com as informações mostradas em Baixando um Kit de ferramentas CUDA.
Figura 25 Selecionando uma versão do CUDA
- Encontre o link para baixar o CUDA 10.1.
Figura 26 Encontrando o link para baixar o CUDA
- Clique em Download para baixar o kit de ferramentas CUDA.
- Clique duas vezes no arquivo de instalação e clique em Run para instalar o kit de ferramentas CUDA.
Figura 27 Instalação do CUDA
- Na página CUDA Setup Package, selecione um caminho de instalação e clique em OK.
Figura 28 Selecionando um caminho de instalação
- Instale o kit de ferramentas CUDA conforme solicitado.
Figura 29 Concluindo a instalação