Instalação do driver da GPU NVIDIA e o kit de ferramentas CUDA em um BMS P3
Cenários
Depois que um P3 BMS acelerado por GPU (usando o flavor physical.p3.large) é criado, o driver da NVIDIA GPU e o kit de ferramentas CUDA devem ser instalados nele para aceleração de computação.
Pré-requisitos
- Um EIP foi vinculado ao BMS.
- Você obteve os pacotes de instalação de driver necessários.
Tabela 1 Baixar caminhos para o driver da GPU NVIDIA e o kit de ferramentas CUDA SO
Driver
Como obter
Ubuntu 16.04 e CentOS 7.4
Pacote de instalação do driver da GPU NVIDIA: NVIDIA-Linux-x86_64-384.81.run
http://www.nvidia.com/download/driverResults.aspx/124722/en-us
Pacote de instalação do kit de ferramentas CUDA: cuda_9.0.176_384.81_linux.run
https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run
O procedimento de instalação do driver da GPU NVIDIA e do kit de ferramentas CUDA varia dependendo do sistema operacional.
CentOS 7.4
- Faça logon no BMS de destino e execute o seguinte comando para alternar para o usuário root:
su root
- (Opcional) Se os pacotes de dependência gcc, gcc-c++, make e kernel-devel não existirem, execute os seguintes comandos para instalar as ferramentas gcc, gcc-c++, make e kernel-devel:
yum install gcc
yum install gcc-c++
yum install make
yum install kernel-devel-`uname -r`
- (Opcional) Adicione o driver Nouveau à lista negra.
Se o driver Nouveau tiver sido instalado e carregado, execute as seguintes operações para adicionar o driver Nouveau à lista negra para evitar conflitos:
- Adicione blacklist nouveau ao final do arquivo /etc/modprobe.d/blacklist.conf.
- Execute os seguintes comandos para fazer backup e reconstruir o initramfs:
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
- Execute o comando reboot para reiniciar o BMS.
- (Opcional) Se o serviço X estiver em execução, execute o comando systemctl set-default multi-user.target e reinicie o BMS para entrar no modo multiusuário.
- (Opcional) Instale o driver da GPU NVIDIA.
Se você selecionou uma versão especificada do driver da GPU NVIDIA em vez de uma versão contida no kit de ferramentas CUDA, execute esta etapa.
- Baixe o pacote de instalação do driver NVIDIA GPU NVIDIA-Linux-x86_64-xxx.yy.run do https://www.nvidia.com/Download/index.aspx?lang=en e carregue este pacote para o diretório /tmp no BMS.
Figura 1 Procurar o pacote de driver da GPU NVIDIA (CentOS 7.4)
- Execute o seguinte comando para instalar o driver da GPU NVIDIA:
- Execute o seguinte comando para excluir os pacotes de instalação:
- Baixe o pacote de instalação do driver NVIDIA GPU NVIDIA-Linux-x86_64-xxx.yy.run do https://www.nvidia.com/Download/index.aspx?lang=en e carregue este pacote para o diretório /tmp no BMS.
- Instale o kit de ferramentas CUDA.
- Baixe o pacote de instalação do kit de ferramentas CUDA cuda_a.b.cc_xxx.yy_linux.run do https://developer.nvidia.com/cuda-downloads e carregue este pacote para o diretório /tmp no BMS.
- Execute o seguinte comando para alterar a permissão para o pacote de instalação:
- Execute o seguinte comando para instalar o kit de ferramentas CUDA:
./cuda_a.b.cc_xxx.yy_linux.run -toolkit -samples -silent -override --tmpdir=/tmp/
- Execute o seguinte comando para excluir os pacotes de instalação:
- Execute os seguintes comandos para verificar se a instalação foi bem-sucedida:
cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv/
make
./deviceQueryDrv
Se a saída do comando contiver "Result = PASS", o kit de ferramentas CUDA e o driver da GPU NVIDIA foram instalados com sucesso.
Ubuntu 16.04
- Faça logon no BMS de destino e execute o seguinte comando para alternar para o usuário root:
sudo root
- (Opcional) Se os pacotes de dependência gcc, g++ e make não existirem, execute os seguintes comandos para instalar as ferramentas gcc, g++ e make:
apt-get install gcc
apt-get install g++
apt-get install make
- (Opcional) Adicione o driver Nouveau à lista negra.
Se o driver Nouveau tiver sido instalado e carregado, execute as seguintes operações para adicionar o driver Nouveau à lista negra para evitar conflitos:
- Adicione as seguintes informações ao final do arquivo /etc/modprobe.d/blacklist.conf:
blacklist nouveau options nouveau modeset=0
- Execute os seguintes comandos para fazer backup e reconstruir o initramfs:
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
sudo update-initramfs -u
- Execute o comando sudoreboot para reiniciar o BMS.
- Adicione as seguintes informações ao final do arquivo /etc/modprobe.d/blacklist.conf:
- (Opcional) Se o serviço X estiver em execução, execute o comando systemctlset-defaultmulti-user.target e reinicie o BMS para entrar no modo multiusuário.
- (Opcional) Instale o driver da GPU NVIDIA.
Se você selecionou uma versão especificada do driver da GPU NVIDIA em vez de uma versão contida no kit de ferramentas CUDA, execute esta etapa.
- Baixe o pacote de instalação do driver da NVIDIA GPU NVIDIA-Linux-x86_64-xxx.yy.run do https://www.nvidia.com/Download/index.aspx?lang=en e carregue este pacote para o diretório /tmp no BMS.
Figura 2 Pesquisar o pacote de driver da GPU NVIDIA
- Execute o seguinte comando para instalar o driver da GPU NVIDIA:
- Execute o seguinte comando para excluir os pacotes de instalação:
- Baixe o pacote de instalação do driver da NVIDIA GPU NVIDIA-Linux-x86_64-xxx.yy.run do https://www.nvidia.com/Download/index.aspx?lang=en e carregue este pacote para o diretório /tmp no BMS.
- Instale o kit de ferramentas CUDA.
- Baixe o pacote de instalação do kit de ferramentas CUDA cuda_a.b.cc_xxx.yy_linux.run do https://developer.nvidia.com/cuda-downloads e carregue este pacote para o diretório /tmp no BMS.
- Execute o seguinte comando para alterar a permissão para o pacote de instalação:
- Execute o seguinte comando para instalar o kit de ferramentas CUDA:
./cuda_a.b.cc_xxx.yy_linux.run -toolkit -samples -silent -override --tmpdir=/tmp/
- Execute o seguinte comando para excluir os pacotes de instalação:
- Execute os seguintes comandos para verificar se a instalação foi bem-sucedida:
cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv/
make
./deviceQueryDrv
Se a saída do comando contiver "Result = PASS", o kit de ferramentas CUDA e o driver da GPU NVIDIA foram instalados com sucesso.
- Execute o seguinte comando para verificar se o driver está sendo executado corretamente:
Se as informações da GPU forem exibidas na saída do comando, o driver está sendo executado corretamente.