Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.

Centro de ayuda/ Elastic Cloud Server/ Guía del usuario/ Instancias/ (Opcional) Instalación de un controlador y un kit de herramientas/ Instalación de un controlador Tesla y CUDA Toolkit en un ECS con aceleración mediante GPU

Actualización más reciente 2025-01-23 GMT+08:00

Ver PDF

Instalación de un controlador Tesla y CUDA Toolkit en un ECS con aceleración mediante GPU

Casos

Antes de usar un ECS con aceleración mediante GPU, asegúrese de que el controlador Tesla y el kit de herramientas CUDA deseados se hayan instalado en el ECS para la aceleración de cómputo.

Un ECS de aceleración de cómputo (serie P) creado usando una imagen pública tiene un controlador Tesla de una versión especificada instalado por defecto.
Después de crear un ECS con aceleración mediante GPU usando una imagen privada, debe tener un controlador Tesla instalado. De lo contrario, la aceleración de cómputo no tendrá efecto.

Esta sección describe cómo instalar un controlador Tesla y un kit de herramientas CUDA en un ECS con aceleración mediante GPU.

Notas

El ECS de destino tiene un límite EIP.
El controlador Tesla y el kit de herramientas CUDA no se han instalado en el ECS.

Descargue el kit de herramientas CUDA del sitio web oficial de NVIDIA e instálelo. Un controlador de Tesla que coincida con la versión de CUDA se instalará automáticamente entonces. Sin embargo, si hay requisitos específicos o dependencias en la versión del controlador de Tesla, descargue primero el controlador de Tesla correspondiente desde el sitio web oficial de NVIDIA y luego instale el controlador antes de instalar el kit de herramientas CUDA.
Si se ha instalado un controlador Tesla en el ECS, compruebe la versión del controlador. Antes de instalar una nueva versión de controlador, desinstale el controlador original de Tesla para evitar un error de instalación debido a conflictos de controladores.

Proceso de instalación:

Obtención de un controlador Tesla y CUDA Toolkit
Instalación de un controlador Tesla
- Instalación de un controlador Tesla en ECS de Linux
- Instalación de un controlador Tesla en ECS de Windows
Instalación de un kit de herramientas CUDA
- Instalación del kit de herramientas CUDA en un ECS de Linux
- Instalación del kit de herramientas CUDA en un ECS de Windows

Instalación de un controlador Tesla en ECS de Linux

El siguiente ejemplo utiliza Ubuntu 16.04 64bit para describir cómo instalar el controlador de Tesla que coincide con CUDA 10.1 en un ECS con aceleración mediante GPU.

La versión del kernel de Linux es compatible con la versión del controlador. Si la instalación del controlador falla, compruebe el registro de instalación del controlador, que generalmente se almacena en /var/log/nvidia-installer.log. Si el registro muestra que el error fue causado por un error de compilación de controladores, por ejemplo, la configuración del parámetro get_user_pages es incorrecta, la versión del núcleo es incompatible con la versión del controlador. En tal caso, seleccione la versión del kernel y la versión del controlador deseados y vuelva a instalarlos. Se recomienda que el tiempo de lanzamiento de la versión del kernel y la versión del controlador sean los mismos.

Inicie sesión en el ECS.
Actualice el software del sistema basado en el SO.
- Ubuntu
  Actualice la fuente de instalación del software: apt-get -y update
  
  Instalar los programas necesarios: apt-get install gcc g++ make
- CentOS
  Actualice la fuente de instalación de software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
  
  Instalar el programa deseado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
Descargue el paquete de controladores de NVIDIA.
Seleccione una versión de controlador en Descargas de controladores de NVIDIA según el tipo ECS. Haga clic en SEARCH.

Figura 1 Selección de una versión de controlador de NVIDIA
Seleccione una versión de controlador según sea necesario. Lo siguiente utiliza Tesla 418.67 como ejemplo.
Figura 2 Selección de una versión de controlador
Haga clic en el controlador que desea descargar. En la página TESLA DRIVER FOR LINUX X64 que se muestra, haga clic en DOWNLOAD.
Copiar el enlace de descarga.
Figura 3 Copiando el enlace de descarga
Ejecute el siguiente comando en el ECS para descargar el controlador:
wget Copied link

Por ejemplo, wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run

Figura 4 Obtención del paquete de instalación
Ejecute el siguiente comando para instalar el controlador:
sh NVIDIA-Linux-x86_64-418.67.run
(Opcional) Si se muestra la siguiente información después de ejecutar el comando para instalar el controlador, deshabilite el controlador Nouveau.
Figura 5 Desactivación del controlador Nouveau
1. Ejecute el siguiente comando para comprobar si se ha instalado el controlador Nouveau:
  lsmod | grep nouveau
  - Si la salida del comando contiene información sobre el controlador Nouveau, el controlador Nouveau se ha instalado y debe deshabilitarse. Luego, siga con el paso 9.b.
  - Si la salida del comando no contiene información sobre el controlador Nouveau, el controlador Nouveau se ha deshabilitado. Luego, siga con el paso 9.d.
2. Edite el archivo blacklist.conf.
  Si el archivo /etc/modprobe.d/blacklist.conf no está disponible, créelo.
  
  vi /etc/modprobe.d/blacklist.conf
  
  Agregue la siguiente instrucción al final del archivo:
```
blacklist nouveau
options nouveau modeset=0
```
1. Ejecute el siguiente comando para hacer una copia de seguridad y crear una aplicación initramfs:
  - Ubuntu
    sudo update-initramfs -u
  - CentOS:
    mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
    
    dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
1. Reinicie el ECS:
  reboot
Seleccione OK tres veces consecutivas según se le indique para completar la instalación del controlador.
Figura 6 Finalización de la instalación del controlador NVIDIA
Ejecute el siguiente comando para configurar systemd:
systemctl set-default multi-user.target
Ejecute el comando reboot para reiniciar el ECS.
Inicie sesión en ECS y ejecute el comando nvidia-smi. Si el resultado del comando contiene la versión del controlador instalada, se ha instalado el controlador.
Figura 7 Ver la versión del controlador de NVIDIA

Instalación de un controlador Tesla en ECS de Windows

El siguiente ejemplo utiliza Windows Server 2016 Standard 64bit para describir cómo instalar un controlador Tesla en un ECS con aceleración mediante GPU.

Inicie sesión en el ECS.
Descargue el paquete de controladores de NVIDIA.
Seleccione una versión de controlador en Descargas de controladores de NVIDIA según el tipo ECS.

Figura 8 Selección de un tipo de controlador (Windows)
Seleccione una versión de controlador según sea necesario. Lo siguiente utiliza Tesla 425.25 como ejemplo.
Figura 9 Selección de una versión de controlador (Windows)
Haga clic en el controlador que desea descargar. En la página TESLA DRIVER FOR WINDOWS que se muestra, haga clic en DOWNLOAD.
Haga clic en Agree & Download para descargar el paquete de instalación.
Figura 10 Descargar el paquete de instalación del controlador
Haga doble clic en el controlador y haga clic en Run.
Figura 11 Ejecución del programa de instalación del controlador NVIDIA
Seleccione una ruta de instalación y haga clic en OK.
Figura 12 Selección de una ruta de instalación
Instale el programa NVIDIA como se le indique.
Figura 13 Finalización de la instalación del controlador
Reinicie el ECS:
Compruebe si el controlador de NVIDIA se ha instalado.
1. Pase al Device Manager y haga clic en Display adapters.
  Figura 14 Adaptadores de pantalla
1. Abra la ventana cmd en el ECS y ejecute los siguientes comandos:
  cd C:\Program Files\NVIDIA Corporation\NVSMI
  
  nvidia-smi
  
  Si el resultado del comando contiene la versión del controlador instalada, se ha instalado el controlador.
  
  Figura 15 Ver la versión del controlador de NVIDIA

Instalación del kit de herramientas CUDA en un ECS de Linux

El siguiente ejemplo utiliza Ubuntu 16.04 64bit para describir cómo instalar el kit de herramientas CUDA 10.1 en un ECS con aceleración mediante GPU.

Inicie sesión en el ECS.
Actualice el software del sistema basado en el SO.
- Ubuntu
  Actualice la fuente de instalación del software: apt-get -y update
  
  Instalar los programas necesarios: apt-get install gcc g++ make
- CentOS
  Actualice la fuente de instalación de software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
  
  Instalar el programa deseado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
En la página de descarga de CUDA, establezca los parámetros de acuerdo con la información mostrada en Obtención de un controlador Tesla y CUDA Toolkit.
Figura 16 Selección de una versión de CUDA
Encuentre el enlace para descargar CUDA 10.1 y copie el enlace.
Figura 17 Copiando el enlace para descargar CUDA

Ejecute el siguiente comando en el ECS para descargar CUDA:
wget Copied link

Por ejemplo, wget https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.105_418.39_linux.run

Figura 18 Descargando CUDA

Instale CUDA.
Siga las instrucciones proporcionadas en el sitio web oficial de NVIDIA.
Figura 19 Instalación de CUDA
Ejecute el siguiente comando para instalar CUDA:
sh cuda_10.1.243_418.87.00_linux.run
Seleccione accept en la página de instalación y pulse Enter.
Figura 20 Instalación de CUDA_1
Seleccione Install y pulse Enter para iniciar la instalación.
Figura 21 Instalación de CUDA_2

Figura 22 Finalización de la instalación
Ejecute el siguiente comando para pasar a /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery:
cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery
Ejecute el comando make para compilar automáticamente el programa deviceQuery.
Ejecute el siguiente comando para comprobar si CUDA se ha instalado:
./deviceQuery

Si la salida del comando contiene la versión CUDA, CUDA se ha instalado.

Figura 23 salida común de deviceQuery
Compruebe la versión de CUDA.
/usr/local/cuda/bin/nvcc -V

Figura 24 Comprobación de la versión de CUDA
Ejecute el siguiente comando para habilitar el modo persistente:
sudo nvidia-smi -pm 1

Habilitar el modo persistente optimiza el rendimiento de la GPU en los ECS de Linux.

Instalación del kit de herramientas CUDA en un ECS de Windows

El siguiente ejemplo utiliza Windows Server 2016 Standard 64bit para describir cómo instalar el kit de herramientas CUDA 10.1 en un ECS con aceleración mediante GPU.

Inicie sesión en el ECS.
En la página de descarga de CUDA, establezca los parámetros de acuerdo con la información mostrada en Descargar un kit de herramientas CUDA.
Figura 25 Selección de una versión de CUDA
Encuentre el enlace para descargar CUDA 10.1.
Figura 26 Encontrar el enlace para descargar CUDA
Haga clic en Download para descargar el kit de herramientas CUDA.
Haga doble clic en el archivo de instalación y haga clic en Run para instalar el kit de herramientas CUDA.
Figura 27 Instalación de CUDA
En la página CUDA Setup Package, seleccione una ruta de instalación y haga clic en OK.
Figura 28 Selección de una ruta de instalación
Instale el kit de herramientas CUDA como se le indique.
Figura 29 Finalización de la instalación

Comprobar si se ha instalado CUDA
Abra la ventana cmd y ejecute el siguiente comando:

nvcc -V

Si la salida del comando contiene la versión CUDA, CUDA se ha instalado.

Figura 30 Instalación exitosa