Instalación de un controlador Tesla y CUDA Toolkit en un ECS con aceleración mediante GPU
Casos
Antes de usar un ECS con aceleración mediante GPU, asegúrese de que el controlador Tesla y el kit de herramientas CUDA deseados se hayan instalado en el ECS para la aceleración de cómputo.
- Un ECS de aceleración de cómputo (serie P) creado usando una imagen pública tiene un controlador Tesla de una versión especificada instalado por defecto.
- Después de crear un ECS con aceleración mediante GPU usando una imagen privada, debe tener un controlador Tesla instalado. De lo contrario, la aceleración de cómputo no tendrá efecto.
Esta sección describe cómo instalar un controlador Tesla y un kit de herramientas CUDA en un ECS con aceleración mediante GPU.
Notas
- El ECS de destino tiene un límite EIP.
- El controlador Tesla y el kit de herramientas CUDA no se han instalado en el ECS.
- Descargue el kit de herramientas CUDA del sitio web oficial de NVIDIA e instálelo. Un controlador de Tesla que coincida con la versión de CUDA se instalará automáticamente entonces. Sin embargo, si hay requisitos específicos o dependencias en la versión del controlador de Tesla, descargue primero el controlador de Tesla correspondiente desde el sitio web oficial de NVIDIA y luego instale el controlador antes de instalar el kit de herramientas CUDA.
- Si se ha instalado un controlador Tesla en el ECS, compruebe la versión del controlador. Antes de instalar una nueva versión de controlador, desinstale el controlador original de Tesla para evitar un error de instalación debido a conflictos de controladores.
- Obtención de un controlador Tesla y CUDA Toolkit
- Instalación de un controlador Tesla
- Instalación de un kit de herramientas CUDA
Instalación de un controlador Tesla en ECS de Linux
El siguiente ejemplo utiliza Ubuntu 16.04 64bit para describir cómo instalar el controlador de Tesla que coincide con CUDA 10.1 en un ECS con aceleración mediante GPU.
La versión del kernel de Linux es compatible con la versión del controlador. Si la instalación del controlador falla, compruebe el registro de instalación del controlador, que generalmente se almacena en /var/log/nvidia-installer.log. Si el registro muestra que el error fue causado por un error de compilación de controladores, por ejemplo, la configuración del parámetro get_user_pages es incorrecta, la versión del núcleo es incompatible con la versión del controlador. En tal caso, seleccione la versión del kernel y la versión del controlador deseados y vuelva a instalarlos. Se recomienda que el tiempo de lanzamiento de la versión del kernel y la versión del controlador sean los mismos.
- Inicie sesión en el ECS.
- Actualice el software del sistema basado en el SO.
- Ubuntu
Actualice la fuente de instalación del software: apt-get -y update
Instalar los programas necesarios: apt-get install gcc g++ make
- CentOS
Actualice la fuente de instalación de software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
Instalar el programa deseado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
- Ubuntu
- Descargue el paquete de controladores de NVIDIA.
Seleccione una versión de controlador en Descargas de controladores de NVIDIA según el tipo ECS. Haga clic en SEARCH.
Figura 1 Selección de una versión de controlador de NVIDIA
- Seleccione una versión de controlador según sea necesario. Lo siguiente utiliza Tesla 418.67 como ejemplo.
Figura 2 Selección de una versión de controlador
- Haga clic en el controlador que desea descargar. En la página TESLA DRIVER FOR LINUX X64 que se muestra, haga clic en DOWNLOAD.
- Copiar el enlace de descarga.
Figura 3 Copiando el enlace de descarga
- Ejecute el siguiente comando en el ECS para descargar el controlador:
Por ejemplo, wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run
Figura 4 Obtención del paquete de instalación
- Ejecute el siguiente comando para instalar el controlador:
- (Opcional) Si se muestra la siguiente información después de ejecutar el comando para instalar el controlador, deshabilite el controlador Nouveau.
Figura 5 Desactivación del controlador Nouveau
- Ejecute el siguiente comando para comprobar si se ha instalado el controlador Nouveau:
- Si la salida del comando contiene información sobre el controlador Nouveau, el controlador Nouveau se ha instalado y debe deshabilitarse. Luego, siga con el paso 9.b.
- Si la salida del comando no contiene información sobre el controlador Nouveau, el controlador Nouveau se ha deshabilitado. Luego, siga con el paso 9.d.
- Edite el archivo blacklist.conf.
Si el archivo /etc/modprobe.d/blacklist.conf no está disponible, créelo.
vi /etc/modprobe.d/blacklist.conf
Agregue la siguiente instrucción al final del archivo:
blacklist nouveau options nouveau modeset=0
- Ejecute el siguiente comando para hacer una copia de seguridad y crear una aplicación initramfs:
- Ejecute el siguiente comando para comprobar si se ha instalado el controlador Nouveau:
- Seleccione OK tres veces consecutivas según se le indique para completar la instalación del controlador.
Figura 6 Finalización de la instalación del controlador NVIDIA
- Ejecute el siguiente comando para configurar systemd:
- Ejecute el comando reboot para reiniciar el ECS.
- Inicie sesión en ECS y ejecute el comando nvidia-smi. Si el resultado del comando contiene la versión del controlador instalada, se ha instalado el controlador.
Figura 7 Ver la versión del controlador de NVIDIA
Instalación de un controlador Tesla en ECS de Windows
El siguiente ejemplo utiliza Windows Server 2016 Standard 64bit para describir cómo instalar un controlador Tesla en un ECS con aceleración mediante GPU.
- Inicie sesión en el ECS.
- Descargue el paquete de controladores de NVIDIA.
Seleccione una versión de controlador en Descargas de controladores de NVIDIA según el tipo ECS.
Figura 8 Selección de un tipo de controlador (Windows)
- Seleccione una versión de controlador según sea necesario. Lo siguiente utiliza Tesla 425.25 como ejemplo.
Figura 9 Selección de una versión de controlador (Windows)
- Haga clic en el controlador que desea descargar. En la página TESLA DRIVER FOR WINDOWS que se muestra, haga clic en DOWNLOAD.
- Haga clic en Agree & Download para descargar el paquete de instalación.
Figura 10 Descargar el paquete de instalación del controlador
- Haga doble clic en el controlador y haga clic en Run.
Figura 11 Ejecución del programa de instalación del controlador NVIDIA
- Seleccione una ruta de instalación y haga clic en OK.
Figura 12 Selección de una ruta de instalación
- Instale el programa NVIDIA como se le indique.
Figura 13 Finalización de la instalación del controlador
- Reinicie el ECS:
- Compruebe si el controlador de NVIDIA se ha instalado.
- Pase al Device Manager y haga clic en Display adapters.
Figura 14 Adaptadores de pantalla
- Abra la ventana cmd en el ECS y ejecute los siguientes comandos:
cd C:\Program Files\NVIDIA Corporation\NVSMI
nvidia-smi
Si el resultado del comando contiene la versión del controlador instalada, se ha instalado el controlador.
Figura 15 Ver la versión del controlador de NVIDIA
- Pase al Device Manager y haga clic en Display adapters.
Instalación del kit de herramientas CUDA en un ECS de Linux
El siguiente ejemplo utiliza Ubuntu 16.04 64bit para describir cómo instalar el kit de herramientas CUDA 10.1 en un ECS con aceleración mediante GPU.
- Inicie sesión en el ECS.
- Actualice el software del sistema basado en el SO.
- Ubuntu
Actualice la fuente de instalación del software: apt-get -y update
Instalar los programas necesarios: apt-get install gcc g++ make
- CentOS
Actualice la fuente de instalación de software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*
Instalar el programa deseado: yum install -y kernel-devel-`uname -r` gcc gcc-c++
- Ubuntu
- En la página de descarga de CUDA, establezca los parámetros de acuerdo con la información mostrada en Obtención de un controlador Tesla y CUDA Toolkit.
Figura 16 Selección de una versión de CUDA
- Encuentre el enlace para descargar CUDA 10.1 y copie el enlace.
Figura 17 Copiando el enlace para descargar CUDA
- Ejecute el siguiente comando en el ECS para descargar CUDA:
Por ejemplo, wget https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.105_418.39_linux.run
Figura 18 Descargando CUDA
- Instale CUDA.
- Ejecute el siguiente comando para instalar CUDA:
- Seleccione accept en la página de instalación y pulse Enter.
Figura 20 Instalación de CUDA_1
- Seleccione Install y pulse Enter para iniciar la instalación.
Figura 21 Instalación de CUDA_2
Figura 22 Finalización de la instalación
- Ejecute el siguiente comando para pasar a /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery:
cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery
- Ejecute el comando make para compilar automáticamente el programa deviceQuery.
- Ejecute el siguiente comando para comprobar si CUDA se ha instalado:
Si la salida del comando contiene la versión CUDA, CUDA se ha instalado.
Figura 23 salida común de deviceQuery
- Compruebe la versión de CUDA.
Figura 24 Comprobación de la versión de CUDA
- Ejecute el siguiente comando para habilitar el modo persistente:
Habilitar el modo persistente optimiza el rendimiento de la GPU en los ECS de Linux.
Instalación del kit de herramientas CUDA en un ECS de Windows
El siguiente ejemplo utiliza Windows Server 2016 Standard 64bit para describir cómo instalar el kit de herramientas CUDA 10.1 en un ECS con aceleración mediante GPU.
- Inicie sesión en el ECS.
- En la página de descarga de CUDA, establezca los parámetros de acuerdo con la información mostrada en Descargar un kit de herramientas CUDA.
Figura 25 Selección de una versión de CUDA
- Encuentre el enlace para descargar CUDA 10.1.
Figura 26 Encontrar el enlace para descargar CUDA
- Haga clic en Download para descargar el kit de herramientas CUDA.
- Haga doble clic en el archivo de instalación y haga clic en Run para instalar el kit de herramientas CUDA.
Figura 27 Instalación de CUDA
- En la página CUDA Setup Package, seleccione una ruta de instalación y haga clic en OK.
Figura 28 Selección de una ruta de instalación
- Instale el kit de herramientas CUDA como se le indique.
Figura 29 Finalización de la instalación