Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Cómputo
Elastic Cloud Server
Bare Metal Server
Auto Scaling
Image Management Service
Dedicated Host
FunctionGraph
Cloud Phone Host
Huawei Cloud EulerOS
Redes
Virtual Private Cloud
Elastic IP
Elastic Load Balance
NAT Gateway
Direct Connect
Virtual Private Network
VPC Endpoint
Cloud Connect
Enterprise Router
Enterprise Switch
Global Accelerator
Gestión y gobernanza
Cloud Eye
Identity and Access Management
Cloud Trace Service
Resource Formation Service
Tag Management Service
Log Tank Service
Config
Resource Access Manager
Simple Message Notification
Application Performance Management
Application Operations Management
Organizations
Optimization Advisor
Cloud Operations Center
Resource Governance Center
Migración
Server Migration Service
Object Storage Migration Service
Cloud Data Migration
Migration Center
Cloud Ecosystem
KooGallery
Partner Center
User Support
My Account
Billing Center
Cost Center
Resource Center
Enterprise Management
Service Tickets
HUAWEI CLOUD (International) FAQs
ICP Filing
Support Plans
My Credentials
Customer Operation Capabilities
Partner Support Plans
Professional Services
Análisis
MapReduce Service
Data Lake Insight
CloudTable Service
Cloud Search Service
Data Lake Visualization
Data Ingestion Service
GaussDB(DWS)
DataArts Studio
IoT
IoT Device Access
Otros
Product Pricing Details
System Permissions
Console Quick Start
Common FAQs
Instructions for Associating with a HUAWEI CLOUD Partner
Message Center
Seguridad y cumplimiento
Security Technologies and Applications
Web Application Firewall
Host Security Service
Cloud Firewall
SecMaster
Data Encryption Workshop
Database Security Service
Cloud Bastion Host
Data Security Center
Cloud Certificate Manager
Situation Awareness
Managed Threat Detection
Blockchain
Blockchain Service
Servicios multimedia
Media Processing Center
Video On Demand
Live
SparkRTC
Almacenamiento
Object Storage Service
Elastic Volume Service
Cloud Backup and Recovery
Storage Disaster Recovery Service
Scalable File Service
Volume Backup Service
Cloud Server Backup Service
Data Express Service
Dedicated Distributed Storage Service
Contenedores
Cloud Container Engine
SoftWare Repository for Container
Application Service Mesh
Ubiquitous Cloud Native Service
Cloud Container Instance
Bases de datos
Relational Database Service
Document Database Service
Data Admin Service
Data Replication Service
GeminiDB
GaussDB
Distributed Database Middleware
Database and Application Migration UGO
TaurusDB
Middleware
Distributed Cache Service
API Gateway
Distributed Message Service for Kafka
Distributed Message Service for RabbitMQ
Distributed Message Service for RocketMQ
Cloud Service Engine
EventGrid
Dedicated Cloud
Dedicated Computing Cluster
Aplicaciones empresariales
ROMA Connect
Message & SMS
Domain Name Service
Edge Data Center Management
Meeting
AI
Face Recognition Service
Graph Engine Service
Content Moderation
Image Recognition
Data Lake Factory
Optical Character Recognition
ModelArts
ImageSearch
Conversational Bot Service
Speech Interaction Service
Huawei HiLens
Developer Tools
SDK Developer Guide
API Request Signing Guide
Terraform
Koo Command Line Interface
Distribución de contenido y cómputo de borde
Content Delivery Network
Intelligent EdgeFabric
CloudPond
Soluciones
SAP Cloud
High Performance Computing
Servicios para desarrolladores
ServiceStage
CodeArts
CodeArts PerfTest
CodeArts Req
CodeArts Pipeline
CodeArts Build
CodeArts Deploy
CodeArts Artifact
CodeArts TestPlan
CodeArts Check
Cloud Application Engine
aPaaS MacroVerse
KooPhone
KooDrive
Centro de ayuda/ Elastic Cloud Server/ Guía del usuario/ Instancias/ (Opcional) Instalación de un controlador y un kit de herramientas/ Instalación de un controlador Tesla y CUDA Toolkit en un ECS con aceleración mediante GPU

Instalación de un controlador Tesla y CUDA Toolkit en un ECS con aceleración mediante GPU

Actualización más reciente 2025-01-23 GMT+08:00

Casos

Antes de usar un ECS con aceleración mediante GPU, asegúrese de que el controlador Tesla y el kit de herramientas CUDA deseados se hayan instalado en el ECS para la aceleración de cómputo.

  • Un ECS de aceleración de cómputo (serie P) creado usando una imagen pública tiene un controlador Tesla de una versión especificada instalado por defecto.
  • Después de crear un ECS con aceleración mediante GPU usando una imagen privada, debe tener un controlador Tesla instalado. De lo contrario, la aceleración de cómputo no tendrá efecto.

Esta sección describe cómo instalar un controlador Tesla y un kit de herramientas CUDA en un ECS con aceleración mediante GPU.

Notas

  • El ECS de destino tiene un límite EIP.
  • El controlador Tesla y el kit de herramientas CUDA no se han instalado en el ECS.
NOTA:
  • Descargue el kit de herramientas CUDA del sitio web oficial de NVIDIA e instálelo. Un controlador de Tesla que coincida con la versión de CUDA se instalará automáticamente entonces. Sin embargo, si hay requisitos específicos o dependencias en la versión del controlador de Tesla, descargue primero el controlador de Tesla correspondiente desde el sitio web oficial de NVIDIA y luego instale el controlador antes de instalar el kit de herramientas CUDA.
  • Si se ha instalado un controlador Tesla en el ECS, compruebe la versión del controlador. Antes de instalar una nueva versión de controlador, desinstale el controlador original de Tesla para evitar un error de instalación debido a conflictos de controladores.

Instalación de un controlador Tesla en ECS de Linux

El siguiente ejemplo utiliza Ubuntu 16.04 64bit para describir cómo instalar el controlador de Tesla que coincide con CUDA 10.1 en un ECS con aceleración mediante GPU.

NOTA:

La versión del kernel de Linux es compatible con la versión del controlador. Si la instalación del controlador falla, compruebe el registro de instalación del controlador, que generalmente se almacena en /var/log/nvidia-installer.log. Si el registro muestra que el error fue causado por un error de compilación de controladores, por ejemplo, la configuración del parámetro get_user_pages es incorrecta, la versión del núcleo es incompatible con la versión del controlador. En tal caso, seleccione la versión del kernel y la versión del controlador deseados y vuelva a instalarlos. Se recomienda que el tiempo de lanzamiento de la versión del kernel y la versión del controlador sean los mismos.

  1. Inicie sesión en el ECS.
  2. Actualice el software del sistema basado en el SO.
    • Ubuntu

      Actualice la fuente de instalación del software: apt-get -y update

      Instalar los programas necesarios: apt-get install gcc g++ make

    • CentOS

      Actualice la fuente de instalación de software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*

      Instalar el programa deseado: yum install -y kernel-devel-`uname -r` gcc gcc-c++

  3. Descargue el paquete de controladores de NVIDIA.

    Seleccione una versión de controlador en Descargas de controladores de NVIDIA según el tipo ECS. Haga clic en SEARCH.

    Figura 1 Selección de una versión de controlador de NVIDIA
  4. Seleccione una versión de controlador según sea necesario. Lo siguiente utiliza Tesla 418.67 como ejemplo.
    Figura 2 Selección de una versión de controlador
  5. Haga clic en el controlador que desea descargar. En la página TESLA DRIVER FOR LINUX X64 que se muestra, haga clic en DOWNLOAD.
  6. Copiar el enlace de descarga.
    Figura 3 Copiando el enlace de descarga
  7. Ejecute el siguiente comando en el ECS para descargar el controlador:

    wget Copied link

    Por ejemplo, wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run

    Figura 4 Obtención del paquete de instalación
  8. Ejecute el siguiente comando para instalar el controlador:

    sh NVIDIA-Linux-x86_64-418.67.run

  9. (Opcional) Si se muestra la siguiente información después de ejecutar el comando para instalar el controlador, deshabilite el controlador Nouveau.
    Figura 5 Desactivación del controlador Nouveau
    1. Ejecute el siguiente comando para comprobar si se ha instalado el controlador Nouveau:

      lsmod | grep nouveau

      • Si la salida del comando contiene información sobre el controlador Nouveau, el controlador Nouveau se ha instalado y debe deshabilitarse. Luego, siga con el paso 9.b.
      • Si la salida del comando no contiene información sobre el controlador Nouveau, el controlador Nouveau se ha deshabilitado. Luego, siga con el paso 9.d.
    2. Edite el archivo blacklist.conf.

      Si el archivo /etc/modprobe.d/blacklist.conf no está disponible, créelo.

      vi /etc/modprobe.d/blacklist.conf

      Agregue la siguiente instrucción al final del archivo:

      blacklist nouveau
      options nouveau modeset=0
    1. Ejecute el siguiente comando para hacer una copia de seguridad y crear una aplicación initramfs:
      • Ubuntu

        sudo update-initramfs -u

      • CentOS:

        mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

        dracut -v /boot/initramfs-$(uname -r).img $(uname -r)

    1. Reinicie el ECS:

      reboot

  10. Seleccione OK tres veces consecutivas según se le indique para completar la instalación del controlador.
    Figura 6 Finalización de la instalación del controlador NVIDIA
  11. Ejecute el siguiente comando para configurar systemd:

    systemctl set-default multi-user.target

  12. Ejecute el comando reboot para reiniciar el ECS.
  13. Inicie sesión en ECS y ejecute el comando nvidia-smi. Si el resultado del comando contiene la versión del controlador instalada, se ha instalado el controlador.
    Figura 7 Ver la versión del controlador de NVIDIA

Instalación de un controlador Tesla en ECS de Windows

El siguiente ejemplo utiliza Windows Server 2016 Standard 64bit para describir cómo instalar un controlador Tesla en un ECS con aceleración mediante GPU.

  1. Inicie sesión en el ECS.
  2. Descargue el paquete de controladores de NVIDIA.

    Seleccione una versión de controlador en Descargas de controladores de NVIDIA según el tipo ECS.

    Figura 8 Selección de un tipo de controlador (Windows)
  3. Seleccione una versión de controlador según sea necesario. Lo siguiente utiliza Tesla 425.25 como ejemplo.
    Figura 9 Selección de una versión de controlador (Windows)
  4. Haga clic en el controlador que desea descargar. En la página TESLA DRIVER FOR WINDOWS que se muestra, haga clic en DOWNLOAD.
  5. Haga clic en Agree & Download para descargar el paquete de instalación.
    Figura 10 Descargar el paquete de instalación del controlador
  6. Haga doble clic en el controlador y haga clic en Run.
    Figura 11 Ejecución del programa de instalación del controlador NVIDIA
  7. Seleccione una ruta de instalación y haga clic en OK.
    Figura 12 Selección de una ruta de instalación
  8. Instale el programa NVIDIA como se le indique.
    Figura 13 Finalización de la instalación del controlador
  9. Reinicie el ECS:
  10. Compruebe si el controlador de NVIDIA se ha instalado.
    1. Pase al Device Manager y haga clic en Display adapters.
      Figura 14 Adaptadores de pantalla
    1. Abra la ventana cmd en el ECS y ejecute los siguientes comandos:

      cd C:\Program Files\NVIDIA Corporation\NVSMI

      nvidia-smi

      Si el resultado del comando contiene la versión del controlador instalada, se ha instalado el controlador.

      Figura 15 Ver la versión del controlador de NVIDIA

Instalación del kit de herramientas CUDA en un ECS de Linux

El siguiente ejemplo utiliza Ubuntu 16.04 64bit para describir cómo instalar el kit de herramientas CUDA 10.1 en un ECS con aceleración mediante GPU.

  1. Inicie sesión en el ECS.
  2. Actualice el software del sistema basado en el SO.
    • Ubuntu

      Actualice la fuente de instalación del software: apt-get -y update

      Instalar los programas necesarios: apt-get install gcc g++ make

    • CentOS

      Actualice la fuente de instalación de software: yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*

      Instalar el programa deseado: yum install -y kernel-devel-`uname -r` gcc gcc-c++

  3. En la página de descarga de CUDA, establezca los parámetros de acuerdo con la información mostrada en Obtención de un controlador Tesla y CUDA Toolkit.
    Figura 16 Selección de una versión de CUDA
  4. Encuentre el enlace para descargar CUDA 10.1 y copie el enlace.
    Figura 17 Copiando el enlace para descargar CUDA
  1. Ejecute el siguiente comando en el ECS para descargar CUDA:

    wget Copied link

    Por ejemplo, wget https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.105_418.39_linux.run

    Figura 18 Descargando CUDA
  1. Instale CUDA.
    Siga las instrucciones proporcionadas en el sitio web oficial de NVIDIA.
    Figura 19 Instalación de CUDA
  2. Ejecute el siguiente comando para instalar CUDA:

    sh cuda_10.1.243_418.87.00_linux.run

  3. Seleccione accept en la página de instalación y pulse Enter.
    Figura 20 Instalación de CUDA_1
  4. Seleccione Install y pulse Enter para iniciar la instalación.
    Figura 21 Instalación de CUDA_2
    Figura 22 Finalización de la instalación
  5. Ejecute el siguiente comando para pasar a /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery:

    cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery

  6. Ejecute el comando make para compilar automáticamente el programa deviceQuery.
  7. Ejecute el siguiente comando para comprobar si CUDA se ha instalado:

    ./deviceQuery

    Si la salida del comando contiene la versión CUDA, CUDA se ha instalado.

    Figura 23 salida común de deviceQuery
  8. Compruebe la versión de CUDA.

    /usr/local/cuda/bin/nvcc -V

    Figura 24 Comprobación de la versión de CUDA
  9. Ejecute el siguiente comando para habilitar el modo persistente:

    sudo nvidia-smi -pm 1

    Habilitar el modo persistente optimiza el rendimiento de la GPU en los ECS de Linux.

Instalación del kit de herramientas CUDA en un ECS de Windows

El siguiente ejemplo utiliza Windows Server 2016 Standard 64bit para describir cómo instalar el kit de herramientas CUDA 10.1 en un ECS con aceleración mediante GPU.

  1. Inicie sesión en el ECS.
  2. En la página de descarga de CUDA, establezca los parámetros de acuerdo con la información mostrada en Descargar un kit de herramientas CUDA.
    Figura 25 Selección de una versión de CUDA
  3. Encuentre el enlace para descargar CUDA 10.1.
    Figura 26 Encontrar el enlace para descargar CUDA
  4. Haga clic en Download para descargar el kit de herramientas CUDA.
  5. Haga doble clic en el archivo de instalación y haga clic en Run para instalar el kit de herramientas CUDA.
    Figura 27 Instalación de CUDA
  6. En la página CUDA Setup Package, seleccione una ruta de instalación y haga clic en OK.
    Figura 28 Selección de una ruta de instalación
  7. Instale el kit de herramientas CUDA como se le indique.
    Figura 29 Finalización de la instalación
  1. Comprobar si se ha instalado CUDA

    Abra la ventana cmd y ejecute el siguiente comando:

    nvcc -V

    Si la salida del comando contiene la versión CUDA, CUDA se ha instalado.

    Figura 30 Instalación exitosa

Utilizamos cookies para mejorar nuestro sitio y tu experiencia. Al continuar navegando en nuestro sitio, tú aceptas nuestra política de cookies. Descubre más

Comentarios

Comentarios

Comentarios

0/500

Seleccionar contenido

Enviar el contenido seleccionado con los comentarios