文档首页 > > 用户指南> 实例> 安装驱动和工具包(可选)> GPU加速型实例安装NVIDIA GPU驱动及CUDA工具包

GPU加速型实例安装NVIDIA GPU驱动及CUDA工具包

分享
更新时间: 2019/10/25 GMT+08:00

操作场景

使用GPU加速型弹性云服务器时,需确保云服务器已安装GPU驱动和CUDA工具包,否则无法实现计算加速功能。

前提条件

  • 已绑定弹性公网IP。
  • 云服务器未安装GPU驱动以及CUDA工具包。

从NVIDIA官网下载CUDA工具包进行安装,通常会同时自动安装一个和CUDA版本匹配的GPU驱动,免去用户单独安装GPU驱动的步骤。但是如果用户需要进行生产用途,请务必先单独从NVIDIA官网下载并安装匹配的GPU驱动包,然后在再安装CUDA工具包。

安装指引:

CUDA工具包下载地址

表1 CUDA工具包下载地址

实例

类型

操作系统

CUDA版本

下载路径

Operating

System

Architecture

Distribution

Version

P2v

(V100)

CentOS 7.4 64bit

9.2/10.1

9.2版本:https://developer.nvidia.com/cuda-92-download-archive

10.1版本:

https://developer.nvidia.com/cuda-10.1-download-archive-base

Linux

x86_64

CentOS

7

Ubuntu 16.04 64bit

Linux

x86_64

Ubuntu

16.04

Windows Server 2016 Standard 64bit

Windows

x86_64

-

Server 2016

Windows Server 2012 R2 Standard 64bit

Windows

x86_64

-

Server 2012 R2

P1

(P100)

CentOS 7.3 64bit

9

https://developer.nvidia.com/cuda-90-download-archive

Linux

x86_64

CentOS

7

Ubuntu 16.04 64bit

Linux

x86_64

Ubuntu

16.04

Windows Server 2012 R2 Standard 64bit

Windows

x86_64

-

Server 2012 R2

Pi1

(P4)

CentOS 7.3 64bit

9

https://developer.nvidia.com/cuda-90-download-archive

Linux

x86_64

CentOS

7

Ubuntu 16.04 64bit

Linux

x86_64

Ubuntu

16.04

G5.8xlarge.4

(V100直通)

CentOS 7.5 64bit

10.1

https://developer.nvidia.com/cuda-10.1-download-archive-base

Linux

x86_64

CentOS

7

Windows Server 2016 Standard 64bit

Windows

x86_64

-

Server 2016

Windows Server 2012 R2 Standard 64bit

Windows

x86_64

-

Server 2012 R2

Pi2(T4)

CentOS 7.5 64bit

10.1

https://developer.nvidia.com/cuda-10.1-download-archive-base

Linux

x86_64

CentOS

7

Ubuntu 16.04 64bit

Linux

x86_64

Ubuntu

16.04

Windows Server 2016 Standard 64bit

Windows

x86_64

-

Server 2016

Linux操作系统云服务器安装NVIDIA驱动

以下操作以Ubuntu 16.04 64bit操作系统,P2v实例安装CUDA 10.1对应的NVIDIA驱动为例。

Linux内核版本和驱动的版本存在兼容性关系。如果驱动安装失败,请检查驱动安装日志(安装日志通常位于/var/log/nvidia-installer.log)。 日志中如提示失败原因为驱动编译错误,例如 get_user_pages参数不匹配,说明当前内核版本与驱动版本不兼容,请选择合适的内核版本和驱动版本重新安装。建议内核版本与驱动版本发布时间不要相差过大。

  1. 登录弹性云服务器。
  2. 根据操作系统选择命令更新系统软件。
    • CentOS

      更新软件安装源:yum -y update --exclude=kernel* --exclude=centos-release* --exclude=initscripts*

      安装必要程序:yum install -y gcc gcc-c++

    • Ubuntu

      更新软件安装源:apt-get -y update

      安装必要程序:apt-get install gcc g++ make

  3. 下载NVIDIA驱动包。

    单击NVIDIA驱动下载根据实例的类型,选择驱动版本。

    图1 选择NVIDIA驱动
  4. 单击“SEARCH”,进入“TESLA DRIVER FOR LINUX X64”界面,单击“DOWNLOAD”。
  5. 单击“Skip & Continue to Download”,进入下载页面。
    图2 下载NVIDIA驱动
  6. 复制下载链接地址。
    图3 复制下载链接地址
  7. 在云服务器内部执行如下命令进行下载。

    wget 复制的链接地址

    例如:wget http://us.download.nvidia.com/tesla/418.87/NVIDIA-Linux-x86_64-418.87.00.run

    图4 获取安装包
  8. 执行以下命令安装驱动。

    sh NVIDIA-Linux-x86_64-418.87.00.run

  9. (可选)如果执行驱动安装命令后出现如下提示信息,需要禁用nouveau驱动。
    图5 禁用nouveau驱动
    1. 执行以下命令,查看是否安装Nouveau驱动。

      lsmod | grep nouveau

      • 如果回显信息中包含已Nouveau驱动信息,说明Nouveau驱动已安装,请执行步骤9.b
      • 如果回显信息没有Nouveau驱动信息,说明Nouveau驱动未安装,请执行步骤9.d
    2. 执行如下命令编辑blacklist.conf文件。

      如果没有“/etc/modprobe.d/blacklist.conf”文件,请新建一个。

      vi /etc/modprobe.d/blacklist.conf

      添加如下语句添加至文件结尾。

      blacklist nouveau
      options nouveau modeset=0
    1. 执行以下命令,备份并新建一个initramfs。
      • Ubuntu系统:

        sudo update-initramfs –u

      • CentOS系统:

        mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

        dracut -v /boot/initramfs-$(uname -r).img $(uname -r)

    1. 执行以下命令,重启云服务器。

      reboot

  10. 根据安装提示,连续三次选择“OK”。完成驱动的安装。
    图6 完成NVIDIA驱动的安装
  11. 执行命令设置systemd。

    systemctl set-default multi-user.target

  12. 执行reboot,重启云服务器。
  13. 登录云服务器,执行nvidia-smi,如果回显信息中包含了已安装的驱动版本,说明驱动安装成功。
    图7 查看NVIDIA驱动的版本

Windows操作系统云服务器安装NVIDIA驱动

以下操作以Windows Server 2012 R2 Standard 64bit操作系统,P2v实例安装CUDA 10.1对应的NVIDIA驱动为例。

  1. 登录弹性云服务器。
  2. 下载NVIDIA驱动包。

    单击NVIDIA驱动下载根据实例的类型,选择驱动版本。

    图8 选择NVIDIA驱动的版本
  3. 单击“SEARCH”,进入“TESLA DRIVER FOR LINUX X64”界面,单击“DOWNLOAD”。
  4. 单击“Skip & Continue to Download”,进入下载页面。
    图9 跳转至下载页面
  5. 单击“Agree & Download”,下载安装包。
    图10 下载NVIDIA驱动安装包
  6. 双击驱动安装驱动,单击“运行”。
    图11 运行NVIDIA驱动安装程序
  7. 选择安装路径,单击“OK”。
    图12 选择NVIDIA驱动安装路径
  8. 根据安装提示完成NVIDIA程序的安装。
    图13 完成NVIDIA驱动的安装
  9. 重启云服务器。
  10. 检查驱动是否安装成功。
    1. 进入“设备管理器”,查看“显示适配器”。
      图14 显示适配器
    1. 打开云服务器cmd窗口,执行以下命令:

      cd C:\Program Files\NVIDIA Corporation\NVSMI

      nvidia-smi

      如果回显信息中包含了已安装的驱动版本,说明驱动安装成功。

      图15 查看NVIDIA驱动安装版本

Linux操作系统安装CUDA工具包

以下操作以Ubuntu 16.04 64bit操作系统,P2v实例使用run包安装CUDA 10.1为例。

  1. 登录GPU弹性云服务器。
  2. 在CUDA下载页面中,按照表1中的对应的索引项在页面中进行选择。
    图16 选择CUDA版本
  3. 选择完成后,页面会自动呈现出Ubuntu 16.04 64bit对应的CUDA 10.1的下载地址,复制下载地址。
    图17 下载CUDA
  1. 在云服务器内部执行如下命令进行下载。

    wget 复制的链接地址

    例如:wget https://developer.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.105_418.39_linux.run

    图18 Linux云服务器下载CUDA
  1. CUDA工具包下载完成后,按照NVIDIA官网安装指引进行安装。
    按照如下图的NVIDIA官网的Installation Instructions进行安装。
    图19 Linux云服务器安装CUDA
  2. 执行以下命令安装CUDA。

    sh cuda_10.1.243_418.87.00_linux.run

  3. 在安装界面输入“accept”,回车进入下一步。
    图20 安装CUDA_1
  4. 选择“Install”,回车进入安装过程。
    图21 安装CUDA_2
    图22 安装CUDA完成
  5. 执行以下命令进入/usr/local/cuda-10.1/samples/1_Utilities/deviceQuery 目录下。

    cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery

  6. 执行make命令,自动编译deviceQuery程序。
  7. 执行以下命令查看CUDA是否安装成功。

    ./deviceQuery

    如回显信息中有CUDA的版本信息证明CUDA安装成功。

    图23 deviceQuery回显信息
  8. 执行以下命令启动持久模式。

    sudo nvidia-smi –pm 1

    启用持久模式设置可以优化Linux实例上GPU设备的性能。

Windows操作系统安装CUDA工具包

以下操作以Windows Server 2012 R2 Standard 64bit操作系统P2v实例安装CUDA 10.1为例。

  1. 登录弹性云服务器。
  2. 在CUDA下载页面中,按照表1中的对应的索引项在页面中进行选择。
    图24 选择CUDA版本
  3. 选择完成后,页面会自动呈现出Windows Server 2012 R2 Standard 64bit对应的CUDA 10.1的下载地址。
    图25 下载CUDA
  4. 单击“Download”下载CUDA工具包。
  5. 双击打开安装文件,单击“运行”安装CUDA工具包。
    图26 安装CUDA_1
  6. 选择安装地址,在“CUDA Setup Package”界面,单击“OK”
    图27 选择CUDA安装路径
  7. 根据安装提示完成CUDA的安装。
    图28 CUDA安装完成
  1. 检查CUDA是否安装成功。

    打开cmd命令窗口,执行以下命令。

    nvcc -V

    如果回显信息中出现CUDA的版本信息,说明CUDA安装成功。

    图29 CUDA安装成功
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区