(推荐)自动安装GPU加速型ECS的GPU驱动(Linux)
操作场景
在使用GPU加速型实例时,需确保实例已安装GPU驱动,否则无法获得相应的GPU加速能力。
本节内容介绍如何在GPU加速型Linux实例上通过脚本自动安装GPU驱动。
使用须知
- 本操作仅支持Linux操作系统。
- 本操作当前仅支持安装Tesla驱动。
- 如果GPU加速型实例已安装GPU驱动,需要先卸载原驱动后再安装新的目标驱动。
- GPU驱动安装成功后,实例会自动重启。
- 仅部分Linux公共镜像支持通过脚本自动安装GPU驱动,如下所示:
- CentOS 7.6、CentOS 7.9、CentOS 8.2。
- Ubuntu 18.04、Ubuntu 20.04、Ubuntu22.04。
如果在支持的Linux公共镜像中没有您需要的操作系统及版本,请参考手动安装GPU加速型ECS的Tesla驱动,手动安装GPU驱动。
- 如果您使用的是私有镜像,请确保镜像已安装了Cloud-init组件及安装GPU驱动所需的依赖,且需使用驱动脚本所支持的Linux操作系统及版本。
- 请根据表1选择需要的驱动安装包版本。
驱动安装脚本支持区域及获取方式
您可以通过执行以下命令,获取驱动安装脚本。
- 华北-北京一
wget -t 10 --timeout=10 https://hgcs-drivers-cn-north-1.obs.cn-north-1.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华北-北京二
wget -t 10 --timeout=10 https://hgcs-drivers-cn-north-2.obs.cn-north-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华北-北京四
wget -t 10 --timeout=10 https://hgcs-drivers-cn-north-4.obs.cn-north-4.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华北-乌兰察布一
wget -t 10 --timeout=10 https://hgcs-drivers-cn-north-9.obs.cn-north-9.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华东-上海一
wget -t 10 --timeout=10 https://hgcs-drivers-cn-east-3.obs.cn-east-3.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华东-上海二
wget -t 10 --timeout=10 https://hgcs-drivers-cn-east-2.obs.cn-east-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华南-广州
wget -t 10 --timeout=10 https://hgcs-drivers-cn-south-1.obs.cn-south-1.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 华南-广州-友好用户环境
wget -t 10 --timeout=10 https://hgcs-drivers-cn-south-4.obs.cn-south-4.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 西南-贵阳一
wget -t 10 --timeout=10 https://hgcs-drivers-cn-southwest-2.obs.cn-southwest-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 中国-香港
wget -t 10 --timeout=10 https://hgcs-drivers-ap-southeast-1.obs.ap-southeast-1.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 亚太-曼谷
wget -t 10 --timeout=10 https://hgcs-drivers-ap-southeast-2.obs.ap-southeast-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 亚太-新加坡
wget -t 10 --timeout=10 https://hgcs-drivers-ap-southeast-3.obs.ap-southeast-3.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 非洲-约翰内斯堡
wget -t 10 --timeout=10 https://hgcs-drivers-af-south-1.obs.af-south-1.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
操作步骤
以下操作以Ubuntu 20.04 64bit操作系统,P2v规格的GPU加速型实例安装CUDA 11.0对应的Tesla驱动为例进行介绍。
- 以root账号远程登录云服务器。
- 执行以下命令,获取驱动安装脚本并运行。
wget -t 10 --timeout=10 https://hgcs-drivers-cn-east-2.obs.cn-east-2.myhuaweicloud.com/release/script/auto_install.sh && bash auto_install.sh
- 根据界面提示,选择需要安装的驱动版本。
图1 选择驱动安装版本
- 卸载已安装驱动。
如果云服务器本身未安装驱动,脚本会自动跳过该步骤,开始进行驱动安装。
- 卸载CUDA Toolkit。
图2 卸载CUDA Toolkit(1)
图3 卸载CUDA Toolkit(2)
- 卸载GPU driver。
图4 卸载GPU driver
卸载完成后,开始安装驱动,此过程会持续几分钟,请耐心等待。
- 卸载CUDA Toolkit。
- 驱动安装完成后,会自动重启云服务器后,请重新以root账号登录。
- 执行以下命令,检查驱动是否安装成功。
如果返回信息中包含了已安装的驱动版本,说明驱动安装成功。
图5 查看驱动安装结果
- 执行以下命令,检查CUDA版本是否正确。
图6 检查CUDA版本
- (可选)检查CUDA是否正常。