- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
- 用户指南
-
私有镜像制作指南
- 制作镜像准备
- 创建虚拟机
-
安装并配置虚拟机(Linux)
- 安装虚拟机
- 启动引导文件修改(仅UEFI启动场景涉及)
- 虚拟机环境配置
- 安装Cloud-Init
- 配置Cloud-Init
- 查看Cloud-Init服务状态
- 修改引导的硬件设备驱动
- 安装bms-network-config软件包
- 安装network服务
- 安装SDI卡驱动
- 安装Hi1822网卡驱动
- 安装IB驱动(可选)
- 安装FusionServer/TaiShanServer服务器iDriver驱动
- 安装多路径软件(可选)
- 安装一键式重置密码插件
- 安全性配置
-
配置裸金属服务器远程登录
- x86:Oracle Linux 7.3/Oracle Linux 7.4/Red Hat 7系列/CentOS 7.2/CentOS 7.4/CentOS 7.5/CentOS 7.6
- x86:Oracle Linux 6系列/Red Hat 6系列/CentOS 6系列
- x86:SUSE 11 SP4
- ARM:CentOS 7
- x86:SUSE 12系列/SUSE 15系列/CentOS 7.3/EulerOS/OpenEuler/Oracle Linux 7.2
- ARM:EulerOS/OpenEuler
- x86:Ubuntu 16.04/Ubuntu 18.04
- ARM:Ubuntu 16.04、Ubuntu 18.04
- x86:Ubuntu 14.04/Debian
- 配置根分区自动扩盘
- 昇腾服务器驱动和固件安装升级
- 安装vroce驱动
- 清理文件
- 配置虚拟机(Windows)
- 获取镜像
-
FAQ
- 如何处理从Linux裸金属服务器的bond0的vlan子接口输出的报文,其源mac为bond0的mac问题?
- 如何处理SUSE 12 SP1操作系统自带的wicked模块,其概率性将bond端口模式配置不正确,进而导致IP链路不通的问题?
- 如何设置裸金属服务器CPU频率调节模式?
- 如何处理Windows裸金属服务器下发后Cloudbase-init服务异常退出的问题?
- 如何处理cloud-init-local概率性启动失败导致裸金属服务器不能正确注入数据的问题?
- x86 EulerOS 2.3 UDP报文性能调优
- 如何处理EulerOS系列操作系统在远程登录时,出现无法弹出登录指令或乱码干扰登录的问题?
- 如何对软件进行完整性校验?
- 如何检查device是否正常运行
- 附录
- 修订记录
- 最佳实践
-
API参考
- 使用前必读
- API概览
- 如何调用API
- API
- 应用示例
- 公共参数
- 权限和授权项
-
历史API
- 接口使用说明(OpenStack Nova API)
- 查询API版本信息(OpenStack Nova API)
- 裸金属服务器生命周期管理(OpenStack Nova API)
- 裸金属服务器状态管理(OpenStack Nova API)
- 裸金属服务器元数据管理(OpenStack Nova API)
- 裸金属服务器IP地址查询(OpenStack Nova API)
- 裸金属服务器规格查询(OpenStack Nova API)
- 裸金属服务器网卡管理(OpenStack Nova API)
- 裸金属服务器云硬盘管理(OpenStack Nova API)
- 裸金属服务器一维标签管理(OpenStack Nova API)
- 附录
- 修订记录
- 场景代码示例
- SDK参考
-
常见问题
- 通用类
- 实例类
- 密钥对与密码类
- 登录类
-
网络与安全类
- 不同账号下裸金属服务器内网是否可以互通?
- 同一区域、不同可用区的两台裸金属服务器如何通信?
- 我创建的裸金属服务器是否在同一子网?
- 裸金属服务器是否可以关联多个安全组?
- 裸金属服务器可以和同一VPC内的弹性云服务器通信吗?
- 裸金属服务器的主网卡和扩展网卡在使用上有什么区别?
- 裸金属服务器可以绑定多个弹性公网IP吗?
- 是否可以手动设置弹性公网IP的地址?
- 已释放的弹性公网IP,再次申请会分配相同的EIP地址吗?
- 弹性公网IP、私有IP、虚拟IP之间有什么区别?
- 在只能使用SSH登录裸金属服务器的情况下,如何修改裸金属服务器的网络配置或重启网络?
- 如何处理CentOS 7系列扩展网卡无法ping通的问题?
- 如何处理业务端口被一键式重置密码插件占用?
- 如何处理裸金属服务器主网卡和扩展网卡共平面通信异常问题?
- 如何设置裸金属服务器的静态IP?
- 裸金属服务器绑定128个eth网络设备时,网络性能差,如何解决?
- 磁盘类
-
操作系统类
- 我能否自己安装或者升级操作系统?
- 裸金属服务器能否更换操作系统?
- 裸金属服务器操作系统是否有图形界面?
- 裸金属服务器操作系统自带上传工具吗?
- 裸金属服务器的公共镜像是否存在Swap分区?
- 如何设置裸金属服务器的静态主机名?
- 如何设置裸金属服务器镜像密码的有效期?
- 如何设置SSH服务配置项?
- Windows裸金属服务器的系统时间与本地时间相差8小时,如何处理?
- Windows Server 2012裸金属服务器如何修改SID值?
- CentOS 7系列裸金属服务器如何切换内核版本?
- 根分区自动扩盘的场景下,如何隔离日志空间大小?
- 误升内核的场景,如何回退至原始内核版本?
- 如何增加系统Swap交换分区的大小?
- 如何扩展快速发放裸金属服务器的根分区大小?
- Linux操作系统常用命令速查
- 重新挂载lvm卷后如何更新磁盘metadata信息
- Windows云盘裸机HA之后网络不通如何恢复?
- 故障排除
- 视频帮助
- 文档下载
- 通用参考
链接复制成功!
p2服务器安装NVIDIA GPU驱动和CUDA工具包
操作场景
GPU加速型p2(physical.p2.large规格)裸金属服务器创建成功后,需安装NVIDIA GPU驱动和CUDA工具包,从而实现计算加速功能。
前提条件
- 已绑定弹性公网IP。
- 已下载对应操作系统所需驱动的安装包。
表1 NVIDIA GPU驱动和CUDA工具包下载 操作系统
需要下载的驱动
下载地址
Ubuntu 16.04、CentOS 7.4
NVIDIA GPU驱动安装包“NVIDIA-Linux-x86_64-384.81.run”
https://www.nvidia.com/download/driverResults.aspx/124722/en-us
CUDA工具包安装包“cuda_9.0.176_384.81_linux.run”
不同的操作系统,安装NVIDIA GPU驱动和CUDA工具包的操作略有不同,具体如下:
CentOS 7.4安装操作
- 登录裸金属服务器,执行以下命令,切换至root权限。
su root
- (可选)如果不存在依赖包gcc、gcc-c++、make和kernel-devel,请执行以下命令进行安装。
yum install gcc
yum install gcc-c++
yum install make
yum install kernel-devel-`uname -r`
- (可选)将Nouveau驱动列入黑名单。
如果已经安装并加载了Nouveau的显卡驱动,请执行以下操作将Nouveau驱动列入黑名单以避免冲突。
- (可选)如果X服务正在运行,请执行systemctl set-default multi-user.target命令并重启裸金属服务器以进入多用户模式。
- (可选)安装NVIDIA GPU驱动。
如果选择了特定版本的NVIDIA GPU驱动,而不是捆绑在CUDA工具包中的版本,则需要执行此步骤。
- 下载NVIDIA GPU驱动安装包NVIDIA-Linux-x86_64-xxx.yy.run(下载链接:https://www.nvidia.com/Download/index.aspx?lang=en),并将该安装包上传至裸金属服务器的“/tmp”目录下。
图1 搜索NVIDIA驱动包(CentOS 7.4)
- 执行以下命令,安装NVIDIA GPU驱动。
- 执行以下命令,删除安装包。
- 下载NVIDIA GPU驱动安装包NVIDIA-Linux-x86_64-xxx.yy.run(下载链接:https://www.nvidia.com/Download/index.aspx?lang=en),并将该安装包上传至裸金属服务器的“/tmp”目录下。
- 安装CUDA工具包。
- 下载CUDA Toolkit安装包cuda_a.b.cc_xxx.yy_linux.run(下载链接:https://developer.nvidia.com/cuda-downloads),并将该安装包上传至裸金属服务器的“/tmp”目录下。
- 执行以下命令,修改安装包的权限。
- 执行以下命令,安装CUDA工具包。
./cuda_a.b.cc_xxx.yy_linux.run --toolkit --samples --silent --override --tmpdir=/tmp/
- 执行以下命令,删除安装包。
- 执行如下三条命令,验证是否安装成功。
cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv/
make
./deviceQueryDrv
回显信息中包含“Result = PASS”,表示CUDA工具包和NVIDIA GPU驱动安装成功。
Ubuntu 16.04安装操作
- 登录裸金属服务器,执行以下命令,切换至root权限。
sudo root
- (可选)如果不存在依赖包gcc、g++和make,请执行以下命令进行安装。
apt-get install gcc
apt-get install g++
apt-get install make
- (可选)将Nouveau驱动列入黑名单。
如果已经安装并加载了Nouveau的显卡驱动,请执行以下操作将Nouveau驱动列入黑名单以避免冲突。
- (可选)如果X服务正在运行,请执行systemctl set-default multi-user.target命令并重启裸金属服务器以进入多用户模式。
- (可选)安装NVIDIA GPU驱动。
如果选择了特定版本的NVIDIA GPU驱动,而不是捆绑在CUDA工具包中的版本,则需要执行此步骤。
- 下载NVIDIA GPU驱动安装包NVIDIA-Linux-x86_64-xxx.yy.run(下载链接:https://www.nvidia.com/Download/index.aspx?lang=en),并将该安装包上传至裸金属服务器的“/tmp”目录下。
图2 搜索NVIDIA驱动包(Ubuntu 16.04)
- 执行以下命令,安装NVIDIA GPU驱动。
- 执行以下命令,删除安装包。
- 下载NVIDIA GPU驱动安装包NVIDIA-Linux-x86_64-xxx.yy.run(下载链接:https://www.nvidia.com/Download/index.aspx?lang=en),并将该安装包上传至裸金属服务器的“/tmp”目录下。
- 安装CUDA工具包。
- 下载CUDA Toolkit安装包cuda_a.b.cc_xxx.yy_linux.run(下载链接:https://developer.nvidia.com/cuda-downloads),并将该安装包上传至裸金属服务器的“/tmp”目录下。
- 执行以下命令,修改安装包的权限。
- 执行以下命令,安装CUDA工具包。
./cuda_a.b.cc_xxx.yy_linux.run --toolkit --samples --silent --override --tmpdir=/tmp/
- 执行以下命令,删除安装包。
- 执行如下三条命令,验证是否安装成功。
cd /usr/local/cuda/samples/1_Utilities/deviceQueryDrv/
make
./deviceQueryDrv
回显信息中包含“Result = PASS”,表示CUDA工具包和NVIDIA GPU驱动安装成功。