升级昇腾服务器芯片驱动
操作场景
该任务指导用户升级Atlas 800 训练服务器(型号9000)昇腾服务器芯片的驱动。
run升级包支持一键式升级,本章节以Atlas 800 训练服务器(型号9000)的A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run包为例说明,具体操作以客户实际host系统对应驱动包为准。
- 驱动升级不会改变系统的用户名和密码。
对系统的影响
Atlas 800 训练服务器(型号9000)驱动版本升级过程中需要复位系统,会导致业务中断。为了减少对业务的影响,执行升级操作前请提前切走业务。
操作步骤
- 参照升级前准备准备驱动包“A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run”。
- 使用root账户登录Atlas 800 训练服务器(型号9000)所在服务器。
- 将“A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run”上传至到Linux系统任意目录下,如/opt下。
- 进入软件包“A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run”所在路径,如/opt下。
cd /opt
- 执行如下命令,更改“A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run”软件包权限。
chmod u+x A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run
- 执行./A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run --check命令,校验run安装包的一致性和完整性。
- 执行升级命令完成升级操作。
升级过程支持一键式升级操作,可执行./A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run --upgrade命令,完成升级。
出现以下类似回显,表示升级成功。
Driver package install success! Reboot needed for installation/upgrade to take effect!
- 升级驱动时,会将动态库libdcmi.so和头文件dcmi_interface_api.h拷贝到“/usr/local/dcmi/”目录下。
- 驱动升级过程中昇腾服务器驱动的日志信息输出在“/var/log/ascend_seclog/ascend_install.log”文件中。
- 重启系统。
reboot
- 检查升级后的版本号。
在软件包安装路径下,执行以下命令查看所升级软件包版本是否正确。
cat version.info
- 软件包安装默认路径:“/usr/local/Ascend/driver”。
- 如果升级后无法登录host系统,请联系技术支持解决。
- 如果升级后不是目标版本或者升级失败,请重新进行升级。如果依然升级失败,请记录故障现象和操作步骤,并联系技术支持解决。