更新时间:2023-10-30 GMT+08:00

升级昇腾服务器芯片驱动

操作场景

该任务指导用户升级Atlas 800 训练服务器(型号9000)昇腾服务器芯片的驱动。

run升级包支持一键式升级,本章节以Atlas 800 训练服务器(型号9000)的A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run包为例说明,具体操作以客户实际host系统对应驱动包为准。

  • 驱动升级不会改变系统的用户名和密码。

对系统的影响

Atlas 800 训练服务器(型号9000)驱动版本升级过程中需要复位系统,会导致业务中断。为了减少对业务的影响,执行升级操作前请提前切走业务。

操作步骤

  1. 参照升级前准备准备驱动包“A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run”。
  2. 使用root帐户登录Atlas 800 训练服务器(型号9000)所在服务器。
  3. 将“A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run”上传至到Linux系统任意目录下,如/opt下。
  4. 进入软件包“A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run”所在路径,如/opt下。

cd /opt

  1. 执行如下命令,更改“A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run”软件包权限。

chmod u+x A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run

  1. 执行./A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run --check命令,校验run安装包的一致性和完整性。
  2. 执行升级命令完成升级操作。

升级过程支持一键式升级操作,可执行./A800-9000-npu-driver_x.x.x_euleros2.8-aarch64.run --upgrade命令,完成升级。

出现以下类似回显,表示升级成功。

Driver package install success! Reboot needed for installation/upgrade to take effect!
  • 升级驱动时,会将动态库libdcmi.so和头文件dcmi_interface_api.h拷贝到“/usr/local/dcmi/”目录下。
  • 驱动升级过程中昇腾服务器驱动的日志信息输出在“/var/log/ascend_seclog/ascend_install.log”文件中。
  1. 重启系统。

reboot

  1. 检查升级后的版本号。

在软件包安装路径下,执行以下命令查看所升级软件包版本是否正确。

cat version.info

  • 软件包安装默认路径:“/usr/local/Ascend/driver”。
  • 如果升级后无法登录host系统,请联系技术支持解决。
  • 如果升级后不是目标版本或者升级失败,请重新进行升级。如果依然升级失败,请记录故障现象和操作步骤,并联系技术支持解决。