更新时间:2023-10-30 GMT+08:00

升级前必读

升级影响

升级过程禁止进行其他维护操作动作。

Atlas 800 训练服务器(型号9000)软件版本升级过程中需要复位系统,会导致业务中断。

注意事项

Atlas 800 训练服务器(型号9000)版本升级时的注意事项如表1所示。

表1 升级时注意事项

序号

描述

1

在进行升级操作之前,请仔细阅读本文档,确定已经理解全部内容。如果您对文档有任何意见或建议,请联系技术支持解决。

2

为了减少对业务的影响,请提前切走业务或在业务量低时进行升级操作。

3

升级后,请确保所有组件的版本保持一致。

4

需要确保系统已经正常运行且固件升级工具及依赖的驱动被正确加载。如果不能确保,请复位后再升级。相关检查方法请参见如何检查device是否正常运行

5

不建议用户修改“/etc/ascend_install.info”,如果修改,会导致系统功能不可用。

6

NPU C72B050(不含)之前版本升级至C72B050(含)之后版本,升级目标版本固件时请跳过升级昇腾服务器芯片固件中的重启系统步骤,待升级完驱动包后(升级中也跳过升级昇腾服务器芯片驱动中的重启系统步骤),进行冷复位操作(先下电再上电)。

NPU版本号查询命令:

/usr/local/Ascend/driver/tools/upgrade-tool --device_index -1 --component -1 --version

版本要求

建议使用同一个Atlas 800 训练服务器(型号9000)软件版本列表下驱动版本、固件版本,使二者保持配套关系。

升级流程

请按照“固件->驱动”的升级顺序,分别升级软件包。