更新时间:2025-10-22 GMT+08:00
分享

节点重部署检测

客户已执行重部署操作后,登录重部署节点检测资源是否重部署成功。

  • NPU健康状态检查

    8个NPU模组(两个device & mcu)的健康状态是否OK(执行结果都是3)

    执行命令npu-smi info,回显信息如下:

    device_id=0
    3
    device_id=1
    3
    device_id=2
    3
    device_id=3
    3
    ……
  • NPU网络健康验证

    NPU参数面网络健康状态是否正常, 回显16条net health status 并且每一个都为Success表示正常

    执行命令for i in $(seq 0 7); do echo =============$i; hccn_tool -i $i -net_health -g;done,回显信息如下:

    net health status: Success
    net health status: Success
    ……

相关文档