文档首页/ AI开发平台ModelArts/ 故障排除/ 轻量算力节点/ NpuL1SwitchPortPartialFunctionFailure事件处理建议
更新时间:2026-02-06 GMT+08:00
分享

NpuL1SwitchPortPartialFunctionFailure事件处理建议

故障影响

可能导致通信性能降低,影响业务正常运行。

告警解释

NPU的L1 1520交换机端口局部功能失效。

告警参数

参数名称

参数含义

名称

NPU:L1交换机端口局部功能失效

类型

故障类告警

发生时间

告警触发时间

定位信息

局点、云服务、微服务、虚拟机ID、虚拟机名称、告警信息

可能原因

L1 1520交换机软件或硬件故障。

处理步骤

  1. 查看事件上报的详情信息,事件详情信息示例如下:
    四分之一降Lane:“Port real lanes are less than quarter of the configured lanes. event_type: 10, sub_type: 0, switch chip id: 123, switch port id: 124, peer device type: 2, peer device id:-1”
    二分之一降Lane:“Port real lanes are less than half of the configured lanes. event_type: 10, sub_type: 0, switch chip id: 123, switch port id: 124, peer device type: 2, peer device id:-1”
  2. 事件详细信息中的peer device type值与设备类型的对应关系为:0 - CPU;1 - NPU;2 - L2。
  3. 如果 peer device type 为0 (CPU)、1 (NPU),待业务运行结束后,隔离节点,重调度任务。
  4. 如果 peer device type 为 2 (L2),该故障会尝试自愈,暂时无需处理。

告警清除

此告警恢复后,关闭工单时清除方式选择清除网管告警即可。

参考信息

相关文档