NpuL1SwitchFault事件处理建议
故障影响
业务可能受到影响终止。
告警解释
NPU的L1 1520交换机发生故障。
告警参数
| 参数名称 | 参数含义 |
|---|---|
| 名称 | NPU:L1交换机故障 |
| 类型 | 故障类告警 |
| 发生时间 | 告警触发时间 |
| 定位信息 | 局点、云服务、微服务、虚拟机ID、虚拟机名称、告警信息 |
可能原因
L1 1520交换机软件或硬件故障。
处理步骤
- 查看事件上报的详情信息列,事件详情信息示例如下:
The L1 1520 switch is faulty, alarm_id 139591683, fault_id 4294967295. switch chip id 2, switch port id 8, peer device type 2, peer device id 0
通过事件详情信息,可以查到告警对应的 alarm_id,fault_id,peer device type 值,并将alarm_id 和 fault_id 转换为十六进制。
- 结合上述信息,参考表1进行故障处理。
告警清除
此告警恢复后,关闭工单时清除方式选择清除网管告警即可。
参考信息
| Level | 故障处理类型 | 故障说明 | 业务影响 | 处理策略 | 故障信息alarm_id | 故障信息fault_id | 故障信息peer device type | 故障信息peer device id |
|---|---|---|---|---|---|---|---|---|
| L1 | NoHandleFault | 自愈故障 | 不影响业务 | 无需处理 | 0x00f1fef5 | 155913 | 0 | -1 |
| 0x00f1fef5 | 155913 | 0 | -1 | |||||
| 0x08520003 | -1 | 2 | -1 | |||||
| 0x00f10509 | 132333 | 2 | -1 | |||||
| 0x00f1fef5 | 155913 | -1 | -1 | |||||
| 0x00f1fef5 | 155913 | 1 | -1 | |||||
| 0x00f1fef5 | 155914 | 2 | -1 | |||||
| 0x00f10509 | 132332 | 2 | -1 | |||||
| 0x00f1fef5 | 155912 | 2 | -1 | |||||
| 0x00f1fef5 | 155915 | 0 | -1 | |||||
| 0x00f1fef5 | 155915 | 1 | -1 | |||||
| 0x00f1fef5 | 155915 | 2 | -1 | |||||
| 0x00f103b6 | 155909 | -1 | -1 | |||||
| L2 | SubHealthFault | 亚健康 | 影响业务性能 | 待业务运行结束后,隔离节点,重调度任务。 | 0x00f103b6 | 155908 | -1 | -1 |
| 0x00f10509 | 132332 | 0 | -1 | |||||
| 0x00f1ff06 | 155910 | -1 | -1 | |||||
| 0x00f10509 | 132332 | 1 | -1 | |||||
| 0x00f10509 | 132333 | 0 | -1 | |||||
| 0x00f10509 | 132333 | 1 | -1 | |||||
| 0x00f1ff06 | 132134 | -1 | -1 | |||||
| 0x00f1ff06 | 155911 | -1 | -1 | |||||
| L3 | SeparateFault | 故障 | 业务失败 | 隔离节点,重调度任务。 提工单,联系运维人员进行维修。 | 0x00f103b0 | 155907 | -1 | -1 |
| 0x00f103b0 | 155649 | -1 | -1 | |||||
| 0x00f103b0 | 155904 | -1 | -1 | |||||
| 0x00f1fef5 | 155912 | 0 | -1 | |||||
| 0x00f1fef5 | 155912 | 1 | -1 | |||||
| 0x00f1fef5 | 155914 | 0 | -1 | |||||
| 0x00f1fef5 | 155914 | 1 | -1 | |||||
| 0x08520003 | -1 | 0 | -1 | |||||
| 0x08520003 | -1 | 1 | -1 |