ALM-135462958 单板整体功能失效
告警解释
The board totally failed. (EntPhysicalIndex=[EntPhysicalIndex], EntPhysicalName=[EntPhysicalName], EntityType=[EntityType], EntityTrapFaultID=[EntityTrapFaultID])
单板整体功能失效。
告警属性
告警ID |
OID |
告警级别 |
告警类型 |
---|---|---|---|
135462958 |
1.3.6.1.4.1.2011.5.25.219.2.2.5 |
紧急 |
设备告警 |
告警参数
参数名称 |
参数含义 |
---|---|
EntPhysicalIndex |
实体索引 |
EntPhysicalName |
实体名称 |
EntityType |
实体类型 |
EntityTrapFaultID |
告警产生原因 |
对系统的影响
- 原因1:单板供电不足。
- 原因6:单板EPLD逻辑故障。
- 原因7:在位单板与预配置的逻辑单板冲突。
- 原因8:单板时钟信号故障。
- 原因9:当前单板与配置冲突,不允许注册。
- 原因10:单板与设备不匹配。
- 原因11:单板FPGA local bus自检失败。
- 原因12:SD5K通信丢失。
- 原因13:接口板获取主控板的主备信号异常。
- 原因14:设备硬件验证失败。
- 原因19:单板TCAM故障。
- 原因20:单板的FPGA表项可能故障。
- 原因21:单板PCIE故障。
- 原因22:线卡未插稳。
- 原因23:FPGA和备CXP的PCIE链路故障。
- 原因24:PoE功率高导致单板烧毁。
- 原因26:主控板获取本板的主备信号异常。
- 原因33:单板未注册。
- 原因66:单板在尝试注册3次后失败。
- 原因67:单板被下电。原因包括:
- 用户将单板执行了下电操作。
- 当前版本不支持该单板而导致单板被下电。
- 单板因温度过高被下电。
- 长时间不注册的单板被下电。
- 单板异常导致下电。
单板整体功能失效,业务中断。
- 原因68:单板上电。
- 原因69:单板FPGA故障。
- 原因70:单板与槽位不匹配。
- 原因80:单板电源故障。
- 原因85:单板SMI通道故障。
- 原因87:子卡不注册。
- 原因98:单板EPLD逻辑故障。
- 原因99:单板FPGA local bus自检失败。
- 原因123:单板高电压严重告警。
- 原因124:单板低电压严重告警。
- 原因125:单板高电压致命告警。
- 原因126:单板低电压致命告警。
- 原因127:单板与软件版本不兼容。
- 原因128:不同网板插入到同一个框。
- 原因130:子卡与单板类型不兼容。
可能原因
- 原因1:单板供电不足。
- 原因6:单板EPLD逻辑故障。
- 原因7:在位单板与预配置的逻辑单板冲突。
- 原因8:单板时钟信号故障。
- 原因9:当前单板与配置冲突,不允许注册。
- 原因10:单板与设备不匹配。
- 原因11:单板FPGA localbus自检失败。
- 原因12:SD5K通信丢失。
- 原因13:接口板获取主控板的主备信号异常。
- 原因14:设备硬件验证失败。
- 原因19:单板TCAM故障。
- 原因20:单板的FPGA表项可能故障。
- 原因21:单板PCIE故障。
- 原因22:线卡未插稳。
- 原因23:FPGA和备CXP的PCIE链路故障
- 原因24:PoE功率高导致单板烧毁。
- 原因26:主控板获取本板的主备信号异常。
- 原因33:单板未注册。
- 原因66:单板在尝试注册3次后失败。
- 原因67:单板被下电。原因包括:
- 用户将单板执行了下电操作。
- 当前版本不支持该单板而导致单板被下电。
- 单板因温度过高被下电。
- 长时间不注册的单板被下电。
- 单板异常导致下电。
- 原因68:单板上电。
- 原因69:单板FPGA故障。
- 原因70:单板与槽位不匹配。
- 原因80:单板电源故障。
- 原因85:单板SMI通道故障。
- 原因87:子卡不注册。
- 原因98:单板EPLD逻辑故障。
- 原因99:单板FPGA local bus自检失败。
- 原因123:单板高电压严重告警。
- 原因124:单板低电压严重告警。
- 原因125:单板高电压致命告警。
- 原因126:单板低电压致命告警。
- 原因127:单板与软件版本不兼容。
- 原因128:不同网板插入到同一个框。
- 原因130:子卡与单板类型不兼容。
处理步骤
- 原因1:单板供电不足。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因6:单板EPLD逻辑故障。
- 检查故障单板是否为主用单板。
- 如果是,在备用单板正常的情况下,进行主备倒换。
- 如果不是,请执行2。
- 下电故障单板,然后再上电故障单板。如果故障单板不能注册或注册后故障仍存在,则更换故障单板。
- 检查故障单板是否为主用单板。
- 原因7:在位单板与预配置的逻辑单板冲突。
- 将预配置冲突策略改为以物理为准。
- 删除该位置预配置的单板配置。
- 拔出单板。
- 清除该槽位离线配置。
- 原因8:单板时钟信号故障。
- 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
- 如果单板没有出现复位或者下电现象,且业务正常运行,请执行4。
- 如果单板出现复位或者下电现象,或者业务运行出现异常,请执行2。
- 下电故障单板,然后再上电。
- 如果单板注册成功并且注册后故障恢复,请执行5。
- 如果单板无法注册或者注册后告警仍然存在,请执行3。
- 更换故障单板。
- 如果单板注册成功并且注册后故障恢复,请执行5。
- 如果单板无法注册或者注册后告警仍然存在,请执行4。
- 联系技术支持人员。
- 结束。
- 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
- 原因9:当前单板与配置冲突,不允许注册。
- 当前系统不支持该单板,请拔出单板。
- 原因10:单板与设备不匹配。
- 当前机框不支持该单板,请拔出单板。
- 原因11:单板FPGA local bus自检失败。
- 如果故障单板不是主用主控板,则执行3。
- 如果备用主控板正常,则在系统视图下执行slave switchover进行主备倒换,然后执行1。
- 下电故障单板,然后再上电故障单板。
- 如果故障依然存在,则更换故障单板。
- 原因12:SD5K通信丢失。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因13:接口板获取主控板的主备信号异常。
- 检查两块主控板是否插稳,未插稳则插稳两块主控板,检查故障是否恢复。
- 故障恢复,请执行步骤4。
- 故障未恢复,请执行步骤2。
- 如果故障单板未运行业务,请依次进行以下故障检查。如果故障恢复,则执行步骤4;否则执行步骤3。
- 如果单板没有插稳,则插稳故障单板。
- 如果背板倒针,则不要插入新单板到此故障槽位,同时联系技术支持工程师。
- 如果单板连接器故障,则更换单板。
- 如果故障单板已经运行业务,或者故障仍然无法恢复,请联系技术支持人员。
- 结束。
- 检查两块主控板是否插稳,未插稳则插稳两块主控板,检查故障是否恢复。
- 原因14:设备硬件验证失败。
- 复位单板观察是否恢复,若不能恢复,请更换单板。
- 原因19:单板TCAM故障。
- 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
- 如果单板没有出现复位或者下电现象,且业务正常运行,请执行4。
- 如果单板出现复位或者下电现象,或者业务运行出现异常,请执行2。
- 下电故障单板,然后再上电。
- 如果单板注册成功并且注册后故障恢复,请执行5。
- 如果单板无法注册或者注册后告警仍然存在,请执行3。
- 更换故障单板。
- 如果单板注册成功并且注册后故障恢复,请执行5。
- 如果单板无法注册或者注册后告警仍然存在,请执行4。
- 联系技术支持人员。
- 结束。
- 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
- 原因20:单板的FPGA表项可能故障。
- 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
- 如果单板没有出现复位或者下电现象,且业务正常运行,请执行4。
- 如果单板出现复位或者下电现象,或者业务运行出现异常,请执行2。
- 下电故障单板,然后再上电。
- 如果单板注册成功并且注册后故障恢复,请执行5。
- 如果单板无法注册或者注册后告警仍然存在,请执行3。
- 更换故障单板。
- 如果单板注册成功并且注册后故障恢复,请执行5。
- 如果单板无法注册或者注册后告警仍然存在,请执行4。
- 联系技术支持人员。
- 结束。
- 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
- 原因21:单板PCIE故障。
- 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
- 如果单板没有出现复位或者下电现象,且业务正常运行,请执行4。
- 如果单板出现复位或者下电现象,或者业务运行出现异常,请执行2。
- 下电故障单板,然后再上电。
- 如果单板注册成功并且注册后故障恢复,请执行5。
- 如果单板无法注册或者注册后告警仍然存在,请执行3。
- 更换故障单板。
- 如果单板注册成功并且注册后故障恢复,请执行5。
- 如果单板无法注册或者注册后告警仍然存在,请执行4。
- 联系技术支持人员。
- 结束。
- 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
- 原因22:线卡未插稳。
- 检查线卡是否插稳,未插稳则插稳线卡,检查故障是否恢复。如果没有恢复,转到2。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因23:FPGA和备CXP的PCIE链路故障。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因24:PoE功率高导致单板烧毁。
- 请收集告警信息、日志信息,联系华为工程师进行处理。
- 原因26:主控板获取本板的主备信号异常。
- 查看其他单板是否有电压过低告警或者电源相关告警,如果有则优先处理。
- 插拔当前备用主控板,并检查是否插稳,是否存在倒针,单板连接器是否故障,转4。
- 如果整机复位,则拔出另一块主控板,并检查是否插稳,是否存在倒针,单板连接器是否故障,转4。
- 如果单板没有插稳,则插稳故障单板。
- 如果背板倒针则不要插入新单板到此故障槽位,同时联系技术支持工程师。
- 如果仅故障单板连接器故障,则更换单板,转8。
- 如果备用主控板不注册,或告警仍未恢复,则联系技术支持工程师。
- 结束。
- 原因33:单板未注册。
- 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
- 原因66:单板在尝试注册3次后失败。
- 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
- 原因67:单板被下电。
- 更换单板,检查告警是否清除,如果没有清除,请执行2。
- 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
- 原因68:单板上电。
- 单板上电。
- 原因69:单板FPGA故障。
- 通过EntPhysicalName确认发生故障的单板槽位号,具体方式:fpga后第一个数字指fpga芯片编号,从第二个数字开始代表单板槽位号,如,EntPhysicalName=fpga1 3,表示3号槽的FPGA1故障。
- 如果故障单板重启后无法注册或者注册后告警不能恢复,则请更换故障单板。
- 如果故障单板没有发生重启、下电的现象,且有业务正常运行,请联系技术支持人员。
- 原因70:单板与槽位不匹配。
- 当前槽位不支持该单板,请拔出单板。
- 原因80:单板电源故障。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因85:单板SMI通道故障。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因87:子卡不注册。
- 请尝试重新插拔子卡。如果故障子卡仍不能注册,则更换故障子卡,检查故障是否恢复。如果没有恢复,转到步骤2。
- 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
- 原因98:单板EPLD逻辑故障。
- 如果故障单板不是主用主控板,则转3;
- 如果备用主控板正常,则系统视图下主备倒换slave switchover,转1;
- 如果故障单板处于注册状态,则用户视图下命令行升级CPlD:upgrade mpu/lpu/sfu <slotid> startup firmware,转5;
- 如果故障单板处于非注册状态,下电故障单板,然后再上电故障单板;
- 如果故障单板不能注册或注册后故障仍存在,则更换故障单板。
- 原因99:单板FPGA local bus自检失败。
- 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
- 原因123:单板高压电严重告警。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因124:单板低电压严重告警。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因125:单板高电压致命告警。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因126:单板低电压致命告警。
- 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
- 原因127:单板与软件版本不兼容。
- 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
- 原因128:不同网板插入到同一个框。
- 使用clear inactive-configuration命令清除离线配置。
- 尝试拨插故障单板或者上电故障单板,检查故障是否恢复。
- 如果故障恢复,则请执行操作步骤4。
- 如果故障未恢复,则请执行操作步骤3。
- 请收集告警信息、日志信息和配置信息,联系技术工程师进行处理。
- 结束。
- 原因130:子卡与单板类型不兼容。
- 拔出子卡,插入与单板类型兼容的子卡。