更新时间:2024-06-13 GMT+08:00
分享

ALM-135462958 单板整体功能失效

告警解释

The board totally failed. (EntPhysicalIndex=[EntPhysicalIndex], EntPhysicalName=[EntPhysicalName], EntityType=[EntityType], EntityTrapFaultID=[EntityTrapFaultID])

单板整体功能失效。

告警属性

告警ID

OID

告警级别

告警类型

135462958

1.3.6.1.4.1.2011.5.25.219.2.2.5

紧急

设备告警

告警参数

参数名称

参数含义

EntPhysicalIndex

实体索引

EntPhysicalName

实体名称

EntityType

实体类型

EntityTrapFaultID

告警产生原因

对系统的影响

  • 原因1:单板供电不足。

    单板整体功能失效,业务中断。

  • 原因6:单板EPLD逻辑故障。

    单板整体功能失效,业务中断。

  • 原因7:在位单板与预配置的逻辑单板冲突。

    单板整体功能失效,业务中断。

  • 原因8:单板时钟信号故障。

    单板整体功能失效,业务中断。

  • 原因9:当前单板与配置冲突,不允许注册。

    单板整体功能失效,业务中断。

  • 原因10:单板与设备不匹配。

    单板整体功能失效,业务中断。

  • 原因11:单板FPGA local bus自检失败。

    单板整体功能失效,业务中断。

  • 原因12:SD5K通信丢失。

    单板整体功能失效,业务中断。

  • 原因13:接口板获取主控板的主备信号异常。

    单板整体功能失效,业务中断。

  • 原因14:设备硬件验证失败。

    单板整体功能失效,业务中断。单板关键器件可能已经被替换或篡改,对系统的可靠性和安全性存在影响。

  • 原因19:单板TCAM故障。

    单板整体功能失效,业务中断。

  • 原因20:单板的FPGA表项可能故障。

    单板整体功能失效,业务中断。

  • 原因21:单板PCIE故障。

    单板整体功能失效,业务中断。

  • 原因22:线卡未插稳。

    单板整体功能失效,业务中断。

  • 原因23:FPGA和备CXP的PCIE链路故障。

    单板整体功能失效,业务中断。

  • 原因24:PoE功率高导致单板烧毁。

    单板整体功能失效,业务中断。

  • 原因26:主控板获取本板的主备信号异常。

    有可能会影响该单板上的业务,甚至业务中断,急需解决。

  • 原因33:单板未注册。

    单板整体功能失效,业务中断。

  • 原因66:单板在尝试注册3次后失败。

    单板整体功能失效,业务中断。

  • 原因67:单板被下电。原因包括:
    • 用户将单板执行了下电操作。
    • 当前版本不支持该单板而导致单板被下电。
    • 单板因温度过高被下电。
    • 长时间不注册的单板被下电。
    • 单板异常导致下电。

    单板整体功能失效,业务中断。

  • 原因68:单板上电。

    无影响。

  • 原因69:单板FPGA故障。

    单板整体功能失效,业务中断。

  • 原因70:单板与槽位不匹配。

    单板整体功能失效,业务中断。

  • 原因80:单板电源故障。

    单板整体功能失效,业务中断。

  • 原因85:单板SMI通道故障。

    单板整体功能失效,业务中断。

  • 原因87:子卡不注册。

    单板整体功能失效,业务中断。

  • 原因98:单板EPLD逻辑故障。

    有可能会影响该单板上的业务,甚至业务中断,急需解决。

  • 原因99:单板FPGA local bus自检失败。

    单板整体功能失效,业务中断。

  • 原因123:单板高电压严重告警。

    单板整体功能失效,业务中断。

  • 原因124:单板低电压严重告警。

    单板整体功能失效,业务中断。

  • 原因125:单板高电压致命告警。

    单板整体功能失效,业务中断。

  • 原因126:单板低电压致命告警。

    单板整体功能失效,业务中断。

  • 原因127:单板与软件版本不兼容。

    有可能会影响该单板上的业务,甚至业务中断,急需解决。

  • 原因128:不同网板插入到同一个框。

    单板整体功能失效,业务中断。

  • 原因130:子卡与单板类型不兼容。

    子卡整体功能失效,业务中断。

可能原因

  • 原因1:单板供电不足。
  • 原因6:单板EPLD逻辑故障。
  • 原因7:在位单板与预配置的逻辑单板冲突。
  • 原因8:单板时钟信号故障。
  • 原因9:当前单板与配置冲突,不允许注册。
  • 原因10:单板与设备不匹配。
  • 原因11:单板FPGA localbus自检失败。
  • 原因12:SD5K通信丢失。
  • 原因13:接口板获取主控板的主备信号异常。
  • 原因14:设备硬件验证失败。
  • 原因19:单板TCAM故障。
  • 原因20:单板的FPGA表项可能故障。
  • 原因21:单板PCIE故障。
  • 原因22:线卡未插稳。
  • 原因23:FPGA和备CXP的PCIE链路故障
  • 原因24:PoE功率高导致单板烧毁。
  • 原因26:主控板获取本板的主备信号异常。
  • 原因33:单板未注册。
  • 原因66:单板在尝试注册3次后失败。
  • 原因67:单板被下电。原因包括:
    • 用户将单板执行了下电操作。
    • 当前版本不支持该单板而导致单板被下电。
    • 单板因温度过高被下电。
    • 长时间不注册的单板被下电。
    • 单板异常导致下电。
  • 原因68:单板上电。
  • 原因69:单板FPGA故障。
  • 原因70:单板与槽位不匹配。
  • 原因80:单板电源故障。
  • 原因85:单板SMI通道故障。
  • 原因87:子卡不注册。
  • 原因98:单板EPLD逻辑故障。
  • 原因99:单板FPGA local bus自检失败。
  • 原因123:单板高电压严重告警。
  • 原因124:单板低电压严重告警。
  • 原因125:单板高电压致命告警。
  • 原因126:单板低电压致命告警。
  • 原因127:单板与软件版本不兼容。
  • 原因128:不同网板插入到同一个框。
  • 原因130:子卡与单板类型不兼容。

处理步骤

  • 原因1:单板供电不足。
    1. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因6:单板EPLD逻辑故障。
    1. 检查故障单板是否为主用单板。
      • 如果是,在备用单板正常的情况下,进行主备倒换。
      • 如果不是,请执行2。
    2. 下电故障单板,然后再上电故障单板。如果故障单板不能注册或注册后故障仍存在,则更换故障单板。
  • 原因7:在位单板与预配置的逻辑单板冲突。
    1. 将预配置冲突策略改为以物理为准。
    2. 删除该位置预配置的单板配置。
    3. 拔出单板。
    4. 清除该槽位离线配置。
  • 原因8:单板时钟信号故障。
    1. 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
      • 如果单板没有出现复位或者下电现象,且业务正常运行,请执行4。
      • 如果单板出现复位或者下电现象,或者业务运行出现异常,请执行2。
    2. 下电故障单板,然后再上电。
      • 如果单板注册成功并且注册后故障恢复,请执行5。
      • 如果单板无法注册或者注册后告警仍然存在,请执行3。
    3. 更换故障单板。
      • 如果单板注册成功并且注册后故障恢复,请执行5。
      • 如果单板无法注册或者注册后告警仍然存在,请执行4。
    4. 联系技术支持人员。
    5. 结束。
  • 原因9:当前单板与配置冲突,不允许注册。
    1. 当前系统不支持该单板,请拔出单板。
  • 原因10:单板与设备不匹配。
    1. 当前机框不支持该单板,请拔出单板。
  • 原因11:单板FPGA local bus自检失败。
    1. 如果故障单板不是主用主控板,则执行3。
    2. 如果备用主控板正常,则在系统视图下执行slave switchover进行主备倒换,然后执行1。
    3. 下电故障单板,然后再上电故障单板。
    4. 如果故障依然存在,则更换故障单板。
  • 原因12:SD5K通信丢失。
    1. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因13:接口板获取主控板的主备信号异常。
    1. 检查两块主控板是否插稳,未插稳则插稳两块主控板,检查故障是否恢复。
      • 故障恢复,请执行步骤4。
      • 故障未恢复,请执行步骤2。
    2. 如果故障单板未运行业务,请依次进行以下故障检查。如果故障恢复,则执行步骤4;否则执行步骤3。
      • 如果单板没有插稳,则插稳故障单板。
      • 如果背板倒针,则不要插入新单板到此故障槽位,同时联系技术支持工程师。
      • 如果单板连接器故障,则更换单板。
    3. 如果故障单板已经运行业务,或者故障仍然无法恢复,请联系技术支持人员。
    4. 结束。
  • 原因14:设备硬件验证失败。
    1. 复位单板观察是否恢复,若不能恢复,请更换单板。
  • 原因19:单板TCAM故障。
    1. 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
      • 如果单板没有出现复位或者下电现象,且业务正常运行,请执行4。
      • 如果单板出现复位或者下电现象,或者业务运行出现异常,请执行2。
    2. 下电故障单板,然后再上电。
      • 如果单板注册成功并且注册后故障恢复,请执行5。
      • 如果单板无法注册或者注册后告警仍然存在,请执行3。
    3. 更换故障单板。
      • 如果单板注册成功并且注册后故障恢复,请执行5。
      • 如果单板无法注册或者注册后告警仍然存在,请执行4。
    4. 联系技术支持人员。
    5. 结束。
  • 原因20:单板的FPGA表项可能故障。
    1. 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
      • 如果单板没有出现复位或者下电现象,且业务正常运行,请执行4。
      • 如果单板出现复位或者下电现象,或者业务运行出现异常,请执行2。
    2. 下电故障单板,然后再上电。
      • 如果单板注册成功并且注册后故障恢复,请执行5。
      • 如果单板无法注册或者注册后告警仍然存在,请执行3。
    3. 更换故障单板。
      • 如果单板注册成功并且注册后故障恢复,请执行5。
      • 如果单板无法注册或者注册后告警仍然存在,请执行4。
    4. 联系技术支持人员。
    5. 结束。
  • 原因21:单板PCIE故障。
    1. 检查故障单板是否出现复位或者下电现象,业务是否正常运行。
      • 如果单板没有出现复位或者下电现象,且业务正常运行,请执行4。
      • 如果单板出现复位或者下电现象,或者业务运行出现异常,请执行2。
    2. 下电故障单板,然后再上电。
      • 如果单板注册成功并且注册后故障恢复,请执行5。
      • 如果单板无法注册或者注册后告警仍然存在,请执行3。
    3. 更换故障单板。
      • 如果单板注册成功并且注册后故障恢复,请执行5。
      • 如果单板无法注册或者注册后告警仍然存在,请执行4。
    4. 联系技术支持人员。
    5. 结束。
  • 原因22:线卡未插稳。
    1. 检查线卡是否插稳,未插稳则插稳线卡,检查故障是否恢复。如果没有恢复,转到2。
    2. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因23:FPGA和备CXP的PCIE链路故障。
    1. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因24:PoE功率高导致单板烧毁。
    1. 请收集告警信息、日志信息,联系华为工程师进行处理。
  • 原因26:主控板获取本板的主备信号异常。
    1. 查看其他单板是否有电压过低告警或者电源相关告警,如果有则优先处理。
    2. 插拔当前备用主控板,并检查是否插稳,是否存在倒针,单板连接器是否故障,转4。
    3. 如果整机复位,则拔出另一块主控板,并检查是否插稳,是否存在倒针,单板连接器是否故障,转4。
    4. 如果单板没有插稳,则插稳故障单板。
    5. 如果背板倒针则不要插入新单板到此故障槽位,同时联系技术支持工程师。
    6. 如果仅故障单板连接器故障,则更换单板,转8。
    7. 如果备用主控板不注册,或告警仍未恢复,则联系技术支持工程师。
    8. 结束。
  • 原因33:单板未注册。
    1. 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
  • 原因66:单板在尝试注册3次后失败。
    1. 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
  • 原因67:单板被下电。
    1. 更换单板,检查告警是否清除,如果没有清除,请执行2。
    2. 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
  • 原因68:单板上电。
    1. 单板上电。
  • 原因69:单板FPGA故障。
    1. 通过EntPhysicalName确认发生故障的单板槽位号,具体方式:fpga后第一个数字指fpga芯片编号,从第二个数字开始代表单板槽位号,如,EntPhysicalName=fpga1 3,表示3号槽的FPGA1故障。
    2. 如果故障单板重启后无法注册或者注册后告警不能恢复,则请更换故障单板。
    3. 如果故障单板没有发生重启、下电的现象,且有业务正常运行,请联系技术支持人员。
  • 原因70:单板与槽位不匹配。
    1. 当前槽位不支持该单板,请拔出单板。
  • 原因80:单板电源故障。
    1. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因85:单板SMI通道故障。
    1. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因87:子卡不注册。
    1. 请尝试重新插拔子卡。如果故障子卡仍不能注册,则更换故障子卡,检查故障是否恢复。如果没有恢复,转到步骤2。
    2. 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
  • 原因98:单板EPLD逻辑故障。
    1. 如果故障单板不是主用主控板,则转3;
    2. 如果备用主控板正常,则系统视图下主备倒换slave switchover,转1;
    3. 如果故障单板处于注册状态,则用户视图下命令行升级CPlD:upgrade mpu/lpu/sfu <slotid> startup firmware,转5;
    4. 如果故障单板处于非注册状态,下电故障单板,然后再上电故障单板;
    5. 如果故障单板不能注册或注册后故障仍存在,则更换故障单板。
  • 原因99:单板FPGA local bus自检失败。
    1. 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
  • 原因123:单板高压电严重告警。
    1. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因124:单板低电压严重告警。
    1. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因125:单板高电压致命告警。
    1. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因126:单板低电压致命告警。
    1. 请收集告警信息、日志信息和配置信息,并联系技术支持人员。
  • 原因127:单板与软件版本不兼容。
    1. 请收集告警信息、日志信息和配置信息,联系技术人员进行处理。
  • 原因128:不同网板插入到同一个框。
    1. 使用clear inactive-configuration命令清除离线配置。
    2. 尝试拨插故障单板或者上电故障单板,检查故障是否恢复。
      • 如果故障恢复,则请执行操作步骤4。
      • 如果故障未恢复,则请执行操作步骤3。
    3. 请收集告警信息、日志信息和配置信息,联系技术工程师进行处理。
    4. 结束。
  • 原因130:子卡与单板类型不兼容。
    1. 拔出子卡,插入与单板类型兼容的子卡。

告警清除

此告警修复后,系统会自动清除此告警,当前告警页面将不再显示该告警,无需手工清除。

相关文档