更新时间:2024-06-13 GMT+08:00
分享

ALM-3276800028 单板局部功能失效

告警解释

ENTITYTRAP/2/BOARDFAIL: OID [OID] Board fails. (Index=[INTEGER], EntityPhysicalIndex=[INTEGER], PhysicalName="[OCTET]", EntityTrapEntType=[INTEGER], EntityTrapFaultID=[INTEGER], EntityTrapReasonDescr="[OCTET]")

设备局部功能失效。

告警属性

告警ID

告警级别

告警类型

3276800028

重要

设备告警

告警参数

参数名称

参数含义

OID

该告警所对应的MIB节点的OID号。

Index

索引。

EntityPhysicalIndex

物理索引。

PhysicalName

实体名。

EntityTrapEntType

实体类型。

EntityTrapFaultID

错误码。

EntityTrapReasonDescr

告警原因描述。

对系统的影响

见处理步骤中的描述。

可能原因

见处理步骤中的描述。

处理步骤

请根据错误码分别进行处理。

错误码

可能原因及对系统的影响

处理步骤

132096

设备供电的电源异常。

请收集告警信息和配置信息,并联系技术支持人员。

132105

传感器故障。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132106

单板Flash故障。

请收集告警信息和配置信息,并联系技术支持人员。

132107

设备单板PHY芯片故障。

使用其他可用端口或更换相应槽位单板。

132121

USB控制器故障。

  • 如果USB口没有外界存储器,则对业务无影响,不需处理。
  • 如果USB口需要使用,可以选择故障设备单板其他的USB口或其他设备单板的USB口使用。

132124

I2C总线故障。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132127

板内时钟故障。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132128

板内锁相环故障。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132131

DSP故障。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132137

芯片故障,包括CPLD、RTC、EEPROM、温度芯片。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132146

设备单板PoE故障。

  1. 更换相应PoE电源。检查是否有恢复告警,如无恢复告警,执行2。
  2. 更换相应PoE DIMM条。检查是否有恢复告警,如无恢复告警,执行3。
  3. 请收集告警信息和配置信息,并联系技术支持人员。

132147

指示灯故障。

请收集告警信息和配置信息,并联系技术支持人员。

132171

设备所处环境温度过高,超过45°C

通过开冷气、增强散热等方式降低环境温度,使设备所处环境温度不超过45°C。

132176

PHY芯片持续低温。

检查是否出现错误码为132128的告警。

  • 未出现,表示未引起锁相环故障,无需处理。
  • 出现,表示设备由于PHY持续低温导致锁相环失锁,设备会自动重启,用户无需处理。

132185

设备内部IIC模块故障。

等待一段时间,查看故障是否恢复。如果没有恢复,请更换故障器件或更换相应槽位设备。

132199

PoE设备MCU部件对应的内部通道故障。

等待一段时间,查看故障是否恢复。如果没有恢复,请更换故障器件或更换相应槽位设备。

132200

设备硅晶体受到刺激,导致出现不可纠正的错误,设备存储单元内存或Flash发生ECC无法纠正的错误(即多bit ECC错误)。如果是指令或文件系统发生错误,则会导致设备无法正常运行。

等待一段时间,查看故障是否恢复。如果没有恢复,请更换故障器件或更换相应槽位设备。

132201

CPU DDR发生故障,导致设备1个小时内发生DDR多比特故障60次。当检测到设备DDR多比特故障在1个小时内了发生100次时,复位设备,并记录复位原因。

等待一段时间,查看故障是否恢复。如果没有恢复,请更换故障器件或更换相应槽位设备。

132208

单板PCI故障。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132212

CPU CACHE发生内部故障,设备检测出CPU CACHE存在多bit故障将重新启动。

发现故障后,设备会自动重启。如果多次出现告警,请更换故障器件或更换设备。

132215

1.5V CPU传感器故障,设备检测出CPU CACHE存在多bit故障将重新启动。

发现故障后,设备会自动重启。如果多次出现告警,请更换故障器件或更换设备。

132217

设备上某些上行光接口不可用。

  • 上行光接口中同时插入了GPON光模块(MA5671A)和其他光模块。
  • 上行光接口中同时插入了两个或多个GPON光模块(MA5671A)。
  1. 根据组网判断需要使用的接口。
  2. 拔掉不需要使用接口上的光模块。

132218

0.9V电压对应的芯片异常。

重启设备,若继续上报告警,请更换相应槽位的设备。

132219

单板间的通道存在故障或单板器件存在故障,设备主控板故障监测项存在异常。如果是备用主控板检测项存在异常,将无法通过命令slave switchover进行主备倒换。

  1. 执行诊断命令display switchover-prohibit status查看设备各主控板故障监测项状态。
  2. 执行诊断命令display ecm information查看设备ECM通道信息。
  3. 请收集告警信息和配置信息,并联系技术支持人员。

132220

设备检测到TCAM奇偶校验错误。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132223

分区读写操作频繁造成存储器件损耗,SystemMain(nsysmain)分区坏块率超过告警门限值2%,可用存储空间变少。

  1. 重启设备,若10秒后继续上报该告警,执行2。
  2. 执行命令format flash:格式化Flash,若10秒后继续上报该告警,执行3。
  3. 联系技术支持工程师更换设备或Flash器件。

132224

分区读写操作频繁造成存储器件损耗,SystemBack(nsysbak)分区坏块率超过告警门限值2%,可用存储空间变少。

  1. 重启设备,若10秒后继续上报该告警,执行2。
  2. 执行命令format flash:格式化Flash,若10秒后继续上报该告警,执行3。
  3. 联系技术支持工程师更换设备或Flash器件。

132225

分区读写操作频繁造成存储器件损耗,SystemData(nsysdata)分区坏块率超过告警门限值2%,可用存储空间变少。

  1. 重启设备,若10秒后继续上报该告警,执行2。
  2. 执行命令format flash:格式化Flash,若10秒后继续上报该告警,执行3。
  3. 联系技术支持工程师更换设备或Flash器件。

132226

分区读写操作频繁造成存储器件损耗,SystemFile(NVRP或nand root file system)分区坏块率超过告警门限值2%,可用存储空间变少。

  1. 重启设备,若10秒后继续上报该告警,执行2。
  2. 执行命令format flash:格式化Flash,若10秒后继续上报该告警,执行3。
  3. 联系技术支持工程师更换设备或Flash器件。

132227

分区读写操作频繁造成存储器件损耗,NVRP分区坏块率超过预警门限值1.5%,可用存储空间变少。

  1. 重启设备,若10秒后继续上报该告警,执行2。
  2. 执行命令format flash:格式化Flash,若10秒后继续上报该告警,执行3。
  3. 联系技术支持工程师更换设备或Flash器件。

132228

S5720I-10X-PWH-SI-AC设备相连的受电设备耗用功率太大,PoE输出功率和直流输出功率超过总功率,设备自动关闭12V line1线路的直流供电功能。

减少受电设备耗用的功率。

132229

S5720I-10X-PWH-SI-AC设备相连的受电设备耗用功率太大,PoE输出功率和直流输出功率超过总功率,设备自动关闭12V line2路的直流供电功能。

减少受电设备耗用的功率。

132230

S5720I-10X-PWH-SI-AC设备相连的受电设备耗用功率太大,PoE输出功率和直流输出功率超过总功率,设备自动关闭24V线路的直流供电功能。

减少受电设备耗用的功率。

132231

S5720I-10X-PWH-SI-AC设备相连的受电设备耗用功率太大,设备12V直流输出功率超过12V直流输出功率告警门限阈值104W,设备自动关闭12V线路的直流供电功能。

减少受电设备耗用的功率。

132232

S5720I-10X-PWH-SI-AC设备相连的受电设备耗用功率太大,设备24V直流输出功率超过24V直流输出功率告警门限阈值78W,设备自动关闭24V线路的直流供电功能。

减少受电设备耗用的功率。

132233

CPU内部模块存在故障。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132234

芯片故障,导致主控板管理通道故障。

重启故障的设备单板,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备单板

132625

芯片异常。

重启故障的设备,检查是否有恢复告警。如无恢复告警,请更换相应槽位的设备。

135190

铅酸电池存储的电量不足,铅酸电池不能继续给交换机供电,交换机会因电量不足而断电。

请给交换机插上交流电源继续给交换机供电或更换新的铅酸电池。

132236

MCU串口故障。

等待一段时间,查看故障是否恢复。如果没有恢复,请更换故障器件或更换相应槽位设备。

132237

MCU I2C故障。

等待一段时间,查看故障是否恢复。如果没有恢复,请更换故障器件或更换相应槽位设备。

132239

NOR Flash擦写频繁,24小时内NOR Flash擦写次数达到100次。

请收集告警信息和配置信息,并联系技术支持人员。

132240

磁盘使用率超过阈值,可能为设备上日志文件过多或者多余的.cc文件未删除。

可通过以下三种方式进行处理:

  • 用户视图下执行命令reset logbuffer,清除Log缓冲区中无用的日志信息。
  • 用户视图下执行命令delete /unreserved,删除存储器中指定的.cc文件。
  • 用户视图下执行命令reset recycle-bin,彻底删除指定路径下回收站中的文件。
    说明:

    如果存储空间使用率持续上升到85%,系统会自动清空回收站、删除未使用的大包、补丁或日志文件。

132249

NOR FLASH擦写次数达到最大寿命的90%。

请收集告警信息和配置信息,并联系技术支持人员。

132252

单板上获取框的类型错误。

请收集告警信息和配置信息,并联系技术支持人员。

132253

集群系统主控板的MAC地址个数与集群系统的MAC地址个数不同。

  1. 执行命令display css system-mac查看集群系统MAC地址个数和各主控板MAC地址个数。
  2. 根据集群系统中MAC地址最小值,将系统MAC地址个数和各主控板的MAC地址个数都修改为最小值。

132281

PoE烧板故障。

请收集告警信息和配置信息,并联系技术支持人员。

132281

PoE烧板故障。

请收集告警信息和配置信息,并联系技术支持人员。

132282

端口收到前导码错包。

执行port serdes-mode命令配置MultiGE接口工作的频点模式。

132283

频点模式不足导致接口无法UP。

  1. 请确认告警中接口所连接的设备是否可以迁移至交换机的其他接口。
    • 是,=>2
    • 否,=>3
  2. 将告警中接口所连接的设备迁移至交换机的其他接口,检查设备是否仍然打印该告警。
    • 是,=>重复执行步骤2
    • 否,=>结束
  3. 重新执行port serdes-mode命令配置MultiGE接口工作的频点模式,确保告警中的接口工作的频点模式被包含在内。

132315

SATA硬盘协商速率等级不满足要求。

请收集告警信息和配置信息,并联系技术支持人员。

132316

SATA硬盘剩余寿命不足。

请收集告警信息和配置信息,并联系技术支持人员。

132317

SATA硬盘异常。

请收集告警信息和配置信息,并联系技术支持人员。

132318

SATA硬盘权限为只读。

请收集告警信息和配置信息,并联系技术支持人员。

132322

设备的ESN与License文件的ESN不匹配。

请申请并安装与设备ESN匹配的License文件。

参考信息

相关文档