ALM-4289601657 BGP状态机的状态值从高值状态变为低值状态
告警解释
BGP/2/BACKWARD:OID [oid] The BGP FSM moves from a higher numbered state to a lower numbered state. (BgpPeerRemoteAddr=[ipaddr], InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], InterfaceIndex=[integer], BgpPeerLastError=[octet], BgpPeerState=[integer], BgpPeerUnavaiReason=[gauge], InterfaceName=[octet])
当BGP状态机的状态值从高值状态变为低值状态并且前一个状态是Openconfirm状态或Established状态时,该bgpBackwardTransition告警事件就会产生。
告警属性
告警ID |
告警级别 |
告警类型 |
---|---|---|
4289601657 |
重要 |
告警 |
告警参数
参数名称 |
参数含义 |
---|---|
oid |
该告警所对应的MIB节点的OID号。 |
BgpPeerRemoteAddr |
对等体地址。 |
InstanceId |
实例ID |
Afi |
地址族 |
Safi |
子地址族 |
PeerType |
对等体类型 |
PeerRemoteAddr |
对等体地址 |
InterfaceIndex |
接口索引 |
BgpPeerLastError |
这个邻居上次断连时BGP Notification的错误码。 该参数显示格式是[ErrorCode][ErrorSubCode],其中[ErrorCode]是错误码,[ErrorSubCode]是错误子码。例如35,3代表错误码,5代表错误子码。 该参数为0时,代表没有产生错误。 |
BgpPeerState |
BGP peer的状态。
|
BgpPeerUnavaiReason |
对等体断连原因 |
InterfaceName |
接口名称 |
对系统的影响
BGP邻居断连,撤销从邻居收来的BGP路由,基于BGP路由的报文转发失败。
可能原因
- 原因1:BGP Holdtimer超时并且没有收到Keepalive报文。
- 原因2:BGP收到错误的BGP协议报文。
- 原因3:BGP邻居重置,主动中断邻居。
- 原因4:BGP收到邻居的Notification报文。
处理步骤
- 使用display bgp peer ipv4-address log-info查看显示信息中的“Error”字段,可以看到收到的Notification信息中的Error Code和Sub Error Code,显示的格式是[ErrorCode][ErrorSubCode]。
- 如果Notification的Error Code是1,表示BGP收到了报文头错误的报文,=>23。
- 如果Notification的Error Code是2,表示BGP收到了错误的Open报文,=>23。
- 如果Notification的Error Code是3,表示BGP收到了错误的Update报文,=>23。
- 如果Notification的Error Code是4,表示BGP的Holdtimer超时也没有收到Keepalive报文,=>4。
- 如果Notification的Error Code是5,表示BGP的有限状态机发生了错误,=>23。
- 如果Notification的Error Code是6,=>2。
- Error Code值是6时表示BGP断连的原因是BGP主动关闭连接,使用display bgp peer ipv4-address log-info查看“Notification”字段,检查Notification是否是产生告警的交换机所发。
- 如果显示“Send Notification”表示是本端交换机主动发送Notification的=>3。
- 如果显示“Receive Notification”,表示本端交换机接收Notification=>22。
- 在用户日志中搜索命令reset bgp all和reset bgp ipv4-address,检查日志本端是否有重置BGP,或者搜索命令peer ipv4-address enable,检查本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。
- Y=>属于配置引起的告警,无需处理=>24。
- N=>23。
- Error Code值是4表示是BGP断连的原因是HoldTimer超时,Ping BGP邻居的地址是否能通。
- Y=>21。
- N=>5。
- 使用命令display ip routing-table在“Destination/Mask”字段中查看是否有对端Peer地址的路由。
- Y=>7。
- N=>8。
- 使用命令display acl all命令可以查看交换机是否配置了禁止TCP端口179的ACL。
- Y=>9。
- N=>10。
- 使用命令display ip interface brief查看路由出接口对应的“Physical”和“Protocol”字段值是否是UP的。
- Y=>23。
- N=>11。
- 查看配置信息,检查BGP Peer地址的路由的来源。
- 如果路由来源来自OSPF=>12。
- 如果路由来源来自IS-IS=>13。
- 否则=>23。
- 删除禁止TCP端口179的ACL。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。
- Y=>24。
- N=>10。
- 查看配置BGP邻居是否用Loopback接口建立连接。
- Y=>14。
- N=>15。
- 进入该接口的视图下,使用命令display this查看接口是否被shutdown了。
- Y=>undo shutdown接口。
- N=>22。
- 使用命令display ospf peer查看OSPF邻居是否建立。
- Y=>23。
- N=>查看告警OSPF_1.3.6.1.2.1.14.16.2.2 ospfNbrStateChange的修复建议。
- 使用命令display isis peer查看IS-IS邻居是否建立。
- Y=>23。
- N=>查看告警ISIS_1.3.6.1.3.37.2.0.13 isisRejectedAdjacency的修复建议。
- 检查是否配置peer connect-interface指定源地址。
- Y=>15。
- N=>16。
- 如果BGP是EBGP邻居且EBGP邻居间有多跳,检查有没有配置peer ebgp-max-hop。
- Y=>17。
- N=>19。
- 配置peer connect-interface命令。该命令的参数必须是与peer建立连接的本地接口。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。
- Y=>24。
- N=>23。
- 检查是否配置了peer valid-ttl-hops hops命令。
- Y=>18。
- N=>23。
- 检查到对端的报文的TTL是否在[255–hops+1, 255]的范围内。
- Y=>23。
- N=>20。
- 配置peer ebgp-max-hop。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。
- Y=>24。
- N=>23。
- 修改peer valid-ttl-hops hops的值,使之满足到对端的报文的TTL在[255–hops+1, 255]的范围内的判断条件。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。
- Y=>24。
- N=>23。
- 使用命令display cpu-usage查看CPU的利用率是否在一段时间内一直处于100%。
- Y=>23。
- N=>6。
- 联系对端设备的维护人员,检查对端交换机是否有重置BGP,或者本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。
- Y=>24。
- N=>23。
- 请收集告警信息和配置信息,并联系华为技术支持工程师。
- 结束。