ALM-3491241990 BGP邻居断连
告警解释
BGP/2/HWBACKWARD:OID [OID] The BGP FSM moves from a higher numbered state to a lower numbered state. (InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], InterfaceIndex=[integer], PeerLastError=[octet], PeerState=[integer], PeerUnavaiReason=[gauge], InterfaceName=[octet])
当BGP状态机的状态值从高值状态变为低值状态并且前一个状态是Openconfirm状态或Established状态时,该hwBgpPeerBackwardTransition告警事件就会产生。
告警属性
告警ID |
OID |
告警级别 |
告警类型 |
---|---|---|---|
3491241990 |
1.3.6.1.4.1.2011.5.25.177.1.3.10 |
重要 |
通信告警 |
告警参数
对系统的影响
BGP邻居断连,撤销从邻居收来的BGP路由,基于BGP路由的报文转发失败。
可能原因
原因1:BGP Holdtimer超时并且没有收到Keepalive报文。
原因2:BGP收到错误的BGP协议报文。
原因3:BGP邻居重置,主动中断邻居。
原因4:BGP收到邻居的Notification报文。
处理步骤
- 使用display bgp peer ipv4-address log-info查看显示信息中的“Error”字段,可以看到收到的Notification信息中的Error Code和Sub Error Code,显示的格式是[ErrorCode][ErrorSubCode]。
- 如果Notification的Error Code是1,表示BGP收到了报文头错误的报文,=>23。
- 如果Notification的Error Code是2,表示BGP收到了错误的Open报文,=>23。
- 如果Notification的Error Code是3,表示BGP收到了错误的Update报文,=>23。
- 如果Notification的Error Code是4,表示BGP的Holdtimer超时也没有收到Keepalive报文,=>4。
- 如果Notification的Error Code是5,表示BGP的有限状态机发生了错误,=>23。
- 如果Notification的Error Code是6,=>2。
- Error Code值是6时表示BGP断连的原因是BGP主动关闭连接,使用display bgp peer ipv4-address log-info查看“Notification”字段,检查Notification是否是产生告警的路由器所发。
- 如果显示“Send Notification”表示是本端路由器主动发送Notification的=>3。
- 如果显示“Receive Notification”,表示本端路由器接收Notification=>22。
- 在用户日志中搜索命令reset bgp all和reset bgp ipv4-address,检查日志本端是否有重置BGP,或者搜索命令peer ipv4-address enable,检查本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。
- Y=>属于配置引起的告警,无需处理=>24。
- N=>23。
- Error Code值是4表示是BGP断连的原因是HoldTimer超时,Ping BGP邻居的地址是否能通。
- Y=>21。
- N=>5。
- 使用命令display ip routing-table在“Destination/Mask”字段中查看是否有对端Peer地址的路由。
- Y=>7。
- N=>8。
- 使用命令display acl all命令可以查看路由器是否配置了禁止TCP端口179的ACL。
- Y=>9。
- N=>10。
- 使用命令display ip interface brief查看路由出接口对应的“Physical”和“Protocol”字段值是否是UP的。
- Y=>23。
- N=>11。
- 查看配置信息,检查BGP Peer地址的路由的来源。
- 如果路由来源来自OSPF=>12。
- 如果路由来源来自IS-IS=>13。
- 否则=>23。
- 删除禁止TCP端口179的ACL。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
- Y=>24。
- N=>10。
- 查看配置BGP邻居是否用Loopback接口建立连接。
- Y=>14。
- N=>15。
- 进入该接口的视图下,使用命令display this查看接口是否被shutdown了。
- Y=>undo shutdown接口。
- N=>22。
- 使用命令display ospf peer查看OSPF邻居是否建立。
- Y=>23。
- N=>查看告警OSPF_1.3.6.1.2.1.14.16.2.2 ospfNbrStateChange的修复建议。
- 使用命令display isis peer查看IS-IS邻居是否建立。
- Y=>23。
- N=>查看告警ISIS_1.3.6.1.3.37.2.0.13 isisRejectedAdjacency的修复建议。
- 检查是否配置peer connect-interface指定源地址。
- Y=>15。
- N=>16。
- 如果BGP是EBGP邻居且EBGP邻居间有多跳,检查有没有配置peer ebgp-max-hop。
- Y=>17。
- N=>19。
- 配置peer connect-interface命令。该命令的参数必须是与peer建立连接的本地接口。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
- Y=>24。
- N=>23。
- 检查是否配置了peer valid-ttl-hops hops命令。
- Y=>18。
- N=>23。
- 检查到对端的报文的TTL是否在[255–hops+1, 255]的范围内。
- Y=>23。
- N=>20。
- 配置peer ebgp-max-hop。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
- Y=>24。
- N=>23。
- 修改peer valid-ttl-hops hops的值,使之满足到对端的报文的TTL在[255–hops+1, 255]的范围内的判断条件。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
- Y=>24。
- N=>23。
- 使用命令display cpu-usage查看CPU的利用率是否在一段时间内一直处于100%。
- Y=>23。
- N=>6。
- 联系对端设备的维护人员,检查对端路由器是否有重置BGP,或者本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
- Y=>24。
- N=>23。
- 请收集告警信息和配置信息,并联系技术支持人员。
- 结束。
告警清除
此告警修复后,系统会自动清除此告警,当前告警页面将不再显示该告警,无需手工清除。