更新时间:2024-06-13 GMT+08:00
分享

ALM-3491241985 BGP邻居变化

告警解释

BGP/2/BACKWARD:OID [OID] The BGP FSM moves from a higher numbered state to a lower numbered state. (BgpPeerRemoteAddr=[ipaddr], InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], InterfaceIndex=[integer], BgpPeerLastError=[octet], BgpPeerState=[integer], BgpPeerUnavaiReason=[gauge], InterfaceName=[octet])

当BGP状态机的状态值从高值状态变为低值状态并且前一个状态是Openconfirm状态或Established状态时,该bgpBackwardTransition告警事件就会产生。

告警属性

告警ID

OID

告警级别

告警类型

3491241985

1.3.6.1.2.1.15.7.2

重要

通信告警

告警参数

参数名称

参数含义

OID

该告警所对应的MIB节点的OID号。

BgpPeerRemoteAddr

对等体地址。

InstanceId

实例ID

Afi

地址族

Safi

子地址族

PeerType

对等体类型

PeerRemoteAddr

对等体地址

InterfaceIndex

接口索引

BgpPeerLastError

这个邻居上次断连时BGP Notification的错误码。

该参数显示格式是[ErrorCode][ErrorSubCode],其中[ErrorCode]是错误码,[ErrorSubCode]是错误子码。例如35,3代表错误码,5代表错误子码。错误码的具体含义请参见BGP错误码。

该参数为0时,代表没有产生错误。

BgpPeerState

BGP peer的状态。
  • 1 Idle:BGP拒绝任何进入的连接请求,是BGP初始状态。

    当BGP收到开始事件后,BGP启动到对等体的TCP连接,启动连接重传定时器(ConnectRetry Timer),检测来自对等体的TCP消息,并且转移到Connect状态。

  • 2 Connect:此状态下,BGP等待TCP连接的建立完成后再决定后续操作。
    • 如果TCP连接建立成功,BGP将停止连接重传定时器(ConnectRetry Timer),然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果TCP连接建立失败,BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并再尝试与对等体建立TCP连接,此时BGP继续保持在Connect状态。

  • 3 Active:BGP将尝试进行TCP连接的建立,是BGP的中间状态。
    • 如果TCP连接建立成功,BGP将重置ConnectRetry Timer,然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并转移到Connect状态。

    • 如果BGP试图与一个未知的IP地址建立TCP会话,则TCP连接失败,连接重传定时器(ConnectRetry Timer)被重置,并且BGP保持在Active状态。

  • 4 OpenSent:此状态下,BGP等待对等体的Open消息。
    • 如果BGP收到正确的Open消息,则转移到OpenConfirm状态。

    • 如果BGP收到的Open消息有错误,则给对等体发送一个Notification消息,并且转移到Idle状态。

    • 如果BGP收到TCP连接断开消息,则BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

  • 5 OpenConfirm:此状态下,BGP等待一个Notification消息或Keepalive消息。
    • 如果BGP收到Notification消息或者TCP连接断开消息,则转移到Idle状态。

    • 如果BGP收到Keepalive消息,则转移到Established状态。

  • 6 Established:BGP对等体间可以交换Update消息、Notification消息和Keepalive消息。
    • 如果BGP收到Update消息或Keepalive消息,则继续保持在Established状态。

    • 如果BGP收到Notification消息,将转移到Idle状态。

BgpPeerUnavaiReason

对等体断连原因

  • 1 Configuration lead peer down:配置导致对等体断连。

  • 2 Receive notification:收到Notification报文。

  • 3 Receive error packet:收到错误报文内容。

  • 4 Hold timer expire:Hold定时器到时。

  • 5 Remote peer not reachable:远端对等体不可达。

  • 6 Direct connect-interface down:直连接口状态为Down。

  • 7 Route limit路由数达到上限。

InterfaceName

接口名称

对系统的影响

BGP邻居断连,撤销从邻居收来的BGP路由,基于BGP路由的报文转发失败。

可能原因

原因1:BGP Holdtimer超时并且没有收到Keepalive报文。

原因2:BGP收到错误的BGP协议报文。

原因3:BGP邻居重置,主动中断邻居。

原因4:BGP收到邻居的Notification报文。

处理步骤

  1. 使用display bgp peer ipv4-address log-info查看显示信息中的“Error”字段,可以看到收到的Notification信息中的Error Code和Sub Error Code,显示的格式是[ErrorCode][ErrorSubCode]。

    • 如果Notification的Error Code是1,表示BGP收到了报文头错误的报文,=>23。
    • 如果Notification的Error Code是2,表示BGP收到了错误的Open报文,=>23。
    • 如果Notification的Error Code是3,表示BGP收到了错误的Update报文,=>23。
    • 如果Notification的Error Code是4,表示BGP的Holdtimer超时也没有收到Keepalive报文,=>4。
    • 如果Notification的Error Code是5,表示BGP的有限状态机发生了错误,=>23。
    • 如果Notification的Error Code是6,=>2。

  2. Error Code值是6时表示BGP断连的原因是BGP主动关闭连接,使用display bgp peer ipv4-address log-info查看“Notification”字段,检查Notification是否是产生告警的路由器所发。

    • 如果显示“Send Notification”表示是本端路由器主动发送Notification的=>3。
    • 如果显示“Receive Notification”,表示本端路由器接收Notification=>22。

  3. 在用户日志中搜索命令reset bgp allreset bgp ipv4-address,检查日志本端是否有重置BGP,或者搜索命令peer ipv4-address enable,检查本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。

    • Y=>属于配置引起的告警,无需处理=>24。
    • N=>23。

  4. Error Code值是4表示是BGP断连的原因是HoldTimer超时,Ping BGP邻居的地址是否能通。

    • Y=>21。
    • N=>5。

  5. 使用命令display ip routing-table在“Destination/Mask”字段中查看是否有对端Peer地址的路由。

    • Y=>7。
    • N=>8。

  6. 使用命令display acl all命令可以查看路由器是否配置了禁止TCP端口179的ACL。

    • Y=>9。
    • N=>10。

  7. 使用命令display ip interface brief查看路由出接口对应的“Physical”和“Protocol”字段值是否是UP的。

    • Y=>23。
    • N=>11。

  8. 查看配置信息,检查BGP Peer地址的路由的来源。

    • 如果路由来源来自OSPF=>12。
    • 如果路由来源来自IS-IS=>13。
    • 否则=>23。

  9. 删除禁止TCP端口179的ACL。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。
    • N=>10。

  10. 查看配置BGP邻居是否用Loopback接口建立连接。

    • Y=>14。
    • N=>15。

  11. 进入该接口的视图下,使用命令display this查看接口是否被shutdown了。

    • Y=>undo shutdown接口。
    • N=>22。

  12. 使用命令display ospf peer查看OSPF邻居是否建立。

    • Y=>23。
    • N=>查看告警OSPF_1.3.6.1.2.1.14.16.2.2 ospfNbrStateChange的修复建议。

  13. 使用命令display isis peer查看IS-IS邻居是否建立。

    • Y=>23。
    • N=>查看告警ISIS_1.3.6.1.3.37.2.0.13 isisRejectedAdjacency的修复建议。

  14. 检查是否配置peer connect-interface指定源地址。

    • Y=>15。
    • N=>16。

  15. 如果BGP是EBGP邻居且EBGP邻居间有多跳,检查有没有配置peer ebgp-max-hop

    • Y=>17。
    • N=>19。

  16. 配置peer connect-interface命令。该命令的参数必须是与peer建立连接的本地接口。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。
    • N=>23。

  17. 检查是否配置了peer valid-ttl-hops hops命令。

    • Y=>18。
    • N=>23。

  18. 检查到对端的报文的TTL是否在[255–hops+1, 255]的范围内。

    • Y=>23。
    • N=>20。

  19. 配置peer ebgp-max-hop。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。
    • N=>23。

  20. 修改peer valid-ttl-hops hops的值,使之满足到对端的报文的TTL在[255–hops+1, 255]的范围内的判断条件。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。
    • N=>23。

  21. 使用命令display cpu-usage查看CPU的利用率是否在一段时间内一直处于100%。

    • Y=>23。
    • N=>6。

  22. 联系对端设备的维护人员,检查对端路由器是否有重置BGP,或者本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。
    • N=>23。

  23. 请收集告警信息和配置信息,并联系技术支持人员。
  24. 结束。

告警清除

此告警修复后,系统会自动清除此告警,当前告警页面将不再显示该告警,无需手工清除。

相关文档