更新时间:2023-11-17 GMT+08:00
分享

ALM-3491241990 BGP邻居断连

告警解释

BGP/2/HWBACKWARD:OID [OID] The BGP FSM moves from a higher numbered state to a lower numbered state. (InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], InterfaceIndex=[integer], PeerLastError=[octet], PeerState=[integer], PeerUnavaiReason=[gauge], InterfaceName=[octet])

当BGP状态机的状态值从高值状态变为低值状态并且前一个状态是Openconfirm状态或Established状态时,该hwBgpPeerBackwardTransition告警事件就会产生。

告警属性

告警ID

OID

告警级别

告警类型

3491241990

1.3.6.1.4.1.2011.5.25.177.1.3.10

重要

通信告警

告警参数

参数名称

参数含义

OID

该告警所对应的MIB节点的OID号。

InstanceId

邻居所在的实例索引。

Afi

地址族。包括:

  • 1: ipv4
  • 2: ipv6
  • 25: vpls
  • 196: l2vpn

Safi

子地址族。包括:

  • 1: unicast
  • 2: multicast
  • 4: mpls
  • 65: vpls
  • 128: vpn

PeerType

邻居地址类型。包括:

  • 1: ipv4
  • 2: ipv6

PeerRemoteAddr

邻居地址。

InterfaceIndex

接口索引。

PeerLastError

这个邻居上次断连时BGP Notification的错误码。

该参数显示格式是[ErrorCode][ErrorSubCode],其中[ErrorCode]是错误码,[ErrorSubCode]是错误子码。例如35,3代表错误码,5代表错误子码。错误码的具体含义请参见BGP错误码。

该参数为0时,代表没有产生错误。

PeerState

BGP peer的状态。

  • 1 Idle:BGP拒绝任何进入的连接请求,是BGP初始状态。

    当BGP收到开始事件后,BGP启动到对等体的TCP连接,启动连接重传定时器(ConnectRetry Timer),检测来自对等体的TCP消息,并且转移到Connect状态。

  • 2 Connect:此状态下,BGP等待TCP连接的建立完成后再决定后续操作。
    • 如果TCP连接建立成功,BGP将停止连接重传定时器(ConnectRetry Timer),然后发送一个Open消息给对等体,并且转移到Opensent状态。
    • 如果TCP连接建立失败,BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。
    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并再尝试与对等体建立TCP连接,此时BGP继续保持在Connect状态。
  • 3 Active:BGP将尝试进行TCP连接的建立,是BGP的中间状态。
    • 如果TCP连接建立成功,BGP将重置ConnectRetry Timer,然后发送一个Open消息给对等体,并且转移到Opensent状态。
    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并转移到Connect状态。
    • 如果BGP试图与一个未知的IP地址建立TCP会话,则TCP连接失败,连接重传定时器(ConnectRetry Timer)被重置,并且BGP保持在Active状态。
  • 4 OpenSent:此状态下,BGP等待对等体的Open消息。
    • 如果BGP收到正确的Open消息,则转移到OpenConfirm状态。
    • 如果BGP收到的Open消息有错误,则给对等体发送一个Notification消息,并且转移到Idle状态。
    • 如果BGP收到TCP连接断开消息,则BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。
  • 5 OpenConfirm:此状态下,BGP等待一个Notification消息或Keepalive消息。
    • 如果BGP收到Notification消息或者TCP连接断开消息,则转移到Idle状态。
    • 如果BGP收到Keepalive消息,则转移到Established状态。
  • 6 Established:BGP对等体间可以交换Update消息、Notification消息和Keepalive消息。
    • 如果BGP收到Update消息或Keepalive消息,则继续保持在Established状态。
    • 如果BGP收到Notification消息,将转移到Idle状态。

PeerUnavaiReason

对等体断连原因。

InterfaceName

接口名称。当取值为NULL时,表示当前告警和接口无关。

对系统的影响

BGP邻居断连,撤销从邻居收来的BGP路由,基于BGP路由的报文转发失败。

可能原因

原因1:BGP Holdtimer超时并且没有收到Keepalive报文。

原因2:BGP收到错误的BGP协议报文或收到邻居的Notification报文

原因3:BGP邻居重置,主动中断邻居。

处理步骤

  1. 检查链路质量配置。

    以租户管理员登录iMaster NCE-Campus,在主菜单中选择部署 > 物理网络 > 站点配置,选中所属站点,单击“WAN路由”,查看“存活时间”“保持时间”的设置。
    • 如果配置正确,则无需处理。
    • 如果配置不正确,请修改相关配置。

  2. 检查EBGP的安全加密链路配置。

    1. 以租户管理员登录iMaster NCE-Campus,在主菜单中选择部署 > 虚拟网络 > Overlay网络,单击“Overlay网络”页签,单击“LAN路由”,查看BGP的认证类型是否配置。
      1. 如果已配置,则修改密码,同时修改对端密码。
      2. 如果未配置,则选中对应设备的BGP配置,单击操作列的修改图标,配置认证类型。
    2. 以租户管理员登录iMaster NCE-Campus,在主菜单中选择部署 > 物理网络 > 站点配置,选中所属站点,单击“WAN路由”,查看BGP的认证类型是否配置。
      1. 如果已配置,则修改密码,同时修改对端密码。
      2. 如果未配置,则选中对应设备的BGP配置,单击操作列的修改图标,配置认证类型。

  3. 使用display bgp peer ipv4-address log-info查看显示信息中的“Error”字段,可以看到收到的Notification信息中的Error Code和Sub Error Code,显示的格式是[ErrorCode][ErrorSubCode]。

    • 如果Notification的Error Code是1,表示BGP收到了报文头错误的报文,=>25
    • 如果Notification的Error Code是2,表示BGP收到了错误的Open报文,=>25
    • 如果Notification的Error Code是3,表示BGP收到了错误的Update报文,=>25
    • 如果Notification的Error Code是4,表示BGP的Holdtimer超时也没有收到Keepalive报文,=>6
    • 如果Notification的Error Code是5,表示BGP的有限状态机发生了错误,=>25
    • 如果Notification的Error Code是6,=>4
    • 如果Notification的Error Code是4,Error SubCode是6,表示邻居主动断开连接,=>25。

  4. Error Code值是6时表示BGP断连的原因是BGP主动关闭连接,使用display bgp peer ipv4-address log-info查看“Notification”字段,检查Notification是否是产生告警的路由器所发。

    • 如果显示“Send Notification”表示是本端路由器主动发送Notification的=>5
    • 如果显示“Receive Notification”,表示本端路由器接收Notification=>24

  5. 在用户日志中搜索命令reset bgp allreset bgp ipv4-address,检查日志本端是否有重置BGP,或者搜索命令peer ipv4-address enable,检查本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。

    • Y=>属于配置引起的告警,无需处理=>26
    • N=>25

  6. Error Code值是4表示是BGP断连的原因是HoldTimer超时,Ping BGP邻居的地址是否能通。

    • Y=>23
    • N=>7

  7. 使用命令display ip routing-table在“Destination/Mask”字段中查看是否有对端Peer地址的路由。

    • Y=>9
    • N=>10

  8. 使用命令display acl all命令可以查看路由器是否配置了禁止TCP端口179的ACL。

    • Y=>11
    • N=>12

  9. 使用命令display ip interface brief查看路由出接口对应的“Physical”和“Protocol”字段值是否是UP的。

    • Y=>25
    • N=>13

  10. 查看配置信息,检查BGP Peer地址的路由的来源。

    • 如果路由来源来自OSPF=>14
    • 如果路由来源来自IS-IS=>15
    • 否则=>25

  11. 删除禁止TCP端口179的ACL。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>26
    • N=>12

  12. 查看配置BGP邻居是否用Loopback接口建立连接。

    • Y=>16
    • N=>17

  13. 进入该接口的视图下,使用命令display this查看接口是否被shutdown了。

    • Y=>undo shutdown接口。
    • N=>24

  14. 使用命令display ospf peer查看OSPF邻居是否建立。

    • Y=>25
    • N=>查看告警OSPF_1.3.6.1.2.1.14.16.2.2 ospfNbrStateChange的修复建议。

  15. 使用命令display isis peer查看IS-IS邻居是否建立。

    • Y=>25
    • N=>查看告警ISIS_1.3.6.1.3.37.2.0.13 isisRejectedAdjacency的修复建议。

  16. 检查是否配置peer connect-interface指定源地址。

    • Y=>17
    • N=>18

  17. 如果BGP是EBGP邻居且EBGP邻居间有多跳,检查有没有配置peer ebgp-max-hop

    • Y=>19
    • N=>21

  18. 配置peer connect-interface命令。该命令的参数必须是与peer建立连接的本地接口。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>26
    • N=>25

  19. 检查是否配置了peer valid-ttl-hops hops命令。

    • Y=>20
    • N=>25

  20. 检查到对端的报文的TTL是否在[255–hops+1, 255]的范围内。

    • Y=>25
    • N=>22

  21. 配置peer ebgp-max-hop。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>26
    • N=>25

  22. 修改peer valid-ttl-hops hops的值,使之满足到对端的报文的TTL在[255–hops+1, 255]的范围内的判断条件。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>26
    • N=>25

  23. 使用命令display cpu-usage查看CPU的利用率是否在一段时间内一直处于100%。

    • Y=>25
    • N=>8

  24. 联系对端设备的维护人员,检查对端路由器是否有重置BGP,或者本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>26
    • N=>25

  25. 请收集告警信息和配置信息,并联系技术支持人员。
  26. 结束。

告警清除

此告警修复后,系统会自动清除此告警,当前告警页面将不再显示该告警,无需手工清除。

分享:

    相关文档

    相关产品