文档首页/ 华为乾坤/ 更多文档/ 设备告警处理/ V200版本LSW设备告警/ ALM-4289601658 BGP状态机的状态值从高值状态变为低值状态
更新时间:2024-06-13 GMT+08:00
分享

ALM-4289601658 BGP状态机的状态值从高值状态变为低值状态

告警解释

BGP/2/BACKWARD:OID [oid] The BGP FSM moves from a higher numbered state to a lower numbered state. (BgpPeerRemoteAddr=[ipaddr], InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], InterfaceIndex=[integer], BgpPeerLastError=[octet], BgpPeerState=[integer], BgpPeerUnavaiReason=[gauge], InterfaceName=[octet])

当BGP状态机的状态值从高值状态变为低值状态并且前一个状态是Openconfirm状态或Established状态时,该bgpBackwardTransition告警事件就会产生。

告警属性

告警ID

告警级别

告警类型

4289601658

重要

通信告警

告警参数

参数名称

参数含义

oid

该告警所对应的MIB节点的OID号。

InstanceId

邻居所在的实例索引。

Afi

地址族。包括:
  • 1: ipv4

  • 2: ipv6

  • 25: vpls

  • 196: l2vpn

Safi

子地址族。包括:
  • 1: unicast

  • 2: multicast

  • 4: mpls

  • 5: mvpn

  • 65: vpls

  • 66: mdt

  • 70: evpn

  • 128: vpn

  • 245: tunnel-encap-ext

PeerType

邻居地址类型。包括:
  • 1: ipv4

  • 2: ipv6

PeerRemoteAddr

邻居地址。

InterfaceIndex

接口索引。

PeerLastError

这个邻居上次断连时BGP Notification的错误码。

该参数显示格式是[ErrorCode][ErrorSubCode],其中[ErrorCode]是错误码,[ErrorSubCode]是错误子码。例如35,3代表错误码,5代表错误子码。

该参数显示格式是[ErrorCode][ErrorSubCode],其中[ErrorCode]是错误码,[ErrorSubCode]是错误子码。例如35,3代表错误码,5代表错误子码。

该参数为0时,代表没有产生错误。

PeerState

BGP peer的状态。
  • 1 Idle:BGP拒绝任何进入的连接请求,是BGP初始状态。

    当BGP收到开始事件后,BGP启动到对等体的TCP连接,启动连接重传定时器(ConnectRetry Timer),检测来自对等体的TCP消息,并且转移到Connect状态。

  • 2 Connect:此状态下,BGP等待TCP连接的建立完成后再决定后续操作。
    • 如果TCP连接建立成功,BGP将停止连接重传定时器(ConnectRetry Timer),然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果TCP连接建立失败,BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并再尝试与对等体建立TCP连接,此时BGP继续保持在Connect状态。

  • 3 Active:BGP将尝试进行TCP连接的建立,是BGP的中间状态。
    • 如果TCP连接建立成功,BGP将重置ConnectRetry Timer,然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并转移到Connect状态。

    • 如果BGP试图与一个未知的IP地址建立TCP会话,则TCP连接失败,连接重传定时器(ConnectRetry Timer)被重置,并且BGP保持在Active状态。

  • 4 OpenSent:此状态下,BGP等待对等体的Open消息。
    • 如果BGP收到正确的Open消息,则转移到OpenConfirm状态。

    • 如果BGP收到的Open消息有错误,则给对等体发送一个Notification消息,并且转移到Idle状态。

    • 如果BGP收到TCP连接断开消息,则BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

  • 5 OpenConfirm:此状态下,BGP等待一个Notification消息或Keepalive消息。
    • 如果BGP收到Notification消息或者TCP连接断开消息,则转移到Idle状态。

    • 如果BGP收到Keepalive消息,则转移到Established状态。

  • 6 Established:BGP对等体间可以交换Update消息、Notification消息和Keepalive消息。
    • 如果BGP收到Update消息或Keepalive消息,则继续保持在Established状态。

    • 如果BGP收到Notification消息,将转移到Idle状态。

PeerUnavaiReason

对等体断连原因。
  1. Configuration lead peer down:配置导致对等体断连。
  2. Receive notification:收到Notification报文。
  3. Receive error packet:收到错误报文内容。
  4. Hold timer expire:Hold定时器到时。
  5. Remote peer not reachable:远端对等体不可达。
  6. Direct connect-interface down:直连接口状态为Down。
  7. Route limit路由数达到上限。

InterfaceName

接口名称。

对系统的影响

BGP邻居断连,撤销从邻居收来的BGP路由,基于BGP路由的报文转发失败。

可能原因

  • 原因1:BGP Holdtimer超时并且没有收到Keepalive报文。
  • 原因2:BGP收到错误的BGP协议报文。
  • 原因3:BGP邻居重置,主动中断邻居。
  • 原因4:BGP收到邻居的Notification报文。

处理步骤

  1. 使用display bgp peer ipv4-address log-info查看显示信息中的“Error”字段,可以看到收到的Notification信息中的Error Code和Sub Error Code,显示的格式是[ErrorCode][ErrorSubCode]。
    • 如果Notification的Error Code是1,表示BGP收到了报文头错误的报文,=>23。
    • 如果Notification的Error Code是2,表示BGP收到了错误的Open报文,=>23。
    • 如果Notification的Error Code是3,表示BGP收到了错误的Update报文,=>23。
    • 如果Notification的Error Code是4,表示BGP的Holdtimer超时也没有收到Keepalive报文,=>4。
    • 如果Notification的Error Code是5,表示BGP的有限状态机发生了错误,=>23。
    • 如果Notification的Error Code是6,=>2。
  2. Error Code值是6时表示BGP断连的原因是BGP主动关闭连接,使用display bgp peer ipv4-address log-info查看“Notification”字段,检查Notification是否是产生告警的交换机所发。
    • 如果显示“Send Notification”表示是本端交换机主动发送Notification的=>3。
    • 如果显示“Receive Notification”,表示本端交换机接收Notification=>22。
  3. 在用户日志中搜索命令reset bgp allreset bgp ipv4-address,检查日志本端是否有重置BGP,或者搜索命令peer ipv4-address enable,检查本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。
    • Y=>属于配置引起的告警,无需处理=>24。
    • N=>23。
  4. Error Code值是4表示是BGP断连的原因是HoldTimer超时,Ping BGP邻居的地址是否能通。
    • Y=>21。
    • N=>5。
  5. 使用命令display ip routing-table在“Destination/Mask”字段中查看是否有对端Peer地址的路由。
    • Y=>7。
    • N=>8。
  6. 使用命令display acl all命令可以查看交换机是否配置了禁止TCP端口179的ACL。
    • Y=>9。
    • N=>10。
  7. 使用命令display ip interface brief查看路由出接口对应的“Physical”和“Protocol”字段值是否是UP的。
    • Y=>23。
    • N=>11。
  8. 查看配置信息,检查BGP Peer地址的路由的来源。
    • 如果路由来源来自OSPF=>12。
    • 如果路由来源来自IS-IS=>13。
    • 否则=>23。
  9. 删除禁止TCP端口179的ACL。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
    • Y=>24。
    • N=>10。
  10. 查看配置BGP邻居是否用Loopback接口建立连接。
    • Y=>14。
    • N=>15。
  11. 进入该接口的视图下,使用命令display this查看接口是否被shutdown了。
    • Y=>undo shutdown接口。
    • N=>22。
  12. 使用命令display ospf peer查看OSPF邻居是否建立。
    • Y=>23。
    • N=>查看告警OSPF_1.3.6.1.2.1.14.16.2.2 ospfNbrStateChange的修复建议。
  13. 使用命令display isis peer查看IS-IS邻居是否建立。
    • Y=>23。
    • N=>查看告警ISIS_1.3.6.1.3.37.2.0.13 isisRejectedAdjacency的修复建议。
  14. 检查是否配置peer connect-interface指定源地址。
    • Y=>15。
    • N=>16。
  15. 如果BGP是EBGP邻居且EBGP邻居间有多跳,检查有没有配置peer ebgp-max-hop
    • Y=>17。
    • N=>19。
  16. 配置peer connect-interface命令。该命令的参数必须是与peer建立连接的本地接口。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
    • Y=>24。
    • N=>23。
  17. 检查是否配置了peer valid-ttl-hops hops命令。
    • Y=>18。
    • N=>23。
  18. 检查到对端的报文的TTL是否在[255–hops+1, 255]的范围内。
    • Y=>23。
    • N=>20。
  19. 配置peer ebgp-max-hop。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
    • Y=>24。
    • N=>23。
  20. 修改peer valid-ttl-hops hops的值,使之满足到对端的报文的TTL在[255–hops+1, 255]的范围内的判断条件。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
    • Y=>24。
    • N=>23。
  21. 使用命令display cpu-usage查看CPU的利用率是否在一段时间内一直处于100%。
    • Y=>23。
    • N=>6。
  22. 联系对端设备的维护人员,检查对端交换机是否有重置BGP,或者本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。
    • Y=>24。
    • N=>23。
  23. 请收集告警信息和配置信息,并联系华为技术支持工程师。
  24. 结束。

相关文档