生成树故障及排错思路
一、故障现象:业务间歇性中断,汇聚交换机VRRP主备状态频繁切换
VRRP频繁切换,则说明VRRP之间交互的hello报文存在丢失,导致备机认为主机宕机,切换成master模式;
导致hello报文丢失的原因:
1、网络中存在大流数据包;(vrrp的hello报文1s发送一次,死亡时间为3s,所以不存在大流报文)
2、网络中出现环路
以上两种情况都会占用了接口大量的资源,造成丢包。
快速恢复业务的方法:
找到流量非常大的交换机,查看那个接口接口流量最大或者是入接口,直接将入接口shutdown,先恢复业务,如果shutdown以后,还没恢复,则说明环路出现在其他设备。
如果shutdown以后,流量正常了,说明对端设备存在问题,则检查对端设备配置
二、大量的TCN报文导致交换机CPU利用率过高故障案例
故障现象:设备上出现CPU占用率过高,且设备上有ARP报文超时CPCAR后丢弃的日志记录
出现这种现象的原因:
1,ARP攻击
2、设备上有大量的TCN报文
处理思路:
1、如果在核心交换机上有大量虚假MAC地址,则说明可能是存在arp攻击
2、设备收到大量的TCN报文,则说明生成树有问题,可以通过开启TCN保护
STP协议故障排查思路
环路问题导致业务故障异常定位处理思路
判断环路思路:
查接口流量是否特别大
如果只有一个端口流量特别大,很有可能是本设备自环或者是下游设备环路
如果是两个端口流量特别大,可能是不通端口之间环路和环形组网的问题