不想看原理请跳过一、二、三、四, 直接到配置五,干完活有时间在慢慢看原理。
一、什么是堆叠-Stack
指将多台交换机通过堆叠线缆连接在一起,逻辑上变成一台交换设备,作为一个整体参与数据转发。即:1 + 1 = 一
二、堆叠的好处
提高可靠性、扩展端口数量、增大带宽、简化组网易于管理、长距离堆叠、跨设备链路聚合、流量本地优先转发等
三、堆叠方式
3.1业务口堆叠
- 普通线缆堆叠:需要手动配置(指定物理端口绑定到逻辑端口),可以使用光纤、网线、高速电缆等。
- 专用线缆堆叠:无需配置,插入即能堆叠成功。专用堆叠线缆的两端区分主和备,带有Master标签的一端为线缆主端,不带有标签的一端为线缆备端。
3.2堆叠卡堆叠
四、堆叠的原理
-
堆叠角色
在一个堆叠系统中,分为主交换机、备交换机、从交换机三种角色,都可以进行业务流量的转发。添加、移除或替换堆叠成员交换机,都可能导致堆叠成员角色的变化。
主交换机:整个堆叠系统就1个,负责管理。
备交换机:整个堆叠系统就1个,是主交换机的备份交换机。
从交换机:整个堆叠系统会有很多台,是备交换机的备份交换机,负责业务转发。 -
堆叠ID
用来标识堆叠成员交换机,是槽位号,取值范围是0~8,默认是0。即:最多支持9台设备组建堆叠
每个堆叠成员交换机在堆叠系统中具有唯一的堆叠ID。
为了便于管理,需要手动指定ID,当交换机成员加入堆叠系统,槽位号自动变更。
如果没有提前规划,那ID会随机分配,当有新交换机成员加入时ID冲突,则堆叠主交换机从0~最大的堆叠ID进行遍历,找到第一个空闲的ID分配给该新成员。 -
堆叠优先级
主要用于角色选举过程中确定成员交换机的角色。
优先级值越大表示优先级越高
堆叠主交换机的选举过程是:先比较交换机启动时间,再比较堆叠优先级。当两台交换机启动时间相差20秒以内时,则认为交换机启动时间相同,此时堆叠优先级大的交换机将被选举为主交换机。堆叠优先级取值范围为1~255,缺省优先级值为100,可以修改,修改后的堆叠优先级不影响当前主交换机。只有堆叠系统复位重新选举时,修改后的堆叠优先级才生效。 -
堆叠建立
1.物理连接:将设备和线缆连接好。可分为成链形和环形两种连接。
2.主交换机选举:交换机之间相互发送堆叠竞争报文,并根据选举原则,选出主交换机。
3.堆叠ID分配和备交换机选举:主交换机收集所有成员交换机的拓扑信息,向所有成员交换机分配堆叠ID,之后选出堆叠系统备交换机。
4.软件版本和配置文件同步:主交换机将整个堆叠系统的拓扑信息同步给所有成员交换机,成员交换机同步主交换机的系统软件和配置文件,之后进入稳定运行状态。
关于选举比较:1、比较开机时间越短 越优先。2、比较优先级值越大 越优先。3、比较mac地址值越小 越优先。当1相同时比较2,当2相同时比较3。
关于连接类型
链形堆叠:适合长距离堆叠,可靠性低
环形堆叠:可靠性高、带宽利用率高,不适合长距离堆叠
-
MAC地址
堆叠系统的MAC地址是主交换机的MAC地址。当堆叠系统的主交换机离开时,
如果主交换机在10分钟内重新加入堆叠系统,则堆叠系统将继续使用该交换机的MAC地址。新加入堆叠系统后,如果原主交换机变为了从交换机,则堆叠系统的MAC地址就是从交换机的MAC地址。
如果主交换机没有在10分钟内重新加入堆叠系统,则堆叠系统的MAC地址将切换为新主交换机的MAC地址。
堆叠系统MAC地址的缺省切换时间是10分钟,可以使用命令stack timer mac-address switch-delay delay-time进行配置。
堆叠系统MAC地址切换将造成流量中断,为了减少影响,可以执行命令stack timer mac-address switch-delay 0将堆叠系统MAC地址设置为永久堆叠MAC地址,只要堆叠系统不重启永久堆叠MAC地址都不会进行切换。 -
多主检测-MAD
堆叠系统中所有成员交换机都使用同一个IP地址和MAC地址,当堆叠分裂后,会产生多个交换机共用同一个IP及MAC,引起网络故障,必须进行IP地址和MAC地址的冲突检查。
多主检测MAD(Multi-Active Detection),是一种检测和处理堆叠分裂的协议。链路故障导致堆叠系统分裂后,MAD可以实现堆叠分裂的检测、冲突处理和故障恢复,降低堆叠分裂对业务的影响。堆叠分裂后,MAD冲突处理机制会使分裂后的堆叠系统处于Detect(工作)状态或Recovery(禁用)状态
MAD分裂检测机制会检测到网络中存在多个处于Detect状态的堆叠系统,这些堆叠系统之间相互竞争,竞争成功的堆叠系统保持Detect状态,竞争失败的堆叠系统会转入Recovery状态;并且在Recovery状态堆叠系统的所有成员交换机上,关闭除保留端口以外的其它所有物理端口包括管理口,以保证该堆叠系统不再转发业务报文。
MAD竞争原则与主交换机的竞争原则类似MAD检测方式有两种:直连检测方式和代理检测方式。在同一个堆叠系统中,两种检测方式互斥,不可以同时配置。
1.直连检测方式:交换机间通过普通线缆直连的专用链路进行多主检测,堆叠系统正常运行时,不发送MAD报文;堆叠系统分裂后,分裂后的两台交换机以1s为周期通过检测链路发送MAD报文进行多主冲突处理。
1.1中间设备直连:所有成员交换机之间至少有一条检测链路与中间设备相连。 由于MAD报文是BPDU报文,采用通过中间设备的直连检测方式时,在直连检测链路的中间设备上需要配置转发BPDU报文 1.2Full-mesh方式直连 :即每两台成员交换机之间至少有一条检测链路。 接口配置直连多主检测功能后,不能再配置其他业务。为保证可靠性,成员交换机之间最多可以配置8条直连检测链路。
2.代理检测方式:所有成员交换机都与代理设备连接,并将这些链路加入同一个Eth-Trunk内,在堆叠系统Eth-Trunk上启用代理检测,在代理设备上启用MAD检测功能。
堆叠系统正常运行时,堆叠成员交换机以30s为周期通过检测链路发送MAD报文。堆叠成员交换机对在正常工作状态下收到的MAD报文不做任何处理;堆叠分裂后,分裂后的两台交换机以1s为周期通过检测链路发送MAD报文进行多主冲突处理。
2.1单机作代理
2.2两套堆叠系统互为代理
部署建议
•堆叠系统与其他网络设备相连时,建议使用Eth-Trunk接口相连,并且堆叠系统的每台成员交换机都能有一个端口加入到Eth-Trunk中。
•堆叠系统连接接入设备时,建议将直连终端的端口配置为STP边缘口,以避免连接终端的端口Up/Down状态变化时触发STP重新计算,影响流量转发。
•如果配置storm-control的端口较多,建议用流量抑制替代,流量抑制对CPU资源的消耗很少。
•如果配置port-security的端口较多,建议用mac-limit替代,mac-limit对CPU资源的消耗很少。
•当堆叠系统相连的网络中有成环风险时,建议通过命令mac-address flapping action error-down配置MAC地址漂移检测与接口error-down联动机制。这样可以提升处理性能,并且接口Down时能够被对端设备感知。同时,如果对端设备有冗余保护链路,则可以快速切换到正常链路。
上述代码框来自官方文档
五、抄底捞干-直接开配置
- 本次实验环境为华为S5731-S系列交换机2台,配置业务口普通线缆堆叠,配置直连式MAD检测。
- 5.1实验环境准备
1台华为S5731-S48T4X交换机、1台华为S5731-S24T4X交换机、2个SM1310-10G模块、1条万兆单模光纤跳线、1条网线
物理端口连接(2台设备采用链形连接)
- 5.2配置
开局先将1台交换机加电——登录交换机,检查软件版本,发现不是最新版软件,进入官网升级交换机软件版本(操作步骤)软件版本升级完成。
<MYWS1>dis version
Huawei Versatile Routing Platform Software
VRP (R) software, Version 5.170 (S5731 V200R022C00SPC500)
Copyright (C) 2000-2022 HUAWEI TECH Co., Ltd.
HUAWEI S5731-S48T4X Routing Switch uptime is 0 week, 0 day, 0 hour, 33 minutes
开始进行堆叠配置
1.将物理端口加入堆叠逻辑端口
<MYWS1>dis int brie \\检查端口信息
PHY: Physical
*down: administratively down
#down: LBDT down
..........
XGigabitEthernet0/0/1 up up 0% 0% 0 0
XGigabitEthernet0/0/2 down down 0% 0% 0 0
XGigabitEthernet0/0/3 down down 0% 0% 0 0
XGigabitEthernet0/0/4 down down 0% 0% 0 0
<MYWS1>
<MYWS1>system-view \\进入系统试图
Enter system view, return user view with Ctrl+Z.
[MYWS1]interface stack-port 0/1 \\进入堆叠逻辑接口
[MYWS1-stack-port0/1]port interface XGigabitEthernet 0/0/1 enable \\将物理接口加入逻辑接口
Warning: Enabling stack function may cause configuration loss on the interface. Continue? [Y/N]:y \\确认
Info: This operation may take a few seconds. Please wait...
下面是系统回显
Jun 26 2024 07:21:42 MYWS LLDP/4/NBRCHGTRAP:OID 1.0.8802.1.1.2.0.0.1 Neighbor information is changed. (LldpStatsRemTablesInserts=0, LldpStatsRemTablesDeletes=1, LldpStatsRemTablesDrops=0, LldpStatsRemTablesAgeouts=0)
Jun 26 2024 07:21:42 MYWS %%01IFPDT/4/IF_STATE(l)[6]:Interface XGigabitEthernet0/0/1 has turned into DOWN state.
Jun 26 2024 07:21:42 MYWS %%01IFNET/4/IF_STATE(l)[7]:Interface Vlanif1 has turned into DOWN state..
[MYWS1-stack-port0/1]
Jun 26 2024 07:21:42 MYWS %%01IFNET/4/IF_DISABLE(l)[8]:Interface XGigabitEthernet0/0/1 has been unavailable.
Jun 26 2024 07:21:42 MYWS %%01IFADP/4/PORTDOWNINFO(l)[9]:Interface XGigabitEthernet0/0/1 has turned into DOWN state. (Information=Physical state(PMD): down, Physical state(PCS): down, RX loss of signal: no, Current lane0 RX power(dBM): -1.92, Current lane0 TX power(dBM): -2.81, Local fault: no, Remote fault: no, PMA fault: NA, PCS fault: NA, High BER: NA, PCS block lock: NA, Transmit local fault: NA, Receive local fault: NA, PMD receive signal OK: NA, XGXS PLL has lost lock: NA, XGXS PLL lock detected: NA, RX lock: NA)
Jun 26 2024 07:21:43 MYWS %%01IFNET/4/IF_ENABLE(l)[10]:Interface XGigabitEthernet0/0/1 has been available.
[MYWS1-stack-port0/1]
Jun 26 2024 07:21:43 MYWS FSP/4/STACKPORTISUP:OID 1.3.6.1.4.1.2011.5.25.183.1.22.12 Stack port XGigabitEthernet0/0/1 state has changed to up.
Jun 26 2024 07:21:43 MYWS FSP/3/STACKPORTDOWNRESUME:OID 1.3.6.1.4.1.2011.5.25.183.1.22.66 Stack port XGigabitEthernet0/0/1 recovers from the down state.
[MYWS1-stack-port0/1]
Jun 26 2024 07:21:45 MYWS %%01IFPDT/4/IF_STATE(l)[11]:Interface XGigabitEthernet0/0/1 has turned into UP state.
[MYWS1-stack-port0/1]quit
[MYWS1]
-------------------------------------------------------------------------
<MYWS2>system-view \\进入系统试图
Enter system view, return user view with Ctrl+Z.
[MYWS2]interface stack-port 0/2 \\进入堆叠逻辑接口
[MYWS2-stack-port0/2]port interface XGigabitEthernet 0/0/4 enable \\将物理接口加入逻辑接口
Warning: Enabling stack function may cause configuration loss on the interface. Continue? [Y/N]:y \\确认
Info: This operation may take a few seconds. Please wait...
下面是系统回显
Jun 26 2024 07:47:31 MYWS2 %%01IFPDT/4/IF_STATE(l)[0]:Interface XGigabitEthernet0/0/4 has turned into DOWN state.
Jun 26 2024 07:47:31 MYWS2 %%01IFNET/4/IF_STATE(l)[1]:Interface Vlanif1 has turned into DOWN state.
Jun 26 2024 07:47:31 MYWS2 %%01IFNET/4/IF_DISABLE(l)[2]:Interface XGigabitEthernet0/0/4 has been unavailable.
Jun 26 2024 07:47:31 MYWS2 %%01IFADP/4/PORTDOWNINFO(l)[3]:Interface XGigabitEthernet0/0/4 has turned into DOWN state. (Information=Physical state(PMD): down, Physical state(PCS): down, RX loss of signal: no, Current lane0 RX power(dBM): -2.07, Current lane0 TX power(dBM): -3.29, Local fault: no, Remote fault: no, PMA fault: NA, PCS fault: NA, High BER: NA, PCS block lock: NA, Transmit local fault: NA, Receive local fault: NA, PMD receive signal OK: NA, XGXS PLL has lost lock: NA, XGXS PLL lock detected: NA, RX lock: NA).
The stack-port 2 turned to up at 2024-06-26 07:47:32
.
[MYWS2-stack-port0/2]
Jun 26 2024 07:47:32 MYWS2 %%01ECML/3/ECM_CHANNEL_NORMAL(l)[4]:Stack port XGigabitEthernet0/0/4 channel status is normal.
Jun 26 2024 07:47:32 MYWS2 FSP/4/STACKPORT_UP:OID 1.3.6.1.4.1.2011.5.25.183.1.22.1 Stack-port 0/2 changes to up.
Jun 26 2024 07:47:32 MYWS2 FSP/4/STACKPORTISUP:OID 1.3.6.1.4.1.2011.5.25.183.1.22.12 Stack port XGigabitEthernet0/0/4 state has changed to up.
Jun 26 2024 07:47:32 MYWS2 FSP/3/STACKPORTDOWNRESUME:OID 1.3.6.1.4.1.2011.5.25.183.1.22.66 Stack port XGigabitEthernet0/0/4 recovers from the down state.
Jun 26 2024 07:47:32 MYWS2 %%01SRM/4/STACK_PORT_UP(l)[5]:Stack-port 0/2 change to up.
Jun 26 2024 07:47:32 MYWS2 %%01IFNET/4/IF_ENABLE(l)[6]:Interface XGigabitEthernet0/0/4 has been available.
[MYWS2-stack-port0/2]
Jun 26 2024 07:47:33 MYWS2 %%01FSP/4/NBR_DISCOVER(l)[7]:Slot 0 discovered a neighbor on port 2.
[MYWS2-stack-port0/2]
Jun 26 2024 07:47:33 MYWS2 %%01IFPDT/4/IF_STATE(l)[8]:Interface XGigabitEthernet0/0/4 has turned into UP state.
[MYWS2-stack-port0/2]quit
[MYWS2]
Jun 26 2024 07:47:38 MYWS2 %%01FSP/4/SWTICH_REBOOTING(l)[9]:An SPDU message is received from another MPU, and the switch 0 will reboot.
[MYWS2]
Device will restart for stack merge
Jun 26 2024 07:47:41 MYWS2 %%01SRM/4/MSTRSCURST(l)[10]:Master SCU is reset.
Jun 26 2024 07:47:41 MYWS2 %%01SRM/4/RESETREASON(l)[11]:Reset for stack combine, the barcode is: 1021A0384342.
[MYWS2]
The stack-port 2 turned to down at 2024-06-26 07:47:42
System reboot at 07:47:42BSBC start...
根据上述操作后,该设备会自动重启,检查堆叠系统是否建立。
[MYWS1]dis stack \\查看堆叠成员交换机的堆叠信息。
Stack mode: Service-port
Stack topology type: Link
Stack system MAC: 6c44-2ab8-af60
MAC switch delay time: 10 min
Stack reserved VLAN: 4093
Slot of the active management port: --
Slot Role MAC Address Priority Device Type
-------------------------------------------------------------
0 Master 6c44-2ab8-af60 100 S5731-S48T4X
1 Standby c0bc-9a8c-0d30 100 S5731-S24T4X
[MYWS1]dis stack peers \\查看堆叠成员交换机的邻居信息。
(B): Block all
Slot Port1 Peer1 Port2 Peer2
---------------------------------------------------------------------------
0 STACK 1 1 STACK 2 None
1 STACK 1 None STACK 2 0
[MYWS1]dis stack port brief \\查看堆叠端口信息
PHY :Physical state
Protocol:Stack link protocol state
*down :administratively down
(r) :Runts trigger error down
(c) :CRC trigger error down
(l) :Link-flapping trigger error down
(m) :Media mismatch trigger error down
Stack Port PHY Protocol InUti OutUti InErrors OutErrors
-------------------------------------------------------------------------------
stack-port0/1
XGigabitEthernet0/0/1 up up 0.01% 0.01% 0 0
stack-port1/2
XGigabitEthernet1/0/4 up up 0.01% 0.01% 0 0
[MYWS1]dis stack configuration \\查看堆叠系统当前配置的堆叠命令信息。
* : Invalid-configuration
# : Unsaved configuration
---------------Configuration on slot 0 Begin---------------
stack enable
stack slot 0 renumber 0
stack slot 0 priority 100
stack reserved-vlan 4093
stack timer mac-address switch-delay 10
interface stack-port 0/1
port interface XGigabitEthernet0/0/1 enable
---------------Configuration on slot 0 End-----------------
---------------Configuration on slot 1 Begin---------------
stack enable
stack slot 0 renumber 1
stack slot 1 priority 100
stack reserved-vlan 4093
stack timer mac-address switch-delay 10
interface stack-port 1/1
interface stack-port 1/2
port interface XGigabitEthernet1/0/4 enable
---------------Configuration on slot 1 End-----------------
[MYWS1]dis stack channel all \\查看堆叠链路的连线及状态信息。
! : Port have received packets with CRC error.
L-Port: Logic stack port
P-Port: Physical port
Slot L-Port P-Port Speed State || P-Port Speed State L-Port Slot
---------------------------------------------------------------------------------------
0 0/1 XGE0/0/1 10G UP XGE1/0/4 10G UP 1/2 1
1 1/2 XGE1/0/4 10G UP XGE0/0/1 10G UP 0/1 0
---------------------------------------------------------------------------------------
[MYWS1]
配置MAD多主检测
[MYWS1]dis cu int g 0/0/1
#
interface GigabitEthernet0/0/1 \\接口下配置
mad detect mode direct
#
return
[MYWS1]dis cu int g 1/0/1
#
interface GigabitEthernet1/0/1 \\接口下配置
mad detect mode direct
#
return
[MYWS1]
[MYWS1]dis mad verbose \\验证配置
Current MAD domain: 0
Current MAD status: Detect
Mad direct detect interfaces configured:
GigabitEthernet0/0/1
GigabitEthernet1/0/1
Mad relay detect interfaces configured:
Excluded ports(configurable):
Excluded ports(can not be configured):
XGigabitEthernet0/0/1
XGigabitEthernet1/0/4
[MYWS1]
拆分堆叠
拆分通过业务口普通线缆和专用线缆组建的堆叠
1.执行命令save,保存配置。
2.执行命令copy source-filename destination-filename all
备份配置文件到所有成员交换机,以备再次组建堆叠时使用。
3.拆除成员交换机之间的堆叠线缆。拆除堆叠线缆后,
如果分裂后的交换机不再与原主交换机或备交换机相连,则该交换机会重启。
由于堆叠成员交换机IP地址等部分配置相同,远程登录可能不成功,
因此请通过Console口登录交换机进行后续配置。
4.执行命令system-view,进入系统视图。
5.执行命令reset stack configuration,清除堆叠的相关配置。
清除的堆叠配置包括:
交换机槽位号、堆叠优先级、
堆叠保留VLAN、系统MAC切换时间、堆叠口配置、堆叠口速率配置。
执行该命令会导致设备重启。
6.将成员交换机下电。