【数据结构】高效解决连通性问题的并查集详解及Python实现

news2026/2/15 12:30:38

文章目录

- 1. 并查集：一种高效的数据结构
- 2. 并查集的基本操作与优化
- - 2.1 初始化
  - 2.2 查找操作与路径压缩
  - 2.3 合并操作与按秩合并
- 3. 并查集的应用
- - 3.1 判断连通性
  - 3.2 计算连通分量
- 4. 并查集的实际案例
- - 4.1 图的连通性问题
  - 4.2 网络连接问题
- 5. 并查集的优缺点
- - 5.1 优点
  - 5.2 缺点
- 6. 结论

1. 并查集：一种高效的数据结构

并查集（Union-Find）是一种用于处理不相交集合（Disjoint Sets）的数据结构。它支持两种操作：合并（Union）和查找（Find）。这种数据结构常用于解决连通性问题，如图论中的连通分量、网络中的连通子网等。

2. 并查集的基本操作与优化

2.1 初始化

并查集通过一个数组 parent 来表示每个元素的父节点，另一个数组 rank 用于优化合并操作。以下是初始化的代码：

class UnionFind:
    def __init__(self, n):
        self.parent = list(range(n))
        self.rank = [0] * n

uf = UnionFind(10)
print(uf.parent)
print(uf.rank)

2.2 查找操作与路径压缩

查找操作用于找到某个元素所在集合的根节点。路径压缩技术通过将访问过的节点直接连接到根节点上，从而降低树的高度，提高后续查找操作的效率。以下是路径压缩的实现代码：

def find(self, p):
    if self.parent[p] != p:
        self.parent[p] = self.find(self.parent[p])  # 路径压缩
    return self.parent[p]

2.3 合并操作与按秩合并

合并操作用于将两个不相交的集合合并为一个集合。按秩合并技术确保在合并操作中总是将高度较小的树连接到高度较大的树上，从而避免增加树的高度，按秩合并还可以看看这篇：并查集（按秩合并+路径压缩）基础讲解。以下是按秩合并的实现代码：

def union(self, p, q):
    rootP = self.find(p)
    rootQ = self.find(q)

    if rootP != rootQ:
        if self.rank[rootP] < self.rank[rootQ]:
            rootP, rootQ = rootQ, rootP  # 确保rootP是秩较高的树根
        self.parent[rootQ] = rootP
        if self.rank[rootP] == self.rank[rootQ]:
            self.rank[rootP] += 1  # 更新秩

3. 并查集的应用

3.1 判断连通性

并查集可以用于判断两个节点是否连通。通过检查它们的根节点是否相同即可判断。

def connected(self, p, q):
    return self.find(p) == self.find(q)

uf = UnionFind(10)
uf.union(1, 2)
uf.union(2, 3)
print(uf.connected(1, 3))  # 输出: True
print(uf.connected(1, 4))  # 输出: False

3.2 计算连通分量

并查集还可以用于计算连通分量的数量。在初始状态下，每个节点都是一个独立的连通分量，随着合并操作的进行，连通分量的数量逐渐减少。

def count_components(self):
    root_set = set()
    for i in range(len(self.parent)):
        root_set.add(self.find(i))
    return len(root_set)

uf = UnionFind(10)
uf.union(1, 2)
uf.union(2, 3)
print(uf.count_components())  # 输出: 8

4. 并查集的实际案例

4.1 图的连通性问题

在图论中，可以用并查集解决连通分量、最小生成树等问题。例如，Kruskal算法用于寻找最小生成树，通过并查集来判断边的两个端点是否属于同一连通分量，从而避免形成环。

def kruskal(edges, n):
    edges.sort(key=lambda x: x[2])
    uf = UnionFind(n)
    mst = []
    total_weight = 0

    for u, v, weight in edges:
        if not uf.connected(u, v):
            uf.union(u, v)
            mst.append((u, v, weight))
            total_weight += weight

    return mst, total_weight

edges = [(0, 1, 1), (0, 2, 4), (1, 2, 2), (1, 3, 5), (2, 3, 3)]
n = 4
mst, total_weight = kruskal(edges, n)
print("最小生成树：", mst)
print("总权重：", total_weight)

4.2 网络连接问题

并查集可以用于解决网络连接问题，例如判断网络中两个计算机是否连通，以及在动态变化的网络中维护连通性信息。

class Network:
    def __init__(self, n):
        self.uf = UnionFind(n)

    def connect(self, p, q):
        self.uf.union(p, q)

    def is_connected(self, p, q):
        return self.uf.connected(p, q)

network = Network(5)
network.connect(0, 1)
network.connect(1, 2)
print(network.is_connected(0, 2))  # 输出: True
print(network.is_connected(0, 3))  # 输出: False