【并查集】一种简单而强大高效的数据结构

news2024/12/24 20:50:30

目录

一、并查集原理

二、并查集实现

三、并查集应用

1. LeetCode并查集相关OJ题

2. 并查集的其他应用及总结


一、并查集原理

并查集(Disjoint Set)是一种用来管理元素分组和查找元素所属组别的数据结构。它主要支持两种操作:查找(Find)和合并(Union)。

在并查集中,每个元素都被分配一个代表元素(也可以称为根节点),该代表元素用来表示所属的组别。初始时,每个元素都是其自身的代表元素,即根节点。当需要进行合并操作时,实际上是将两个组别的根节点连接在一起,从而将这两个组别合并为一个组别。而查找操作则是通过不断向上查找代表元素,直到找到根节点为止,以确定元素所属的组别。

在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算

比如:某公司今年校招全国总共招生10人,西安招4人,成都招3人,武汉招3人,10个人来自不同的学校, 起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号:{0, 1, 2, 3, 4, 5, 6, 7, 8, 9},而现在它们对应的值就代表自身,即-1 (这里约定,每个下标对应值如果是非负数,代表这个下标属于这个值的集合,或者说这个值就是该下标的根;负数则代表是一个集合的根,且元素数量就为负号后的数字,具体的看后面的图对照) ; 给以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个数。此时假设同一个地方的学生分别组成了小分队,西安学生小分队s1={0,6,7,8},成都学生小分队s2={1,4,9},武汉学生小分队s3={2,3,5}就相互认识了,10个人形成了三个小团体。假设0,1,2担任队长,负责大家的出行。

此时将这三个集合用一个数组表示:

从上图可以看出:编号6,7,8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1),编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。

仔细观察数组,可以得出以下结论:
  1. 数组的下标对应集合中元素的编号
  2. 数组中如果为负数,负号代表根,数字代表该集合中元素个数
  3. 数组中如果为非负数,代表该元素双亲在数组中的下标

一段时间后,假设s1小分队的8号元素和s2小分队的1号元素玩到了一起,两个小圈子相互介绍认识,最后成为了一个小圈子,这就是合并。

现在0集合有7个人,2集合有3个人,总共两个朋友圈。

二、并查集实现

通过以上例子可知,并查集一般可以解决一下问题:
  • 1. 查找元素属于哪个集合
    • 沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)
  • 2. 查看两个元素是否属于同一个集合
    • 沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在
  • 3. 将两个集合归并成一个集合
    • 将两个集合中的元素合并
    • 将一个集合名称改成另一个集合的名称
  • 4. 集合的个数
    • 遍历数组,数组中元素为负数的个数即为集合的个数。

到此可以看到,并查集并不复杂。综上,就能够自己实现一个并查集:

import java.util.Arrays;

public class UnionFindSet {
    public int[] elem;

    public UnionFindSet(int n) {
        this.elem = new int[n];
        Arrays.fill(elem, -1);
    }

    /**
     * 找x下标对应的根
     *
     * @param x 下标
     * @return x根的下标
     */
    public int findRoot(int x) {
        if (x < 0) {
            throw new IndexOutOfBoundsException("下标不合法");
        }
        while (elem[x] >= 0) {
            x = elem[x];
        }
        return x;
    }

    /**
     * 合并两个集合 x1和x2必须从根合并
     *
     * @param x1 把x2作为自己的子集
     * @param x2 成为x1的子集
     */
    public void union(int x1, int x2) {
        //x1和x2到自己集合的根位置
        x1 = findRoot(x1);
        x2 = findRoot(x2);
        if (x1 == x2) return; //相同根,不需要合并
        elem[x1] = elem[x1] + elem[x2];
        elem[x2] = x1;
    }

    /**
     * 判断两个下标对应的数字是否在一个集合中 -> 是否同根
     */
    public boolean isSameSet(int x1, int x2) {
        x1 = findRoot(x1);
        x2 = findRoot(x2);
        return x1 == x2;
    }

    /**
     * 求数组中集合的个数
     */
    public int getCount() {
        int count = 0;
        for (int x : elem) {
            if (x < 0) {
                count++;
            }
        }
        return count;
    }
}

UnionFindSet类测试: 

import java.util.Arrays;

public class Test {
    public static void main(String[] args) {
        UnionFindSet ufs = new UnionFindSet(10);

        ufs.union(0, 6);
        ufs.union(0, 7);
        ufs.union(0, 8);

        ufs.union(1, 4);
        ufs.union(1, 9);

        ufs.union(2, 3);
        ufs.union(2, 5);

        System.out.println(Arrays.toString(ufs.elem));
        System.out.println("合并根为0和根为1的集合:");
        ufs.union(0, 1);
        System.out.println(Arrays.toString(ufs.elem));

        System.out.println(ufs.isSameSet(3, 6));
        System.out.println(ufs.isSameSet(4, 8));
        System.out.println(ufs.getCount());
    }
}

 测试结果正确:

三、并查集应用

1. LeetCode并查集相关OJ题

题目一:LeetCdoe 547. 省份数量icon-default.png?t=N7T8https://leetcode.cn/problems/number-of-provinces/description/

有 n 个城市,其中一些彼此相连,另一些没有相连。如果城市 a 与城市 b 直接相连,且城市 b 与城市 c 直接相连,那么城市 a 与城市 c 间接相连。

省份 是一组直接或间接相连的城市,组内不含其他没有相连的城市。

给你一个 n x n 的矩阵 isConnected ,其中 isConnected[i][j] = 1 表示第 i 个城市和第 j 个城市直接相连,而 isConnected[i][j] = 0 表示二者不直接相连。

返回矩阵中 省份 的数量。

思路:前面我们已经自己实现了一个并查集,这里就可以用上。题目说到:isConnected[i][j] = 1 表示第 i 个城市和第 j 个城市直接相连,而 isConnected[i][j] = 0 表示二者不直接相连。对于矩阵中值为1的元素,将他们所对应城市相连,进行合并(i ==j时就是自己和自己相连,不需要合并),最后看并查集中负数的个数,即为省份数量。

class Solution {
    public int findCircleNum(int[][] isConnected) {
        int n = isConnected.length;
        UnionFindSet ufs = new UnionFindSet(n);
        //遍历数组,合并
        for(int i = 0; i < n; i++) {
            for(int j = 0; j < isConnected[i].length; j++) {
                if(i != j && isConnected[i][j] == 1) {
                    ufs.union(i, j);
                }
            }
        }
        return ufs.getCount();
    }
}

前面自己实现的并查集类也要放到代码框中,官方题解中同样有并查集的解法。

题目2:LeetCode 990. 等式方程的可满足性icon-default.png?t=N7T8https://leetcode.cn/problems/satisfiability-of-equality-equations/

给定一个由表示变量之间关系的字符串方程组成的数组,每个字符串方程 equations[i] 的长度为 4,并采用两种不同的形式之一:"a==b" 或 "a!=b"。在这里,a 和 b 是小写字母(不一定不同),表示单字母变量名。

只有当可以将整数分配给变量名,以便满足所有给定的方程时才返回 true,否则返回 false。 

思路:将每个变量看出一个节点,==关系看作两者的连接,即将两者合并成一个集合(题目的提示:出现的字母都为小写字母,因此集合的长度给26就够了)。我们先遍历一次数组,将所有==关系的变量合并;再遍历数组,看每个 != 关系的两个变量是否在同一个集合中,如果在同一个集合,说明与方程冲突,即为false。若都无冲突,即为true。

class Solution {
    public boolean equationsPossible(String[] equations) {
        //1.合并所有==的情况
        int n = equations.length;
        UnionFindSet ufs = new UnionFindSet(26);//所有小写字母
        for(int i = 0; i < n; i++) {
            if(equations[i].charAt(1) == '=') {
                //合并
                ufs.union(equations[i].charAt(0) - 'a',equations[i].charAt(3) - 'a');
            }
        }
        //2.判断!=的情况是否正确
        for(int i = 0; i < n; i++) {
            //如果==,说明不满足方程
            if(equations[i].charAt(1) == '!' && 
                ufs.isSameSet(equations[i].charAt(0) - 'a',equations[i].charAt(3) - 'a')) {
                    return false;
            }
        }
        return true;
    }
}

同样,前面自己实现的并查集类也要放到代码框中,官方题解中也是并查集的解法。

2. 并查集的其他应用及总结

并查集还有一些其他的应用:

  1. 连通性问题:并查集常被用来判断图中节点之间的连通性。通过并查集可以快速判断两个节点是否在同一个连通分量中,从而进行相关操作,比如最小生成树算法中的 Kruskal 算法。

  2. 图论中的环检测:在无向图中,可以利用并查集来检测是否存在环路。每次加入一条边时,如果边的两个端点已经在同一个连通分量中,则说明存在环路。

  3. 最近公共祖先(LCA)问题:在树形结构中,通过并查集可以快速计算两个节点的最近公共祖先。

  4. 社交网络中的关系处理:在社交网络中,可以利用并查集维护用户之间的关系,快速合并用户的关系圈子或者查找两个用户之间的关系。

总结:并查集在算法和数据结构领域有着广泛的应用,其时间复杂度通常为接近常数级别,使其成为许多算法和数据结构中重要的一部分。虽然并查集很优秀,但相对来说并查集面试的频率不是特别高,可以说不是一个面试热点。虽然如此,并查集的思想还是很实用的,是一个很有意思的数据结构,通常一旦想到用并查集解决问题,思路也会变得很清晰,所以建议还是好好学习一下。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1499893.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第四篇【传奇开心果系列】Python的自动化办公库技术点案例示例:深度解读Pandas生物信息学领域应用

传奇开心果博文系列 系列博文目录Python的自动化办公库技术点案例示例系列 博文目录前言一、Pandas生物学数据操作应用介绍二、数据加载与清洗示例代码三、数据分析与统计示例代码四、数据可视化示例代码五、基因组数据分析示例代码六、蛋白质数据分析示例代码七、生物医学图像…

LabVIEW管道缺陷智能检测系统

LabVIEW管道缺陷智能检测系统 管道作为一种重要的输送手段&#xff0c;其安全运行状态对生产生活至关重要。然而&#xff0c;随着时间的推移和环境的影响&#xff0c;管道可能会出现老化、锈蚀、裂缝等多种缺陷&#xff0c;这些缺陷若不及时发现和处理&#xff0c;将严重威胁到…

阿珊比较Vue和React:两大前端框架的较量

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…

linux下访问MySQL,检索数据库库表字段报错 Public Key Retrieval is not allowed(不允许公钥检索)

报错如下&#xff1a; 解决办法 在连接数据库的配置文件中加上&allowPublicKeyRetrievaltrue语句&#xff0c;如下&#xff1a; jdbc:mysql://localhost:3306?useUnicodetrue&zeroDateTimeBehaviorconvertToNull&autoReconnecttrue&characterEncodingutf-8&…

图片速览 BitNet: 1-bit LLM

输入数据 模型使用absmax 量化方法进行b比特量化,将输入量化到 [ − Q b , Q b ] ( Q b 2 b − 1 ) \left[-Q_{b},Q_{b}\right](Q_{b}2^{b-1}) [−Qb​,Qb​](Qb​2b−1) x ~ Q u a n t ( x ) C l i p ( x Q b γ , − Q b ϵ , Q b − ϵ ) , Clip ⁡ ( x , a , b ) ma…

代码随想录算法训练营第day9|28. 找出字符串中第一个匹配项的下标、459.重复的子字符串

a.28. 找出字符串中第一个匹配项的下标 题目链接 给你两个字符串 haystack 和 needle &#xff0c;请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标&#xff08;下标从 0 开始&#xff09;。如果 needle 不是 haystack 的一部分&#xff0c;则返回 -1 。 示…

小火星露谷管理器 如何禁用管理器下载?

错误操作 当你在N网点击下载时&#xff0c;你可能会点击左边第一个按钮进行下载&#xff0c;如图&#xff1a; 然后你可能会看到这样的一个提示&#xff1a; 很多用户看着这个提示误以为小火星露谷管理器禁用了N网的下载。 正确操作 N网网页上的按钮MOD MANAGER DOWNLOAD翻…

[PTA] 分解质因子

输入一个正整数n&#xff08;1≤n≤1e15&#xff09;&#xff0c;编程将其分解成若干个质因子&#xff08;素数因子&#xff09;积的形式。 输入格式: 任意给定一个正整数n&#xff08;1≤n≤1e15&#xff09;。 输出格式: 将输入的正整数分解成若干个质因子积的形式&#…

Linux 之五:权限管理(文件权限和用户管理)

1. 文件权限 在Linux系统中&#xff0c;文件权限是一个非常基础且重要的安全机制。它决定了用户和用户组对文件或目录的访问控制级别。 每个文件或目录都有一个包含9个字符的权限模式&#xff0c;这些字符分为三组&#xff0c;每组三个字符&#xff0c;分别对应文件所有者的权限…

面向对象中类与对象

思考系统1000个对象逻辑结构 理解系统1000个对象物理结构 对象this 引用 类的静态变量和静态函数 静态变量和静态函数属于类本身&#xff0c;而不是类的实例。它们可以在不创建类的实例的情况下直接通过类名访问。静态变量在内存中只有一份拷贝&#xff0c;被所有实例共享&…

基于FPGA加速的bird-oid object算法实现

导语 今天继续康奈尔大学FPGA 课程ECE 5760的典型案例分享——基于FPGA加速的bird-oid object算法实现。 &#xff08;更多其他案例请参考网站&#xff1a; Final Projects ECE 5760&#xff09; 1. 项目概述 项目网址 ECE 5760 Final Project 模型说明 Bird-oid object …

关于esp8266的一些经验汇总,新手必看

说实话&#xff0c;esp8266的nodemcu 已经使用了2年多了&#xff0c;各种问题遇到过&#xff0c;就尝试各种解决&#xff0c;而现在回头来看真的是稀里糊涂的在用&#xff0c;当然这个问题也同样涉及到esp32. 因为最近打算自己打一块esp8266的板&#xff0c;之前打的比较多的是…

数据结构之单链表详解(C语言手撕)

​ &#x1f389;个人名片&#xff1a;&#x1f43c;作者简介&#xff1a;一名乐于分享在学习道路上收获的大二在校生 &#x1f648;个人主页&#x1f389;&#xff1a;GOTXX &#x1f43c;个人WeChat&#xff1a;ILXOXVJE &#x1f43c;本文由GOTXX原创&#xff0c;首发CSDN…

(五)关系数据库标准语言SQL

注&#xff1a;课堂讲义使用的数据库 5.1利用SQL语言建立数据库 5.1.1 create Database 5.1.2 create schema...authorization... 创建数据库和创建模式的区别&#xff1a; 数据库是架构的集合&#xff0c;架构是表的集合。但在MySQL中&#xff0c;他们使用的方式是相同的。 …

如何修改SAP标准代码

文章目录 1 Introduction2 Method2.1 Click Change2.2 Switch off Assistent 3 Summary 1 Introduction In the sap sometimes we need change the standard code . I.E. How to comment code ? 2 Method 2.1 Click Change 2.2 Switch off Assistent This is the result wh…

GAMMA电源维修高压直流电源ES30P-5W ES系列

美国Gamma高压电源维修型号&#xff1a;D-ES30R-10N-5W/M&#xff0c;LXR30-1N&#xff0c;XRM5N-100W&#xff0c;ES50P-10W/DDPM&#xff0c;ES60P-10W/DDPM&#xff0c;RR20-20P/DDPM&#xff0c;ES30P-10W&#xff0c;ES60P-10W DDPM&#xff0c;RR60-18P/220V&#xff0c;…

iStoreOS系统内安装HomeAssistant服务

iStoreOS系统内安装HomeAssistant服务 1. HomeAssistant服务 HomeAssistant是一款基于Python的开源智能家居系统&#xff0c;简称HA。 HomeAssistant可以方便地连接各种外部设备&#xff0c;如智能设备、摄像头、邮件、短消息和云服务等&#xff0c;其成熟的可连接组件有近千…

rocketmq学习笔记(一)安装部署

初次使用rocketmq&#xff0c;记录一下全流程步骤。 1、下载安装包 首先在官网&#xff0c;下载安装包&#xff0c;可也根据官方文档进行部署&#xff0c;但有一些细节没说明&#xff0c;可能会有坑&#xff0c;本文会尽量详细的描述每个步骤&#xff0c;把我踩过的坑填补上。…

Python自动化测试:API接口自动化——requests、webSocket

接口自动化测试1 一、requests二、简单示例1.导入/引入库2.请求与响应示例1>简单访问百度主页-GET请求2>简单的登录请求-POST请求3>保存cookies至头信息headers4>其他接口请求时携带headers 三、webSocketwebSocket连接与数据收发示例 本文介绍了借助Python的reque…

Manacher 算法——Leetcode 5.最长回文子串

在了解之前&#xff0c;我们先要了解什么是回文串&#xff0c;什么是回文子串。 回文串和回文子串&#xff1a; 回文串是指一个字符串正序遍历和反向遍历结果相同的字符串。如 ABBA&#xff0c;正着读反着读结果是一样的。 有了回文串的概念&#xff0c;回文子串的概念也就显…