【高阶数据结构】并查集 {并查集原理;并查集优化;并查集实现;并查集应用}

news2025/1/17 6:19:25

一、并查集原理

在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-findset)

比如:某公司今年校招全国总共招生10人,西安招4人,成都招3人,武汉招3人,10个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号:{0, 1, 2, 3,4, 5, 6, 7, 8, 9}; 给以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个数。(负号下文解释)

在这里插入图片描述

毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路,于是:西安学生小分队s1={0,6,7,8},成都学生小分队s2={1,4,9},武汉学生小分队s3={2,3,5}就相互认识了,10个人形成了三个小团体。假设右三个群主0,1,2担任队长,负责大家的出行。

在这里插入图片描述

一趟火车之旅后,每个小分队成员就互相熟悉,称为了一个朋友圈。

在这里插入图片描述

从上图可以看出:编号6,7,8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1),编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。

仔细观察数组中的内容,可以得出以下结论:

  1. 数组的下标对应集合中元素的编号
  2. 数组中如果为负数,负号代表根,数字代表该集合中元素个数
  3. 数组中如果为非负数,代表该元素双亲在数组中的下标

在公司工作一段时间后,西安小分队中8号同学与成都小分队1号同学奇迹般的走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子:

在这里插入图片描述

现在0集合有7个人,2集合有3个人,总共两个朋友圈。
通过以上例子可知,并查集一般可以解决一下问题:

  1. 查找元素属于哪个集合
    沿着数组表示的树形关系向上一直找到根 (即:树中中元素为负数的位置)
  2. 查看两个元素是否属于同一个集合
    沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在
  3. 将两个集合归并成一个集合
    找到两个集合的根
    一个根任作为根,另一个作孩子:作根的将两集合的元素个数加到一起,作孩子的,将值变为根在数组中的下标
  4. 集合的个数
    遍历数组,数组中元素为负数的个数即为集合的个数。

二、并查集优化

  1. 按秩合并
    按秩合并是并查集的一种优化方法,其核心思想是在合并两个集合时,将秩(可以理解为树的高度)较小的节点的根直接接到秩较大的节点的根上,而不必在寻找秩较大的节点的根的过程中进行额外的find函数调用。这样做的好处是可以减少find函数的调用次数,从而优化算法的效率。
    我们用一个数组rank[]记录每个根节点对应的树的深度(如果不是根节点,其rank相当于以它作为根节点的子树的深度)。一开始,把所有元素的rank(秩)设为1。合并时比较两个根节点,把rank较小者往较大者上合并。具体来说,如果两个集合的秩不同,那么秩较小的集合的根节点会成为秩较大的集合的子节点。如果两个集合的秩相同,那么在合并时,秩较大的集合的根节点的秩会增加1。
    按秩合并的好处包括:
    降低树的高度:按秩合并优化了合并操作,使得树的高度相对较小,从而减少了查找操作的时间复杂度。
    提高查找操作效率:通过按秩合并,将较小的树合并到较大的树上,减少树的高度,从而减少了查找操作的路径长度,提高了查找效率。
    平衡树的结构:按秩合并能够保持树结构的平衡性,避免树退化成链表,进一步提高了查找操作的效率。

  2. 路径压缩
    然而,需要注意的是,按秩合并虽然在一定程度上优化了并查集的性能,但在实际应用中,路径压缩技术往往能带来更大的性能提升。路径压缩是一种在查找节点根节点的同时,将查找路径上的节点的父节点直接设置为根节点的方法,这样可以使得树的深度大大降低,从而在后续的操作中提高效率。

  3. 路径压缩和按秩合并如果一起使用,很可能会破坏rank的准确性。

  4. 算法学习笔记:并查集的优化详解


二、并查集实现

#include <vector>
#include <map>
using namespace std;

// 只有编号,实现一个简单的并查集
class UnionFindSet{
    vector<int> _ufs; //并查集s

public:
    UnionFindSet(int n)
    {
        _ufs.resize(n, -1); //初始时,每个元素自成一个单元素集合
    }

    bool Union(int x, int y)
    {
        int rx = FindRoot(x);
        int ry = FindRoot(y);
        if(rx == ry) return false;
        _ufs[rx] += _ufs[ry];
        _ufs[ry] = rx;
        return true;
    }

    int FindRoot(int x)
    {
        int root = x;
        while(_ufs[root] >= 0)
        {
            root = _ufs[root];
        }

        // 路径压缩
        while(_ufs[x] >= 0)
        {
            int parent = _ufs[x];
            _ufs[x] = root;
            x = parent;
        }
        
        return root;
    }

    bool InSet(int x, int y)
    {
        return FindRoot(x)==FindRoot(y);
    }

    int SetCount()
    {
        int count = 0;
        for(int e : _ufs)
        {
            if(e < 0) ++count;
        }
        return count;
    }
};

// 其他数据类型组成的并查集
// 1.建立编号和其他数据类型相互的映射关系
// 2.最终还是要通过编号组织并查集
// template <class T>
// class UnionFindSet{
//     vector<T> _vct; //编号找人
//     map<T, int> _map; //人找编号
//     vector<int> _ufs; //并查集s
// public:
//     UnionFindSet(const T* set, int n)
//     {
//         //1.建立编号<-->人名的映射关系
//         for(int i = 0; i < n; ++i)
//         {
//             _vct.push_back(set[i]);
//             _map[set[i]] = i;
//         }
//         //2.初始化并查集
//         _ufs.resize(n, -1); //初始时,每个元素自成一个单元素集合
//     }
// };

三、并查集应用

LCR 116. 省份数量 - 力扣(LeetCode)

class Solution {
public:
    int findCircleNum(vector<vector<int>>& isConnected) {
        vector<int> ufs(isConnected.size(), -1);
        auto FindRoot = [&ufs](int x)
        {
            while(ufs[x] >= 0) x = ufs[x];
            return x;
        };
        
        for(int i = 0; i < isConnected.size(); ++i)
        {
            for(int j = 0; j < isConnected[i].size(); ++j)
            {
                if(isConnected[i][j] == 1) 
                {
                    int r1 = FindRoot(i);
                    int r2 = FindRoot(j);
                    if(r1 != r2)
                    {
                        ufs[r1] += ufs[r2];
                        ufs[r2] = r1;
                    }
                }
            }
        }

        int count = 0;
        for(int e : ufs)
        {
            if(e < 0) ++count;
        }
        return count;
    }
};

990. 等式方程的可满足性 - 力扣(LeetCode)

class Solution {
public:
    bool equationsPossible(vector<string>& equations) {
         vector<int> ufs(26, -1);
         auto FindRoot = [&ufs](int x)
         {
            while(ufs[x] >= 0) x = ufs[x];
            return x;
         };

         for(auto& e : equations)
         {
            if(e[1] == '=')
            {
                int r1 = FindRoot(e[0]-'a');
                int r2 = FindRoot(e[3]-'a');
                if(r1 != r2)
                {
                    ufs[r1] += ufs[r2];
                    ufs[r2] = r1;
                }
            }
         }

         for(auto& e : equations)
         {
            if(e[1] == '!')
            {
                int r1 = FindRoot(e[0]-'a');
                int r2 = FindRoot(e[3]-'a');
                if(r1 == r2) 
                    return false;
            }
         }
         return true;
    }
};

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1674712.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年Java程序员的职业发展路径

程序员的职业路径是非常清晰的&#xff0c;但是现实情况下&#xff0c;很多人卡在了高级开发就再也上不去&#xff0c;直到遇到职业发展的危机&#xff0c;比如&#xff1a; 35岁大龄程序员找工作难&#xff0c;国内很多大型互联网公司在招聘要求上&#xff0c;会限制35岁这个年…

记录Spring Boot 2.3.4.RELEASE版注解方式实现AOP和通知的执行顺序

1.advice 按照以下的顺序执行 输出结果&#xff1a;(正常和异常) 说明&#xff1a;Spring boot 2.3.4.RELEASE 版本使用的AOP是spring-aop-5.2.9.RELEASE&#xff0c;AOP的通知顺序不一样。 可以测试下Spring boot 2.1.1.RELEASE 版做对比&#xff0c;发现结果是不一样的。 2…

算法-卡尔曼滤波之卡尔曼滤波的第一个方程:状态更新方程

通过一个例子来引出卡尔曼滤波的状态更新方程&#xff1b; 这里系统状态是金条的重量&#xff1b; 为了估计系统的状态&#xff0c;我们可以多次测量金条的重量&#xff0c;然后求平均值&#xff1b; 其中估计值是所有测量值的平均值&#xff1b; 由于我们使用的是静态模型&am…

灵活的静态存储控制器 (FSMC)的介绍(STM32F4)

目录 概述 1 认识FSMC 1.1 应用介绍 1.2 FSMC的主要功能 1.2.1 FSMC用途 1.2.2 FSMC的功能 2 FSMC的框架结构 2.1 AHB 接口 2.1.1 AHB 接口的Fault 2.1.2 支持的存储器和事务 2.2 外部器件地址映射 3 地址映射 3.1 NOR/PSRAM地址映射 3.2 NAND/PC卡地址映射 概述…

思维导图软件哪个好?5个软件教你自己快速制作思维导图

思维导图软件哪个好&#xff1f;5个软件教你自己快速制作思维导图 思维导图软件在现代生活和工作中扮演着重要的角色&#xff0c;它们可以帮助人们整理思维、规划项目、记录笔记等。以下是五款值得推荐的思维导图软件&#xff0c;它们各有特色&#xff0c;可以帮助您快速制作思…

开发者体验官:参与华为云CodeArts开发实践,赢取千元好礼!

CodeArts携华为云其他六大上云实践项目&#xff0c; 一起给大家送福利啦&#xff01; 这次我们准备了华为全套电子产品&#xff0c; 包括但不限于华为智能音箱、耳机、摄像头&#xff0c;最高价值1000元&#xff01; 只要体验完产品&#xff0c;提出相关的产品优化建议即有…

【020】基于JavaWeb实现的批报管理系统

项目介绍 基于jspservlet实现的批报管理系统采用B/S架构,该项目设计了一个角色管理员&#xff0c;管理员实现了我的案件、查询统计、项目维护等三大功能模块 技术栈 开发工具&#xff1a;Idea2020.3 运行环境&#xff1a;jdk1.8tomcat9.0mysql5.7 服务端技术&#xff1a;j…

wireshark_概念

ARP (Address Resolution Protocol&#xff09;协议&#xff0c;即地址解析协议。该协议的功能就是将IP地址解析成MAC地址。 混杂模式 抓取经过网卡的所有数据包&#xff0c;包括发往本网卡和非发往本网卡的。 非混杂模式 只抓取目标地址是本网卡的数据包&#xff0c;对于发往…

算法练习第21天|216.组合总和|||、17.电话号码的字母组合

216.组合总和 III 216. 组合总和 III - 力扣&#xff08;LeetCode&#xff09;https://leetcode.cn/problems/combination-sum-iii/ 题目描述&#xff1a; 找出所有相加之和为 n 的 k 个数的组合&#xff0c;且满足下列条件&#xff1a; 只使用数字1到9每个数字 最多使用一…

历史影像的下载办法总结

最近想要下黄河口的历史影像&#xff0c;试验了几个办法&#xff1a; 1&#xff09;参考文献1中的办法&#xff0c;用Global Mapper下载World Imagery Wayback网站的历史数据&#xff0c;能下载从2014年至现在的&#xff1b; 2&#xff09;参考文献1中的办法&#xff0c;用SA…

SSL证书:守护网站安全的必要之选

随着互联网的飞速发展&#xff0c;网络安全问题愈发受到人们的关注。在这个信息爆炸的时代&#xff0c;数据的安全传输和用户的隐私保护成为了每个网站运营者必须面对的重要议题。而SSL证书&#xff0c;作为保障网站安全的重要工具&#xff0c;其重要性不言而喻。本文将详细探讨…

LeetCode416:分割等和子集

题目描述 给你一个 只包含正整数 的 非空 数组 nums 。请你判断是否可以将这个数组分割成两个子集&#xff0c;使得两个子集的元素和相等。 解题思想 [1,5,11,5] 和为22&#xff0c;其中一半为 11。如果能寻找到若干数的和为11则成立可以抽象为一个0-1背包问题&#xff1a;容…

【Python 下载大量品牌网站的图片(二)】关于图片的处理和下载,吃满带宽,可多开窗口下载多个网站,DOS窗口类型

写作日期&#xff1a;2024.05.11 使用工具&#xff1a;Python 可修改功能&#xff1a;线程量、UA、Cookie、代理、存储目录、间隔时间、超时时间、图片压缩、图片缩放 默认功能&#xff1a;图片转换、断续下载、图片检测、路径处理、存储文件 GUI&#xff1a;DOS窗口 类型&…

有奖调研 | OpenSCA开源社区用户调研问卷

调研背景&#xff1a; 亲爱的OpenSCA开源社区用户&#xff0c;感谢您一路以来的支持与相伴。随着OpenSCA开源社区的不断发展&#xff0c;我们持续专注安全开发与开源治理实践&#xff0c;为全球用户提供一站式审查治理、SaaS云分析和精准情报预警的开源数字供应链安全赋能。 为…

gcc跟g++ -std=c99跟-std=c++11

报错&#xff1a; myshell.c: In function ‘int doBuildin(char**)’: myshell.c:91:12: warning: deprecated conversion from string constant to ‘char*’ [-Wwrite-strings] path "."; 解决方案&#xff1a;这个waring提示我c11&#xff0c;也就是这里…

【csv-parse】使用parse方法的时候来转换为csv字符串时,会导致输出有乱码

&#x1f601; 作者简介&#xff1a;一名大四的学生&#xff0c;致力学习前端开发技术 ⭐️个人主页&#xff1a;夜宵饽饽的主页 ❔ 系列专栏&#xff1a;前端bug记录 &#x1f450;学习格言&#xff1a;成功不是终点&#xff0c;失败也并非末日&#xff0c;最重要的是继续前进…

网安面经之文件上传漏洞

一、文件上传漏洞 1、文件上传漏洞的原理&#xff1f;危害&#xff1f;修复&#xff1f; 原理&#xff1a;⽂件上传漏洞是发⽣在有上传功能的应⽤中&#xff0c;如果应⽤程序对⽤户上传的⽂件没有控制或者存在缺陷&#xff0c;攻击者可以利⽤应⽤上传功能存在的缺陷&#xff…

深度学习之激活函数——Tanh

Tanh 双曲正切1函数(tanh)&#xff0c;其图像与sigmoid函数十分相近&#xff0c;相当于sigmoid函数的放大版。在实际的使用中&#xff0c;tanh函数要优先于sigmoid函数。 函数表达式 t a n h e x − e − x e x e − x tanh\frac{e^x-e^{-x}}{e^xe^{-x}} tanhexe−xex−e−…

高中数学:平面向量-基本概念

一、定义 有方向&#xff0c;且有大小的量&#xff0c;就叫向量 与之对应的是&#xff0c;数量&#xff0c;只有大小&#xff0c;没有方向 例如 A B → \mathop{AB}\limits ^{\rightarrow} AB→ a → \mathop{a}\limits ^{\rightarrow} a→ 二、相关性质 相等 大小相同…

半监督的GCN:Semi-Supervised Classification With Graph Convolutional Networks

Semi-Supervised Classification With Graph Convolutional Networks -Theophilus Siameh-2017(2023) 思路 使用可扩展方法对图进行半监督学习,其中CNN应用在图数据上,得到GCN。 这种方法是在图的边的数量上进行线性的缩放模型,并学习包含局部图结构和图节点的几个隐藏层…