关于set和map的简单理解

news2024/11/16 1:50:02

1. 关于搜索

1.1 set和map的引入

        Map和set是一种专门用来进行搜索的容器或者数据结构,其搜索的效率与其具体的实例化子类有关。以前常见的搜索方式有:

        1. 直接遍历,时间复杂度为O(N),元素如果比较多效率会非常慢

        2. 二分查找,时间复杂度为log(2^N) ,但搜索前必须要求序列是有序的

        上述排序比较适合静态类型(只查找,不会进行增删操作)的查找,即一般不会对区间进行插入和删除操作了,而现实中的查找比如:

        1. 根据姓名查询考试成绩

        2. 通讯录,即根据姓名查询联系方式

        3. 不重复集合,即需要先搜索关键字是否已经在集合中

        可能在查找时进行一些插入和删除的操作,即动态查找,那上述两种方式就不太适合了,本节介绍的Map和Set是 一种适合动态查找的集合容器。

1.2 模型

        一般把搜索的数据称为关键字(Key),和关键字对应的称为值(Value),将其称之为Key-value的键值对,所以模型会有两种:

        1. 纯 key 模型,比如: 有一个英文词典,快速查找一个单词是否在词典中

        2. Key-Value 模型,比如: 统计文件中每个单词出现的次数,统计结果是每个单词都有与其对应的次数:<单词,该单词出现的次数>

        而Map中存储的就是key-value的键值对,Set中只存储了Key

2. 关于Map 

        Map是一个接口类,该类没有继承自Collection,该类中存储的是结构的键值对,并且K一定是唯一的,不能重复。  官方文档如下:

           

2.1 关于Map.Entry

        Map.Entry <K, V>是Map内部实现的用来存放键值对<key, value>映射关系的内部类,该内部类中主要提供了<key, value>的获取,value的设置以及Key的比较方式。下图是关于map.entry的一些基本使用方法;

            

        注意:Map.Entry<K,V>并没有提供设置Key的方法 

2.2 Map 的常用方法说明 

        map的方法如下图所示:

       

注意事项
1、Map是一个接口,不能直接实例化对象,如果要实例化对象只能实例化其实现类TreeMap或者HashMap

2、Map中存放键值对的Key是唯一的,value是可以重复的

3、在TreeMap中插入键值对时,key不能为空,否则就会抛NullPointerException异常,value可以为空;但是HashMap的key和value都可以为空

4、Map中的Key可以全部分离出来,存储到Set中来进行访问(因为Key不能重复)。

5、Map中的value可以全部分离出来,存储在Collection的任何一个子集合中(value可能有重复)。

6、Map中键值对的Key不能直接修改,value可以修改,如果要修改key,只能先将该key删除掉,然后再来进行重新插入。

7、TreeMap和HashMap的区别:

        代码展示部分: 

package demo1;

import java.util.Collection;
import java.util.Map;
import java.util.Set;
import java.util.TreeMap;

public class TestMap {
    public static void main(String[] args) {
        Map<String,Integer> map=new TreeMap<>();
         map.put("沈梦瑶",1);
         map.put("周诗雨",2);
         map.put("王奕",3);
         map.put("袁一琦",4);
         map.put("委婉待续",5);
        System.out.println(map);
        //{周诗雨=2, 委婉待续=5, 沈梦瑶=1, 王奕=3, 袁一琦=4}

        // GetOrDefault(): 如果key存在,返回与key所对应的value,如果key不存在,返回一个默认值
        System.out.println(map.getOrDefault("smallye",99));//99
        System.out.println(map.getOrDefault("委婉待续",99));//5

        // 返回所有 key 的不重复集合
        Set keys=map.keySet();
        System.out.println(keys);//[周诗雨, 委婉待续, 沈梦瑶, 王奕, 袁一琦]

        //返回所有 value 的可重复集合
        Collection vals=  map.values();
        System.out.println(vals);//[2, 5, 1, 3, 4]

        // 打印所有的键值对
        // entrySet(): 将Map中的键值对放在Set中返回了
        for(Map.Entry<String, Integer> entry : map.entrySet()){
            System.out.println(entry.getKey() + "--->" + entry.getValue());
        }
//        周诗雨--->2
//        委婉待续--->5
//        沈梦瑶--->1
//        王奕--->3
//        袁一琦--->4
    }
}

 3、关于set

        Set与Map主要的不同有两点:Set是继承自Collection的接口类Set中只存储了Key

        接口实现逻辑图如下所示:

    

        set的底层是map,我们实例化的treemap对象中的value都是一个object对象; 

 

 3.1 set的常用方法说明

         方法说明如下图所示:

注意事项:

1、Set是继承自Collection的一个接口类

2、Set中只存储了key,并且要求key一定要唯一

3、TreeSet的底层是使用Map来实现的,其使用key与Object的一个默认对象作为键值对插入到Map中的

4、Set最大的功能就是对集合中的元素进行去重

5、实现Set接口的常用类有TreeSet和HashSet,还有一个LinkedHashSet,LinkedHashSet是在HashSet的基础上维护了一个双向链表来记录元素的插入次序。

6、Set中的Key不能修改,如果要修改,先将原来的删除掉,然后再重新插入

7、TreeSet中不能插入null的key,HashSet可以。

8、TreeSet和HashSet的区别(图解如下):

 9、treeset和treemap背后的底层是一颗搜索树(红黑树),所以每次存储元素都得进行大小比较,即存放到这两个集合类中的元素,一定是可以进行比较的;

3.2 代码使用部分

package demo1;

import java.util.Iterator;
import java.util.Set;
import java.util.TreeSet;

public class TextSet {
    public static void main(String[] args) {
        Set<String> set=new TreeSet<>();
        // add(key): 如果key不存在,则插入,返回ture
        // 如果key存在,返回false
        set.add("smallye");
        set.add("shengmengyao");
        set.add("wangyi");
        set.add("zhoushiyu");
        //迭代器遍历
        Iterator<String> iterator = set.iterator();
        while (iterator.hasNext()){
            System.out.println(iterator.next());
        }
       //shengmengyao
        //smallye
        //wangyi
        //zhoushiyu
    }
}

4、哈希表的介绍

4.1 引入哈希表

        顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素时,必须要经过关键码的多次比较。顺序查找时间复杂度为O(N),平衡树中为树的高度,即O(log2^N ),搜索的效率取决于搜索过程中元素的比较次数。

        理想的搜索方法:可以不经过任何比较,一次直接从表中得到要搜索的元素。 如果构造一种存储结构,通过某种函 数(hashFunc)使元素的存储位置与它的关键码之间能够建立一一映射的关系,那么在查找时通过该函数可以很快找到该元素。

        如此当向该结构中:

        插入元素 :根据待插入元素的关键码,以此函数计算出该元素的存储位置并按此位置进行存放         

        搜索元素 :对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置取元素比较,若关键码相等,则搜索成功

        该方式即为哈希(散列)方法,哈希方法中使用的转换函数称为哈希(散列)函数,构造出来的结构称为哈希表(Hash Table)(或者称散列表)

        例如:数据集合{1,7,6,4,5,9};

        哈希函数设置为:hash(key) = key % capacity; capacity为存储元素底层空间总的大小。详细解析如下图所示:

        用该方法进行搜索不必进行多次关键码的比较,因此搜索的速度比较快

        但是会引出一个新的问题:按照上述哈希方式,向集合中插入元 素44,会出现什么问题?

        由此我们引入冲突这个概念。

4.2 冲突及冲突避免

        对于两个数据元素的关键字 Ki 和 Kj(i != j),有Ki !=K j,但有:Hash(Ki ) == Hash(K j ),即:不同关键字通过相同哈希哈数计算出相同的哈希地址,该种现象称为哈希冲突或哈希碰撞

        把具有不同关键码而具有相同哈希地址的数据元素称为“同义词”。 

        首先,我们需要明确一点,由于我们哈希表底层数组的容量往往是小于实际要存储的关键字的数量的,这就导致一个问题,冲突的发生是必然的,但我们能做的应该是尽量的降低冲突率。(即冲突是没发避免消除的只能尽量降低

4.3 哈希函数设计避免冲突

        引起哈希冲突的一个原因可能是:哈希函数设计不够合理。 哈希函数设计原则:

  • 哈希函数的定义域必须包括需要存储的全部关键码,而如果散列表允许有m个地址时,其值域必须在0到m-1之间

  • 哈希函数计算出来的地址能均匀分布在整个空间中

  • 哈希函数应该比较简单

        常见哈希函数有以下几种:

1、直接定制法–(常用)
        取关键字的某个线性函数为散列地址:Hash(Key)= A*Key + B

优点:简单、均匀

缺点:需要事先知道关键字的分布情况

使用场景:适合查找比较小且连续的情况 

2、除留余数法–(常用)
        设散列表中允许的地址数为m,取一个不大于m,但最接近或者等于m的质数p作为除数,按照哈希函数:Hash(key) = key% p(p<=m),将关键码转换成哈希地址

3、平方取中法–(了解)
        假设关键字为1234,对它平方就是1522756,抽取中间的3位227作为哈希地址; 再比如关键字为4321,对它平方就是18671041,抽取中间的3位671(或710)作为哈希地址 平方取中法比较适合:不知道关键字的分布,而位数又不是很大的情况

4、折叠法–(了解)
        折叠法是将关键字从左到右分割成位数相等的几部分(最后一部分位数可以短些),然后将这几部分叠加求和,并按散列表表长,取后几位作为散列地址。折叠法适合事先不需要知道关键字的分布,适合关键字位数比较多的情况

5、随机数法–(了解)
        选择一个随机函数,取关键字的随机函数值为它的哈希地址,即H(key) = random(key),其中random为随机数函数。

通常应用于关键字长度不等时采用此法

6、数学分析法–(了解)
        设有n个d位数,每一位可能有r种不同的符号,这r种不同的符号在各位上出现的频率不一定相同,可能在某些位上分布比较均匀,每种符号出现的机会均等,在某些位上分布不均匀只有某几种符号经常出现。可根据散列表的大小,选择其中各种符号分布均匀的若干位作为散列地址。例如:

                         

        假设要存储某家公司员工登记表,如果用手机号作为关键字,那么极有可能前7位都是 相同的,那么我们可以选择后面的四位作为散列地址,如果这样的抽取工作还容易出现 冲突,还可以对抽取出来的数字进行反转(如1234改成4321)、右环位移(如1234改成4123)、左环移位、前两数与后两数叠加(如1234改成12+34=46)等方法。

        数字分析法通常适合处理关键字位数比较大的情况,如果事先知道关键字的分布且关键字的若干位分布较均匀的情况

注意:哈希函数设计的越精妙,产生哈希冲突的可能性就越低,但是无法避免哈希冲突

 4.4 负载因子调节避免冲突

        负载因子和冲突率的关系粗略演示:

           

        所以当冲突率达到一个无法忍受的程度时,我们需要通过降低负载因子来变相的降低冲突率。已知哈希表中已有的关键字个数是不可变的,那我们能调整的就只有哈希表中的数组的大小。

4.5 冲突解决

        解决哈希冲突两种常见的方法是:闭散列和开散列

4.5.1 闭散列

        也叫开放定址法,当发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有空位置,那么可以 把key存放到冲突位置中的“下一个” 空位置中去,下面介绍两种方法来寻找下一个空位置:

        1. 线性探测

        比如上面的场景,现在需要插入元素44,先通过哈希函数计算哈希地址,下标为4,因此44理论上应该插在该 位置,但是该位置已经放了值为4的元素,即发生哈希冲突。 线性探测:从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止。

插入:

        1、通过哈希函数获取待插入元素在哈希表中的位置

        2、如果该位置中没有元素则直接插入新元素,如果该位置中有元素发生哈希冲突,使用线性探测找到下一个空位置,插入新元素​​。图解如下图所示:

        2. 二次探测

        线性探测的缺陷是产生冲突的数据堆积在一块,这与其找下一个空位置有关系,因为找空位置的方式就是挨着往后逐个去找,因此二次探测为了避免该问题,找下一个空位置的方法为:Hi = (H0 +i^2 )% m, 或者:Hi= (H0 -i ^2 )% m。其中:i = 1,2,3…, 是通过散列函数Hash(x)对元素的关键码 key 进行计算得到的位置,m是表的大小。 对于2.1中如果要插入44,产生冲突,使用解决后的情况为:

    

        研究表明:当表的长度为质数且表装载因子a不超过0.5时,新的表项一定能够插入,而且任何一个位置都不 会被探查两次。因此只要表中有一半的空位置,就不会存在表满的问题。在搜索时可以不考虑表装满的情 况,但在插入时必须确保表的装载因子a不超过0.5,如果超出必须考虑增容。

4.5.2 开散列/哈希桶

        开散列法又叫链地址法(开链法),首先对关键码集合用散列函数计算散列地址,具有相同地址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中

        从上图可以看出,开散列中每个桶中放的都是发生哈希冲突的元素。开散列,可以认为是把一个在大集合中的搜索问题转化为在小集合中做搜索了。

 4.6 性能分析

        虽然哈希表一直在和冲突做斗争,但在实际使用过程中,我们认为哈希表的冲突率是不高的,冲突个数是可控的, 也就是每个桶中的链表的长度是一个常数,所以,通常意义下,我们认为哈希表的插入/删除/查找时间复杂度是 O(1) 。

 4.7 和 java 类集的关系

        1. HashMap 和 HashSet 即 java 中利用哈希表实现的 Map 和 Set

        2. java 中使用的是哈希桶方式解决冲突的

        3. java 会在冲突链表长度大于一定阈值后,将链表转变为搜索树(红黑树

        4. java 中计算哈希值实际上是调用的类的 hashCode 方法,进行 key 的相等性比较是调用 key 的 equals 方 法。所以如果要用自定义类作为 HashMap 的 key 或者 HashSet 的值,必须覆写 hashCode 和 equals 方 法,而且要做到 equals 相等的对象,hashCode 一定是一致的。

ps:本次的内容就到这里了,大家感兴趣的话就请一键三连哦!!! 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1312508.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数智化时代,亚信安慧AntDB邀您一起复盘年度100个值得学习的好案例

全球软件案例研究峰会&#xff08;简称“壹佰案例”&#xff09;是科技界一年一度的案例研究榜单&#xff0c;它萃取了100位领先企业的核心思路及战略方法&#xff0c;旨在发现有案例教学意义的项目或方法论。 湖南亚信安慧科技有限公司AntDB-T产品线负责人洪建辉先生受邀出席此…

Docker知识点整理

Docker和虚拟机技术的区别&#xff1a; 传统的虚拟机&#xff0c;可以虚拟出一条硬件&#xff0c;运行一个完整的操作系统&#xff0c;在这个操作系统上安装和运行所需的软件 容器内的应用可以直接运行在宿主 主机的内核中&#xff0c;容器没有自己的内核&#xff0c;也不用虚…

linux文件打包和压缩

7.2 文件打包和压缩 7.2.1 tar tar&#xff08;英文全拼&#xff1a;tape archive &#xff09;命令用于备份文件。 ​ tar 是用来建立&#xff0c;还原备份文件的工具程序&#xff0c;它可以加入&#xff0c;解开备份文件内的文件。 ​ tar命令是Unix/Linux系统中备给文件的…

ROS2 学习08 导航Nav2:简介、安装、测试效果、错误处理

1、简介 在ROS2中自动导航使用Nav2来实现。 Nav2 使用几个独立的模块化服务&#xff0c;通过 ROS 2接口&#xff08;例如动作服务器或服务&#xff09;与行为树 (BT) 通信。 Nav2 输入包括&#xff1a;TF转换、一个地图源、一个行为树 (BT) XML 文件和相关的传感器数据源; Nav…

UE虚幻引擎中程序无需运行也可调试

首先先新建一个蓝图类&#xff0c;在蓝图类中创建一个Custom event 事件&#xff0c;然后在右侧细节面板中搜索call in editor&#xff0c;编译保存之后&#xff0c;将该蓝图类拖拽到关卡场景中&#xff0c;在细节面板中即可看到该事件的按钮。

基于ssm点餐平台系统论文

摘 要 现代经济快节奏发展以及不断完善升级的信息化技术&#xff0c;让传统数据信息的管理升级为软件存储&#xff0c;归纳&#xff0c;集中处理数据信息的管理方式。本点餐平台系统就是在这样的大环境下诞生&#xff0c;其可以帮助管理者在短时间内处理完毕庞大的数据信息&am…

记一次在OrangePiZero2(香橙派zero 2)上部署Redroid(云手机)的过程

一句废话 这次换一种写作风格&#xff0c;尝试一下轻松的行文方式。 起因 很久以前看见有群友讨论关于docker部署Redroid&#xff0c;拿来挂机玩游戏一类的。当时听了感觉很有意思&#xff0c;后面粗浅地在zero2上部署了一下&#xff0c;容器虽然是跑起来了&#xff0c;但是…

【每次启动wsl时自动更新ip】

每次启动wsl时自动更新ip 在windows中使用wsl时&#xff0c;每次启动wsl后发现其ip都会改变&#xff0c;这样的话如果想通过vscode的Remote-SSH插件打开代码编辑器&#xff0c;就需要手动更新ssh配置文件&#xff0c;极为不便&#xff0c;所以考虑使用一种优雅的方式&#xff0…

Linux,Windows或macOS系统的电脑怎样才能投屏到手机?

很多人都知道手机投屏到电脑的方法&#xff0c;但想要反过来的时候&#xff0c;却束手无策。 如果你想要将电脑投屏到手机&#xff0c;无论你的电脑是Windows&#xff0c;Linux还是macOS系统&#xff0c;无论你的手机是安卓、iOS还是鸿蒙&#xff0c;都可以用下面这个方法实现电…

YOLOv8改进 | 2023Neck篇 | 利用RepGFPN改进特征融合层(附yaml文件+添加教程)

一、本文介绍 本文给大家带来的改进机制是Damo-YOLO的RepGFPN&#xff08;重参数化泛化特征金字塔网络&#xff09;&#xff0c;利用其优化YOLOv8的Neck部分&#xff0c;可以在不影响计算量的同时大幅度涨点&#xff08;亲测在小目标和大目标检测的数据集上效果均表现良好涨点…

PPT插件-超好用的插件-统一尺寸、裁剪、分布-大珩助手

超级对齐-统一尺寸、裁剪、分布 操作方法 先选中1个或多个形状&#xff0c;然后最后选择目标形状&#xff0c;若希望形状的位置也改变&#xff0c;则需要在对齐幻灯下选中对齐对象。 等比缩放 将选中的1个或多个形状的外形尺寸设置为目标形状大小&#xff0c;图像的纵横比可…

Nginx rewrite 参数

目录 常用的Nginx 正则表达式 rewrite 和 location的区别 location location 大致分三类&#xff1a; location 常用的匹配规则&#xff1a; location 优先级&#xff1a; rewrite rewrite跳转实现 rewrite 执行顺序如下 语法格式 flag标记说明 rewrite实际操作 基…

微信小程序万能建站源码系统 附带完整的搭建教程

随着移动互联网的迅速发展&#xff0c;微信小程序已经成为企业、商家以及个人开发者的重要入口。小编给大家分享一款微信小程序万能建站源码系统&#xff0c;并附带完整的搭建教程&#xff0c;帮助用户轻松搭建自己的小程序平台。 以下是部分代码示例&#xff1a; 系统特色功能…

java综合实验-图书管理系统

二、实验项目内容&#xff08;实验题目&#xff09; 1. 使用Java编程语言进行实验。 2. 采用面向对象的思想进行系统设计。 3. 实现基本的图书管理功能&#xff0c;包括添加图书、删除图书、查询图书信息等。 4. 要求有良好的用户交互界面。 步骤参考&#xff1a; 步骤一…

亚信科技AntDB数据库——深入了解AntDB-M元数据锁的实现(二)

5.5 防止低优先级锁饥饿 AntDB-M按照优先级将锁又分了两类&#xff0c;用于解决低优先级锁饥饿问题。 ●独占型(hog): X, SNRW, SNW; 具有较强的不兼容性&#xff0c;优先级高&#xff0c;容易霸占锁&#xff0c;造成其他低优先级锁一直处于等待状态。 ●暗弱型(piglet): SW; …

Vue3-18-侦听器watch()、watchEffect() 的基本使用

什么是侦听器 个人理解&#xff1a;当有一个响应式状态&#xff08;普通变量 or 一个响应式对象&#xff09;发生改变时&#xff0c;我们希望监听到这个改变&#xff0c;并且能够进行一些逻辑处理。那么侦听器就是来帮助我们实现这个功能的。侦听器 其实就是两个函数&#xff…

2 - Electron 核心概念

Electron 核心概念 主进程 通过Node.js、Electron提供的API与系统底层打交道启动项目时运行的 main.js 脚本就是我们说的主进程。在主进程运行的脚本可以以创建 Web 页面的形式展示 GUI。主进程只有一个 渲染进程 每个 Electron 的页面都在运行着自己的进程&#xff0c;这样…

java SSM火车票务管理系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

一、源码特点 java SSM火车票务管理系统是一套完善的web设计系统&#xff08;系统采用SSM框架进行设计开发&#xff0c;springspringMVCmybatis&#xff09;&#xff0c;对理解JSP java编程开发语言有帮助&#xff0c;系统具有完整的源代 码和数据库&#xff0c;系统主要采…

51单片机的外部中断的以及相关寄存器的讲解

中断系统 本文主要涉及8051单片机的中断系统的讲解与使用 其中包括中断相关寄存器的介绍与使用以及外部中断初始化的代码分析。 文章目录 中断系统一、 中断的介绍二、 中断结构及相关寄存器2.1 中断源 2.2 中断请求控制器2.2.1 TCON寄存器2.2.2 SCON寄存器2.2.3 中断允许寄存器…

【算法小技巧】如何判断奇偶

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…