Map,Set和哈希表的使用

news2024/11/26 14:40:28

目录

两种模型

Map的使用

Map接口方法的使用

注意事项

Set的使用

哈希表

冲突

如何避免冲突


在我们日常生活中,会进行一些查找操作,比如根据姓名查询考试成绩,根据姓名查询联系方式等在查找是进行一些插入和删除操作,即动态查找. 而Map和Set是一种适合动态查找的集合容器.

两种模型

一般把搜索的数据称为关键字Key,和关键字对应的称为值Value,将其称为Key- Value的键值对.会有下面两种模型

1 纯 key 模型

    比如在一本语文书中查找某篇文章是否在书中,查找某个名字在不在通讯录中.

2 key - value模型

     比如统计文件中每个单词出现的次数,统计结果是每个单词都有与其对应的次数 <单词,单词出现的次数>

Map中存储的是Key- Value的键值对,Set只存储了Key


Map的使用

Map是一个接口类,该类没有继承自Collection,该类存储的是<Key- Value>结构的键值对,并且Key一定是唯一的,不能重复.

Map接口方法的使用

在这里主要讲一下Map.Entry<K,V>的使用

Map.Entry<K,V>是Map内部实现的用来存放<Key,Value>键值对映射关系的内部类,该类主要提功了<Key,Value>的获取,value的设置以及Key的比较方式

代码表示:

运行结果:

注意事项

1. Map是一个接口,不能实例化对象,如果要实例化对象只能实例化其实现类TreeMap和HashMap

2. Map中存放键值对的key是唯一的,value是可以重复的,在插入是如果插入一个相同的key,而value不同时,会更新原来的value.

3. 在TreeMap中插入键值对时,Key不能为空,否则会抛NullPointerException异常,Value可以为空.但在HashMap的key和value都可以为空

4. Map中的key可以分离出来,存储到set中进行访问(因为key可以重复)

5. Map中的value 可以分离出来,存储到Collection的任何一个子集合中(value可以重复)

6. Map中键值对的key不能直接修改,Value可以修改,如果要修改key,只能先将key删除,在重新插入


Set的使用

Set和Map有两个不同点: Set是继承自Collection的接口类,Set中只存储了Key.

常用方法

使用迭代器进行遍历

运行结果:

注意事项:

1. Set是继承Collection的一个接口类

2. Set只存储了key,并且要求key一定要唯一

3. TreeSet的底层是使用Map来实现的,并且使用key与Object的一个默认对象作为键值对插入到Map中

4. set最大的功能就是对集合中的元素进行去重,因为集合当中的内容是不重复的

5. 实现Set接口常用常用的类有TreeSet和HashSet,还有一个LInkedHashSet,LinkedHashSet是在HashSet的基础上维护了一个双向链表来记录插入的次序.

6. Set中的key不能修改,如果要修改,先将原来的删除掉,在重新插入

7. TreeSet中不能插入null的key,HashSet可以

哈希表

在我们已知的搜索方法中,在查找一个元素的时候,必须要经过关键码的多次比较.顺序查找的时间复杂度为O(N), 平衡树中时间复杂度为树的高度,即O(log₂N),   在理想的搜索方法中可以不经过任何比较,一次直接从表中得到要搜索的元素,通过构造一种存储结构,通过某种函数(hashFunc)使元素的存储位置与它的关键码建立一 一映射关系,在查找时通过该函数可以很快找到该元素.在该结构中:

插入元素:  根据待插入元素的关键码,从此函数计算出该元素的存储位置并按此位置存放

搜索元素:  对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,按此位置取元素比较,若关键码相等,则搜搜成功.

该方式即为哈希方法,哈希方法中使用的转换函数称为哈希函数,构造出来的结构称为哈希表

例如将数据集合{1 , 4 , 6 , 5 , 7 , 9} 存储到哈希表中

设置哈希函数为 : hash(key) = key % m;   m为存储元素底层空间的大小.  m = 10;

用关键码 % 存储空间的大小   得到的余数为该元素的存储位置.

当我们将数据集合 { 4, 14} 用哈希函数 hash(key) = key % m,(m  = 10)时,得到的余数都是4则存储到了相同的位置,就发生了冲突.

冲突

不同关键字通过相同的哈希函数计算出相同的哈希地址,这种现象称为哈希冲突或哈希碰撞

冲突时必然发生的,我们要设计合理的哈希函数降低冲突率.

如何避免冲突

1.选取合适的哈希函数

● 直接定址法

取关键字的某个线性函数值为哈希地址,即 :

        Hash(key)  =  a * key + b  ( a , b为常数)

例如有一个关键字集合{200, 300, 500, 700,},选取哈希函数hash(key) = key / 100,假设表长为8,则哈希表如下:

直接定址法的特点是哈希函数简单,并且对于不同的关键字不会产生冲突,但也有缺点,需要事先知道关键字的分布情况,适合查找比较小且连续的情况.

● 除留余数法

设散列表中的地址数为m, 取一个不大于m但最接近或者等于m的质数p作为除数,取余数作为哈希地址,即 :       hash(key) = key % p (p <= m)

2. 调节负载因子

负载因子 :  α = 填入表中的元素个数 / 散列表的长度

负载因子和冲突率的关系

负载因子越大,冲突率越高

在已知哈希表中,关键字的个数是不可变的,要改变冲突率就只能改变哈希表中数组的大小

1. 开放定址法

当发生冲突时,形成一个地址序列,沿着这个序列逐个探测,直到找到一个空的开放地址,将发生冲突的关键码值存放到该地址中去.

例如将数据集合{1 , 4 , 6 , 5 , 7 , 9, 44} 存储到哈希表中

设置哈希函数为 : hash(key) = key % m;   m为存储元素底层空间的大小.  m = 10;

当存储44的时候发生冲突,从4位置往后逐个探测,在8位置位空,将44存放到里面.若整个空间都找遍仍然找不到空余的地址,则产生溢出.

线性探测的缺陷是产生冲突的元素都堆积到一起,二次探测法就避免了这种问题

二次探测法

二次探测法和开放定址法的方法类似,只是设置的增量序列不同

增量序列为: di = 1² , -1², 2², -2², ...  , q², -q² (q <= m / 2)

哈希函数 : Hi = (H0 + i²) % m;

2 链地址法

将所有具有相同哈希地址的不同关键字的数据元素链接到同一个单链表中.

每一个关键字都相当于一个节点.每一个哈希地址都相当于一个单链表

用代码实现一个简单的哈希桶

public class HashBuck {

    static class Node {
        public int key;
        public int val;
        public Node next;

        public Node(int key,int val) {
            this.key = key;
            this.val = val;
        }
    }
    public Node[] array;
    public int usedSize;
    //负载因子
    public static final double LOAD_FACTOR = 0.75;

    public HashBuck() {
        array = new Node[8];
    }
    public void put(int key,int val) {
        int index = key % array.length;
        Node cur = array[index];
        while(cur != null) {
            if(cur.key == key) {
                cur.val = val;
                return;
            }
            cur = cur.next;
        }
        //头插法
        Node node = new Node(key,val);
        node.next = array[index];
        array[index] = node;
        usedSize++;
        if(calculateLoadFActor() >= LOAD_FACTOR) {
            //扩容  每个元素都要进行重新的哈希
            resize();
        }
    }
    private void resize() {
        Node[] newArray = new Node[2 * array.length];
        for (int i = 0; i < array.length; i++) {
            Node cur = array[i];
            while(cur != null) {
                Node curNext = cur.next;
                int index = cur.key % newArray.length;
                cur.next = newArray[index];
                newArray[index] = cur;
                cur = curNext;
            }
        }
        array = newArray;
    }

    //计算负载因子
    private double calculateLoadFActor() {
        return usedSize*1.0 / array.length;
    }
    public int get(int key) {
        int index = key % array.length;
        Node cur = array[index];
        while(cur != null) {
            if(cur.key == key) {
                return cur.val;
            }
            cur = cur.next;
        }
        return -1;
    }
}

当用自定义类作为hashMap的值或者hashSet的值.要重写hashCode()和equals()方法.将自定义类型变成整型.而且要做到equals相等的对象.hashCode一定是一致的.

面试问题:

hashCode一样,equals一定一样吗?

hashCode一样,只能说明哈希地址相同,而我们每一个哈希地址是一个单链表,里面存放了很多数据,所以equals不一定相同

equals一样,hashCode一定一样吗?

equals一样,说明数据相同,则存放在相同的哈希地址,hashCode一定相同

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1070654.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot整合thymeleaf模板引擎

1.什么是thyeleaf模板引擎 Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。 是新一代 Java 模板引擎&#xff0c;它支持 HTML 原型&#xff0c;其文件后缀为“.html”&#xff0c;因此它可以直接被浏览器打开&#xff0c;此时浏览器会忽略未定义的 Thymeleaf 标签…

C语言:字符字符串

目录 字符 字符串 输出各字符串 输出各类型长度——strlen函数返回字符串长度&#xff0c;需指定头文件 字符 a;char ch z;// char ch "z"; // err 字符类型只能是单引号// char ch zh; // err 字符类型只能是单个字符 字符串 这种由双引号&#xff08;Doub…

SpringBoot+Vue3外卖项目构思

SpringBoot的学习&#xff1a; SpringBoot的学习_明里灰的博客-CSDN博客 实现功能 前台 用户注册&#xff0c;邮箱登录&#xff0c;地址管理&#xff0c;历史订单&#xff0c;菜品规格&#xff0c;购物车&#xff0c;下单&#xff0c;菜品浏览&#xff0c;评价&#xff0c;…

软考程序员考试大纲(2023)

文章目录 前言一、考试说明1.考试目标2.考试要求3&#xff0e;考试科目设置 二、考试范围考试科目1&#xff1a;计算机与软件工程基本知识1&#xff0e;计算机科学基础2&#xff0e;计算机系统基础知识3&#xff0e;系统开发和运行知识4&#xff0e;网络与信息安全基础知识5&am…

你的librosa和scikit-learn打架了吗?

被这个问题困扰好久&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01; 我的原来版本librosa0.7.1 和 scikit-learn1.3.1 一直拆了按&#xff0c;按…

好物周刊#19:开源指北

https://github.com/cunyu1943/JavaPark https://yuque.com/cunyu1943 村雨遥的好物周刊&#xff0c;记录每周看到的有价值的信息&#xff0c;主要针对计算机领域&#xff0c;每周五发布。 一、项目 1. Vditor 一款浏览器端的 Markdown 编辑器&#xff0c;支持所见即所得、…

Android---Class 对象在执行引擎中的初始化过程

一个 class 文件被加载到内存中的步骤如下图所示&#xff1a; 装载 装载是指 Java 虚拟机查找 .class 文件并生成字节流&#xff0c;然后根据字节流创建 java.lang.Class 对象的过程。 1. ClassLoader 通过一个类的全限定名&#xff08;包名类名&#xff09;来查找 .class 文件…

10款录屏软分析与选择使用,只看这篇文章就轻松搞定所有,高清4K无水印录屏,博主UP主轻松选择

录屏软件整理 如下为录屏软件&#xff0c;通过思维导图展示分析介绍&#xff1a; https://www.drawon.cn/template/details/6522bd5e0dad9029a0b528e1 如下为整理的录屏软件列表 名称产地价格支持的平台下载地址说明OBS国外免费开源windows/linux/machttps://obsproject.co…

好物周刊#12:计算机考研资料

https://cunyu1943.github.io https://yuque.com/cunyu1943 村雨遥的好物周刊&#xff0c;记录每周看到的有价值的信息&#xff0c;主要针对计算机领域&#xff0c;每周五发布。 一、项目 1. JEECG BOOT 低代码开发平台 一款基于代码生成器的低代码开发平台&#xff01;前后…

Charles:移动端抓包 / windows客户端 iOS手机 / 手机访问PC本地项目做调试

一、背景描述 1.1、本文需求&#xff1a;移动端进行抓包调试 1.2、理解Charles可以做什么 Charles是一款跨平台的网络代理软件&#xff0c;可以用于捕获和分析网络流量&#xff0c;对HTTP、HTTPS、HTTP/2等协议进行调试和监控。使用Charles可以帮助开发人员进行Web开发、调试…

数字三角形加强版题解(组合计数+快速幂+逆元)

Description 一个无限行的数字三角形&#xff0c;第 i 行有 i 个数。第一行的第一个数是 1 &#xff0c;其他的数满足如下关系&#xff1a;如果用 F[i][j] 表示第 i 行的第 j 个数&#xff0c;那么 F[i][j]A∗F[i−1][j]B∗F[i−1][j−1] &#xff08;不合法的下标的数为 0 &a…

【jvm--方法区】

文章目录 1. 栈、堆、方法区的交互关系2. 方法区的内部结构3. 运行时常量池4. 方法区的演进细节5. 方法区的垃圾回收 1. 栈、堆、方法区的交互关系 方法区的基本理解&#xff1a; 方法区&#xff08;Method Area&#xff09;与 Java 堆一样&#xff0c;是各个线程共享的内存区…

openGauss学习笔记-93 openGauss 数据库管理-访问外部数据库-oracle_fdw

文章目录 openGauss学习笔记-93 openGauss 数据库管理-访问外部数据库-oracle_fdw93.1 编译oracle_fdw93.2 使用oracle_fdw93.3 常见问题93.4 注意事项 openGauss学习笔记-93 openGauss 数据库管理-访问外部数据库-oracle_fdw openGauss的fdw实现的功能是各个openGauss数据库及…

ChatGPT讲Mysql优化技巧 附体验地址

ChatGPT讲Mysql优化技巧 体验地址附文末 面具选择互联网写手 提问&#xff1a;Mysql优化 回答 MySQL优化是一个广泛讨论的话题&#xff0c;因为好的MySQL性能可以极大地提高应用程序的效率。在这里&#xff0c;我将向你介绍一些常见的MySQL优化技巧&#xff1a; 使用正确的…

软件测试基础 - 测试覆盖率

一、覆盖率概念 覆盖率是用来度量测试完整性的一个手段&#xff0c;是测试技术有效性的一个度量。分为&#xff1a;白盒覆盖、灰盒覆盖和黑盒覆盖&#xff1b;测试用例设计不能一味追求覆盖率&#xff0c;因为测试成本随覆盖率的增加而增加。 覆盖率&#xff08;至少被执行一次…

2023年DDoS攻击发展趋势的分析和推断

DDoS是一种非常“古老”的网络攻击技术&#xff0c;随着近年来地缘政治冲突对数字经济格局的影响&#xff0c;DDoS攻击数量不断创下新高&#xff0c;其攻击的规模也越来越大。日前&#xff0c;安全网站Latest Hacking News根据DDoS攻击防护服务商Link11的统计数据&#xff0c;对…

解析‘找不到msvcp140.dll无法继续执行代码’这个问题的解决方法

大家好&#xff01;今天我要和大家分享的主题是“msvcp140.dll丢失的解决方法”。我们都知道&#xff0c;在运行一些软件或游戏时&#xff0c;经常会遇到“msvcp140.dll丢失”的错误提示&#xff0c;这会让我们非常烦恼。那么&#xff0c;这个问题是什么原因引起的呢&#xff1…

爱普生LQ1900KIIH复位方法

爱普生EPSON 1900KIIH是一部通用针式打印机&#xff0c;136列&#xff08;10cpi下&#xff09;的打印宽度&#xff0c;缓冲区128KB&#xff0c;打印速度为270字/秒。 打印机类型 打印方式&#xff1a;24针击打式点阵打印、打印方向&#xff1a;双向逻辑查找、安全规格标准&am…

Games104现代游戏引擎笔记高级ai

Hierarchical Task Network 层次任务网络 World State是一个主观的对世界的认知&#xff0c;并不是一个真实世界的描述 Sensors负责从游戏环境中抓取各种状态 HTN Domain 存放层次化的树状结构Task和之间的关联关系1 Planner 根据World State从 Domain 里规划 task Plan Runne…

论文研读|Protecting Intellectual Property of Deep Neural Networks with Watermarking

目录 论文信息文章简介研究动机研究方法水印生成水印嵌入版权验证 实验结果有效性&#xff08;Effectiveness&#xff09;高效性&#xff08;Converge Speed&#xff09;保真度&#xff08;Functionality&#xff09;鲁棒性&#xff08;Robustness&#xff09;Anti-剪枝攻击&am…