七、HashSet底层详解

news2025/1/11 9:09:24

文章目录

  • 特点
  • 结论
  • 源码解读
    • 构造器
    • 添加元素
  • 小结说明
  • 练习(重要*掌握)
  • 思考

特点

  • 无序、无索引

  • 不可重复(地址),可存一个null在这里插入图片描述

  • 不可用索引取出

  • 存放和取出顺序不一定一样

  • 但每次取出的顺序是一样的

  • 遍历只能迭代器和增强for

  • 底层其实是HashMap在这里插入图片描述

结论

在这里插入图片描述

源码解读

构造器

HashSet hs = new HashSet();底层实现
在这里插入图片描述
可见底层HashSet底层就是HashMap;

添加元素

hs.add(“1”)底层实现

  1. 首先进入add方法
    在这里插入图片描述
    相当于map添加元素e就是我们存的值,PRESENT是底层统一提供的value,因为map是需要key-value的,但我们只需要使用这里的key,所以value我们不用管
  2. add方法调用put方法进行存值在这里插入图片描述
    我们知道,HashSet是无序的,底层的排列方式是按照Hash值进行排列的,所以先进入hash(key)进行Hash值的计算
  3. 进入hash(key)进行hash值的计算
    在这里插入图片描述
    这里就可以看到hash值的计算方法,如果传进来null的话,hash值直接为0,不为null的话,得到key的hashCode(hashCode是Object的方法,每个对象都会有自己的hashCode),再右移16位。
  4. 这是String类型的hashCode计算 在这里插入图片描述
    我们自己写的类,hashCode就由我们自己定义
  5. 好hash值算好,我们回到第二步的putVal方法进行存值
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;//设置一些辅助变量
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
            /*
            	1.table就是map的属性,是一个数组,即存的内容
            	2.(tab = table) == null || (n = tab.length) == 0
            		这就是先tab = table然后判断是否为空或者长度为0
            	3.如果表中没有数据,就resize()重新设置表的长度,见resize讲解
            */
            
            
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
            /*
            	p = tab[i = (n - 1) & hash]:p指向tab数组将要保存的数据位置,
            	位置就是按照得到的hash值i = (n - 1) & hash再经过这样的计算
            	判断这个位置是否为null即这个位置是否保存了数据
            	如果没保存的话,就直接保存在这个位置
			*/
        else {
        	/*
            	否则就说明那个位置有数据了,就要考虑以下两点
            	1. 是否相同(和其中任意一个已有数据相同,就直接替换。注意这里的相同判断是equals方法,大部分equals方法是需要我们程序员自己定义的)
            	2. 往后添加是链型添加还是树形添加
					hashmap底层添加原理
					当该位置有数据,就以链表形式添加在最后
					但要考虑,如果链表后缀到达8时,并且表长超过64,链表就变成红黑树的形式保存,如果如果链表后缀到达8时,并且表长没有超过64,则还是添加在最后,与此同时表长变成原来2倍。
			*/
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                //这里判断是否equals相同
                e = p;
            else if (p instanceof TreeNode)
            //这里判断是树形添加,树形添加方式就不细说了,涉及到红黑树
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
            //这里判断是链型添加,这就是链表的添加,遍历比较
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            //以上的三个判断,就是找到新数据需要添加的位置,如果找到位置应该是放在最后的,e就是null,因为最后就是空嘛,,如果找到了相同元素,这是e就不是空了,就走下面的个方法
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)//开头传入的参数flase,说明冲突时会进行替换操作
                    e.value = value;
                afterNodeAccess(e);//子类实现,这里不实现
                return oldValue;
            }
        }
        ++modCount;//改变次数记录
        if (++size > threshold)//看当前size是否超过扩容边界,如果超过,就要进行resize
            resize();
        afterNodeInsertion(evict);//这个方法是空方法,我们不用管,这个是留给hashset子类需要的话去实现的
        return null;
    }
  • 5.1 resize讲解
    这里就不细讲了,可以参考别人写的https://juejin.cn/post/7035613144047157279
    代码整体框架:

首先进行新的容量确定

    final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;//先把表表赋值给oldTab
        int oldCap = (oldTab == null) ? 0 : oldTab.length;//判断原来的表是否为null并赋值
        int oldThr = threshold;//原来扩容界限
        /*hashmap并不是装满再扩容的,而是到达75%容量时,进行扩容,所以这里保存一下原来的扩容界限*/
        int newCap, newThr = 0;//新的容量和扩容界限先定义为0
        //第一部分
        if (oldCap > 0) {//判断原来是否有内容
            if (oldCap >= MAXIMUM_CAPACITY) {//若容量超过最大值,就将扩容边界值等于表长
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                  //否则就容量加倍,边界值加倍
                newThr = oldThr << 1; // double threshold
        }
        else if (oldThr > 0) // initial capacity was placed in threshold
        //当没有容量且,边界值>0 时,说明边界值初始化过,就将新表容量等于边界值
            newCap = oldThr;
        else {               // zero initial threshold signifies using defaults
        	/*
				一开始为null时,就走到这里进行初始化
				DEFAULT_INITIAL_CAPACITY = 1 << 4即newCap一开始赋值为16
				DEFAULT_LOAD_FACTOR = 0.75即扩容临界值为容量的0.75倍
			*/
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        //如果新的边界值,在上面没有设置过,就用这个方法设值
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        /*
        	上面,就是新表大小以及新的边界值都设置好了
        	接下来开始转移数据
        */
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;//将新的容量表赋值给table
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {//遍历原来的表
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {//不为null时,转移数据
                    oldTab[j] = null;
                    if (e.next == null)//没有下一个数据时,说明,这块地方就一个数据,直接转移就好
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)//这个地方是个红黑树,就按照红黑树的方法进行转移
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                    //这个地方是一个链表,就按照链表方式进行转移
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

小结说明

  1. 底层是hashmap
  2. 存入数据前先计算hash值,再存值
  3. 存值,需要考虑,该位置是否重复,是否按链表存还是树存
  4. 表长扩容是2倍
  5. 加载因子是0.75,当添加的数据大于12时(无论怎么添加),进行扩容
  6. 长度大于8时(且表长大于等于64时)转换为红黑树,小于6时退化为链表

练习(重要*掌握)

定义一个Employee类,该类包含:private成员属性name.age
要求:1.创建3个Employee对象放入HashSet中
2.当name和age的值相同时,认为是相同员工,不能添加到HashSet集合中

之后写的时候会涉及到的
在这里插入图片描述
在这里插入图片描述
以上两个分别表示当name和age相同时,equals和hashcode返回true

import java.util.HashSet;
import java.util.Objects;

class Employee{
    private String name;
    private int age;

    public Employee(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "Employee{" +
                "name='" + name + '\'' +
                ", age=" + age +
                '}';
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Employee employee = (Employee) o;
        return age == employee.age && Objects.equals(name, employee.name);
    }

    @Override
    public int hashCode() {
        return Objects.hash(name, age);
    }
}
public class Test {
    @SuppressWarnings({"all"})
    public static void main(String[] args){
        HashSet hs = new HashSet();
        hs.add(new Employee("xiaoming",12));
        hs.add(new Employee("wanggang",18));
        hs.add(new Employee("xiaoming",12));
        //如果不重写equals和hashcode的话,就会按照默认的equals和hashcode执行
        //就会有存入三个值
        //我们重写了之后,就会按照我们的给出equals和hashcode,这时,就会存入两个值
        System.out.println(hs);
    }
}

思考

定义一个Employee类,该类包含:private成员属性name,sal,birthday(MyDate类型),其中 birthday为 MyDate类型(属性包括:year, month, day),要求:
1.创建3个Employee放入 HashSet中
2.当name和birthday的值相同时,认为是相同员工,不能添加到HashSet集合中

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/118319.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring AOP源码:配置文件解析过程

前言 本篇文章主要讲解AOP配置中的几个通知类的解析过程&#xff0c;为后续对目标类进行代理做准备&#xff1b;在前面的Spring IOC篇我们讲解了自定义配置的解析&#xff0c;AOP配置的解析过程也是其自定义注解的过程&#xff0c;如果不熟悉自定义解析过程可以看之前的文章Sp…

CVPR2017|Deep Feature Flow for Video Recognition论文复现(pytorch版)

&#x1f3c6;引言&#xff1a;深度卷积神经网络在图像识别任务中取得了巨大的成功。然而&#xff0c;将最先进的图像识别网络转移到视频上并非易事&#xff0c;因为每帧评估速度太慢且负担不起。我们提出了一种快速准确的视频识别框架——深度特征流DFF。它只在稀疏关键帧上运…

数据通信基础 - 调制技术

文章目录1 概述2 调制技术2.1 分类2.2 N 相调制3 网工软考真题1 概述 #mermaid-svg-ZTF6pPysJlmUes01 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-ZTF6pPysJlmUes01 .error-icon{fill:#552222;}#mermaid-svg-ZTF…

谷歌用量子处理器发现:光子能在混沌中保持稳健的束缚态

一圈超导量子比特可以容纳微波光子的“束缚态”&#xff0c;其中光子往往聚集在相邻的量子比特位点上。图片来源&#xff1a;Google Quantum AI 使用量子处理器&#xff0c;研究人员可以使微波光子具有异常的“粘性”。在诱使它们聚集成束缚态后&#xff0c;他们发现这些光子簇…

谷歌 Chrome 浏览器弹窗境外广告的解决方法

谷歌的 Chrome 浏览器是我非常喜欢的一款的浏览器&#xff0c;用了它之后就不想再用其它浏览器。可是不知道从什么时候开始&#xff0c;Chrome 浏览器居然时不时地在右下角弹出广告&#xff0c;仔细一看&#xff0c;还是境外的 VPN 广告&#xff0c;如下图。有弹出过几次了&…

如何通过创建 SSH key 来进行Git 代码管理

1.检查你的电脑是否已经有SSH Key&#xff1f; 运行如下命令查看&#xff1a; $ cd ~/.ssh $ ls如果存在id_rsa.pub或 id_dsa.pub 文件&#xff0c;说明你的电脑已经有 SSH Key &#xff0c;可以直接拿来用&#xff0c;如果没有的话需要创建。 2.创建SSH Key 配置全局的nam…

zookeeper入门篇

文章目录前言介绍安装与启动配置说明节点节点类型PERSISTENT&#xff08;持久化节点&#xff09;PERSISTENT_SEQUENTIAL&#xff08;持久化顺序节点&#xff09;EPHEMERAL&#xff08;临时节点&#xff09;EPHEMERAL_SEQUENTIAL&#xff08;临时顺序节点&#xff09;Container&…

用Java实现简单的图书管理系统(Java系列7)

目录 前言&#xff1a; 1.基础框架的搭建 1.1图书 1.1.1书 1.1.2书架 1.2用户 1.2.1抽象类 1.2.2普通用户 1.2.3管理员 1.3操作 1.3.1新增图书 1.3.2借阅图书 1.3.3删除图书 1.3.4退出图书 1.3.5查找图书 1.3.6归还图书 1.3.7显示图书 2.具体内容的实现 2.1Ma…

<flutter>跨平台开发新手入坑指南 dart dio pubspec.yaml json_annotation 打包 小坑指南

1.资源文件和依赖三方包&#xff08;pubspec.yaml&#xff09;&#xff1a; pubspec.yaml文件可以说是和安卓的gradle文件差不多&#xff0c;它用来描述版本号、sdk、依赖等的。 在资源导入方面同安卓不一样的是&#xff0c;flutter需要在pubspec.yaml中声名&#xff0c;不然…

【PCB专题】Allegro元件库路径设置方法

正常Layout拉线前,需要将原理图导出的网表导入到Allegro里,Allegro就会自动将元件导入。如果库路径没有设置或都软件找不到器件,将会非常的卡顿,并且报Completed with warnings/errors。如下图所示: 在弹出的错误报告View of file:netrev.lst中会提示很多器件找不到封装。…

js知识点

js有预解析阶段&#xff0c;变量声明提升只提升定义&#xff0c;不提升值 console.log(a);//undefined var a10; 基本数据类型 Number、String、Boolean、Undefined和Null 复杂数据类型 Object、Array、Function、RegExp、Date、Map、Set等 使用typeof运算符可以检测值或…

刷爆力扣之验证回文串 II

刷爆力扣之验证回文串 II HELLO&#xff0c;各位看官大大好&#xff0c;我是阿呆 &#x1f648;&#x1f648;&#x1f648; 今天阿呆继续记录下力扣刷题过程&#xff0c;收录在专栏算法中 &#x1f61c;&#x1f61c;&#x1f61c; 该专栏按照不同类别标签进行刷题&#xff…

第六章 作业【数据库原理】

第六章 作业【数据库原理】前言推荐第六章 作业第6章第1题&#xff08;简答题&#xff09;第6章第2题&#xff08;简答题&#xff09;第6章第3题&#xff08;设计题&#xff09;第6章第4题&#xff08;设计题&#xff09;最后前言 2022-12-27 16:05:55 以下内容源自数据库原理…

最大连续子序列的和问题(算法)

问题描述 给定一个有n&#xff08;n≥1&#xff09;个整数的序列&#xff0c;要求求出其中最大连续子序列的和。 蛮力法 暴力枚举 /*** 时间复杂度&#xff1a;O(n^3)* param arr 序列[数组]* param n 数组大小* return int */ int maxSubSum1(int arr[], int n) {int thi…

美团餐饮SaaS基于StarRocks构建商家数据中台的探索

作者&#xff1a;何启航&#xff0c;美团餐饮SaaS数据专家&#xff08;文章整理自作者在 StarRocks Summit Asia 2022 的分享&#xff09; 随着社会经济的发展&#xff0c;餐饮连锁商家越来越大&#xff0c;“万店时代”来临。对于美团餐饮 SaaS 来说&#xff0c;传统的 OLTP …

LeetCode 324 周赛

2506. 统计相似字符串对的数目 给你一个下标从 0 开始的字符串数组 words 。 如果两个字符串由相同的字符组成&#xff0c;则认为这两个字符串 相似 。 例如&#xff0c;"abca" 和 "cba" 相似&#xff0c;因为它们都由字符 a、b、c 组成。然而&#xff…

HQChart实战教程54-renko砖形K线图

HQChart实战教程54-renko砖形K线图 Renko砖形图效果图使用HQChart创建Renko初始化创建Renko配置参数说明ClassNameOption动态修改Renko配置参数完成demo代码Renko砖形图 Renko砖形图是仅测量价格变动的图表类型。 “ renko”一词源自日语单词“ renga”,意为“砖”。并非巧合…

day30【代码随想录】分割回文串、复原IP地址、子集

文章目录前言一、分割回文串&#xff08;力扣131&#xff09;二、复原IP地址&#xff08;力扣93&#xff09;三、子集&#xff08;力扣78&#xff09;总结前言 1、分割回文串 2、复原IP地址 3、子集 一、分割回文串&#xff08;力扣131&#xff09; 给你一个字符串 s&#xf…

前端开发:关于鉴权的使用总结

前言 前端开发过程中&#xff0c;关于鉴权&#xff08;权限的控制&#xff09;是非常重要的内容&#xff0c;尤其是前端和后端之间数据传递时候的请求鉴权校验。前端鉴权的本质就是控制前端视图层的显示和前端向后台所发送的请求&#xff0c;但是只有前端鉴权&#xff0c;没有后…