Java SE 进阶(二)之 HashSet底层原理

news2025/1/16 21:44:25

文章目录

  • 前言
  • HashSet底层原理
    • 1.哈希表
    • 2.哈希值
    • 3.底层原理
    • 4.回答三个问题

前言

关于Set和HashSet的API使用可参见 集合基础入门(Collection,ArrayList,HashSet,HashMap)

HashSet底层原理

1.哈希表

HashSet集合底层采取哈希表存储数据
哈希表是一种对于增删改查数据性能都较好的结构

哈希表组成
JDK8之前:数组+链表(可以看作元素为链表的数组)
JDK8开始:数组+链表+红黑树

在这里插入图片描述

2.哈希值

根据hashcode方法算出来的int类型的整数
该方法定义在Object类中,所有对象都可以调用,默认使用地址值进行计算。一般情况下,会重写hashcode方法,利用对象内部的属性值计算哈希值

对象的哈希值特点

  • 如果没有重写hashCode方法,不同对象计算出的哈希值是不同的
  • 如果已经重写hashcode方法,不同的对象只要属性值相同,计算出的哈希值就是一样的
  • 在小部分情况下,不同的属性值或者不同的地址值计算出来的哈希值也有可能一样。(哈希碰撞)

e.g.
新建一个Student Bean类,没有重写hashcode方法
再创建Student对象

Student std1 = new Student("zs",22); 
Student std2 = new Student("lisi",23); 
Student std3 = new Student("zs",22);  
System.out.println(std1.hashCode()); // 434091818
System.out.println(std2.hashCode()); // 398887205
System.out.println(std3.hashCode()); // 2114889273,此时std1和std3虽然属性值相同,但没有重写HashCode方法,所以哈希值不同

重写HashCode方法后

在Student Bean类方法中重写

 @Override
  public boolean equals(Object o) {
      if (this == o) return true;
      if (o == null || getClass() != o.getClass()) return false;
      Student student = (Student) o;
      return age == student.age && Objects.equals(name, student.name);
  }
  @Override
  public int hashCode() {
      return Objects.hash(name, age);
  }

再创建对象

Student std1 = new Student("zs",22); 
Student std2 = new Student("lisi",23); 
Student std3 = new Student("zs",22);  
System.out.println(std1.hashCode()); // 121790
System.out.println(std2.hashCode()); // 102983077
System.out.println(std3.hashCode()); // 121790,此时std1和std3属性相同,而且重写了HashCode方法,所以哈希值相同

String s1 = "重地";
String s2 = "通话";
String s3 ="hello";
System.out.println(s1.hashCode()); // 1179395
System.out.println(s2.hashCode()); // 1179395,哈希碰撞:不同的地址值可能也会哈希值相同
System.out.println(s3.hashCode());  // 99162322

3.底层原理

(1)创建一个默认长度16,默认加载因子为0.75的数组,数组名table

(2)根据元素的哈希值跟数组的长度计算出应存入的位置

// 计算公式
int index = (数组长度-1& 哈希值

(3)判断当前位置是否为null,如果是null直接存入

(4)如果位置不为null,表示有元素,则调用equals方法比较属性值

(5)一样:不存; 不一样:存入数组,形成链表
JDK8以前:新元素存入数组,老元素挂在新元素下面
JDK8以后:新元素直接挂在老元素下面

其中加载因子是用于扩容:当HashSet的元素到达16 *0.75=12时,就扩容到原先的两倍(32)

另外:
JDK8以后,当链表长度超过8,而且数组长度大于等于64时,自动转换为红黑树

在这里插入图片描述

如果集合中存储的是自定义对象,必须重写hashCode和equals方法(String,Integer等数据类型jdk已经重写好hashCode方法)

4.回答三个问题

Q1:HashSet为什么存和取的顺序不一样(无序性)?
在遍历时会按照数组的索引进行遍历,如果当前索引有链表,则继续遍历当前链表

Q2:HashSet为什么没有索引?
哈希表的底层既有数组又有链表,无法统一索引

Q3:HashSet是利用什么机制保证数据去重的?
利用hashcode和equals方法

参考链接:
https://www.bilibili.com/video/BV17F411T7Aop=197&vd_source=38cb30e60861b967d6cdfa51ce1c31fa

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/198036.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue组件 —— 单文件组件

追溯vue组件问题 在未讲项目之前,在 这一篇内容当中就讲到了组件引入使用,有内置的组件和动态组件以及封装一个swiper组件,组件也分为全局组件和局部组件,在讲在项目当中去使用组件之前先简单的回顾一下组件的编写: &…

89.【SpringBoot-02】

SpringBoot聊一聊如何构建一个网站(十四)、.SpringBoot整合数据库操作1.整合JDBC(1).SpringData简介(2).整合JDBC(3).JdbcTemplate ⭐2. 整合Druid数据源 (德鲁伊)(1).Druid简介(2).配置数据源(3).配置Druid数据源监控(4).配置Druid数据源过滤器(5).注解…

Echarts的Y轴添加定值横线的示例

第010个点击查看专栏目录Echarts折线图的y轴要画一条横线,主要是在series中设置markLine的图表标线参数,具体的参考源代码。文章目录示例效果示例源代码(共142行)相关资料参考专栏介绍示例效果 示例源代码(共142行&…

怎么在Windows电脑更新 DirectX ?

玩游戏的人应该都对DirectX不陌生,它可以提高游戏或多媒体程序的运行效率,增强3d图形和声音效果。但很多人都不知道DirectX该如何更新,这篇文章将以Win10为例,教大家怎么在电脑上更新DirectX。 一、检查当前DirectX版本 如果你不…

简单聊一聊组件封装

封装一个思维导图组件 最近封装了一个简单的思维导图组件,在此简单记录一下心里历程 组件样式 组件结构设计 节点之间的线分成三部分,分别是竖线左边的横线A、竖线B、竖线右边的横线C,所以一个节点可以包含以下几个元素: 横线…

VBA提高篇_18 VBA代码录制优化Select(tion)及表格合并Merge(cells()/Rows()/Columns()

文章目录1. Cells(1,1)2. Rows(Str)和Columns(Str)3. VBA合并单元格3.1 Range.MergeCells属性:3.2 Range.Merge/UnMerage属性:3.3 Range.Merge(参数True/False)3.4 操作合并/取消合并单元格的两种方法4. Select / Selection 和 录制宏的代码优化4.1 Select / Selection4.2 录制…

anconda的pip下载包出现的问题

问题一: 在anconda里面如何创建新的python环境(也就是更换新的python版本) 1.先打开anconda软件,创建需要的环境 2. 环境创建好之后,去pycharm里面进行配置解释器 3. 这样就可以用了 问题二:pip的安装软件时出现包找不到的问题? 注意:因为我们刚刚创建了一个python环境,等…

Python基于已知的分幅条带号筛选出对应遥感影像文件的方法

本文介绍基于Python语言,结合已知研究区域中所覆盖的全部遥感影像的分幅条带号,从大量的遥感影像文件中筛选落在这一研究区域中的遥感影像文件的方法。 首先,先来明确一下本文所需实现的需求。现已知一个研究区域(四川省&#xff…

【C++】C++入门 函数重载

前言 自然语言中,一个词可以有多重含义,人们可以通过上下文来判断该词真实的含义,即该词被重载了。 函数重载一、函数重载定义二、函数重载的条件1. 参数类型不同2. 参数个数不同3. 参数类型顺序不同三、函数重载的原理--名字修饰(name Mangl…

怎么把网页变成灰色?怎么让头像或某一部分不变灰色?filter/backdrop-filter/mix-blend-mode/svg/grayscale(1)

在国家公祭日,我们哀悼沉思,势要勿忘国耻振兴中华;在国家重要人物逝世后,举国哀悼;这些时段很多网站都会积极呼应,给与自己的网页设置成灰色;那给网页设置成灰色是经过怎样的设置来实现的呢&…

利用pandas_udf加速机器学习任务

note pandas udf和python udf区别:前者向量化是在不同partition上处理pandas_udf使用panda API来处理分布式数据集,而toPandas()将分布式数据集转换为本地数据,然后使用pandas进行处理,如果Pyspark的dataframe非常大,…

快速排序和归并排序哪个快?

两个排序的基本思想都是分治(分而治之),实现一般都使用递归实现。1.快速排序双边指针(交换法):记录分界值 ,创建左右指针(记录下标)。以第一个元素为分界值,先从右向左找…

C语言指针变量作为函数参数

在C语言中,函数的参数不仅可以是整数、小数、字符等具体的数据,还可以是指向它们的指针。用指针变量作函数参数可以将函数外部的地址传递到函数内部,使得在函数内部可以操作函数外部的数据,并且这些数据不会随着函数的结束而被销毁…

ocelot的单节点解决方案

ocelot的问题前面我们解决了consul的单节点的集群扩建。这里讨论如果在多客户端访问时,单网关也会有瓶颈。如果单台挂掉,那么也会麻烦,所以根据项目需要解决问题。ocelot多节点部署最简单的粗暴解决,多部署几台网关。但是我们需要…

mac环境和windows环境下GeoServer如何安装部署

geoserver是从事GIS行业都应当了解的一个gis服务器。 所以说学会geoserver是一个非常必要的事情。那么这篇文章呢我就带着大家来一起学习如何在Mac机器上和windows机器上安装并部署Geoserver。 首先不管是哪个环境我们都需要去官网上先下载安装包。 第一步我们要去geoserver的…

【计算机组成原理】y = a * b + c 的执行具体流程

文章目录1.2.2 认识各个硬件部件1. 主存储器的基本组成2. 运算器的基本组成3. 控制器的基本组成4. 计算机的工作流程1.2.2 认识各个硬件部件 1. 主存储器的基本组成 存储体:存放数据和指令地址寄存器:用来存放读取存储体数据时存放的具体位置数据寄存器…

12、字符(串)输入、输出

目录 一、字符数据输入/输出 1. 字符数据输入 2. 字符数据输出 二、字符串输入/输出 1. 字符串输入函数 2. 字符串输出函数 一、字符数据输入/输出 1. 字符数据输入 字符数据输入使用的是getchar函数,其作用是从终端&…

前端遇到的问题

inputs-outputs https://angular.cn/guide/inputs-outputs 用于父组件与子组件间的值传递 在项目中引入核心组件 父组件在其html界面绑定属性 在子组件里通过Input传递值 具体里: 使用默认规则数组绑定固定值(比如id)的错误 这里两个ts文件之间传值,采用了一个get函数,…

微信小程序 view组件的基本使用

1.view基本理论 能看图就尽量减少文字提示,从图书可以看出ABC是纵向排列的。 为什么会纵向排列而不是横向排列,那是因为view是块元素,能占满整一行。 怎么让view块元素横向并排呢? 向上图一样横向排列,接下来教学从0…

Kerberos协议与认证数据包分析

Kerberos协议 Kerberos是一种在开放的非安全网络中认证并识别用户身份信息的方法, 它旨使用密钥加密技术为客户端/服务端应用程序提供强身份认证。 目前主流的Kerberos版本是2005年的RFC4120标准的Kerberos v5, Windows、Linux和MacOs均支持Kerberos协议。Kerberos基础 Kerbe…