HashMap部分源码解析

news2024/9/9 6:06:21

作者~小明学编程 

文章专栏Java数据结构

格言目之所及皆为回忆,心之所想皆为过往

目录

前言

常量字段

构造方法

put方法

确定初始容量

为何我们的数组的大小要是2的n次幂

hash为何要异或其高位

扩容机制


前言

我们在前面的文章中已经简单的介绍了我们的哈希表,其基本的工作原理是什么我们已经讲述了,并且我们还简单了实现了哈希表,但是我们Java中的HashMap是怎么实现并且它的实现过程是怎么样的呢?今天我们就通过对源码的解析来深入的探讨下面三个问题。

1.如果我们new HashMap(19),那么我们的bucket数组有多大?

2.HashMap什么时候开辟bucket数组占用内存?

3.HashMap何时扩容?

常量字段

 首先先给大家介绍一下这几个常量所表示的含义是什么。

    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

默认的初始容量,意思就是我们的HashMap的底层数组bucket的数组的默认容量的大小是16。

    static final int MAXIMUM_CAPACITY = 1 << 30;

数组所能扩容的最大容量,当我们的底层数组的大小超过这个数值的时候我们将不再进行扩容。

    static final float DEFAULT_LOAD_FACTOR = 0.75f;

我们默认的负载因子的大小。

    static final int TREEIFY_THRESHOLD = 8;
    static final int MIN_TREEIFY_CAPACITY = 64;

树化的条件,当我们hash值所对应的那条链表的长度超过8,并且数组的总长度超过64的时候我们的链表将转化为红黑树。

    static final int UNTREEIFY_THRESHOLD = 6;

链表化的条件,当我们扩容数组之后需要重新hash,当我们发现当前红黑树的大小小于6的时候,我们的红黑树就会重新变成链表。

构造方法

    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);
    }

    /**
     * Constructs an empty <tt>HashMap</tt> with the specified initial
     * capacity and the default load factor (0.75).
     *
     * @param  initialCapacity the initial capacity.
     * @throws IllegalArgumentException if the initial capacity is negative.
     */
    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

    /**
     * Constructs an empty <tt>HashMap</tt> with the default initial capacity
     * (16) and the default load factor (0.75).
     */
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

我们可以看到我们的构造方法进行了重载,所以当我们不传参数,传入一个参数,传两个参数都将调用不同的方法。

当我们不传参数的时候,我们的构造方法将会初始化我们的负载因子为我们的默认值0.75,传入一个参数的话也就是我们初始的容量,这时将会调用我们含有两个参数的构造方法,我们看到我们两个参数的构造方法首先是进行一些异常处理然后给我们的负载因子loadFactor赋值,再然后就是通过tableSizeFor这样的方法返回一个是2的次幂并且大于我们传入的参数的值将其赋给threshold,这个值在后面将会作为确定我们开辟的数组多大的值,这也回答了我们的问题 

如果我们new HashMap(19),那么我们的bucket数组有多大?

我们的bucket的大小为32。

put方法

put方法中有我们想要的东西,想要解开后面的两个问题就得去put里面去寻找答案。

确定初始容量

 我们的put方法里面返回的是一个putVal方法,下面我们就进到putVal里面去一探究竟吧。

 从前向后看首先因为我们没有传入初始的容量的话我们将会进入第一个if语句,然后我们将会进行扩容进入我们的resize()方法当中。

最后找到我们这段代码:

 得到我们的新的容量为默认容量16.

 这里开始扩容了,所以综上所述得出我么的HashMap在第一次进行put操作的时候给我们的bucket数组占用空间。

为何我们的数组的大小要是2的n次幂

前面我们在说数组容量大小的时候要是2的n次幂,但是我们为什么要有这个要求呢? 

 

我么把视线再次调回到putVal这个方法中,这里我们的p是我们的链表首节点的地址,它的得出来源于  tab[i = (n - 1) & hash], (n - 1) & hash就是算出我们的数组下标,n是我们的数组长度是个偶数,(n - 1) & hash就相当于hash%n但是我们不这样写因为:

1.我们的&运算符的效率相比%要快。

2.n-1肯定是个奇数所以二进制的最低为肯定为1,比如15的二进制1111,这个时候如果&我们的hash最低位可能是1也可能是0,但是如果我们n不是偶数的话,n-1可能为偶数那么最低值就是0这时候进行&运算的话最低位绝对为0,这时我们看到我们n-1的有效位一共才4为你这一下子就确定了一位,明显降低了我们的随机性,增大了碰撞的概率。

hash为何要异或其高位

现在我们再次把视线往前拨,

 拨到我们hash的产生,

 当我们的key不为空的时候我们原本的hash要异或上hash的右移16位,16位刚好是我们int32字节的前半部分,因为我们的数组容量一般不会要用到我们32个比特位的高16位(65535以上的长度了),一般都是后16位,如此一来高16位基本用不上了,这是我们不想看到的,我们就想怎么能在低16位中同时也能体现出我们高16位的特征呢?

所以我们就想到将hash右移16位再去异或原本的hash,这样我们的的低位也能体现出我们高位的特征,再一次增强了随机性。

扩容机制

 

 我们的实现调回到putVal,先去判断一下我们的p是不是树节点是的话就在树里面添加元素,然后循环判断我们当前链表的节点树是否大于等于7是的话我们将对其树化,

最后我们看看当前节点是否大于容量,是的话就扩容, 

 我们大致看一下扩容的情况,首先看一下是判断一个最大容量的问题,然后就是扩容之后是否大于最大容量,其中扩容的时候是左移两位,也就是扩大二倍,同时也解惑了最后一个问题,HashMap何时扩容,答案是超过负载因子的时候扩容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/68728.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

极客时间Kafka - 04 Kafka生产者和消费者拦截器

文章目录1. 什么是拦截器&#xff1f;2. Kafka 拦截器3. 典型使用场景4. 案例分享1. 什么是拦截器&#xff1f; 如果你用过 Spring Interceptor 或是 Apache Flume&#xff0c;那么应该不会对拦截器这个概念感到陌生&#xff0c;其基本思想就是允许应用程序在不修改逻辑的情况…

无人机边缘计算中的计算卸载——Stackelberg博弈方法论文复现附matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;修心和技术同步精进&#xff0c;matlab项目合作可私信。 &#x1f34e;个人主页&#xff1a;Matlab科研工作室 &#x1f34a;个人信条&#xff1a;格物致知。 更多Matlab仿真内容点击&#x1f447; 智能优化算法 …

不会还有人不会热修复吧?

Class流派原理 基本原理:加载类的时候是找element&#xff0c;每个element对于一个dex。我要把我修复的那个类单独放到dex插入dexlist前面&#xff0c;在你做类加载从前往后找优先从你的dex加载加载的就是你修复后的class.这就是 实现代码 通过context拿到pathClassLoader&am…

Qt跨平台截图工具

Qt跨平台截图工具 文章目录Qt跨平台截图工具1、概述2、实现效果3、软件构成4、关键代码5、源代码更多精彩内容&#x1f449;个人内容分类汇总 &#x1f448;&#x1f449;Qt自定义模块、工具&#x1f448; 1、概述 Qt版本&#xff1a;V5.12.5兼容系统&#xff1a; Windows&…

2022,记录与华为的这场会议

一、数据治理团体标准发布会 11月26日&#xff0c;中国计算机用户协会信息科技审计分会联合华为与擎创科技共同举办了“金融行业运维数据治理团体标准应用研讨暨2022年度调研报告线上发布会”。来自国家开发银行、中国建设银行、中国邮政储蓄银行、招商银行、兴业银行、中信银行…

【LeetCode_字符串_逻辑分析】9. 回文数

目录考察点第一次&#xff1a;2022年12月7日10:16:33解题思路代码展示题目描述给你一个整数 x &#xff0c;如果 x 是一个回文整数&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。回文数是指正序&#xff08;从左向右&#xff09;和倒序&#xff08;从右向左…

340页11万字智慧政务大数据资源平台大数据底座数据治理建设方案

目 录 第一章 项目概况 1.1 项目名称 1.2 项目单位 1.3 项目建设依据 1.4 项目建设内容和目标 1.4.1 建设内容 1.4.2 建设目标 1.5 项目投资估算及建设周期 1.5.1 项目投资估算 1.5.2 服务周期 第二章 现状 2.1 项目单位概况 2.1.1 单位职责、内设及下属机构、人员…

【配准图像】

MU-Net: A MULTISCALE UNSUPERVISED NETWORK FOR REMOTE SENSING IMAGE REGISTRATION &#xff08;MU-Net&#xff1a;一种多尺度无监督遥感图像配准网络&#xff09; 多传感器或多模态图像对的配准是许多遥感应用的基础性任务。为了实现高精度、低成本的遥感图像配准&#x…

彻底搞懂JS原型与原型链

说到JavaScript的原型和原型链&#xff0c;相关文章已有不少&#xff0c;但是大都晦涩难懂。本文将换一个角度出发&#xff0c;先理解原型和原型链是什么&#xff0c;有什么作用&#xff0c;再去分析那些令人头疼的关系。 一、引用类型皆为对象 原型和原型链都是来源于对象而…

浅谈Linux内核编程规范与代码风格

1 缩进 Tab的宽度是八个字符&#xff0c;因此缩进的宽度也是八个字符。有些异教徒想让缩进变成四个字符&#xff0c;甚至是两个字符的宽度&#xff0c;这些人和那些把 PI 定义为 3 的人是一个路子的。 注意&#xff1a;缩进的全部意义在于清晰地定义语句块的开始与结束&#…

《MongoDB》Mongo Shell中的基本操作-删除操作一览

前端博主&#xff0c;热衷各种前端向的骚操作&#xff0c;经常想到哪就写到哪&#xff0c;如果有感兴趣的技术和前端效果可以留言&#xff5e;博主看到后会去代替大家踩坑的&#xff5e; 主页: oliver尹的主页 格言: 跌倒了爬起来就好&#xff5e; 来个关注吧&#xff0c;点个赞…

分布式事务,单JVM进程与多数据库,分布式事务技术选型,0-1过程,代码全。

由于很多小白程序员在单一JVM进程配合多数据库的架构环境中,总是考虑一主多从的mysql集群环境。还不知道mysql集群数据库按照表纵向分割以后,也是可以走数据库使用事务的。那么这里使用到的就是分布式事务,XA协议。现在大部分主流的数据库都支持XA协议。这里不用太多废话,直…

【Web智能聊天客服】之JavaScript、jQuery、AJAX讲解及实例(超详细必看 附源码)

觉得有帮助请点赞关注收藏~~~ 一、JavaScript基础 Javascript是网页编程语言&#xff0c;决定网页元素的动作。HTML页面中通过<script></script>指定Javascript内容&#xff0c;通过//或者 /* */执行代码的备注功能&#xff0c;并且区分大小写。 1&#xff1a;变…

《视觉SLAM十四讲》示例程序编译报错处理(上)

高翔博士《视觉SLAM十四讲》这本书中的代码很不错&#xff0c;适合初学者。可惜有一些可能因为版本的问题会报错&#xff0c;本文总结一下我遇到的问题。 在slambook2/3rdparty文件夹git submodule update&#xff0c;这个版本是和书中的版本一致的。但我已经重新安装了新版Ei…

Webpack中的高级特性

自从webpack4以后&#xff0c;官方帮我们集成了很多特性&#xff0c;比如在生产模式下代码压缩自动开启等&#xff0c;这篇文章我们一起来探讨一下webpack给我们提供的高级特性助力开发。 探索webpack的高级特性 特性&#xff1a;treeShaking 顾名思义treeShaking&#xff0…

C++ Reference: Standard C++ Library reference: Containers: deque: deque: swap

C官网参考里链接&#xff1a;https://cplusplus.com/reference/deque/deque/swap-free/ 函数模板 <deque> std::swap (deque) template <class T, class Alloc> void swap (deque<T,Alloc>& x, deque<T,Alloc>& y); 交换两个双端队列容器的…

【ESP32调试-快速入门】

文章目录ESP32调试一. 环境搭建二. 运行OpenOCD1. 烧入blink2. 找到芯片型号对应的脚本文件&#xff0c;并运行脚本命令三. 运行GDBESP32调试 一. 环境搭建 ESP_IDF环境搭建 二. 运行OpenOCD 1. 烧入blink 如&#xff1a;安装环境中的examples中的blink 路劲&#xff1a;安装…

华为机试 - 探索地块建立

目录 题目描述 输入描述 输出描述 用例 题目解析 算法源码 题目描述 给一块n*m的地块&#xff0c;相当于n*m的二维数组&#xff0c;每个元素的值表示这个小地块的发电量&#xff1b; 求在这块地上建立正方形的边长为c的发电站&#xff0c;发电量满足目标电量k的地块数量…

汽车保养app开发,扩充汽车服务市场发展商机

从汽车市场规模来看&#xff0c;从2017年开始始终保持增长的发展趋势&#xff0c;在2021年市场规模达到140877.18亿元。互联网时代发展下&#xff0c;汽车后市场大力推广电子商务&#xff0c;将互联网技术与汽车保养服务相结合是汽车服务行业强大的必由之路。二者的结合可以让消…

centos7下搭建rabbitmq的开发环境

我们在项目开发的时候都不可避免的会有异步化的问题,比较好的解决方案就是使用消息队列,可供选择的队列产品也有很多,比如轻量级的redis, 当然还有重量级的专业产品rabbitmq,rabbitmq好就好在是用erlang(二郎神)开发的,它那天生的OTP并行计算框架,轻而易举的进程间通…