HashMap源码详细解析

news2024/11/20 18:25:23

HashMap的继承:

  • HashMap实现了Cloneable接口,所以可以被克隆

  • HashMap实现了Serializable接口,可以被序列化

  • HashMap继承了AbstractMap并实现了Map接口,具有Map接口的所有功能

存储结构:

  • JDK1.7(包括1.7)之前HashMap底层是数组+链表结合而成的高级数据结构,即 链表散列,之所以要使用链表是因为,HashMap在存储数据是通过 key 的 hashCode 经过扰动函数处理过后得到 hash 值,然后通过 (n - 1) & hash 判断当前元素存放的位置(这里的 n 指的是数组的长度),如果当前位置存在元素的话,就判断该元素与要存入的元素的 hash 值以及 key 是否相同,如果相同的话,直接覆盖,不相同就产生了Hash冲突,然后通过拉链法解决冲突,即将Hash值相同但值不同的元素以链表的形式放置在链表的尾部。但是链表长度太长查询效率就会变低,所以在jdk8作了优化

  • 在jdk1.8后,在链表长度大于8且容量>=64,就会进行树化,即链表转红黑树。数组的查询效率为O(1),链表的查询效率是O(k),红黑树的查询效率是O(log n)。所以当元素数量非常多的时候,转化为红黑树能极大地提高查询效率

源码解析(jdk1.8):

/**
     * 默认的初始容量为16
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

    /**
     * 最大的容量为2的30次方
     * The maximum capacity, used if a higher value is implicitly specified
     * by either of the constructors with arguments.
     * MUST be a power of two <= 1<<30.
     */
    static final int MAXIMUM_CAPACITY = 1 << 30;

    /**
     * 默认的装载因子
     * The load factor used when none specified in constructor.
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    /**
     * 当一个桶中的元素个数大于等于8时进行树化
     * The bin count threshold for using a tree rather than list for a
     * bin.  Bins are converted to trees when adding an element to a
     * bin with at least this many nodes. The value must be greater
     * than 2 and should be at least 8 to mesh with assumptions in
     * tree removal about conversion back to plain bins upon
     * shrinkage.
     */
    static final int TREEIFY_THRESHOLD = 8;

    /**
     * 当一个桶中的元素个数小于等于6时把树转化为链表
     * The bin count threshold for untreeifying a (split) bin during a
     * resize operation. Should be less than TREEIFY_THRESHOLD, and at
     * most 6 to mesh with shrinkage detection under removal.
     */
    static final int UNTREEIFY_THRESHOLD = 6;

    /**
     * 当桶的个数达到64的时候才进行树化
     * The smallest table capacity for which bins may be treeified.
     * (Otherwise the table is resized if too many nodes in a bin.)
     * Should be at least 4 * TREEIFY_THRESHOLD to avoid conflicts
     * between resizing and treeification thresholds.
     */
    static final int MIN_TREEIFY_CAPACITY = 64;
    /* ---------------- Fields -------------- */

    /**
     * 存储元素的数组,总是2的幂次倍
     * The table, initialized on first use, and resized as
     * necessary. When allocated, length is always a power of two.
     * (We also tolerate length zero in some operations to allow
     * bootstrapping mechanics that are currently not needed.)
     */
    transient Node<K,V>[] table;

    /**
     * 保存entrySet()的缓存
     * Holds cached entrySet(). Note that AbstractMap fields are used
     * for keySet() and values().
     */
    transient Set<Map.Entry<K,V>> entrySet;

    /**
     * 元素的数量
     * The number of key-value mappings contained in this map.
     */
    transient int size;

    /**
     * 每次扩容和更改map结构的计数器
     * The number of times this HashMap has been structurally modified
     * Structural modifications are those that change the number of mappings in
     * the HashMap or otherwise modify its internal structure (e.g.,
     * rehash).  This field is used to make iterators on Collection-views of
     * the HashMap fail-fast.  (See ConcurrentModificationException).
     */
    transient int modCount;

    /**
     * 临界值 当实际大小(容量*填充因子)超过临界值时,会进行扩容
     * The next size value at which to resize (capacity * load factor).
     *
     * @serial
     */
    // (The javadoc description is true upon serialization.
    // Additionally, if the table array has not been allocated, this
    // field holds the initial array capacity, or zero signifying
    // DEFAULT_INITIAL_CAPACITY.)
    int threshold;

    /**
     * The load factor for the hash table.
     *加载因子
     * @serial
     */
    final float loadFactor;

1.容量:为数组的长度,即桶的个数,默认为16,最大为2的30次方,当容量达到64时才可以树化

2.加载因子:loadFactor是控制素组存放数据的疏密程度,loadFactor越趋近于1,entry(数组)中存放的元素也就越密集,产生hash冲突的可能性越大,loadFactor太小(越趋趋近0)会导致数组存储空间利用率太低。所以为了二者平衡,官方给了一个相对临界的值:默认0.75,即初始容量 capacity = 16 , loadFactor = 0.75,threshold = capacity * loadFactor = 12,所以在数组长度达到12就会进行扩容,而非达到16才扩容。

3.树化:当容量达到64且链表的长度达到8时进行树化,当链表的长度小于6时反树化

4.Node<K,V>[] table: Node节点中有四个常量:

final int hash;

final K key;

V value;

Node<K,V> next; // 指向下一个节点

HashMap集合的put方法源码解析:

put方法如下:

public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);//hash(key)根据hash方法计算出key的hash值
    }

hash方法如下:

atic final int hash(Object key) {
        int h;
        /**
        *如果key为null,则hash值为0,否则调用key的hashCode()方法
        *并让高16位与整个hash异或,这种做法是为了尽可能减少hash碰撞
        */
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

putVal方法如下:

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //table未初始化或者长度为0,则扩容
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        //(n - 1) & hash 计算元素在哪个桶中
        //如果这个桶中还没有元素,则把这个元素放在桶中的第一个位置
        if ((p = tab[i = (n - 1) & hash]) == null)
             //新建一个节点放在桶中
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            // 如果桶中第一个元素的key与待插入元素的key相同,保存在e中e来记录,后续通过e判断是否直接return
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            
            // 如果第一个元素是树节点,则调用树节点的putTreeVal插入元素
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            //链表
            else {
                // 遍历这个桶对应的链表,binCount用于存储链表中元素的个数
                for (int binCount = 0; ; ++binCount) {
                    // 如果链表遍历完了都没有找到相同key的元素,说明该key对应的元素不存在,则在链表最后插入一个新节点
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        // 如果插入新节点后链表长度大于8,则判断是否需要树化,因为第一个元素没有加到binCount中,所以这里-1
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            // 如果此时数组长度小于64还是会扩容不会树化
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 如果待插入的key在链表中找到了,则退出循环
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key    
                // 记录下旧值
                V oldValue = e.value;  
                // 判断是否需要替换旧值
                if (!onlyIfAbsent || oldValue == null)                
                    // 替换旧值为新值
                    e.value = value;
                afterNodeAccess(e);   
                // 返回旧值
                return oldValue;
            }
        }
        
        // 修改次数加1
        ++modCount;
        // 元素数量加1,判断是否需要扩容
        if (++size > threshold)
            // 扩容
            resize();
        afterNodeInsertion(evict);
        // 没找到元素返回null
        return null;
    }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/194322.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【深度学习】ReID相关知识点解析(PCB、BoT、MGN)

PCB(Part-based Convolutional Baseline) RPP结构图: 网络流程: 经过一个backbone得到特征图T。T中的每列向量称为f(1,1,c)。 如:输入(384,128,3)经过backbone降采样16倍后得到特征图T(24,8,c)。 将T从上到下切成p(p=6)片。记为P_i(i=1…p)。——测试时接第…

PMP应该如何备考?掌握着三个步骤

在我这里大概就是有三个点需要注意的&#xff1a; 重点一&#xff0c;好好上课 我选择的是线下培训班&#xff0c;一共是6节线下课&#xff0c;每次线下课都占用了周末一整天的时间。 从早上9点到下午5点&#xff0c;没上课前我觉得应该会蛮累的&#xff0c;但实际上下来其实…

linux 安装mysql服务(超详细)

目录 1、查看是否已经安装了mysql 2、下载官方mysql安装包 3、安装MySQL包 4、安装 MySQL 5、启动 Mysql 服务 6、查看mysql运行状态 7、查看初始密码&#xff08;红色部分为初始密码) 8、进入数据库 1.首先关闭mysql服务 2.然后编辑文件&#xff0c;添加代码 3.新增…

什么是散点图?

在之前的文章中&#xff0c;我已经介绍过堆叠条形图、分组条形图和堆叠面积图&#xff0c;本文介绍一些散点图的百科知识。 散点图&#xff0c;顾名思义就是使用一些散乱的点来展示数据的一种图表&#xff0c;这些点在哪个位置&#xff0c;是由其X值和Y值确定的&#xff0c;因此…

【C++】常量引用(常引用)一些经典问题

常量引用1.常量引用错误的案例2.常量引用的前提条件3.分析错误案例4.总结常量引用1.常量引用错误的案例2.常量引用的前提条件3.分析错误案例4.总结1.常量引用错误的案例 1.常量引用的使用的场景一般是用来修饰函数的形参&#xff0c;防止误操作。 比如&#xff1a; //在下列函数…

HTB_Find The Easy Pass

文章目录信息收集分析汇编代码信息收集 下载后是一个加密的zip压缩包&#xff0c;里面是一个exe文件 解压密码获取&#xff1a; 使用zip2john暴破&#xff0c;失败 zip2john Find\ The\ Easy\ Pass.zip >hash.txt john -w/usr/share/wordlists/rockyou.txt hash.txt使用…

DAMA数据管理知识体系指南之数据开发

第5章 数据开发 数据开发&#xff08;Data Development)是数据管理框架中的第三个数据管理职能它是第二个与数据治理功能交互并受其影响的数据管理职能。 5.1 简介 数据开发是指分析、设计、实施、部署及维护数据解决方案&#xff0c;以使企业的数据资源价值最大化。数据开发…

pytorch backward使用解析

目录前言backward函数官方文档backward理解Jacobian矩阵vector-Jacobian product的计算vector-Jacobian product的例子理解输入和输出为标量或向量时的计算输入为标量&#xff0c;输出为标量输入为标量&#xff0c;输出为向量输入为向量&#xff0c;输出为标量输入为标量&#…

从零编写linux0.11 - 第十章 文件系统(二)

从零编写linux0.11 - 第十章 文件系统&#xff08;二&#xff09; 编程环境&#xff1a;Ubuntu 20.04、gcc-9.4.0 代码仓库&#xff1a;https://gitee.com/AprilSloan/linux0.11-project linux0.11源码下载&#xff08;不能直接编译&#xff0c;需进行修改&#xff09; 本章…

学会这7个常见问题和答案,让你下一次JavaScript面试获得高分

在本文中&#xff0c;我将涵盖您在JavaScript 面试中可能遇到的最常见问题&#xff0c;并提供详细的答案和示例&#xff0c;以帮助您在竞争中脱颖而出。无论您是初学者还是经验丰富的开发人员&#xff0c;本指南都会让您有信心打动面试官并找到工作。1️⃣ 什么是 JavaScript&a…

C++——继承

作为面向对象的语言&#xff0c;c开发了名为继承的机制&#xff0c;它是c中代码复用的重要手段&#xff1b; 允许程序员在保持原有特性的基础&#xff08;基类&#xff09;上进行扩展&#xff0c;并产生新的类&#xff08;派生类&#xff09;&#xff0c;这就是继承。 继承的格…

剑指 Offer 64. 求1+2+…+n

剑指 Offer 64. 求12…nhttps://leetcode.cn/problems/qiu-12n-lcof/ 求 12...n &#xff0c;要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句&#xff08;A?B:C&#xff09;。 示例 1&#xff1a; 输入: n 3 输出: 6 示例 2&#xff1a; 输入…

Linux——安装JDK和OpenJDK【多种方法】

目录 一、Linux安装OpenJDK 1、查看系统是否有自带的版本 2、删除OpenJDK 3、本地下载OpenJDK 4、无法本地下载&#xff0c;也可以使用命令下载&#xff08;方法1&#xff09; 4、无法本地下载&#xff0c;也可以使用命令下载&#xff08;方法2&#xff09; 5、拓展 三…

3-3-多线程-TheadLocal内存泄漏

Java TheadLocal内存泄漏 1、引言 组内来了一个实习生&#xff0c;看这小伙子春光满面、精神抖擞、头发微少&#xff0c;我心头一喜&#xff1a;绝对是个潜力股。为了帮助小伙子快速成长&#xff0c;我给他分了一个需求&#xff0c;这不需求刚上线几天就出网上问题了&#x1…

C++ 树进阶系列之线段树和它的延迟更新

1. 前言 线段树和树状数组有相似之处&#xff0c;可以用于解决区间类型的问题。 但两者又各个千秋&#xff0c;树状数组本质是数组&#xff0c;有着树的形&#xff0c;可以借用树的一些概念。线段树是典型的二叉树结构&#xff0c;无论神和形都是树&#xff0c;可以应用树的所…

用 Python 的 tkinter 模块编写一个好看又强大的中国象棋

继上次我的第一版的《中国象棋》程序之后&#xff0c;我又编写了第二版的《中国象棋》程序&#xff0c;关注我的粉丝知道&#xff0c;我在第一篇《中国象棋》的文章末尾说了&#xff0c;我会出第二版的&#xff0c;对第一版感兴趣的朋友们&#xff0c;可以去看看&#xff0c;也…

VueJS 之样式冲突与样式穿透

文章目录参考描述样式冲突现象scoped原理样式穿透深度选择器使用原理顶层元素局限性参考 项目描述搜索引擎Bing哔哩哔哩黑马程序员 描述 项目描述Edge109.0.1518.70 (正式版本) (64 位)操作系统Windows 10 专业版vue/cli5.0.8npm8.19.3VueJS2.6.14 样式冲突 在使用 Vue 进行…

大文件上传/下载

一、前言 大文件上传下载一直以来是前端常用且常考的热门话题。本文将分别介绍大文件上传/下载的思路和前端实现代码。 二、分片上传 整体流程 对文件做切片&#xff0c;选择文件后&#xff0c;对获取到的file对象使用slice方法可以将其按照制定的大小进行切片&#xff0c;…

使用matplotlib,pylab进行python绘图

一提到python绘图&#xff0c;matplotlib是不得不提的python最著名的绘图库&#xff0c;它里面包含了类似matlab的一整套绘图的API。因此&#xff0c;作为想要学习python绘图的童鞋们就得在自己的python环境中安装matplotlib库了&#xff0c;安装方式这里就不多讲&#xff0c;方…

openmmlab学习打卡1

openmmlab学习打卡1通用视觉框架 OpenMMLab通过 conda 安装通用视觉框架 OpenMMLab 基于pytorch实现 其中&#xff1a; 分类算法在 mmclassification 模块下 目标检测在 mmdetection 模块下 分割模型在 mmsegmentation 模块下&#xff08;openmmlab 2.0 版本中加入&#xff09…