HashMap----源码解读

news2024/9/28 21:20:59
源码分析:
public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable

在类的开头声明了几个常量,以下是较为重要的:

/**
 * 定义初始容量大小为16
 */
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16 
​
/**
 * 定义最大容量为2^30
 */
static final int MAXIMUM_CAPACITY = 1 << 30;
​
/**
 * 定义加载因子,与数组实时容量相乘会得到一个扩容阈值(threshold),当到达这个阈值时,将会进行扩容。
 */
static final float DEFAULT_LOAD_FACTOR = 0.75f;
​
/**
 * 当链表元素增加到8时,转化为红黑树提升查找效率
*/
​
static final int TREEIFY_THRESHOLD = 8;
​
/**
 * 当红黑树元素减少到6时,退化为链表
*/
static final int UNTREEIFY_THRESHOLD = 6;
​
/**
 * 只有当哈希表的总容量至少为64时,才可能将链表转换为红黑树。
*/
static final int MIN_TREEIFY_CAPACITY = 64;

以下是定义的一些成员变量:

/**
 * 这是HashMap存储数据的哈希表,它是一个数组,每个元素是一个链表的头节点或者红黑树的
 */
transient Node<K,V>[] table;
​
/**
 * 这是一个缓存,用于存储HashMap中所有键值对(Entry)的集合视图。
 */
transient Set<Map.Entry<K,V>> entrySet;
​
/**
 * 这个字段表示HashMap中键值对的总数。
 */
transient int size;
​
/**
 * 这个字段记录了HashMap结构上被修改的次数,包括添加、删除操作,或者重新哈希(rehash)等。
 * 它用于实现快速失败(fail-fast)机制,当HashMap在迭代过程中被修改时,会抛出
 */
transient int modCount;
​
/**
这个字段表示HashMap能够容纳的最大元素数量,达到这个数量时,HashMap会进行扩容(resize)。它等于数组的容量乘以加载因子(load factor)。如果哈希表还没有被分配,这个字段可以表示初始数组容量或0,0代表使用默认的初始容量。
 */
int threshold;
​
/**
这个字段是HashMap的加载因子,它决定了HashMap何时进行扩容操作。加载因子是HashMap中元素数量与数组长度的比例。当HashMap中的元素数量超过了capacity * loadFactor时,HashMap会进行扩容。默认的加载因子是0.75,这是一个空间和时间成本之间的折中。
 */
final float loadFactor;

对于链表元素,会将其存储在一个叫Node的内部类中,对于红黑树元素,会被存储与TreeNode内部类中:

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;//hash值
    final K key;//键
    V value;//值
    Node<K,V> next;//指向下一个元素
    ...
}
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
    TreeNode<K,V> parent;// 父节点
    TreeNode<K,V> left;//左子树
    TreeNode<K,V> right;//右子树
    TreeNode<K,V> prev;// 这是一个指向当前节点的前一个节点的引用。这个字段主要用于在删除节点时,能够从双向链表中移除当前节点。由于HashMap中的红黑树节点也是双向链表的一部分,所以这个字段是必要的。
    boolean red;//是否转为红色
    ...
}

在初始化的时候,我们查看其中的一个无参构造:

public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // 在调用无参构造,只对加载因子做了初始化,其他都没有初始化。
}

当我们进行插入元素时,我们会调用put方法进行添加元素,传入键值对:

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);//依次参数是
      // 1.对键进行hash(计算键的哈希值以确定它应该存储在哪个桶中)
      // 2.键
      // 3.值
      // 4.是否保留(false时重复会进行覆盖)
      // 5.这个布尔值参数用于LinkedHashMap,它指示在插入后是否需要执行额外的操作。在HashMap中,这个参数通常被忽略,因为它不是用来控制标准HashMap行为的。在LinkedHashMap中,这个参数用于确定是否在插入后移除最旧的条目
}

接着我们进入putVal方法查看:

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    //由于table是成员变量放在堆中,而方法在栈中,所以定义一个局部变量(同样存在于栈中)提高效率
    Node<K,V>[] tab; 
    //指向当前数组位置
    Node<K,V> p; 
    //n为数组容量,i为以hash值与数组长度运算得到的插入位置索引(桶索引)
    int n, i;
    //对tab进行赋值并且判断是否为空,其实就是对我们的数组判断是否为空(还没初始化),调用resize函数进行初始化:
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    //判断在数组中,该位置是否为空,为空直接插入
    if ((p = tab[i = (n - 1) & hash]) == null)
    //将我们的元素插入到数组中。
        tab[i] = newNode(hash, key, value, null);
    //不为空
    else {
        Node<K,V> e; K k;
        //判断是否重复
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
        //重复则将存在的元素赋值给e,后续可以用来更新该节点的值。
            e = p;
        //如果存在的元素的类型是红黑树节点
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        //在原来元素的基础上进行链表插入的操作
        else {
            //这里开始了一个无限循环,binCount用于记录当前桶中的节点数量。循环将遍历链表中的节点,直到找到合适的插入位置。
            for (int binCount = 0; ; ++binCount) {
//在循环内部,首先检查当前节点p的下一个节点e是否为null。如果是null,说明已经到达链表的末尾,可以在这里插入新的节点。
                if ((e = p.next) == null) {
                    //在存在元素上使用尾插法进行插入新元素
                    p.next = newNode(hash, key, value, null);
                    //达到树化阈值,对当前哈希桶转换为红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    //插入超过即break
                    break;
                }
//在遍历链表的过程中,如果找到了一个具有相同哈希值和键的节点,这意味着找到了一个已经存在的键。
//如果键相等(通过==比较或者equals方法),循环会通过break终止。
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                //如果没有找到相等的键,或者还没有到达链表末尾,p会更新为下一个节点e,继续循环。
                p = e;
            }
        }
        //经过上诉操作之后,如果e不为null则说明已经找到了重复元素
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            //判断是否要进行覆盖,因为重复时e指向的是重复元素,此时进行重复元素value的覆盖
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            //这个方法在HashMap类中是空的,用于LinkedHashMap的位置调整,因为有重复元素覆盖则涉及一个插入顺序打乱
            afterNodeAccess(e);
            //返回旧值
            return oldValue;
        }
    }
    ++modCount;
    //大于阈值则调用resize准备扩容
    if (++size > threshold)
        resize();
    //它在节点被插入后调用。这个方法在HashMap类中是空的,但在LinkedHashMap中会被覆盖以维护节点的插入顺序。
    afterNodeInsertion(evict);
    //正常插入返回null
    return null;
}

在resize方法中,由于我们的容量等于零,所以他会执行其中的:

{               
    newCap = DEFAULT_INITIAL_CAPACITY;//给我们的容量赋值默认容量16
    newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);//给我们的阈值赋值为容量乘以加载因子
}
threshold = newThr;//赋值给成员变量
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];//此时才开始初始化存放链表或者红黑树的数组
        table = newTab;//将其赋值给成员变量table
...
return newTab;最后将我们的新数组进行返回。

以上是其中的一种情况,在resize中有三种情况,以下是其他两种:

//当旧容量大于0,此时调用到resize则说明需要进行扩容操作
if (oldCap > 0) {
    //判断旧容量有没有超过最大,超过则设置阈值为Int最大,表示再也不会扩容了。
    if (oldCap >= MAXIMUM_CAPACITY) {
        threshold = Integer.MAX_VALUE;
        return oldTab;
    }
    //开始扩容,让新容量左移一位即为2倍操作,并进行判断新容量有没有超过阈值。
    else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
             oldCap >= DEFAULT_INITIAL_CAPACITY)
        //如果以上判断通过则将新阈值变为旧阈值的两倍
        newThr = oldThr << 1; // double threshold
}
//当旧阈值大于零且不满足旧容量大于零(以上情况),则说明在创建hashMap时进行了初始化容量,当插入元素时会调用resize来到这个if
else if (oldThr > 0) // initial capacity was placed in threshold
    newCap = oldThr;

当扩容之后我们会对对应的成员变量进行赋值,并且让旧数组的元素拷贝到新数组中去:

//阈值更新,即下一次扩容时机
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
//创建新数组
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
//将成员变量table赋值新数组
table = newTab;
//这里判断,只要不是初始化就要快开始数组拷贝
if (oldTab != null) {
    for (int j = 0; j < oldCap; ++j) {
        Node<K,V> e;
        if ((e = oldTab[j]) != null) {
            oldTab[j] = null;
            //只有一个元素
            if (e.next == null)
                newTab[e.hash & (newCap - 1)] = e;
            //树结构节点
            else if (e instanceof TreeNode)
                ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
            //链表结构
            else { // preserve order
                Node<K,V> loHead = null, loTail = null;
                Node<K,V> hiHead = null, hiTail = null;
                Node<K,V> next;
                //低位:落在新容量的(0,旧容量大小)区域
                //高位:落在新容量的(旧容量大小,两倍旧容量)区域
                //先使用其hash值判断它在高位区还是低位区,hash与旧容量相与等于零则说明其在低位。
                //判断后,就可以把j索引下的一整条链表进行复制
                //复制过程就是自己造一条新链表,如落在低位时:
                //先使用lohead将头节点保存,其次用lotail.next在循环中将整条链表进行连接
                //整条链表复制好了,即走完了dowhile,此时再一次判断是高位还是低位(判断高或低有没有为空)不为空则为高或低位。
                //如果是低位直接将头节点插入到新容量数组的j索引处,如果是高位则将头节点插入在新容量(j+旧容量大小)索引处
                do {
                    next = e.next;
                    if ((e.hash & oldCap) == 0) {
                        if (loTail == null)
                            loHead = e;
                        else
                            loTail.next = e;
                        loTail = e;
                    }
                    else {
                        if (hiTail == null)
                            hiHead = e;
                        else
                            hiTail.next = e;
                        hiTail = e;
                    }
                } while ((e = next) != null);
                if (loTail != null) {
                    loTail.next = null;
                    newTab[j] = loHead;
                }
                if (hiTail != null) {
                    hiTail.next = null;
                    newTab[j + oldCap] = hiHead;
                }
            }
        }
    }
}
return newTab;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1919601.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【射频器件供应】 Marki Microwave

射频、微波和毫米波组件 裸片、表面贴装、连接器和波导 直流至Sub-THz Marki Microwave通过创建强大的性能突破性射频和微波组件产品组合&#xff0c;解决了业界最棘手的技术问题。Marki Microwave 成立于 1991 年&#xff0c;以开发业内最好的混频器为目标&#xff0c;如今已…

kaggle提交csv文件

使用colab完成实验后 将要提交的csv文件拖到kaggle网站自己加入的competition就行 如果kaggle网站无法注册&#xff0c;往往是人机验证问题&#xff1a; kaggle网站验证

6-5,web3浏览器链接区块链(react+区块链实战)

6-5&#xff0c;web3浏览器链接区块链&#xff08;react区块链实战&#xff09; 6-5 web3浏览器链接区块链&#xff08;调用读写合约与metamask联动&#xff09; 6-5 web3浏览器链接区块链&#xff08;调用读写合约与metamask联动&#xff09; 这里就是浏览器端和智能合约的交…

语言模型演进:从NLP到LLM的跨越之旅

在人工智能的浩瀚宇宙中&#xff0c;自然语言处理&#xff08;NLP&#xff09;一直是一个充满挑战和机遇的领域。随着技术的发展&#xff0c;我们见证了从传统规则到统计机器学习&#xff0c;再到深度学习和预训练模型的演进。如今&#xff0c;我们站在了大型语言模型&#xff…

【最经典的79个】软件测试面试题(内含答案)提前备战“金九银十”

001.软件的生命周期(prdctrm) 计划阶段(planning)-〉需求分析(requirement)-〉设计阶段(design)-〉编码(coding)->测试(testing)->运行与维护(running maintrnacne) 测试用例 用例编号 测试项目 测试标题 重要级别 预置条件 输入数据 执行步骤 预期结果 0002.问&…

ctfshow-web入门-文件上传(web166、web167)(web168-web170)免杀绕过

目录 1、web166 2、web167 3、web168 4、web169 5、web170 1、web166 查看源码&#xff0c;前端只让传 zip 上传 zip 成功后可以进行下载 随便搞一个压缩包&#xff0c;使用记事本编辑&#xff0c;在其内容里插入一句话木马&#xff1a; 上传该压缩包&#xff0c;上传成功…

LLM独角兽们就要活不下去了!C.AI被资本抛弃,核心员工跑路;Perplexity陷入传统媒体口水战;微软发明的新型收购方式靠谱么?| ShowMeAI日报

&#x1f440;日报&周刊合集 | &#x1f3a1;ShowMeAI官网 | &#x1f9e1; 点赞关注评论拜托啦&#xff01; 1. 亚马逊「招聘式收购」Adept AI&#xff0c;始作俑者微软正在被联邦「反垄断」调查 Adept AI 官网 → https://www.adept.ai Adept AI 成立于2022年4月&#xf…

分享一个 .NET 通过监听器拦截 EF 消息写日志的详细例子

前言 EF 开发效率确实很高也很便捷&#xff0c;但当它发生错误时&#xff0c;也挺让人头疼的&#xff0c;为什么&#xff1f;因为 EF 就像是一个黑盒子&#xff0c;一切全被封装起来&#xff0c;出错的时候很难定位原因&#xff0c;如果能够知道并打印 EF 生成的 SQL 语句&…

历年HW已公开漏洞合集!(目前漏洞库更新至84个,Goby持续更新...)

截至2024年7月11日&#xff0c;Goby红队版已扩充以下历年HW已公开漏洞库&#xff0c;本次更新84个&#xff1a; &#xff08;后续将持续更新…) 华天动力OA 华天动力 OA getHtmlContent 文件读取漏洞华天动力OA办公系统 /OAapp/bfapp/buffalo/TemplateService 文件读取漏洞华…

中国各省养老机构数据明细(更新至2024年)

中国养老机构是指为老年人提供集中居住、生活照顾、健康管理、文化娱乐等综合性服务的设施。这些机构包括养老院、福利院、老年公寓等多种形态&#xff0c;既有公立也有民办&#xff0c;遍布城市与农村。 一、数据介绍 数据名称&#xff1a;中国养老机构数据明细 数据范围&am…

【C++】使用C++实现基于Socket的通信

在本文中&#xff0c;我们将详细讨论如何使用C实现基于Socket的通信&#xff0c;并设计一个TLV&#xff08;Type-Length-Value&#xff09;协议用于数据交互。TLV协议因其灵活性和可扩展性&#xff0c;在多种通信协议中被广泛使用&#xff0c;特别是在需要动态定义数据结构的场…

软件架构之嵌入式系统设计

软件架构之嵌入式系统设计 第 12 章&#xff1a;嵌入式系统设计12.1 嵌入式系统概论12.2 嵌入式系统的组成12.2.1 硬件架构12.2.2 软件架构 12.3 嵌入式开发平台与调试环境12.3.1 嵌入式系统软件开发平台12.3.2 嵌入式开发调试 第 12 章&#xff1a;嵌入式系统设计 随着计算机…

# Redis 入门到精通(一)数据类型(3)

Redis 入门到精通&#xff08;一&#xff09;数据类型&#xff08;3&#xff09; 一、redis 数据类型–set 类型介绍与基本操作 1、set 类型 新的存储需求: 存储大量的数据&#xff0c;在查询方面提供更高的效率。需要的存储结构: 能够保存大量的数据&#xff0c;高效的内部…

MybatisPlus 核心功能

MybatisPlus 核心功能 文章目录 MybatisPlus 核心功能1. 条件构造器1.1 QueryWrapper1.2 LambdaQueryWrapper&#xff08;推荐&#xff09;1.3 UpdateWrapper1.4 LambdaUpdateWrapper 2. 自定义SQL3. Service接口 1. 条件构造器 当涉及到查询或修改语句时&#xff0c;MybatisP…

【C++】C++商店销售管理系统(源码+论文)【独一无二】

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…

【C++】C++-机房收费管理系统(源码+注释)【独一无二】

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…

【深度学习入门篇 ④ 】Pytorch实现手写数字识别

【&#x1f34a;易编橙&#xff1a;一个帮助编程小伙伴少走弯路的终身成长社群&#x1f34a;】 大家好&#xff0c;我是小森( &#xfe61;ˆoˆ&#xfe61; ) &#xff01; 易编橙终身成长社群创始团队嘉宾&#xff0c;橙似锦计划领衔成员、阿里云专家博主、腾讯云内容共创官…

项目中日志采集实践:技术、工具与最佳实践

✨✨谢谢大家捧场&#xff0c;祝屏幕前的小伙伴们每天都有好运相伴左右&#xff0c;一定要天天开心哦&#xff01;✨✨ &#x1f388;&#x1f388;作者主页&#xff1a; 喔的嘛呀&#x1f388;&#x1f388; 目录 引言 一. 选择合适的日志框架 二. 配置日志框架 三. 使用…

既要“性价比”,又要“品价比”,零跑何以成为新能源“卷王”?

从前&#xff0c;“汽车界小米”“品价比”是围绕在零跑汽车周围的关键词。而在零跑C16上市发布会上&#xff0c;零跑汽车创始人朱江明又提出了“车圈优衣库”的概念&#xff0c;“我希望零跑在汽车行业的定位&#xff0c;就像优衣库在服装行业一样&#xff0c;追求品价比&…

看番工具 -- oneAnime v1.2.5绿色版

软件简介 OneAnime是一款专为动漫爱好者设计的应用程序&#xff0c;它提供了一个庞大的动漫资源库&#xff0c;用户可以在这里找到各种类型的动漫&#xff0c;包括热门的、经典的、新番的等等。OneAnime的界面设计简洁明了&#xff0c;操作方便&#xff0c;用户可以轻松地搜索…