前言
List、Set、HashMap作为Java中常用的集合,需要深入认识其原理和特性。
本篇博客介绍常见的关于Java中HashMap集合的面试问题,结合源码分析题目背后的知识点。
关于List的博客文章如下:
- Java进阶(List)——面试时List常见问题解读 & 结合源码分析
关于的Set的博客文章如下:
- Java进阶(Set)——面试时Set常见问题解读 & 结合源码分析
其他关于HaseMap的文章如下:
- Java学数据结构(3)——树Tree & B树 & 红黑树 & Java标准库中的集合Set与映射Map & 使用多个映射Map的案例
- Java学数据结构(4)——散列表Hash table & 散列函数 & 哈希冲突
目录
- 前言
- 引出
- HashMap底层结构是什么?
- JDK 1.7和1.8 对比
- 源码Node类
- HashMap如何解决Hash碰撞问题?HashMap 何时从单链表,转换为红黑树?
- 当链表节点的数量达到8个时,通过treeify转为红黑树
- HashMap的扩容机制?HashMap的数组何时需要扩容?
- 1.首次添加元素
- 2.初始容量16
- 3.大于16时,双倍扩容
- 总结分析
- HashMap设置长度为11,那么数组的容量为多少?
- 第一个2的幂次方的值
- HashMap 何时从红黑树转换为 单链模式?
- split方法和untreeify方法
- HashMap 为什么在多线程并发使用过程中,容易造成死循环/死锁?
- 如何得到一个线程安全的HashMap集合?
- 总结
引出
1.jdk1.7 HashMap:数组+单向链表;
2.jdk1.8 HashMap:数组+链表(单向)+红黑树;
3.当链表节点的数量达到8个时,通过treeify转为红黑树;
4.首次添加元素,初始容量16,大于16时,双倍扩容;
5.HashMap设置长度,第一个2的幂次方的值;
6.红黑树元素的高位或者低位节点个数<6时,那么就调用untreeify方法来退回链表结构;
7.jdk1.7采用的是头插法,即新来元素在链表起始的位置,而jdk1.8采用尾插法,可以有效的避免在多线程操作中产生死循环;
8.ConcurrentHashMap高并发线程安全;
核心:键值对,KEY不可重复,VALUE可以重复
HashMap底层结构是什么?
JDK 1.7和1.8 对比
jdk1.7 HashMap:数组+单向链表
jdk1.8 HashMap:数组+链表(单向)+红黑树
源码Node类
源码可以看到HashMap内部定义了静态Node类,Node类中成员有
Node<K,V> next;
同样可以看到HashMap内部定义了静态TreeNode类,TreeNode类中成员有
TreeNode<K,V> left;
TreeNode<K,V> right;
可以看出存在红黑树
而TreeNode继承了 LinkedHashMap.Entry,点进查看,可以看到 Entry也继承了 HashMap.Node。所以,TreeNode红黑树是从链表Node中转换过来的
整体图:
HashMap如何解决Hash碰撞问题?HashMap 何时从单链表,转换为红黑树?
- 首先理解什么是hash碰撞问题,HashMap存放的元素的KEY需要经过hash计算得到hash值,而这个hash值可以理解为就是此元素要存放的位置,即数组中的下标;但是如果两个不同元素经过hash计算后,得到的hash值相同时,即两个元素要存放的位置为同一个位置,产生冲突,这种现象就叫做hash碰撞。
- 要想了解HashMap是如何解决hash碰撞的,那我们就需要看看HashMap的put方法的源码中的核心操作
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//添加第一个元素时,会进入这个if结构,table为null,则第一次初始化这个table数组的长度为16
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//判断添加的元素的KEY经过hash计算得到的下标位置是否为null
if ((p = tab[i = (n - 1) & hash]) == null)
//如果是null,则直接添加元素
tab[i] = newNode(hash, key, value, null);
//不为null的情况
else {
Node<K,V> e; K k;
//如果key相同,则用新的元素添加到旧元素的位置,后续会将就元素返回
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//判断是否为红黑树节点,如果是红黑树节点,则添加为红黑树
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
//链表类型
else {
//通过for循环遍历链表节点
for (int binCount = 0; ; ++binCount) {
//如果链表节点next节点为空
if ((e = p.next) == null) {
//则添加至链表的next节点属性中
p.next = newNode(hash, key, value, null);
//如果链表节点 >= 7 说明链表存在8个已存的元素节点
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
//转为红黑树方法
treeifyBin(tab, hash);
break;
}
//如果KEY相同,匹配其他API 如 putIfAbsent()
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//存入新值,返回旧值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
....
当链表节点的数量达到8个时,通过treeify转为红黑树
总结:HashMap是通过3层 if 结构来判断,数组下标位置是否有元素和下标位置的类型是链表还是红黑树,然后通过链表和红黑树来解决hash碰撞的问题,当链表节点>=7时(当链表节点的数量达到8个时),会通过treeify转为红黑树。
HashMap的扩容机制?HashMap的数组何时需要扩容?
1.首次添加元素
HashMap在第一次添加元素时,会进入第一个if结构来初始化数组的长度
2.初始容量16
//添加第一个元素时,会进入这个if结构,table为null,则第一次初始化这个table数组的长度为16
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
3.大于16时,双倍扩容
此处resize方法就是扩容方法,jdk8中,resize方法除了扩容还增加了初始化的功能,进入此方法我们可以看一下源码
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
//如果当前数组的长度>=最大值(2^30)时,将预值threshold设置为最大值
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
//如果当前数组的长度>=默认的初始长度16,则双倍扩容
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
...
调用resize方法的地方
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
...
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
总结分析
- 从上面可以看出,HashMap在完成put元素存储后,会判断++size是否>了阈值,如果是就会去扩容
- 下面这个方法是在,put元素为链表节点,并且要转为红黑树时,会调用该方法,该方法会在一开始就判断是否需要扩容
final void treeifyBin(Node<K,V>[] tab, int hash) {
int n, index; Node<K,V> e;
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
resize();
- 判断扩容的核心就是threshold这个值
- 从resize方法中看到,HashMap在扩容时,是之前的双倍扩容
HashMap设置长度为11,那么数组的容量为多少?
第一个2的幂次方的值
指定了长度初始化HashMap时,它会将数组的容量经过一系列算法,设置为大于我们自定义值的第一个2的幂次方的值,
即 设置为11 , 则为2^4=16
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
HashMap 何时从红黑树转换为 单链模式?
- HashMap在resize方法执行时,会将元素从旧数组转入新数组,此时如果转移元素为红黑树结构,那么就会调用split方法来分割红黑树方便转移
- split方法内部,在分割时,会生成高位树与低位树两种,此时也会进行判断如果红黑树元素的高位或者低位节点个数<6时,那么就调用untreeify方法来退回链表结构
split方法和untreeify方法
final void split(HashMap<K,V> map, Node<K,V>[] tab, int index, int bit) {
... //lowhead 低位树
if (loHead != null) {
//在红黑树节点元素往新数组中添加时,会调用split方法来重组这个红黑树
//此时会判断,红黑树的节点操作次数是否<6,即low树(低位树的节点数)< 6时,会通过untreeify方法来退化为链表
if (lc <= UNTREEIFY_THRESHOLD)
tab[index] = loHead.untreeify(map);
else {
tab[index] = loHead;
if (hiHead != null) // (else is already treeified)
loHead.treeify(tab);
}
}
//此时会判断,红黑树的节点操作次数是否<6,即high树(高位树的节点数)< 6时,会通过untreeify方法来退化为链表
//highhead 高位树
if (hiHead != null) {
if (hc <= UNTREEIFY_THRESHOLD)
tab[index + bit] = hiHead.untreeify(map);
else {
tab[index + bit] = hiHead;
if (loHead != null)
hiHead.treeify(tab);
}
}
}
HashMap 为什么在多线程并发使用过程中,容易造成死循环/死锁?
图示:
- 产生死循环的核心原因是因为,jdk1.7采用的是头插法,即新来元素在链表起始的位置,而jdk1.8采用尾插法,可以有效的避免在多线程操作中产生以上死循环
- 但是HashMap不是线程安全的,所以在多线程的场景中,虽然不会出现死锁/死循环,但是还是会出现节点丢失的情况,所以在并发的场景中推荐使用ConcurrentHashMap
如何得到一个线程安全的HashMap集合?
ConcurrentHashMap concurrentHashMap = new ConcurrentHashMap<>();
总结
1.jdk1.7 HashMap:数组+单向链表;
2.jdk1.8 HashMap:数组+链表(单向)+红黑树;
3.当链表节点的数量达到8个时,通过treeify转为红黑树;
4.首次添加元素,初始容量16,大于16时,双倍扩容;
5.HashMap设置长度,第一个2的幂次方的值;
6.红黑树元素的高位或者低位节点个数<6时,那么就调用untreeify方法来退回链表结构;
7.jdk1.7采用的是头插法,即新来元素在链表起始的位置,而jdk1.8采用尾插法,可以有效的避免在多线程操作中产生死循环;
8.ConcurrentHashMap高并发线程安全;