java 集合框架-map(键值对集合)

一、Map接口 (键值对集合)

1.实现类

(1).线程不安全

HashMap

1.特点:

①无序

②查找效率高：根据key，查找value

2.数据结构：数组（哈希表）+ 链表（链地址法解决哈希表冲突） + 红黑树（自平衡二叉树，提高查找效率）

①数组(哈希表):
HashMap内部定义了一个数组，数组中的每个位置被称为“桶”( Bucket )，这是HashMap的基础结构【哈希表】
        下标位置:当添加一个新的key-value键值对时，会根据key的 hashcode()，通过哈希函数计算出一个新的哈希值 h
ash，并通过这个hash值，计算key-value键值对在数组中的下标位置(桶Bucket ) ;
        数组容量:在添加第一个key-value键值对时，数组容量被初始化为 16，并且可以根据key-value 键值对的数量和负载因子，数组会自动按照2倍进行扩容;
②链表:
        数组的每个位置（ Bucket桶)可以保存一个或多个key-value键值对;
        当两个或更多的 key-value键值对，被映射保存到数组的同一个位置(桶Bucket）时，就产生了哈希表冲突;
        HashMap使用链地址法，解决哈希冲突，这些键值对将以链表的形式存储在产生冲突的位置(桶Bucket ) ;
③红黑树:
        为了优化链表的查询性能，当链表长度超过一个阈值（默认是8）并且数组的容量大于等于64时，链表会转换成红黑树;
        红黑树是一种自平衡的二叉查找树，它可以基于二分查找的方式，进行元素的查找，提高查找搜索性能，这对于较长的链表来说是一个明显的性能提升;
        当红黑树中的节点数量减少到6个或更少时，红黑树将转换回链表;

源码分析：

3.关键计算:计算key-value键值对在哈希表中的存储位置(桶)

哈希运算，计算新的哈希值,hash( )扰动函数 (h = key.hashCode()) ^ (h >>> 16)

目的：计算新的哈希值，降低哈希冲突概率
通过新哈希值，计算下标位置(桶位置) ,(n - 1) & hash

4.转换成红黑树的条件：链表的元素个数超过8，并且数组长度大于等于64

5.转换成红黑树的优点：

链表过长，会导致搜索效率降低，使用红黑树提高查找效率；
红黑树，是一颗自平衡的二叉查找树，树中所有节点均自动排序，并且自平衡，可以使用二分查找，提高查找效率。

6.影响性能的关键参数:

①数组容量:默认为16

容量越大，内存占用越多，产生冲突的概率越小
必须为2的N次幂
每次按照2倍进行扩容，最大容量不超过2的30次幂

②加载因子:默认为0.75

加载因子越高，代表利用率越高，产生冲突的概率越高
加载因子越低，代表利用率越低，产生冲突的概率越低

5.扩容条件：

默认情况下，数组长度为16（自定义时，必须保证数组长度为2^n 次幂）
默认情况下，数组长度为16（自定义时，必须保证数组长度为2^n 次幂）
达到扩容阈值threshold，按照2倍进行扩容
链表长度大于8，数组长度小于64，链表不会转换成红黑树，执行数组扩容

LinkedHashMap

1.特点：有序

2.数据结构：HashMap的子类，多维护了一条双向链表，保存顺序

TreeMap

1.特点：自动按照key排序

2.数据结构：红黑树

(2).线程安全

Hashtable

1.特点:无序、key和value不允许为null

2.数据结构:数组+链表

3. 线程安全:通过“synchronized”同步锁实现

ConcurrentHashMap

1.特点：无序

2.数据结构：数组+链表+红黑树

3.线程安全：synchronized同步锁 + CAS无锁化编程模型

二、Collections工具类

封装了集合的常见算法和操作

三、常见的面试题

1.HashMap . LinkedHashMap .TreeMap的区别?

HashMap :无序，基于数组+链表+红黑树实现;
LinkedHashMap:有序，HashMap的子类;
TreeMap :自动排序，按照key或者自定义Comparator比较器，进行排序;

2.HashMap和 Hashtable的区别?

HashMap和 Hashtable都是Map接口的键值对集合实现类，它们的区别主要包括:

线程安全: HashMap是非线程安全的，而 HashTable线程安全;
执行效率:由于 HashTable使用synchronized同步锁实现线程安全所,以 HashTable效率要比HashMap略低;
使用Nu11做key和value :

HashMap:可以使用null 作为key 和value;

HashTable:不允许有null键和null值，否则会抛出NullPointerException异常;
数据结构:HashMap:数组+链表+红黑树;HashTable:数组+链表;
扩容方式:

HashMap : 默认的初始化大小为16。之后每次扩充，容量变为原来的 2倍;
HashTable:默认的初始大小为11，之后每次扩充，容量变为原来的 2n+1 ;

3.HashMap的数据结构是什么?

①数组(哈希表):
HashMap内部定义了一个数组，数组中的每个位置被称为“桶”( Bucket )，这是HashMap的基础结构【哈希表】
        下标位置:当添加一个新的key-value键值对时，会根据key的 hashcode()，通过哈希函数计算出一个新的哈希值 h
ash，并通过这个hash值，计算key-value键值对在数组中的下标位置(桶Bucket ) ;
        数组容量:在添加第一个key-value键值对时，数组容量被初始化为 16，并且可以根据key-value 键值对的数量和负载因子，数组会自动按照2倍进行扩容;
②链表:
        数组的每个位置（ Bucket桶)可以保存一个或多个key-value键值对;
        当两个或更多的 key-value键值对，被映射保存到数组的同一个位置(桶Bucket）时，就产生了哈希表冲突;
        HashMap使用链地址法，解决哈希冲突，这些键值对将以链表的形式存储在产生冲突的位置(桶Bucket ) ;
③红黑树:
        为了优化链表的查询性能，当链表长度超过一个阈值（默认是8）并且数组的容量大于等于64时，链表会转换成红黑树;
        红黑树是一种自平衡的二叉查找树，它可以基于二分查找的方式，进行元素的查找，提高查找搜索性能，这对于较长的链表来说是一个明显的性能提升;
       当红黑树中的节点数量减少到6个或更少时，红黑树将转换回链表;

4.HashMap中put( )的执行过程?

①计算哈希码:
。向Hashwlap中添加一个新的 key-value键值对时，首先会调用key键的hashcode()方法来计算一个hash哈希值。(这个哈希值将被用于计算key-value键值对，在数组中保存时的下标位置)
②计算数组下标:
。计算完hash哈希值后，HashNap会通过数组长度n，按照(n-1)& hash 的方式，将哈希值转化为数组下标;。(n-1) & hash的作用等同于hash % n，位运算比算术运算的效率高;
③处理哈蒂冲突:
。如果不同key按照各自不同的hash哈希值，计算的数组下标位置相同，这种情况称为哈希表冲突;
。HashMap使用链地址法来处理哈希表冲突，在数组的每个位置存放一个链表或红黑树（当链表长度达到一定阈值时会转换为红黑树)。因此，新的键值对会被添加到当前位置的链表或红黑树中;
④检查键是否已存在:
。在将键值对放入对应位置之前，HashMap会检查该位置是否存在与新键相等的对象;
。会调用equals()方法来比较键之间的相等性。如果找到相同的键，那么旧的值将被新值替换，返回旧值;否则，新键值对将被添加;
⑤插入新节点:
。如果没有找到相等的键，新键值对将被插入到该位置的链表头部或红黑树中;
。当链表长度达到8且数组容量大于64时，链表会转化为红黑树，用来优化查找性能;
⑥检查容量和扩容:
。每次插入新键值对后，HashNap会检查当前元素数量是否超过了它的扩容阈值（容量乘以加载因子(默认为0.75 ) ) ;。如果超过了扩容阈值，HashMap会按照2倍进行扩容;
⑦返回旧值:
。如果在插入过程中发现键已经存在，put()方法会返回旧的值;。如果键不存在，插入了一个新键值对，put()方法将返回null ;

5.HashMap如何计算key-value键值对元素在数组中的存储位置?

·为了使key-value元素可以均匀散列的保存在(Hashlap的数组中，所以使用key的哈希值进行哈希扰动计算出一个新的 hash值。
·在JDK 1.8版本以前,Hashwap会将这个hash值与数组长度进行%模运算出一个下标值，从而确定key-value在数组中的存储位置;
。例如:数组长度默认为16，12580 % 16 = 4，753951 % 16 = 15。所以哈希值为12580 、 753951的键值对，会存储在数组下标为4和3的位置。
·在JDK 1.8版本以后，由于“%”模运算性能消耗比较大，所以采用(长度– 1) & hash的位运算方式来计算存储位置;
。例如:数组长度默认为16，(16 - 1) & 12580=4,(16 - 1) & 753951。所以哈希值为12580 、 753951的键值对，会继续存储在数组下标为4和3的位置。

6.什么是哈希冲突?

·哈希冲突是在使用哈希函数或哈希表时遇到的一种特殊情况;
·如果发生在哈希函数，哈希冲突是指当发生在两个不同的输入值，经过哈希函数处理后产生了相同的哈希值;
·如果发生在哈希表，哈希冲突是由于哈希表的大小是有限的，而输入的数据集合可能是无限的，因此，当不同的输入数据映射到哈希表的同一个位置时，就会出现哈希冲突;

7.如何解决哈希冲突?

处理哈希冲突的方法主要有以下几种:
1，开放寻址法（open Addressing )∶当哈希冲突发生时，使用某种探测技术在哈希表中寻找下一个空位来存储数据。
2，链地址法（chaining )∶每个哈希表的槽位都维护一个链表。当哈希冲突发生时，所有哈希值相同的元素都被存储在同一个位置
对应的链表中。这种方法也称为拉链法。
3，再哈希法（Rehashing )∶当哈希冲突发生时，使用第二个哈希函数再次计算哈希值，直到找到空槽位。这种方法会增加计算复
杂度，但可以减少哈希表的装载因子，从而提高查找效率。
4，建立一个公共溢出区︰将哈希表分为基本表和溢出表两部分。所有哈希地址不冲突的元素都存放在基本表中，所有哈希地址冲突的元
素都存放在溢出表中。

8.HashMap如何解决哈希冲突?

HashMap使用链地址法来处理哈希表冲突，当产生哈希冲突时，HashMap会将产生冲突的Key-value键值对，通过一个链表保存在数组产生冲突的位置中;

9.HashMap的长度为什么是2的幂次方(2的倍数)?

HashMap为什么按照2倍进行扩容?
因为必须保持HashMap的的容量为2的幂次方
。降低哈希冲突概率:
。当HashMap中的数组长度为②的幂次方，不同的key计算得到 index相同的几率较小，不容易产生冲突;
·提高计算效率:
HashMap中使用哈希表保存时，索引计算公式为i = (n - 1) & hash 。
。如果n为②的幂次方，那么n-1的低位全是1，那么使用hash哈希值进行&与操作时，可以保证低位的值不变的情况下，高位更多的参与运算，从而保证分布均匀散列;
。同时，(n - 1) & hash效果等同于 hash % n，但是&与运算属于位运算，效率比“%”模运算性能要高;

10.HashMap影响性能的两个参数?

·构建HashMap实例时有两个重要的参数会影响其性能:初始容量和加载因子
·初始容量:用来规定哈希表数组的容量长度，默认为16，因为16是②的幂次方的原因，所以在小数据量的情况下，能减少哈希冲突，提高性能。如果存储大容量数据的时候，最好预先判断数据量，按照②的幂次方，提前预设初始容量;
·加载因子:用来表示哈希表中元素的填满程度，默认为 0.75，越大则表示允许填满的元素就越多，哈希表的空间利用率就越高，但是冲突的机会增加。反之，越小则冲突的机会就会越少，但是空间很多就浪费。
。所以，在设置初始容量时，应该考虑到初始容量及其加载因子，预估设置初始容量，最大限度降低扩容操作频率。

11.HashMap的扩容机制?

HashMap的用来进行扩容的方法是resize()方法;HashMap在以下三种场景下，会触发扩容机制:
1.当Hashwap通过无参构造方法创建，在第一次调用put()方法添加key-value键值对时，数组初始化为16 ;

2当Hashwap 中的元素个数超过扩容阈值 threshold时，数组的容量按照原容量的②倍进行扩容:
·扩容阈值threshold=数组容量×加载因子LoadFactor ;
·加载因子LoadFactor的默认值为 0.75，数组容量默认为16，扩容阈值 threshold默认为12 ( 16 × 0.75 =12 ) ;所以，当Hashwap中元素个数超过12时，数组的容量按照原容量的②倍进行扩容(（ 16 x 2 = 32 );

3.加入元素时，如果链表长度大于阈值（默认为8）并且数组长度小于64，会产生数组扩容;

13.HashMap为什么使用链表?

·Hashwap使用哈希表作为基础数据结构，当两个不同的 key-value键值对，通过 hash哈希值计算数组下标，出现相同下标情况时，产生哈希冲突;
. Hashtap使用“链地址法”解决哈希冲突，所以需要使用链表，来保存产生哈希冲突的 key-value键值对;

14.HashMap为什么使用红黑树?

. HashMap中的链表长度增长到一定长度，会导致搜索性能下降;(链表是线性方式搜索)
·所以，Hashap会在链表过长时，将链表转换为红黑树，通过红黑树提供搜索性能;(红黑树是二分查找方式搜索)
.Hashap不直接用红黑树的原因是:链表简单易于维护，红黑树维护复杂。所以首选使用链表，只有链表长度过长时，才会转换成红黑树来提高搜索查找的性能;

15.红黑树有哪些特点?

HashMap中的红黑树
红黑树是一种自平衡二叉查找树:
。二叉查找树:树中的所有节点满足排序规则（left < root < right )，可以基于二分查找进行搜索;
·自平衡:保持左右子树的平衡，保持搜索性能。不会出现退化成链表的极端情况(所有子节点都保存在左子树或右子树);·所以，HashMap使用红黑树来优化长链表;

16. HashMap链表转换红黑树的条件?

在HashNap 中，当链表转换为红黑树，需要同时满足两个条件︰链表长度大于等于8，并且数组容量大于等于64 ;
1，链表长度:当链表的长度大于等于⑧时(有8个或更多的元素在(HashNap的同一个桶（ bucket）中形成链表)，这是因为
在链表长度较小的情况下，链表的线性查找效率还可以接受，但是一旦当链表长度较长时，必须通过将链表转换成红黑树这种方式,才能够提供更好的查找性能。
2，数组容量︰在链表达到阈值8时，同时还要检查 HashNap的底层数组（哈希表)的容量大于等于64。因为Hashwap不会轻
易使用红黑树，虽然红黑树的搜索性能比链表好，但是维护更复杂。只有在链表足够长，只有红黑树才能带来明显性能提升时，才会进行转换。
。所以，如果数组容量小于64，即使链表长度超过8，也不会立即进行红黑树的转换，而是先进行数组的扩容，将HashMa中的所有元素重新散列保存，用来降低链表的长度。(优先使用链表)

17.HashMap红黑树退化成链表的条件?