1. 看hashmap 源码,有个问题,key 存放是 先hash 再与hash值的高16位值 进行异或运算。再与槽位size() 求模取余。如果多个不同的key 得出de数组位置相同。则采用链表依次存储。
2. 那么除了拉链法还有什么其他解决hash冲突的方法呢?
a. 建立公共溢出区:
chatgpt3.5 answer:
建立公共溢出区是一种处理哈希冲突的方法,它将所有哈希冲突的元素都放置在同一个溢出区中。这种方法可以简化哈希表的实现,但在查找和插入时需要额外的逻辑操作。
下面是建立公共溢出区的详细介绍:
初始化哈希表和公共溢出区:首先,初始化一个固定大小的哈希表和一个公共溢出区,用于存放所有哈希冲突的元素。
哈希函数计算位置:当要插入一个元素时,通过哈希函数计算该元素应该存放的位置。
检查位置:检查计算出的位置是否已经被其他元素占据。
处理冲突:
- 如果位置为空,则直接将元素插入该位置。
- 如果位置已被占据:将新元素添加到公共溢出区中。
查找元素:当查找元素时,先在哈希表中查找,如果未找到,则再在公共溢出区中查找。
动态调整:随着元素的插入和删除,公共溢出区的大小可能需要动态调整,以保持合理的性能。
使用公共溢出区的优点是简化了哈希表的实现,所有哈希冲突的元素都集中在一个地方,管理起来相对容易。然而,由于所有冲突元素都放在同一个区域,可能会导致这个区域的负载过重,影响查找和插入的效率,因此在设计时需要考虑如何平衡元素的分布。
总的来说,建立公共溢出区是一种处理哈希冲突的方法,适用于一些简单的应用场景,但在高负载情况下可能需要额外的优化和调整。
b. rehash():
同时构造多个不同的哈希函数,等发生哈希冲突时就使用第二个、第三个……等其他的哈希函数计算地址,直到不发生冲突为止。虽然不易发生聚集,但是增加了计算时间
c. 链式地址法:
hashMap 采用的就是此种,拉链法:数组中,每个位置都存储一个链表。hash相同,则依次存入链表内
d. 开放地址法:
当哈希表中出现哈希冲突时,开放寻址法是一种解决冲突的方法。它的主要思想是在发生冲突时,顺序地探查哈希表中的下一个位置,直到找到一个空闲的位置或者探查完整个哈希表。
开放寻址法通常有以下几种方式:
线性探测(Linear Probing):当发生哈希冲突时,顺序地检查下一个位置,直到找到一个空闲位置或者探查到了整个哈希表。新的元素会被插入到第一个空闲位置。
二次探测(Quadratic Probing):根据一个固定的增量序列来探测下一个位置,而不是简单地逐个检查。例如,第一次探测的增量是1,第二次是4,第三次是9,依此类推。
双重散列(Double Hashing):使用第二个哈希函数来计算探测的步长,而不是使用固定的增量序列。这样可以避免产生线性探测中的“聚集”现象。
无论使用哪种探测方法,开放寻址法都需要考虑以下问题:
删除操作:在开放寻址法中删除元素时,不能简单地将对应的位置标记为空,因为这可能会影响后续查找其他元素的过程。一种解决方法是使用特殊的标记来表示该位置曾经存储过元素。
装载因子:开放寻址法的装载因子(已占用位置数与总位置数的比值)不能太大,否则会导致探查时间过长。通常情况下,需要及时进行扩容操作来保持合理的装载因子。
开放寻址法相对于链地址法的优势在于内存访问更加连续,从而可以更好地利用 CPU 缓存,但它也需要更多的空间来解决哈希冲突。选择合适的哈希冲突解决方法取决于具体的应用场景和需求。