hash冲突四种解决办法，hash冲突除了拉链法还有什么？

news2026/2/16 4:08:17

1. 看hashmap 源码，有个问题，key 存放是先hash 再与hash值的高16位值进行异或运算。再与槽位size() 求模取余。如果多个不同的key 得出de数组位置相同。则采用链表依次存储。

2. 那么除了拉链法还有什么其他解决hash冲突的方法呢？

a. 建立公共溢出区：

chatgpt3.5 answer:

建立公共溢出区是一种处理哈希冲突的方法，它将所有哈希冲突的元素都放置在同一个溢出区中。这种方法可以简化哈希表的实现，但在查找和插入时需要额外的逻辑操作。

下面是建立公共溢出区的详细介绍：

初始化哈希表和公共溢出区：首先，初始化一个固定大小的哈希表和一个公共溢出区，用于存放所有哈希冲突的元素。

哈希函数计算位置：当要插入一个元素时，通过哈希函数计算该元素应该存放的位置。

检查位置：检查计算出的位置是否已经被其他元素占据。

处理冲突：

如果位置为空，则直接将元素插入该位置。
如果位置已被占据：将新元素添加到公共溢出区中。

查找元素：当查找元素时，先在哈希表中查找，如果未找到，则再在公共溢出区中查找。

动态调整：随着元素的插入和删除，公共溢出区的大小可能需要动态调整，以保持合理的性能。

使用公共溢出区的优点是简化了哈希表的实现，所有哈希冲突的元素都集中在一个地方，管理起来相对容易。然而，由于所有冲突元素都放在同一个区域，可能会导致这个区域的负载过重，影响查找和插入的效率，因此在设计时需要考虑如何平衡元素的分布。

总的来说，建立公共溢出区是一种处理哈希冲突的方法，适用于一些简单的应用场景，但在高负载情况下可能需要额外的优化和调整。

b. rehash()：

同时构造多个不同的哈希函数，等发生哈希冲突时就使用第二个、第三个……等其他的哈希函数计算地址，直到不发生冲突为止。虽然不易发生聚集，但是增加了计算时间

c. 链式地址法：

hashMap 采用的就是此种，拉链法：数组中，每个位置都存储一个链表。hash相同，则依次存入链表内

d. 开放地址法：

当哈希表中出现哈希冲突时，开放寻址法是一种解决冲突的方法。它的主要思想是在发生冲突时，顺序地探查哈希表中的下一个位置，直到找到一个空闲的位置或者探查完整个哈希表。

开放寻址法通常有以下几种方式：

线性探测（Linear Probing）：当发生哈希冲突时，顺序地检查下一个位置，直到找到一个空闲位置或者探查到了整个哈希表。新的元素会被插入到第一个空闲位置。

二次探测（Quadratic Probing）：根据一个固定的增量序列来探测下一个位置，而不是简单地逐个检查。例如，第一次探测的增量是1，第二次是4，第三次是9，依此类推。

双重散列（Double Hashing）：使用第二个哈希函数来计算探测的步长，而不是使用固定的增量序列。这样可以避免产生线性探测中的“聚集”现象。

无论使用哪种探测方法，开放寻址法都需要考虑以下问题：

删除操作：在开放寻址法中删除元素时，不能简单地将对应的位置标记为空，因为这可能会影响后续查找其他元素的过程。一种解决方法是使用特殊的标记来表示该位置曾经存储过元素。

装载因子：开放寻址法的装载因子（已占用位置数与总位置数的比值）不能太大，否则会导致探查时间过长。通常情况下，需要及时进行扩容操作来保持合理的装载因子。

开放寻址法相对于链地址法的优势在于内存访问更加连续，从而可以更好地利用 CPU 缓存，但它也需要更多的空间来解决哈希冲突。选择合适的哈希冲突解决方法取决于具体的应用场景和需求。