哈希与哈希表

news2026/2/14 17:53:29

哈希表的概念

哈希表又名散列表，官话一点讲就是：

散列表（Hash table，也叫哈希表），是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。
给定表M，存在函数f(key)，对任意给定的关键字值key，代入函数后若能得到包含该关键字的记录在表中的地址，则称表M为哈希（Hash）表，函数f(key)为哈希(Hash) 函数。

—— 摘自百度百科

那么通俗一点讲，哈希表就是一张映射表，通过哈希映射，将关键字映射到哈希表中，使得关键字与哈希值具有一一对应的关系。

这样我们就可以直接通过找到

哈希函数

哈希函数的一个关键就是通过哈希方法来得到一个映射值，理论上关键字与映射值一一对应。一般来说，哈希方法大致有如下这些：

直接定址法
取关键字的某个线性函数为散列地址：Hash（Key）= A*Key + B
优点：简单、均匀
缺点：需要事先知道关键字的分布情况
使用场景：适合查找比较小且连续的情况
除留余数法
设散列表中允许的地址数为m，取一个不大于m，但最接近或者等于m的质数p作为除数，按照哈希函数：Hash(key) = key% p(p<=m)，将关键码转换成哈希地址
平方取中法
假设关键字为1234，对它平方就是1522756，抽取中间的3位227作为哈希地址；
再比如关键字为4321，对它平方就是18671041，抽取中间的3位671(或710)作为哈希地址平方取中法比较适合：不知道关键字的分布，而位数又不是很大的情况
折叠法
折叠法是将关键字从左到右分割成位数相等的几部分(最后一部分位数可以短些)，然后将这几部分叠加求和，并按散列表表长，取后几位作为散列地址。
折叠法适合事先不需要知道关键字的分布，适合关键字位数比较多的情况
随机数法
选择一个随机函数，取一个随机值作为关键字的哈希值，即H(key) = random(key)，其中random为随机数函数(伪代码)。通常应用于关键字长度不等时采用此法
数学分析法
设有n个d位数，每一位可能有r种不同的符号，这r种不同的符号在各位上出现的频率不一定相同，可能在某些位上分布比较均匀，每种符号出现的机会均等，在某些位上分布不均匀只有某几种符号经常出现。可根据散列表的大小，选择其中各种符号分布均匀的若干位作为散列地址。

其中，直接定址法、除留余数法是两种较为常用的哈希方法。而直接定址法有非常多的实现方式比如：各种字符串Hash函数 - clq - 博客园 (cnblogs.com)，所以哈希表的大体思路很好理解，但具体实现上却大有讲究。

哈希冲突及其解决方案

不管是哪种哈希方法，随着数据量的增大，必然会造成哈希冲突。哈希冲突就是多个关键字映射的是同一个哈希值的情况。一般来说，解决哈希冲突通常有两种方式：闭散列和开散列。

闭散列 - 开放定址法

简单来说，如果当前哈希映射值对应的位置已经有数据了，就产生了哈希冲突。开放定址法的做法是，再找一个映射位置。常用的有线性探测和二次探测两种方式：

线性探测法：$F(i) = 1, 2, 3, ..., m - 1$。

二次探测法：$F(i) = 1^2, -1^2, 2^2, -2^2, ..., \pm n^2(n \le m / 2)$。

简单来说就是，线性探测在发生哈希冲突之后，线性地向后寻找，直到找到一个空位为止。二次探测是指，第一个在哈希值上加上一个1的平方，如果发生哈希冲突，第二次就减去一个1的平方，第三次加上2的平方，第四次……这样以此类推。那么查找时也是按照对应的探测方式进行查找的。

开散列 - 链地址法(开链法)

而开散列则相对更容易接受一些。开散列又称连地址法，是指的每个哈希表中存放的数据不再是一个单纯的数据，而是一个链表，所有映射值相同的关键字都被这个链表所链起来，就像下面这样：

注意事项与总结

哈希表的两个核心内容在于哈希函数与哈希冲突的解决。哈希函数大致有如下这几类：直接定址法、除留余数法、平方取中法、基数转换法、数字分析法、折叠法、随机数法、乘积法、点积法等。哈希冲突的解决常用的有开放地址法和链地址法。
在哈希表的具体实现中，因为扩容操作会改变哈希的映射关系，所以扩容时每一个元素都需要重新插入。
在具体实现时，可以通过负载因子（有效值与最大容量的比值）来控制扩容的时机。
哈希与哈希表的区别是，哈希是一种思想，哈希表是哈希这种思想的一种实现方式，其它的还有比如位图、布隆过滤器等也是哈希思想的一种体现。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1284554.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！