哈希表(hash_table)的原理

news2025/1/9 17:12:59

一、hash_table的介绍

hash_table可提供对任何键值对的存取和删除操作。由于操作对象是键值对,所以hash table也可被视为一种字典结构(dictionary)。这种结构的用意在于提供常数时间的基本操作,就像stack或queue那样。乍听之下这几乎是不可能的任务,因为约束制条件如此之少,而随着元素个数增加,搜寻操作必定耗费更多时间。

二、问题

举个例子,这里有一些元素,都是16-bits且不带正负号的整数,范围0-65535,如何存储这些整数,并快速的查找呢?
我们用一个array就可以满足上述期望。 首先配置一个array A,它拥有65536个元素,索引号码0-65535,初值全部为0,如下图5-21,每一个元素值代表相应元素的出现次数。如果插入元素i,我们就执行A[i]++,如果删除元素i,我们就执行A[i]--,如果搜寻元素i,我们就检查A[i]是否为0。以上的每一个操作都是常数时间.这种解法的额外负担的是array的空间和初始化时间。

三、分析

这个解法存在两个问题:

第一,如果元素是32-bits,而非16-bits,我们所准备的array A的大小就必须是2的32次方=4GB,这就大得不切实际了。

第二,如果元素型态是字符串而非整数,将无法被拿来作为array的索引。

第二个问题不难解决。就像数值1234是由阿拉伯数字1,2,3,4构成一样,字符串"jhou”是由字符·j',‘j',h','o,'u'构成。那么,既然数值1234是1*103+2*102+3*101+4*10°,我们也可以把字符编码,每个字符以一个7-bits数值来表示(也就是ASCII编码),从而将字符串"jjhou·表现为:
'j*128+·j1*1283+"h'*1282+"0'*1281+·u'*1280。于是先前的array实现法就可适用于“元素型别为字符串”的情况了。但这并不实用,因为这会产生出非常巨大的数值."jhou·的案引值将是:
106*1284+106*1283+104*1282+111*1282+117*128°=28678174709。这太不切合实际了。更长的字符串会导致更大的索引值!

这就回归到第一个问题:array的大小。如何避免使用一个大得荒谬的array呢?办法之一就是使用某种映射函数,将大数映射为小数。负责将某一元素映射为一个“大小可接受之索引”,这样的函数称为hash function(散列函数)

例如,假设X是任意整数,Tablesize是array大小,则X%Tablesize会得到一个整数,范围在0-Tablesize-1之间,正好作为表格(也就是array)的索引,使用散列函数会带来一个问题:可能有不同的元素被映射到相同的位置(即有相同的索引)。这无法避免,因为元素个数大于array容量,这便是所谓的“碰撞(collision)”问题。解决碰撞问题的方法有许多种,包括线性探测(linear probing)、二次探测(quadratic probing)、开链(separate chaining)…等做法。

四、线性探测(linear probing)

当hash function计算出某个元素的插人位置,而该位置上的空间已不再可用时,我们应该怎么办?

最简单的办法依次向后探测,直到寻找到下一个空位置为止。(如果到达尾端,就绕到头部继续寻找)。只要表格(亦即array)足够大,总是能够找到一个安身立命的空间,但是要花多少时间就很难说了,进行元素搜寻操作时,道理也相同,如果hash function计算出来的位置上的元素值与我们的搜寻目标不符,就循序往下一一寻找,直到找到吻合者,或直到遇上空格元素。

 五、二次探测(quadratic probing)

二次探测法是指采用前后跳跃方式探测的方法,发生冲突时,向后 1 位探测,向前 1 位探测,向后 4 位探测,向前 4 位探测......以跳跃式探测,避免堆积。

二次探测的增量序列为 d=1,-1,4,-4,9,-9,16,-16,,,

若当前扫描的元素的地址已经有元素了,那么,当前元素就保存在该地址的后移偏量。

举个例子:有数组{47, 7, 29, 11, 16, 92, 22, 8, 3} ,接下来我们将所有元素对11取余,如下图所示。

 首先创建一个散列表,现在根据取余的值将元素放入散列表,如下图所示。

 其中47,7,11,16,92这些元素是根据取余的值直接放入散列表的。而29取余的值为7,7的位置上已经有元素了,那么我们放在7+1^2的位置上。3取余的值是3,3的位置上也已经有元素了,那么我们看3+1^2上也有元素,再看3-1^2的位置上没有元素,那么我们现在就放在这里。那么其他元素也是一样的道理。

 六、开链(separate chaining)

另一种与二次探测法分庭抗礼的,是所谓的开链(separate chaining)法。这种做法是在每一个表格元素中维护一个list。散列函数为我们分配某一个list,然后我们在那个list身上执行元素的插入,搜寻、删除等操作.虽然针对list而进行的搜寻只能是一种线性操作,但如果list够短,速度还是够快的

 

 

参考:

ixaC++ STL中哈希表 hash_map从头到尾详细介绍_yousss的博客-CSDN博客_std::hash_maph

线性探测-闭散列_小羊教你来编程的博客-CSDN博客_线性探测

开放地址法哈希实现——二次探测法_chengqiuming的博客-CSDN博客_二次探测法

【干货】C++哈希桶(开链法解决哈希冲突)类的实现_weixin_34206899的博客-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/11478.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot中使用Redis实现分布式锁

文章目录一。Redis实现分布式锁原理二。代码实现Redis分布式锁一。Redis实现分布式锁原理 以下内容为转载部分,主要介绍Redis实现分布式锁的背景: 转载博客:https://blog.csdn.net/fuzhongmin05/article/details/119251590 为什么需要分布式…

[附源码]计算机毕业设计JAVA高校创新创业项目管理系统

[附源码]计算机毕业设计JAVA高校创新创业项目管理系统 项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM…

数字化转型重塑企业竞争优势,SaaS电商系统助力锂电池行业实现降本增效

作为我国核心基础工业的关键材料之一,锂电池在汽车、医疗器械、航天航空、消费类电子产品等领域均可发挥重要作用。近年来,随着新能源汽车的快速发展有力带动了锂电池行业的市场需求,锂电池已成为化学电源应用领域中最具竞争力的电池&#xf…

Vue | Vue.js 实现过渡动画

🖥️ Vue .js专栏:Vue .js 实现过渡动画 🧑‍💼 个人简介:一个不甘平庸的平凡人🍬 ✨ 个人主页:CoderHing的个人主页 🍀 格言: ☀️ 路漫漫其修远兮,吾将上下而求索☀️ &#x1f44…

基于51单片机的智能路灯控制系统proteus仿真原理图PCB

功能: 0.本系统采用STC89C52作为单片机 1.LCD1602液晶实时显示当前时间/环境光强/工作模式 2.支持路灯故障检测 3.工作时间内(17~24时),两个路灯同时点亮,24时以后,B路灯关闭,若检测到由物体通过,路灯B点亮…

R17 redcap

微信同步更新欢迎关注同名modem协议笔记 在5G时代,某些场景的终端并不需要特别复杂,只要满足成本低,功耗小,尺寸小等要求即可,例如视频监控,可穿戴设备,工业无线传感器等,redcap就是…

electron vue 模仿qq登录界面

1、使用vuecli创建vue项目 我用的vue2 vue create qq_test2、安装electron npm install electron -g //or npm install electron12.0.11 //老版本3、vue项目安装Electron-builder打包工具 版本我选择的是12 vue add electron-builder4、在vue项目的src下有个background.…

收藏|多指标时序预测方式及时序特征工程总结

背景 现如今,随着企业业务系统越来越复杂,单指标时间序列预测已不能满足大部分企业需求。在复杂的系统内,如果采用单一的指标进行时间序列预测,由于各个指标相互作用的关系,因此会因为漏掉部分指标因素导致出现预测精…

进程间的通信 - 剪切板

剪切板是系统维护管理的一块内存区域,本机的所有进程都可以访问。当一个进程复制数据时,先将数据放在该内存区,当另一个进程粘贴时,则是从该内存区块取出数据 剪切板操作: 其实在剪切板中也就那几个API在使用&#x…

tf模型落地安卓之旧事重提

之前将tf模型落地安卓了,其实就是clone一下官方的代码,然后配置下环境就打包了,没啥技术含量,现在再看,问题就在环境配置了。 1,Unable to start the daemon process. Q Group 277356808 The project use…

西安某1000M3浮顶油罐设计(成品油库1000m³油罐设计与制造工艺)

目 录 1 浮顶油罐及其发展概况 2 2 设计方案 3 2.1 各种设计方法 3 2.2 各种方法优缺点比较 3 2.3 油罐的基础 4 3 罐壁设计 5 3.1 罐壁的强度计算 5 3.2 浮顶油罐的风力稳定计算 6 3.3 浮顶油罐的抗震计算 9 3.4 罐壁结构 14 4 罐底设计 18 4.1 罐底结构设计 18 4.2 罐底的应…

【离散数学】第三章 测试

1.单选题 A&#xff1d;{1,2,3},A上关系R{<1,2>,<2,2>,<2,3>,<3,3>}&#xff0c;则t(R) A. {<1,2>,<2,2>,<2,3>,<3,3>} B. {<1,2>,<1,3>,<2,2>,<2,3>,<3,3>} C. {<1,1>,<2,2>,<…

【面试宝典】Spring Boot 系列面试题

1、什么是 Spring Boot? 多年来&#xff0c;随着新功能的增加&#xff0c;spring 变得越来越复杂。如果必须启动一个新的 Spring 项目&#xff0c;我们必须添 加构建路径或添加 Maven 依赖关系&#xff0c;配置应用程序服务器&#xff0c;添加 spring 配置。 因此&#xff0c…

Vue(九)——页面路由(1)

目录 路由的简介 路由基本使用 几个注意点 嵌套&#xff08;多级&#xff09;路由 路由的query参数 命名路由 路由的params参数 路由的props配置 路由的简介 理解&#xff1a; 一个路由&#xff08;route&#xff09;就是一组映射关系&#xff08;key - value&#xff…

【毕业设计】深度学习身份证识别系统 - 机器视觉 python

文章目录0 前言1 实现方法1.1 原理1.1.1 字符定位1.1.2 字符识别1.1.3 深度学习算法介绍1.1.4 模型选择2 算法流程3 部分关键代码4 效果展示5 最后0 前言 &#x1f525; Hi&#xff0c;大家好&#xff0c;这里是丹成学长的毕设系列文章&#xff01; &#x1f525; 对毕设有任…

第八章: 项目质量管理

一、规划质量管理 识别项目及其可交付成果的质量要求和标准&#xff0c;并书面描述项目将如何证明符合质量要求和标准的过程。主要作用为整个项目期间如何管理和核实质量提供指南和方向。 输入工具与技术输出 1.项目章程 2.项目管理计划 需求管理计划风险管理计划相关方参与计…

C++ opencv图像直方图

1.图像直方图概念 图像有很多基础概念&#xff0c;在我们学习的过程中因为一些原因无法涉及&#xff0c;但这并不代表它们不重要 今天&#xff0c;我们就来介绍一个概念——图像直方图 图像直方图&#xff0c;是图像处理中很重要的一个基础概念&#xff0c; 有很多的算法&…

用HTML+CSS做一个漂亮简单的旅游网站——旅游网页设计与实现(6页)HTML+CSS+JavaScript

&#x1f468;‍&#x1f393;学生HTML静态网页基础水平制作&#x1f469;‍&#x1f393;&#xff0c;页面排版干净简洁。使用HTMLCSS页面布局设计,web大学生网页设计作业源码&#xff0c;这是一个不错的旅游网页制作&#xff0c;画面精明&#xff0c;排版整洁&#xff0c;内容…

(八)Java算法:堆排序(详细图解)

目录一、前言1.1、概念1.2、大根堆特点二、maven依赖三、流程解析3.1、初始建堆3.2、堆化第一步3.2、堆化第二步3.3、堆化第三步3.4、堆化第四步3.5、堆化第五步3.6、堆化第六步四、编码实现4.1、代码实现4.2、运行结果&#xff1a;扩展一、前言 1.1、概念 根据堆的结构可以分…

彩印图文版《Elasticsearch实战》文档,阿里内部共享,堪称精品

学习是一种基础性的能力。然而&#xff0c;“吾生也有涯&#xff0c;而知也无涯。”&#xff0c;如果学习不注意方法&#xff0c;则会“以有涯随无涯&#xff0c;殆矣”。 学习就像吃饭睡觉一样&#xff0c;是人的一种本能&#xff0c;人人都有学习的能力。我们在刚出生的时候…