hashtable的结构和扩容机制

news2024/12/30 2:46:30

结构

最外层封装了dictht,结构如下
在这里插入图片描述
table指向了实际存储的hash结构dictEntry。size是哈希表大小,也就是说dictEntry有多少空间。sizemask是掩码,为固定值size-1,然后元素的index就应该是元素哈希值&sizemask。used代表dictEntry里面多少个坑位已经被用上了。假设index冲突了,用拉链法(头插,避免尾插法遍历到尾巴这一O(n)的时间开销)解决。

扩容机制

触发扩容机制有两种情况,一种是负载因子>=1且没有在执行BGSAVE或BGREWRITEAOF命令,另一种是负载因子>=5。负载因子就是used/size
分别说明如下:

  • 负载因子>=1,说明此时基本dictEntry上每个坑位都有一个链表了,查找时候时间复杂度达不到O(1)了,假设没在执行BGSAVE或者BGREWRITEAOF就进行扩容。因为扩容是主进程推进的,这俩机制会创建子进程,假设此时扩容,相当于主进程在写入,子进程还在复制,内存开销很大
  • 负载因子>=5,那此时哈希表已经不堪重负了,无论如何顶着压力也得扩容。

那么具体扩容机制是啥呢?其实是叫做渐进扩容,就是不是说一口气把旧表迁移过去新表,这样数据多的话会阻塞。实际的思想是一种顺带着做的感觉,就是每次增删改查哈希表时候顺带着迁移一下(注意,这里意思是,步骤3hashtable里有[a, b, c, d]我可能rehashindex是0,那我此时要迁移的是a,时机是我要增删改查一个元素(可能是b或者c都有可能)了)。
以下是哈希表渐进式 rehash 的详细步骤:

  1. 为 ht[1] 分配空间, 让字典同时持有 ht[0] 和 ht[1] 两个哈希表。
  2. 在字典中维持一个索引计数器变量 rehashidx , 并将它的值设置为 0 , 表示 rehash 工作正式开始。
  3. 在 rehash 进行期间, 每次对字典执行添加、删除、查找或者更新操作时, 程序除了执行指定的操作以外, 还会顺带将 ht[0] 哈希表在 rehashidx 索引上的所有键值对 rehash 到 ht[1] , 当 rehash 工作完成之后, 程序将 rehashidx 属性的值增一。
  4. 随着字典操作的不断执行, 最终在某个时间点上, ht[0] 的所有键值对都会被 rehash 至 ht[1] , 这时程序将 rehashidx 属性的值设为 -1 , 表示 rehash 操作已完成。

注意

因为在进行渐进式 rehash 的过程中, 字典会同时使用 ht[0] 和 ht[1] 两个哈希表, 所以在渐进式 rehash 进行期间, 字典的删除(delete)、查找(find)、更新(update)等操作会在两个哈希表上进行: 比如说, 要在字典里面查找(删除和修改本质也需要先找到)一个键的话, 程序会先在 ht[0] 里面进行查找(还没被迁移走), 如果没找到的话(已经被迁移走了), 就会继续到 ht[1] 里面进行查找。

另外, 在渐进式 rehash 执行期间, 新添加到字典的键值对一律会被保存到 ht[1] 里面, 而 ht[0] 则不再进行任何添加操作: 这一措施保证了 ht[0] 包含的键值对数量会只减不增, 并随着 rehash 操作的执行而最终变成空表。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1460325.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

项目经理想辞职的20个“离奇”理由

项目经理,这个看似风光无限的职位,其实背后也有许多鲜为人知的辛酸。以下是几个项目经理想辞职的“离奇”理由: 1、“与难缠客户斗智斗勇” 有些客户的要求比“外星人的要求”还要离奇。 2、“被‘无限需求’吞噬” 客户总是有无尽的需求…

【云原生系列之kubernetes】--Ingress使用

service的缺点: 不支持基于URL等机制对HTTP/HTTPS协议进行高级路由、超时、重试、基于流量的灰度等高级流量治理机制难以将多个service流量统一管理 1.1ingress的概念 ingress是k8s中的一个对象,作用是如何将请求转发到service的规则ingress controlle…

协和眼科牵头 ,5 家眼科中心同发力,用 AI 助力 13 种眼底疾病检测

眼睛方寸之间,疾病千差万别。去年底,由爱康集团与鹰瞳 Airdoc 联合发布的《四百万体检人群健康蓝皮书》显示,近年来眼底异常的总检出率连年上升,已从 2019-2020 年的 76.1%,上升至 2022-2023 年的 78.7%。眼底疾病的发…

网络基础与通信原理:构建数字世界的框架

目录 初识计算机网络 网络介绍 按照拓扑分类 按地域分类 网络设备 交换机(switch) 路由器(router) 传输介质 双绞线 光纤 光纤速度 ISO ISO和OSI有什么关系呢? OSI七层模型 TCP/IP四层 TCP/IP协议族 …

【RN】为项目使用React Navigation中的navigator

简言 移动应用基本不会只由一个页面组成。管理多个页面的呈现、跳转的组件就是我们通常所说的导航器(navigator)。 React Navigation 提供了简单易用的跨平台导航方案,在 iOS 和 Android 上都可以进行翻页式、tab 选项卡式和抽屉式的导航布局…

Android轻量级进程间通信Messenger源码分析

一. 概述 Android中比较有代表性的两大通信机制:1. 线程间Handler通信 2. 进程间Binder通信,本篇文章中我们在理解AIDL原理的基础上来解读一下Messenger的源代码, 并结合示例Demo加深理解。 在看本篇文章前,建议先查阅一下笔者的…

51_蓝桥杯_独立按键

一 电路 注意:J5跳帽接到2~3引脚,使按键S4-S5四个按键的另外一端接地,从而成为4个独立按键。 二 独立按键工作原理 三 代码 代码1:按下S7点亮L1指示灯,松开按键,指示灯熄灭,按下S6点亮L2指示灯…

Spring Boot项目怎么对System.setProperty(key, value)设置的属性进行读取加解密

一、前言 之前我写过一篇文章使用SM4国密加密算法对Spring Boot项目数据库连接信息以及yaml文件配置属性进行加密配置(读取时自动解密),对Spring Boot项目的属性读取时进行加解密,但是没有说明对System.setProperty(key, value)设…

养生系列文章目录 - 心学和冥想融合实践

养生系列文章目录 文章目录 养生系列文章目录前言一、冥想方式二、早起床上冥想三、喝水冥想四、走路冥想四、坐地铁冥想五、写字冥想六、沟通冥想七、学习冥想八、听音乐冥想九、工作冥想十、跑步冥想十一、睡前冥想总结 前言 王阳明(1472-1529)是中国明…

善于利用GPT确实可以解决许多难题

当我设计一个导出Word文档的功能时,我面临了一个挑战。在技术选型时,我选择了poi-tl这个模板引擎,因为在网上看到了很多关于它的推荐。poi-tl可以根据模板快速导出Word文档。虽然之前没有做过类似的功能,而且项目中也没有用过&…

STM32F10X(Cortex-M3)系统定时器寄存器笔记和系统定时器精准延时函数

Cortex-M3系统定时器寄存器笔记和系统定时器精准延时函数 简介系统定时器寄存器STK_CTRLSTK_LOADSTK_VALSTK_CALIB STM32F10X(Cortex-M3)精准延时函数 简介 在STM32F10X(Cortex-M3)除了通用定时器和看门狗定时器外,还有一个系统定时器(SysTick) 拿STM32F103C8T6来说…

SQL注入:网鼎杯2018-unfinish

目录 使用dirmap扫描 使用dirsearch扫描 使用acunetix扫描 爆破后端过滤的字符 绕过限制获取数据 这次的进行SQL注入的靶机是:BUUCTF在线评测 进入到主页面后发现是可以进行登录的,那么我们作为一个安全人员,那肯定不会按照常规的方式来…

企业必备!助你有效防止员工私删客户微信?

在企业管理中,保护客户资源和数据安全至关重要,特别是在微信这样的沟通工具中。为了有效防止员工私删客户微信以及滥用工作微信,企业可以借助一些专业的工具——微信管理系统来进行监控和管理。 首先,企业可以在微信管理系统上给…

CSS基础属性

【三】基础属性 【1】高度和宽度 (1)参数 width(宽度):用于设置元素的宽度。可以使用具体的数值(如像素值)或百分比来指定宽度。 height(高度):用于设置元…

【JGit】分支管理实践

本文紧接【JGit】简述及学习资料整理。 以下梳理了使用 JGit 进行 Git 操作的实践 JGit实践 主函数 public static void main(String[] args) throws Exception {String localDir "D:\\tmp\\git-test\\";String gitUrl "http://192.168.181.1:3000/root/g…

如何合理规划PCB叠层

目录 引言 6层板叠层设计方案 8层板叠层设计方案 10层板叠层设计方案 12层板叠层设计方案 总结 引言 PCB叠层是决定电子产品EMC性能的关键因素,合理的叠层布局,可以使得PCB上的差模和共模辐射最小化,反之,则可能放大这些辐射的干扰。 通常会从以下的因素中,对PCB的叠…

图扑数字孪生“光储充”一体化智慧充电站

近年来,蔚来、理想、特斯拉等电动汽车凭借独特的优势已成为全球消费者的“新宠儿”。随着新能源车保有量迅速增长,充电需求不断上升,充电桩对区域电网的冲击也日益显著。 “光储充”一体化模式,即“光伏储能汽车充电”&#xff0…

关于Windows 10中剪贴板的知识,看这篇文章就差不多了

本文介绍了如何在Windows10中使用剪贴板。除了有关复制、粘贴和清除剪贴板的信息外,还包括有关将项目固定到剪贴板的信息。 如何将内容复制到Windows 10剪贴板 Windows 10操作系统中的剪贴板比以前的剪贴板体验更先进。使用新的剪贴板,你可以查看复制到…

fastApi笔记04-查询参数和字符串校验

额外校验 使用Query可以对查询参数添加校验 from typing import Unionfrom fastapi import FastAPI, Queryapp FastAPI()app.get("/items/") async def read_items(q: Union[str, None] Query(defaultNone, max_length50)):results {"items": [{"…

【力扣hot100】刷题笔记Day8

前言 到了大章节【链表】了,争取两三天给它搞定!! 160. 相交链表 - 力扣(LeetCode)】 双指针 参考题解,相比于求长度右对齐再一起出发的方法简洁多了 class Solution:def getIntersectionNode(self, head…