深入理解 Redis跳跃表 Skip List 原理|图解查询、插入

news2024/11/22 0:28:54

1. 简介

跳跃表 ( skip list ) 是一种有序数据结构,通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的。

在 Redis 中,跳跃表是有序集合键的底层实现之一,那么这篇文章我们就来讲讲跳跃表的实现原理。

2. 跳跃表的实现

Redis 的跳跃表由 redis.h/zskiplistNoderedis.h/zskiplist 两个结构定义。

  • zskiplistNode 结构用于表示跳跃表节点。
  • zskiplist 结构则用于保存跳跃表节点的信息,比如节点数量指向表头节点和表尾节点的指针等等。

在这里插入图片描述
上图中展示了一个跳跃表示例,最左边的就是 zskiplist 结构,各个字段含义如下:

  • Header:指向跳跃表的表头节点
  • Tail:指向跳跃表的表尾节点
  • Level:记录目前跳跃表内,层数最大的那个节点的层数(除了头节点)
  • Length:记录跳跃表的长度,也就是跳跃表目前包含节点的数量(除了头节点)
  • 层(level):节点中用L1、L2、L3等字样标记节点的各个层,L1表示第一层,L2代表第二层,以此类推。每层都带有两个属性:前进指针和跨度前进指针用于方位位于表尾方向的其他节点。而跨度则记录了前进指针所指向节点和当前节点的距离。
  • backward:后退指针, 节点中用BW字样标记的后退指针 ,他指向当前节点的前一个节点。后退指针在程序从表尾向表头遍历时使用。
  • score:分值,各个节点中的 1.0、2.0、3.0 是节点所保存的分值。节点会按各个所保存的分值从小到大排序。
  • obj:成员对象,各个节点中的o1,o2 和 o3 是节点所保存的成员对象。

3. 跳跃表节点

跳跃表节点的实现由 redis.h/zskiplistNode 结构定义,数据结构如下:

typedef struct zskiplistNode{
	struct zskiplistNode *backward;	// 后退指针
	double score; 	// 分支
	robj *obj;		// 成员对象
	struct zskiplistLevel { // 层
		struct zskiplistNode *forward; // 前进指针
		unsigned int span;	// 跨度
	} level[];
}zskiplistNode;

3.1 层

跳跃表节点的 level 数组可以包含多个元素,每个元素都包含一个指向其他节点的指针,程序可以通过这些层来加快访问其他节点的速度,一般来说,层的数量越多,访问其他节点的速度就越快。

3.2 前进指针

每个层都有一个指向表尾方向的前进指针,用于从表头向表尾方向访问节点。那么如何查到对应的某个值呢?

比如有以下这个跳跃表结构:我们需要查到到7这个元素
在这里插入图片描述

  1. 会从最高层,也就是L5开始跳,绿色的箭头跳到了下一层的L5,发现这个值是16,16>7,所以不再继续在这一层跳,走下一层。
  2. L5跳到L4
  3. L4第一跳发现是2,比7大
  4. 于是接着L4的第二条,发现是16,比7小,所以不再继续在L4跳,走下一层
  5. L4跳L3,注意这里L4是在元素2的节点跳的L3
  6. L3接着一跳发现是16,比7大,所以不再继续L3层跳,走下一层
  7. L3跳L2
  8. L2 一跳找到了7,于是就返回了。

在这里插入图片描述

3.3 插入元素

我们知道了如何将查到到这个元素,之后,那如何插入呢?比如在上一个查询例子上插入元素10,那么我们可以先按照上面的方法找到10。

在这里插入图片描述

我们按照上面的方式找到L1之后还是没有找到10,于是就可以在最低层的7~16之间做插入。每次创建一个新跳跃表节点的时候,程序都根据幂次定律,随机生成一个介于1和32之间的值作为level数组的大小,这个大小就是层的高度。

假设这一次生成的层高是2,那么最高层就是L2。
在这里插入图片描述

此时跳表的结构就要发现变化,7的L2的下一跳变成了10的L2,10的L2的下一跳是16的L2,以此类推

在这里插入图片描述
这就插入成功了。

3.4 跨度

层的跨度用于记录两个节点之间的距离

  • 两个节点之间的跨度越大,它们相距就得越远。
  • 指向NULL的所有前进指针的跨度都为0,因为他们没有连向任何节点。

下图中的黑色字体就是跨度
在这里插入图片描述

这里注意一点:遍历操作只使用前进指针就可以完成了,跨度实际上是用来计算排位的,在查找某个节点的过程中,讲沿途访问过的所有层的跨度累计起来,得到的结果就是目标节点在跳跃表中的排位。

3.5 后退指针

节点的后退指针用于从表尾向表头方向访问节点:和可以一次跳过多个节点的前进指针不同,因为每个节点只有一个后退指针,所以每次都只能后退至前一个节点。

在这里插入图片描述

用红色虚线展示了如果从表尾向表头遍历跳跃表中的所有节点:程序首先通过跳跃表的tail指针 访问表尾节点,然后通过后退指针访问倒数第二个节点,之后再沿着后退指针访问倒数第三个节点,在之后遇到指向NULL的后退指针,于是访问结束。

3.6 分值和对象

  • score:分值是一个double类型的浮点数,跳跃表中的所有节点都按分值从小到大来排序。
  • obj对象:节点的成员对象是一个指针,它指向一个字符串对象,而字符串对象则保存着一个SDS值。

在同一个跳跃表中,各个节点保存的成员对象必须是唯一的,但是多个节点保存的分值却可以是相同的:分值相同的节点将按照成员对象在字典序中的大小来进行排序成员对象较小的节点会排在前面(靠近表头的方向),而成员对象较大的节点则会排到后面(靠近表尾的方向)

4. 跳跃表

仅靠多个跳跃表节点就可以组成一个跳跃表,但通过使用一个 zskiplist 结构来持有这些节点,程序可以更方便对整个跳跃表进行处理,比如快速访问跳跃表的表头节点和表尾节点,或者快速地获取跳跃表节点地数量(也即是跳跃表的长度)等信息。

typedef struct zskiplist{
	structz skiplistNode *header,*tail; 	// 表头节点和表尾节点
	unsigned long length; // 表中节点的数量
	int level; // 表中层数最大的节点的层数
}zskiplist;
  1. header 和 tail 指针分别指向跳跃表的表头和表尾节点,通过这两个指针,程序定位表头节点和表尾节点的复杂度未O(1)。
  2. 通过 length 属性来记录节点的数量,程序可以在O(1)复杂度内返回跳跃表的长度。
  3. level 属性则用于在 O(1)复杂度内获取跳跃表中层高最大的那个节点的层数量,注意表头节点的层高并不计算在内。

本来想讲讲为什么mysql用B+树不是跳表、而redis用跳表不用B+树。 但是篇幅有限,我们留到下一篇文章再讲了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2244984.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MediaSession学习总结

1.框架预览 2.用法 2.1参考链接: MediaSession 简单使用 2.2 服务端要实现MediaBrowserService; 主要实现的功能: mPlaybackState new PlaybackStateCompat.Builder().setState(PlaybackStateCompat.STATE_NONE, currentPostion, 1.0f).…

学习大数据DAY61 宽表加工

目录 模型设计 加工宽表 任务调度: 大表 - 把很多数据整合起来 方便后续的明细查询和指标计算 模型设计 设计 建模 设计: excel 文档去编写 建模: 使用建模工具 PowerDesigner Navicat 在线画图工具... 把表结构给绘 制出来 共享\项目课工具\pd 加工宽表 数…

零基础入门Flink,掌握基本使用方法

Flink基本概念 首先来讲,Flink是一个面向数据流处理和批处理的分布式开源计算框架。 那么,流处理和批处理分别处理什么样的数据呢,这就涉及两个概念-无界流和有界流 无界流VS有界流 任何类型的数据都可以形成流数据,比如用户…

Linux设置以及软件的安装(hadoop集群安装02)

一、Linux的常见设置 1、设置静态IP vi /etc/sysconfig/network-scripts/ifcfg-ens33 如何查看自己的虚拟机的网关: 完整的配置(不要拷贝我的): TYPE"Ethernet" PROXY_METHOD"none" BROWSER_ONLY"no&…

数据中台方法论:数据汇聚

文章目录 一、数据汇聚概述二、 汇聚数据类型2.1 结构化数据2.2 半结构化数据2.3 非结构化数据 三、汇聚数据模式四、汇聚数据方法四、数据汇聚工具五、数据汇聚使用经验 数据小伙伴们,之前咱们长篇大论的聊聊过【数据中台建设方法论从0到1】,从数据中台…

【Maven】nexus 配置私有仓库配置【转】

介绍:【Maven】Nexus几个仓库的介绍-CSDN博客 一、仓库类型 proxy 远程仓库的代理,比如说nexus配置了一个central repository的proxy,当用户向这个proxy请求一个artifact的时候,会现在本地查找,如果找不到,则会从远程…

3C产品说明书电子化转变:用户体验、环保与商业机遇的共赢

在科技日新月异的当代社会,3C产品(涵盖计算机类、通信类和消费类电子产品)已成为我们日常生活中不可或缺的重要元素。与此同时,这些产品的配套说明书也经历了一场从纸质到电子化的深刻变革。这一转变不仅体现了技术的飞速进步&…

【YOLOv8】安卓端部署-2-项目实战

文章目录 1 准备Android项目文件1.1 解压文件1.2 放置ncnn模型文件1.3 放置ncnn和opencv的android文件1.4 修改CMakeLists.txt文件 2 手机连接电脑并编译软件2.1 编译软件2.2 更新配置及布局2.3 编译2.4 连接手机 3 自己数据集训练模型的部署4 参考 1 准备Android项目文件 1.1…

虚拟网卡驱动和DM9000C移植

网卡驱动程序框架 网卡驱动程序“收发功能”: 只要把上层的数据发给网卡,从网卡来的数据构造成包给上层即可。网卡只需要 “socket”编程,不需要打开某设备。 驱动程序都是以面向对象的思想写的,都有相关的结构体。 编程步骤 …

Vue3 + Vite 项目引入 Typescript

文章目录 一、TypeScript简介二、TypeScript 开发环境搭建三、编译方式1. 自动编译单个文件2. 自动编译整个项目 四、配置文件1. compilerOptions基本选项严格模式相关选项(启用 strict 后自动包含这些)模块与导入相关选项 2. include 和 excludeinclude…

Cyberchef使用功能之-多种压缩/解压缩操作对比

cyberchef的compression操作大类中有大量的压缩和解压缩操作,每种操作的功能和区别是什么,本章将进行讲解,作为我的专栏《Cyberchef 从入门到精通教程》中的一篇,详见这里。 关于文件格式和压缩算法的理论部分在之前的文章《压缩…

Istio分布式链路监控搭建:Jaeger与Zipkin

分布式追踪定义 分布式追踪是一种用来跟踪分布式系统中请求的方法,它可以帮助用户更好地理解、控制和优化分布式系统。分布式追踪中用到了两个概念:TraceID 和 SpanID。 TraceID 是一个全局唯一的 ID,用来标识一个请求的追踪信息。一个请求…

Linux修改/etc/hosts不起作用(ping: xxx: Name or service not known)的解决方法——开启NSCD

​ 问题描述 起因是我在实验室云资源池的一台虚拟机(CentOS 8.5)上的/etc/hosts文件中为Fabric网络节点的域名指定了IP: IP可以ping通,但是ping域名时提示ping: xxx: Name or service not known。 问题本身应该是Linux通用的&a…

Python中Tushare(金融数据库)入门详解

文章目录 Python中Tushare(金融数据库)入门详解一、引言二、安装与注册1、安装Tushare2、注册与获取Token 三、Tushare基本使用1、设置Token2、获取数据2.1、获取股票基础信息2.2、获取交易日历2.3、获取A股日线行情2.4、获取沪股通和深股通成份股2.5、获…

【网络】网络抓包与协议分析

网络抓包与协议分析 一. 以太网帧格式分析 这是以太网数据帧的基本格式,包含目的地址(6 Byte)、源地址(6 Byte)、类型(2 Byte)、数据(46~1500 Byte)、FCS(4 Byte)。 Mac 地址类型 分为单播地址、组播地址、广播地址。 单播地址:是指第一个字节的最低位…

RabbitMQ的工作队列在Spring Boot中实现(详解常⽤的⼯作模式)

上文着重介绍RabbitMQ 七种工作模式介绍RabbitMQ 七种工作模式介绍_rabbitmq 工作模式-CSDN博客 本篇讲解如何在Spring环境下进⾏RabbitMQ的开发.(只演⽰部分常⽤的⼯作模式) 目录 引⼊依赖 一.工作队列模式 二.Publish/Subscribe(发布订阅模式) …

python学习_3.正则表达式

来源:B站/麦叔编程 1. 正则表达式的7个境界 假设有一段文字: text 身高:178,体重:168,学号:123456,密码:9527要确定文本中是否包含数字123456,我们可以用in运算符,也可以使用inde…

Python学习------第十天

数据容器-----元组 定义格式,特点,相关操作 元组一旦定义,就无法修改 元组内只有一个数据,后面必须加逗号 """ #元组 (1,"hello",True) #定义元组 t1 (1,"hello") t2 () t3 tuple() prin…

nodejs基于微信小程序的云校园的设计与实现

摘 要 相比于传统的校园管理方式,智能化的管理方式可以大幅提高校园的管理效率,实现了云校园管理的标准化、制度化、程序化的管理,有效地防止了云校园信息的不规范管理,提高了信息的处理速度和精确度,能够及时、准确地…

Excel——宏教程(精简版)

一、宏的简介 1、什么是宏? Excel宏是一种自动化工具,它允许用户录制一系列操作并将其转换为VBA(Visual Basic for Applications)代码。这样,用户可以在需要时执行这些操作,以自动化Excel任务。 2、宏的优点 我们可以利用宏来…