Redis 7.x 系列【11】数据类型之位图(Bitmap)

news2024/11/26 13:56:36

有道无术,术尚可求,有术无道,止于术。

本系列Redis 版本 7.2.5

源码地址:https://gitee.com/pearl-organization/study-redis-demo

文章目录

    • 1. 概述
    • 2. 基本命令
      • 2.1 SETBIT
      • 2.2 GETBIT
      • 2.3 BITCOUNT
      • 2.4 BITPOS
      • 2.5 BITFIELD
      • 2.6 BITFIELD_RO
      • 2.7 BITOP
    • 3. 应用场景
      • 3.1 用户登录状态
      • 3.2 签到打卡

1. 概述

Redis Bitmap 实际不是一个独立的数据类型,而是基于 String 类型实现的。它主要用于存储二值状态(即集合元素的取值只有 01 两种)。由于每个位只能表示两种状态,在需要快速进行大量数据的排序、查找、去重等操作时具有显著优势。

Bitmap 实际上是利用 String 类型的最大容量(512 MB)存储一个连续的二进制序列。每个字节的 8 位可以分别代表 8 个独立的状态,因此可以用一个 Bitmap 来跟踪多达数百万甚至数十亿的状态。

2. 基本命令

所有命令:

命名描述
BITCOUNT统计给定范围内为1的位的数量
BITFIELD对字符串类型的 key 进行基于位的操作
BITFIELD_RO使用 BITFIELD命令进行只读操作
BITOP执行针对多个 Bitmap 的并集、交集、差集等位操作
BITPOS查找指定位值的第一个位置
GETBIT获取指定偏移量处的位状态
SETBIT设置指定偏移量处的位状态

2.1 SETBIT

SETBIT 命令用于对 key 所储存的字符串值,设置或清除指定偏移量上的位(bit)。时间复杂度为 O(1),因为直接在内存中操作字符串的位表示。返回值为存储在指定偏移量处的原始位值(01)。

基本语法:

SETBIT key offset value

参数说明:

  • key:操作的 key
  • offset:指定偏移量,从 0 开始计数。注意,偏移量必须大于或等于 0 ,且小于 2^32
  • value:设置的值,只能是 01

注意事项:

  • 如果key不存在,会自动为其创建一个新的字符串。
  • 如果设置的偏移量超过了字符串的当前长度,会扩展字符串以确保可以在指定的偏移量处设置值。扩展部分会使用 0 填充。
  • 警告操作:当key 不存在,或者是比较小的字符串时,直接设置 2^32-1 位置时,会立即分配所有内存,这有可能会导致服务阻塞

示例:

# 想设置其偏移量为7的位为1
SETBIT mykey 7 1

2.2 GETBIT

GETBIT 命令是用于获取存储在 key 中的字符串值在指定偏移量上的位(bit)值的操作。返回值是一个整数,表示指定偏移量上的位的值。返回值只可能是 01

基本语法:

GETBIT key offset

示例:

# 获取偏移量为7的位的值
GETBIT mykey 7

2.3 BITCOUNT

BITCOUNT 命令用于统计指定 key 所储存的字符串值中,被设置为1的二进制位的数量。

基本语法:

BITCOUNT key [start] [end]

参数说明:

  • key:要统计的 key ,对应的值应该是一个字符串。
  • start(可选):统计二进制位的开始位置,参数类型为整数,默认从0开始统计。
  • end(可选):统计二进制位的结束位置,参数类型为整数,默认统计到整个字符串的末尾。

注意事项:

  • 如果指定的 key 不存在,会将其视为空字符串,因此返回值为 0
  • 时间复杂度为 O(N),其中N是字符串的长度(以字节为单位)。在处理大数据量时,请注意性能问题。

无参示例:

redis> SET mykey "foobar"  
OK  
redis> BITCOUNT mykey  
(integer) 26

带参示例:

redis> SET mykey "\xff\xf0\x00"  
OK  
redis> BITCOUNT mykey 0 7  
(integer) 12  
redis> BITCOUNT mykey 0 0 4  
(integer) 4  
redis> BITCOUNT mykey 1 1 4  
(integer) 6

2.4 BITPOS

BITPOS 命令用于查找字符串中第一个设置为指定值(01)的 bit 位,并返回该位置。如果没有找到匹配的 bit,则返回-1

基本语法:

BITPOS key bit [start] [end]

参数说明:

  • key:要操作的 key,其值应为一个字符串。
  • bit:要查找的 bit 值,只能是 01
  • start(可选):开始查找的起始位置,默认为 0
  • end(可选):结束查找的位置,默认为 -1 ,表示字符串的最后一个 bit

注意事项:

  • 如果指定的 key 不存在,会将其视为一个空字符串,并查找空字符串中的 bit
  • 如果在指定的范围内没有找到匹配的 bit,则返回 -1
  • 查找范围是基于 bit 的,而不是基于字节的。例如,start=0end=7 表示查找前 8bit,而不是第一个字节。
  • 命令的时间复杂度为 O(N) ,其中 N 是字符串的长度(以 bit 为单位)。在处理大数据量时,请注意性能问题。

假设当前对应的字符串值为"\xff\x00\x00",这是一个二进制字符串的十六进制表示,"\xff"代表8个连续的1"\x00"代表8个连续的0

查找第一个为1bit

BITPOS mykey 1  
(integer) 0

查找第一个为0bit

BITPOS mykey 0 8  
(integer) -1  
BITPOS mykey 0 9  
(integer) 9

2.5 BITFIELD

BITFIELD 允许将 Redis 字符串视为一个位数组,并允许用户对其中的位进行操作,如获取、设置和递增等。对于每个子命令,BITFIELD都会返回一个响应数组,其中每个数组元素都与参数列表中的相应操作相匹配。

基本语法:

BITFIELD key [GET type offset] [SET type offset value] [INCRBY type offset increment] [OVERFLOW wrap|sat|fail]

参数说明:

  • key:要操作的Redis键。
  • GET:用于从字符串中获取指定位置的位域值。
  • SET:用于设置字符串中指定位置的位域值。
  • INCRBY:用于将字符串中指定位置的位域值进行增加。
  • OVERFLOW:用于指定溢出处理方式,可选值有 wrap(回绕)、sat(饱和)和fail(失败)。

子命令GET参数说明:

  • type:指定读取数据的类型,可以是u(无符号整数)或 i(有符号整数)。
  • offset:位字段的起始偏移位置,从0开始计数。

子命令SET参数说明:

  • type:类型标识,可以是u(无符号整数)或 i(有符号整数)。
  • offset:位字段的起始偏移位置。
  • value:要设置的位域值。

子命令INCRBY参数说明:

  • type:指定要递增的数据类型。
  • offset:位字段的起始偏移位置。
  • increment:递增的值。

OVERFLOW用于指定溢出处理方式,参数说明:

  • wrap:使用回绕方法处理溢出,位域超过最大值后再次增加数值则回到最小值。
  • sat:饱和计算,超过最大值再增加则数值仍不变。
  • fail:超过最大值再增加,则命令直接报错,拒绝指定。

注意事项:

  • 可以在同一个命令调用中使用多个子命令,并按照给定的顺序执行它们。
  • 命令的时间复杂度为O(1),用于指定的每个子命令。
  • 使用BITFIELD命令时,请确保对二进制位操作有深入的理解,以避免出现意外的结果。

示例,假设有一个 key 其对应的字符串值为"abcd"(其ASCII码值分别为97, 98, 99, 100)。获取第一个字符的 ASCII 码值(无符号8位整数):

BITFIELD mykey GET u8 0

修改第二个字符的ASCII码值为大写'B'ASCII码值为66):

BITFIELD mykey SET u8 8 66

将第三个字符的ASCII码值增加1'c'变为'd'):

BITFIELD mykey INCRBY u8 16 1

2.6 BITFIELD_RO

BITFIELD_RO 命令作为 BITFIELD 命令的只读变体。这个命令允许用户从二进制位图中安全地读取数据,而不需要担心在只读副本上执行写操作。

基本语法:

BITFIELD_RO key [GET encoding offset [GET encoding offset ...]]

参数说明:

  • key: 要操作的二进制位图的键名。
  • GET: 表示读取操作。
  • encoding: 指定要读取的数据的编码类型(如 u8i8u16i16u32i32u64i64f32f64)。
  • offset: 指示在二进制位图中的起始位置(以位为单位)。

注意事项:

  • 由于原始的 BITFIELD 命令包含 SETINCRBY 等写操作选项,因此它在 Redis 命令表中被标记为写命令。这意味着在 Redis 集群的只读副本上,即使连接处于只读模式,该命令也会被重定向到主实例。
  • 为了在只读副本上允许 BITFIELD 行为而不破坏命令标志的兼容性,Redis 6.2 引入了 BITFIELD_RO 变体。
  • 通过使用 BITFIELD_RO,可以在只读副本上安全地执行读取操作,而无需担心数据的不一致性或其他与写操作相关的问题

示例,假设有一个名为 hello 的二进制位图,并且我们想要从第 16 位开始读取一个 8 位有符号整数(i8):

BITFIELD_RO hello GET i8 16

2.7 BITOP

BITOP 命令用于对多个键(包含字符串值)执行位操作,并将结果存储在目标键中。它支持四种位操作:AND(与)、OR(或)、XOR(异或)和 NOT(非)。NOT 操作是特殊的,因为它只接受一个输入键,因为位反转只作为一元运算符才有意义。

基本语法:

BITOP <AND | OR | XOR | NOT> destkey key [key ...]

参数说明:

  • <AND | OR | XOR | NOT>:要执行的位操作类型。
  • destkey:存储操作结果的目标键。
  • key [key ...]:要参与位操作的键列表。对于 NOT 操作,只需要一个键。

示例:

redis> SET key1 "foobar"  
"OK"  
redis> SET key2 "abcdef"  
"OK"  
redis> BITOP AND dest key1 key2  
(integer) 6  
redis> GET dest  
"`bc`ab"

3. 应用场景

Bitmap 以极小的空间存储大量数据,2^32次方(约40亿)数据只需要约 500MB 内存,并提供了快速的查询和统计功能。Redis Bitmap的应用场景广泛,尤其在处理大量二进制数据或需要快速进行二值状态统计的场合下表现出色。

二值状态统计是指在集合中,元素的取值只有 01 两种状态,在实际开发中,经常会遇到签到/未签到登录/未登录等情况。

常用场景:

  • 签到打卡:每个用户每天的签到情况可以用一个 bit 位表示,签到为1未签到为0
  • 限制IP地址访问频率:每个 IP 地址对应 Bitmap 的一个 bit 位,访问时设置该位为1。判断某个 IP 地址是否已经访问过,并据此限制其访问频率。
  • 用户登录状态:可以使用 bit 位来记录用户的登录状态, 1 表示已登录,0 表示未登录。

3.1 用户登录状态

例如,当天 ID0-3的用户进行了登录:

localhost:0>SETBIT login_status:20240624 0 1
"0"
localhost:0>SETBIT login_status:20240624 1 1
"0"
localhost:0>SETBIT login_status:20240624 2 1
"0"
localhost:0>SETBIT login_status:20240624 3 1
"0"

查看某个用户当天是否登录:

localhost:0>GETBIT login_status:20240624 3
"1"
localhost:0>GETBIT login_status:20240624 4
"0"
localhost:0>

查看当天登录用户总数:

localhost:0>BITCOUNT login_status:20240624
"4"

3.2 签到打卡

在这里插入图片描述
设置 ID123 的用户在 202405 第一天和第六天进行了签到:

localhost:0>SETBIT sign:123:202405 0 1
"0"
localhost:0>SETBIT sign:123:202405 5 1
"0"

查看用户当月某日是否进行了签到:

localhost:0>GETBIT sign:123:202405 10
"0"
localhost:0>GETBIT sign:123:202405 0
"1"

统计当月的签到次数:

localhost:0>BITCOUNT sign:123:202405
"2"

查看当月第一次签到的日期:

localhost:0>BITPOS sign:123:202405 1
"0"

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1875753.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

二叉搜索数的最小绝对差-二叉树

需要用到中序遍历 中序遍历 94. 二叉树的中序遍历 - 力扣&#xff08;LeetCode&#xff09; 递归 class Solution { public:vector<int> inorderTraversal(TreeNode* root) {vector<int> res;inoder(root,res);return res;}void inoder(TreeNode* root , vector…

从零开始搭建spring boot多模块项目

一、搭建父级模块 1、打开idea,选择file–new–project 2、选择Spring Initializr,选择相关java版本,点击“Next” 3、填写父级模块信息 选择/填写group、artifact、type、language、packaging(后面需要修改)、java version(后面需要修改成和第2步中版本一致)。点击“…

计算机Java项目|基于SpringBoot的新闻稿件管理系统

作者主页&#xff1a;编程指南针 作者简介&#xff1a;Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、腾讯课堂常驻讲师 主要内容&#xff1a;Java项目、Python项目、前端项目、人工智能与大数据、简…

数据结构历年考研真题对应知识点(数组和特殊矩阵)

目录 3.4数组和特殊矩阵 3.4.2数组的存储结构 【二维数组按行优先存储的下标对应关系(2021)】 3.4.3特殊矩阵的压缩存储 【对称矩阵压缩存储的下标对应关系(2018、2020)】 【上三角矩阵采用行优先存储的应用(2011)】 【三对角矩阵压缩存储的下标对应关系(2016)】 3.4.…

PyTorch Tensor进阶操作指南(二):深度学习中的关键技巧

本文主要讲tensor的裁剪、索引、降维和增维 Tensor与numpy互转、Tensor运算等&#xff0c;请看这篇文章 目录 9.1、首先看torch.squeeze()函数&#xff1a; 示例9.1&#xff1a;&#xff08;基本的使用&#xff09; 小技巧1&#xff1a;如何看维数 示例9.2&#xff1a;&a…

优化数据库字段使用位运算-php语言示例

背景&#xff1a;一个会员有三个状态&#xff0c;A、B、C&#xff0c;其中一个人可以为 A、B、C、AB&#xff1b;之前数据表结构加了三个字段is_a、is_b、is_c; 本人实在不想这样粗糙的实现需求&#xff0c;遂决定用位运算优化。 上代码&#xff1a; 位运算可以用来处理状态值…

业务代码插件式开发实践

在学习编程初期&#xff0c;会接触到设计模式的概念&#xff1a;23种设计模式&#xff0c;单例模式&#xff0c;策略模式&#xff0c;… 。接触业务研发后&#xff0c;对设计模式的使用和实践有了更深的见解。 使用设计模式是目的为了更高效的支撑业务诉求&#xff0c;如何在保…

【面试干货】Object 类中的公共方法详解

【面试干货】Object 类中的公共方法详解 1、clone() 方法2、equals(Object obj) 方法3、hashCode() 方法4、getClass() 方法5、wait() 方法6、notify() 和 notifyAll() 方法 &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; 在 Java 中&#…

高频面试题基本总结回顾1(含笔试高频算法整理)

干货分享&#xff0c;感谢您的阅读&#xff01; &#xff08;暂存篇---后续会删除&#xff0c;完整版和持续更新见高频面试题基本总结回顾&#xff08;含笔试高频算法整理&#xff09;&#xff09; 备注&#xff1a;引用请标注出处&#xff0c;同时存在的问题请在相关博客留言…

如何使用飞书快捷指令无感记账,ios版

总结 很多人无法长期坚持记账&#xff0c;主要是每次消费需要打开手机软件&#xff0c;一系列繁琐的操作&#xff0c;导致过程中可能就忘了。 今天给大家带来飞书自动记账。 演示视频 点击查看&#xff1a;https://www.douyin.com/video/7312857946382241063 安装 下载快捷…

【机器学习300问】135、决策树算法ID3的局限性在哪儿?C4.5算法做出了怎样的改进?

ID3算法是一种用于创建决策树的机器学习算法&#xff0c;该算法基于信息论中的信息增益概念来选择最优属性进行划分。信息增益是原始数据集熵与划分后数据集熵的差值&#xff0c;熵越小表示数据集的纯度越高。有关ID3算法的详细步骤和算法公式在我之前的文章中谈到&#xff0c;…

临时文件上传系统Plik

什么是 Plik &#xff1f; Plik 是一个基于 Go 语言的可扩展且用户友好的临时文件上传系统&#xff08;类似于 Wetransfer&#xff09;。 软件主要特点&#xff1a; 强大的命令行客户端易于使用的 Web 用户界面多个数据后端&#xff1a;文件、OpenStack Swift、S3、Google Clo…

单调队列优化DP——AcWing 135. 最大子序和

单调队列优化DP 定义 单调队列优化DP是一种在动态规划&#xff08;Dynamic Programming, DP&#xff09;中应用的数据结构优化方法。它利用单调队列&#xff08;Monotonic Queue&#xff09;这一数据结构来高效维护一个区间内的最值&#xff08;通常是最大值或最小值&#xf…

特斯拉下一代自动驾驶芯片的深度预测

引言 特斯拉一直以来都在自动驾驶技术上不断突破&#xff0c;随着AI大模型技术的爆发&#xff0c;其下一代自动驾驶芯片&#xff08;HW5.0&#xff09;也备受瞩目。本文将深入分析和预测特斯拉下一代自动驾驶芯片AI5的技术特点及其对行业的影响。 深入技术分析 现有自动驾驶…

【电机控制】EG2134无刷电机驱动板——最小核心板STM32F103C8T6,开环、无感SMO验证

【电机控制】EG2134无刷电机驱动板——最小核心板STM32F103C8T6&#xff0c;开环、无感SMO验证 文章目录 前言一、硬件二、软件三、开环SVPWM四、SMO无感观测器五、参考文献总结 前言 【电机控制】直流有刷电机、无刷电机汇总——持续更新 使用工具&#xff1a; 1.控制器&…

大创项目推荐 题目:基于机器视觉opencv的手势检测 手势识别 算法 - 深度学习 卷积神经网络 opencv python

文章目录 1 简介2 传统机器视觉的手势检测2.1 轮廓检测法2.2 算法结果2.3 整体代码实现2.3.1 算法流程 3 深度学习方法做手势识别3.1 经典的卷积神经网络3.2 YOLO系列3.3 SSD3.4 实现步骤3.4.1 数据集3.4.2 图像预处理3.4.3 构建卷积神经网络结构3.4.4 实验训练过程及结果 3.5 …

linux 文件管理

一、linux文件命名规则 1.可使用字符&#xff1a;所有字符都可使用&#xff0c;不建议使用"<、>、&#xff1f;、*"等特殊字符 正常文件命名规则&#xff1a; 1.尽量使用小写 2.在需要对文件名分割时&#xff0c;建议使用“_”&#xff0c;chen_2004_06_28…

【高中数学之基本不等式】已知:a,b皆为正实数且1/a+1/(b+2)=1/2 求:a+b的最小值?

解&#xff1a;先从1/a1/(b2)1/2 入手&#xff0c;看能否化二为一&#xff08;将两变量化成一个变量&#xff09; 由1/a1/(b2)1/2 两边通分得(b2a)/a/(b2)1/2 交叉相乘得2a2b4ab2a 最后得到a24/b 所以ab24/bb 此时已经可以用基本不等式了 ab24/bb>22*根号下(4/b*b)22…

CSS 核心知识点 - grid

思维导图 参考网址: https://developer.mozilla.org/zh-CN/docs/Web/CSS/CSS_grid_layout 一、什么是 grid&#xff1f; CSS Grid布局是在CSS3规范中引入的一种新的布局方式&#xff0c;旨在解决传统布局方法&#xff08;如浮动、定位、表格布局&#xff09;存在的许多问题。C…

运行CDN

背景 CDN代码&#xff0c;调试运行 日常 git clone代码配置虚拟环境 puthon3.8,pip install r requirements.txt改项目数据集路径&#xff0c;在hico.py文件里面 # PATHS {# train: (root / images / train2015, root / annotations / trainval_hico.json),# val: …