技术分享 | 缓存穿透 - Redis Module 之布隆过滤器

news2025/1/20 14:58:54

作者:贲绍华

爱可生研发中心工程师,负责项目的需求与维护工作。其他身份:柯基铲屎官。

本文来源:原创投稿

*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。


一、场景案例

假设目前有一后端接口GET /userinfo/100,实际数据库内也只有最大ID为100的用户。

对于请求参数100以内当然属于是合法请求,但对于10000这种来说明显就异常的请求一样会进入数据库中进行查询,白白消耗DB资源,这就是——缓存穿透。

二、缓存知识

为了方便阅读此处直接上脑图

2.1 缓存失效的三个场景

2.2 缓存预热

三、Redis的内存回收策略

当Redis实例的内存到达上限时就会触发对应的回收策略

3.1 作为缓存使用时:

  • allkeys-lru: Keeps most recently used keys; removes least recently used (LRU) keys
  • allkeys-lfu: Keeps frequently used keys; removes least frequently used (LFU) keys
  • volatile-lru: Removes least recently used keys with the expire field set to true.
  • volatile-lfu: Removes least frequently used keys with the expire field set to true.
  • allkeys-random: Randomly removes keys to make space for the new data added.
  • volatile-random: Randomly removes keys with expire field set to true.
  • volatile-ttl: Removes keys with expire field set to true and the shortest remaining time-to-live (TTL) value.

3.2 作为数据库使用,确保数据不能丢失

  • Noeviction(默认策略)对于写请求不再提供服务,直接返回错误(DEL请求和部分特殊请求除外)

四、Redis Module - 布隆过滤器(RedisBloom)

下面回到主题场景,业务侧该如何确认流量中大于100或小于0的userID就是非法请求呢,答案就是——记下来,判断一下。

当然数据库那边也是这么做的,不过执行成本并不一样,在更靠近客户端的部分进行处理则会有更高的收益。布隆过滤器就是一个用来确认一个元素是否存在于集合内的工具。

介绍:

布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。

布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多,缺点是有一定的误识别率和删除困难。

特性:

  • 布隆过滤器并不是一个精确统计的东西,两个key可能会算得出同样的值。对于业务来说,当返回某个数据存在与过滤器时,这个数据可能不存在与数据库;当返回某个数据不存在时,那么这个数据一定不存在;
  • 布隆过滤器并不能删除元素(布谷鸟过滤器支持)

原理:

插入一个key,通过k次取模算出每次转换后对应的Bit map槽对应的位置,比如“小明“,通过计算后得出其值在1、7两个槽位。则小明={1,7},过滤器标记这两个槽位由0变成1,表示已存在映射。

当判断值是否存在时,如果返回的槽位有为0的,则表示数据不存在。之所以说当某个数据存在与过滤器时,这个数据可能不存在与数据库。是因为哈希会产生碰撞,加入此时”李四“也计算除了李四={1,7}。就会出现这种情况(过滤器存在,数据库不存在)

4.1 Redis Module简介:

Redis提供了一个扩展模块的入口,使用户可以根据需要额外集成一些实用功能。

官网连接:https://redis.io/resources/modules

下边列出一些常见的功能模块

4.2 RedisBloom

仓库地址:https://github.com/RedisBloom/RedisBloom

文档地址:https://redis.io/docs/stack/bloom

RedisBloom同时提供了布隆过滤器与布谷鸟过滤器,适用场景如下:

  • 布隆过滤器:插入性能、可伸缩性较好
  • 布谷鸟过滤器:查询性能较好、允许删除集合中的元素

五、案例说明

前置工作略过(下载、编译、加载、重启Redis)

# redis-cli
# BF就是bloom filter的意思,此时有一位新用户注册了,则业务调用Redis client向过滤器内增加一个名字为userid的filter,并向它添加一个101的值
127.0.0.1:6379> BF.ADD userid 101
(integer) 1
# EXISTS命令检查是否存在:1表示存在
127.0.0.1:6379> BF.EXISTS userid 101
(integer) 1
# EXISTS命令检查是否存在:0表示不存在
127.0.0.1:6379> BF.EXISTS userid 102
(integer) 0
# 查看对应filter内的使用情况
127.0.0.1:6379> BF.INFO userid
# 预设容量
 1) Capacity
 2) (integer) 100
# 实际大小
 3) Size
 4) (integer) 296
# 过滤器个数
 5) Number of filters
 6) (integer) 1
# 过滤器内的元素个数
 7) Number of items inserted
 8) (integer) 1
# 子过滤器扩容系数(默认 2)
 9) Expansion rate
10) (integer) 2
127.0.0.1:6379>
# 更多使用命令介绍见:https://redis.io/commands/?name=bf

在布隆过滤器中没有任何数据时会导致访问全部被拒绝掉,此时需要用到在2.1提到的【缓存预热】来解决这个问题。

布隆过滤器提供了三个配置项,如下:

配置参数是否支持动态调整默认值说明
ERROR_RATE0.1容错比例,值越低需要的空间越大
INITIAL_SIZE100默认容量大小
CF_MAX_EXPANSIONS32布谷鸟过滤器的默认最大扩展

六、总结

  • 布隆过滤器或布谷鸟过滤器可以用来解决缓存穿透的问题;
  • 需要注意数据同步(如新增用户时需要在过滤器添加用户ID)与缓存预热(空过滤器启动前需要把已有数据先写入Redis实例);
  • Redis Module还有许多非常方便使用的功能模块,可以根据需要灵活配置;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/105973.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计模式-抽象工厂模式

1、什么是抽象工厂模式 抽象工厂(AbstractFactory)模式的定义:是一种为访问类提供一个创建一组相关或相互依赖对象的接口,且访问类无须指定所要产品的具体类就能得到同族的不同等级的产品的模式结构。抽象工厂模式是工厂方法模式的…

Tiny ImageNet 数据集分享

ImageNet官网上的数据集,动辄就100G,真的是太大了。 有需要Tiny Image Net 数据集的小伙伴可以点击这个下载链接: http://cs231n.stanford.edu/tiny-imagenet-200.zip数据集简介: Tiny ImageNet Challenge 来源于斯坦福 CS231N …

uwb无线定位系统的原理和介绍

uwb无线定位系统是在 uwb平台上部署的定位基站,通过发射无线信号,将 uwb定位系统部署在需要安装的位置,同时结合定位基站所支持工作环境条件(如:温度、湿度、光照等)和定位算法,实现在不同的地理…

使用elesticsearch-7.10.0版本连接elasticsearch-head

背景: 由于esasticsearch-5.5.1中没有登录,登出的安全校验,在安全测评时,经常被检查到高危漏洞,因此项目经常要升级到es7版本。 问题一:jdk版本不满足要求,提示如下 future versions of Elasti…

Js实现轮盘抽奖功能,一招帮你解决选择困难症

不知道今天自己该吃什么,一招帮你解决选择困难症。 通过htmlcssjs实现一个轮盘抽奖功能。我们可以将平时吃的饭菜输入到代码中,每到纠结的时候只需点开抽一次就可以了。 实现步骤 html代码: 整体实现的结构是一个大的圆形,分成…

热门项目披露:成都双流板桥轨道城市发展有限公司100%股权转让

热门项目披露:成都双流板桥轨道城市发展有限公司100%股权转让;该项目由 西南联合产权交易所 发布,于2022年12月9日被塔米狗平台收录。 项目方 成都双流板桥轨道城市发展有限公司, 成立于 2021年9月7日 , 注册资金 100…

域控制器交付量「翻番」,汽车中间件赛道竞争升级

作为软件定义汽车的关键环节,智能汽车中间件赛道,正在成为兵家必争之地。 从传统IT架构的角度看,中间件位于上层应用和底层操作系统之间;除了基础的通信交互外,中间件还承载着屏蔽底层复杂性的功能,向下适配…

005:UITableView

介绍: 提示:数据量大、样式较为统一、分组的需要以及滚动的需求。 图示: UITableViewDataSource: 提示UITableView作为视图,只负责展示,协助管理,不管数据需要开发者为UITableView提供展示需…

Framework底层原理——Binder调用流程分析

binder是一个非常好的跨进程通信工具,Android对其进行了各种封装,虽然我们用起来简单,但是理解起来却比较困难。 1.自己设计一个跨进程通信机制 在理解binder之前呢,首先我们想一下,如果我们自己设计一个跨进程通信的…

简单Thinkphp5.1如何使用Topsdk\Topapi

一淘模板(56admin.cn)给大家介绍tp5.1相关知识,其中主要记录tp5.1是怎么使用Topsdk\Topapi(对接淘宝客开放平台),希望对需要的朋友有所帮助! 1、公司有一项目需要对接淘宝开放平台 先去申请帐号…

tensorrt debug问题汇总

目录 1. Dynamic dimensions required for input: input, but no shapes were provided. Automatically overriding 2. sampleMNIST.obj : error LNK2019: 无法解析的外部符号 cudaStreamCreate 3. Assertion failed: (smVersion < SM_VERSION_A100) &&…

条码管理系统,助力企业打造轻量级数字化车间

在原辅材料供应、生产管理、仓储物流、市场营销等相关业务环节中,采取适当的软硬件技术手段,实时记录产品信息。通过查询可以随时跟踪产品的生产状态、仓储状态和流向,达到可追溯管理的目的。随着制造企业对精细化管理要求的提高,…

【QT开发笔记-基础篇】| 第五章 绘图QPainter | 5.7 画笔设置

本节对应的视频讲解:B_站_视_频 https://www.bilibili.com/video/BV16W4y1g7dM 经过前面几节课的讲解,学会了绘制点、线、多段线、多边形、矩形、圆角矩形 到这里就可以学习画笔和画刷的设置了,本节先讲解画笔的设置 Qt 中画笔的类是 QPen…

正则表达式验证合集

1.定义封装的公共js 在src下定义一个util文件夹,并且定义个validate.js(当然你想取什么名字就什么名字哈哈哈哈) 2.上代码 //邮箱 /*** 邮箱* param {*} s*/ export function isEmail(s) {return /^([a-zA-Z0-9_-])([a-zA-Z0-9_-])((.[a-zA-Z0-9_-]{2,3}){1,2}…

基于FPGA的 矩阵键盘按键识别 【原理+源码】

目录 引言 原理阐述 实现方法 源码分享 板级调试演示 引言 最近了解了矩阵键盘扫描的原理,动手实现了一下,在这里做一个简单的总结。 原理阐述 矩阵键盘典型电路: FPGA的应用电路: 其中,行信号为FPGA输入信号&a…

企业从哪里开始构建弹性 IT 基础架构

混合工作模式扩大了工作范围,增加了 IT 团队的负担,因为他们需要在面对增加的攻击面时保持弹性。入侵企业的 IT 基础架构只需要一个受损的身份。 什么是企业标识? 这些是用户名、密码、网络、端点、应用程序等,充当业务敏感信息…

CheatEngine教程-官方9关

文章目录第一步:环境准备,下载并安装CE第二关:精确扫描数值第三关:未知数值扫描第四关:浮点数的扫描第五关:代码替换功能第六关:关于指针第七关:简单代码注入第八关:查找…

力扣(LeetCode)173. 二叉搜索树迭代器(C++)

设计 根据二叉树的中序遍历的迭代解法,稍改代码,就是本题的解法。 初始化 : 传入了根结点,根据迭代思路,将结点的左链依次入栈。 nextnextnext : 栈顶结点就是所求。根据迭代思路,当前结点要变成栈顶结点的右儿子。由…

Openlayers:自定义坐标系

Openlayers天然支持EPSG:4326(WGS1984地理坐标系)、EPSG:3857(Web墨卡托投影坐标系,即:将WGS84坐标系投影到正方形,南北投影范围为[-85.051129,+85.051129])。同时,Openlayers也支持开发者自定义坐标系。那么具体如何操作呢? 相关的API ol.proj.projection ol.proj.…

Android设计模式详解之工厂方法模式

前言 工厂方式模式是创建型设计模式; 定义:定义一个用于创建对象的接口,让子类决定实例化哪个类。 使用场景:在任何需要生成复杂对象的地方,都可以使用工厂方法模式。复杂对象适合使用工厂模式,用new就可…