布隆过滤器 python3 pybloom_live使用例子存储开销

布隆过滤器 python3 pybloom_live使用例子存储开销

news2026/2/15 2:28:56

1. 安装pybloom_live

from pybloom_live import BloomFilter

# 创建一个Bloom过滤器对象
# 错误率（False Positive Rate）在布隆过滤器中指的是，不存在的元素被错误地认为存在于集合中的概率
bf = BloomFilter(capacity=10000, error_rate=0.001)

# 添加元素到Bloom过滤器中
bf.add("apple")
bf.add("banana")
bf.add("orange")

# 判断元素是否在集合中
print(bf.__contains__("apple"))  # True
print(bf.__contains__("grape"))  # False

print(bf.__getstate__())  # 查看布隆过滤器状态

# 打开文件，如果文件不存在则创建
with open('output.txt', 'wb+') as f:
    # 将Bloom过滤器写入文件
    bf.tofile(f)

# print(len(bf.bitarray))

# 打开文件，如果文件不存在则创建
with open('output.txt', 'rb+') as f2:
    # 从文件中恢复Bloom过滤器
    bf2 = BloomFilter.fromfile(f2)
    print(bf2.__getstate__())  # True
    print(bf2.__contains__("apple"))  # True
    print(bf2.__contains__("grape"))  # False

它有很多函数

假设错误率设置为0.001，bf.add了3个元素

如果是容量设置为10000个，存储开销是18kb

设置是容量设置为10万个，存储开销是176kb

设置是容量设置为10万个，假设bf.add了10000个元素

176kb

开销不变

如果是把这10000个元素直接存到txt中

38k

布隆过滤器是一种空间效率极高的概率型数据结构，它利用位数组和哈希函数来判断一个元素是否在一个集合中。它的时间复杂度和空间复杂度如下：

时间复杂度：对于判断一个元素是否在一个集合中，布隆过滤器的时间复杂度为O(k)，其中k为哈希函数的数量。因为我们需要将元素通过k个哈希函数映射到位数组中的k个位置，并检查这些位置是否为1。

空间复杂度：布隆过滤器的空间复杂度取决于位数组的大小。假设位数组的大小为m，那么空间复杂度为O(m)。

需要注意的是，布隆过滤器可能会产生假阳性（False Positive），即可能会将一个不在集合中的元素误判为在集合中。但不会产生假阴性（False Negative），即如果判断一个元素不在集合中，那么这个元素肯定不在集合中。

软件工程小施同学

20230914

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1011103.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

IntelliJ IDEA使用_常规设置

IntelliJ IDEA使用_常规设置

文章目录版本说明主题设置取消检查更新依赖自动导入禁止import xxx.*、允许import内部类显示行号、方法分割线、空格代码提示（匹配所有字母）自定义注释颜色添加头部注释自定义字体设置字符编码关联本地GitJDK编译版本Maven配置Tomcat配置代码注释设置头…

阅读更多...

iPhone 15秋季发布会召开，媒介盒子多家媒体持续报道

iPhone 15秋季发布会召开，媒介盒子多家媒体持续报道

现如今互联网引流成本越来越高不说,难度越来越大,大多数都是投入巨大,收效甚微。因此,用有限的成本带来高回报的效果成为企业共同的追求。当然,企业想要产品服务引流绝非易事。为什么你的品牌营销不见效?新产品上市要怎么做宣传?盒子以新发布的苹果15为例分析,给你一些启…

阅读更多...

bootstrap按钮

bootstrap按钮

<a class"btn btn-default">按钮a标签</a> <button class"btn btn-default">按钮button标…

阅读更多...

scrapy框架学习笔记-1

scrapy框架学习笔记-1

前言在现代互联网时代，网页数据获取和处理已经成为了重要的技能之一。无论是为了获取信息、做市场研究，还是进行数据分析，掌握网页爬取和数据处理技术都是非常有用的。本文将介绍从网页加载到数据存储的完整过程，包括网络请求、…

阅读更多...

macOS Big Sur：探索新设计，聚焦新体验

macOS Big Sur：探索新设计，聚焦新体验

自苹果公司推出macOS Big Sur以来，这一新版操作系统以其突破性的设计刷新了我们对Mac的认知。本文将详细介绍macOS Big Sur的各项新功能及其为用户带来的卓越体验。安装：macOS Big Sur(macos11)v11.7.10正式版一、全新设计：导览更轻松&am…

阅读更多...

mysql MVCC多版本并发控制

mysql MVCC多版本并发控制

mvcc的概念 mvcc 的实现依赖于： 隐藏字段行格式（row_id,trx_id,roll_ponter）UndologRead view innodb 存储引擎的表来说，聚集索引记录中都包含两个必要的隐藏字段，row_id(如果没有聚集索引，才会创建的) …

阅读更多...

Kubernetes入门十七、Helm 包管理器

Kubernetes入门十七、Helm 包管理器

目录概述Helm 的三大概念Helm 的安装仓库管理Helm 的常用命令 chart详解目录结构Redis chart 实践升级回滚概述 Kubernetes 上的应用对象，都是由特定的资源描述组成，包括 Deployment、Service 等，都保存在各自的文件中或者集中写在一个配置…

阅读更多...

（2023 最新版）IntelliJ IDEA 下载安装及配置教程

（2023 最新版）IntelliJ IDEA 下载安装及配置教程

IntelliJ IDEA下载安装教程（图解） IntelliJ IDEA 简称 IDEA，由 JetBrains 公司开发，是 Java 编程语言开发的集成环境，具有美观，高效等众多特点。在智能代码助手、代码自动提示、重构、J2EE 支持、各类版本…

阅读更多...

企业架构LNMP学习笔记40

企业架构LNMP学习笔记40

框架配置实现读写分离： 1）修改项目配置文件： return [// 数据库类型type > mysql,// 服务器地址// 1、主从数据库的连接地址主在前从在后hostname > 192.168.17.100,192.168.17.105,// 2、主从数据库的名称、用…

阅读更多...

C语言再学习 -- C语言实现 sin 和 cos 功能

C语言再学习 -- C语言实现 sin 和 cos 功能

之前在 C语言再学习 – C 标准库 - math.h 里有介绍 sin 和 cos 函数。但是这两个函数C语言该怎么实现呢？ 首先看一下这两个函数的介绍： 函数介绍 C 库函数 - sin() C 标准库 - <math.h> 描述 C 库函数 double sin(double x) 返回弧度角 x 的正…

阅读更多...

亚马逊云科技面向游戏运营活动的AI生图解决方案

亚马逊云科技面向游戏运营活动的AI生图解决方案

随着Stable Diffusion等AI生图方案逐步普及，越来越多的场景被开发和落地。其中面向游戏C端玩家的AI生图营销活动场景正在被逐步验证：在某个游戏社区中，玩家一键从手机上传一张照片，AI会将自动识别该照片中的元素并替换成游戏中相应…

阅读更多...

4-2 张量的数据运算

4-2 张量的数据运算

张量数学运算主要有：标量运算，向量运算，矩阵运算，以及使用非常强大而灵活的爱因斯坦求和函数torch.einsum（重难点）进行任意维的张量运算。此外还会介绍张量运算的广播机制。一，标量运算 (操作…

阅读更多...

Vue3高频面试题+八股文

Vue3高频面试题+八股文

Vue3.0中的Composition Api 开始之前 Compos:1 tion API可以说是ue3的最大特点，那么为什么要推出Compos1t1on Api,解决了什么问趣？ 通常使用Vue2开发的项目，普遍会存在以下问题： 代码的可读性随着组件变大而变差每一种代码复用的…

阅读更多...

【JavaScript内置对象】Date对象，从零开始

【JavaScript内置对象】Date对象，从零开始

【JavaScript内置对象】Date对象，从零开始时间的表示方式时间表示的基本概念最初，人们是通过观察太阳的位置来决定时间的，但是这种方式有一个最大的弊端就是不同区域位置大家使用的时间是不一致的。相互之间没有办法通过一个统一的时间…

阅读更多...

15W SIP木质网络音箱

15W SIP木质网络音箱

SV-7041VP15W SIP木质网络音箱一、描述 SV-7041VP是深圳锐科达电子有限公司的一款壁挂式SIP网络有源音箱，具有10/100M以太网接口，可将网络音源通过自带的功放和喇叭输出播放，可达到功率15W。同时它可以外接一个15W的无源副音箱&#xff0c…

阅读更多...

LeetCode每日一题：1222. 可以攻击国王的皇后（2023.9.14 C++）

LeetCode每日一题：1222. 可以攻击国王的皇后（2023.9.14 C++）

目录 1222. 可以攻击国王的皇后题目描述： 实现代码与解析： 模拟原理思路： 1222. 可以攻击国王的皇后题目描述： 在一个 8x8 的棋盘上，放置着若干「黑皇后」和一个「白国王」。给定一个由整数坐标组成的数组 …

阅读更多...

Flutter与Native通信原理剖析与实践

Flutter与Native通信原理剖析与实践

通信原理我们分几种场景来介绍Flutter和Native之间的通信。 Native发送数据给FlutterFlutter发送数据给NativeFlutter发送数据给Native，然后Native回传数据给Flutter Flutter与Native通信机制在讲解Flutter与Native之间是如何传递数据之前，我们先了…

阅读更多...

k8s集群中部署项目之流水线

k8s集群中部署项目之流水线

微服务项目部署之流水线编写一、部署微服务项目环境说明 1.1 代码托管到gitee 1.2 镜像托管到dockerhub 用户名：nextgomsb 密码：abc***.com1.3 流水线工具 KubeSphere 二、通过KubeSphere部署之拉取代码流水线编写 2.1 准备凭证 2.2 编辑流水线 pipe…

阅读更多...

MySQL学习6：索引

MySQL学习6：索引

来源教学视频来源：黑马程序员 MySQL数据库入门到精通，从mysql安装到mysql高级、mysql优化全囊括简介索引（index）是帮助MySQL高效获取数据的数据结构（有序）。在数据之外，数据库系统还维护着…

阅读更多...

vue事件处理表单输入绑定

vue事件处理表单输入绑定

1.监听事件我们可以使用 v-on 指令 (简写为 ) 来监听 DOM 事件，并在事件触发时执行对应的 JavaScript。用法：v-on:click"handler" 或 click"handler"。事件处理器 (handler) 的值可以是： 内联事件处理器：事…

阅读更多...

推荐文章

最新文章