哈希应用 : 位图和布隆过滤器

news2024/12/23 9:47:35

位图

在这里我们可以用一种哈希的新方法  --  又快又节省内存(位图)

--------------------------------------------------------------------------------------------------------------------------------

对我们的位进行标记

位图的应用

1.给定100亿个整数,设计算法找到只出现一次的整数

2.给两个文件,分别有100亿个整数,我们只有1G内存,如何找到两个文件交集

位图的应用:

1.快速查找某个数据是否在一个集合中

2.排序  + 去重(问题1)

3.求两个集合的交集和并集

------------------------------------------------------------------------------------------------------------------------------

布隆过滤器

我们的位图只能处理整数,但是要是我们来了字符串,但是数据量又很大很大我们就得用布隆过滤器

理论而言,一个值映射的位越多,冲突的,误判率越低,但是也不敢映射太多,映射位越多,空间消耗越多

布隆过滤器应用

1.给两个文件,分别有100亿个query ,我们只有1G内存,如何找到两个文件的交集?分别给出精确算法和近似算法

近似算法: 把一个文件放进布隆过滤器当中,在把另一个文件与布隆过滤器进行比对,在就是交集,当然这里存在两个问题就是,在也有可能存在误判,然后没有去重

精确算法:

2.如何扩展BloomFilter使得它支持删除元素的操作

BloomFilter能否支持删除呢???

如果要强行支持呢??

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1072607.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SVV,PPV算法开发记录

定义 刘大为-血液动力学 Getinge 链接:高级监测参数: SVV, PPV 数据集 计算SVV和PPV使用的动脉血压曲线,在此选用了Kaggle上的Cuff-Less Blood Pressure Estimation数据集,该数据集包含PPG,ABP,ECG三条曲线&…

Godot 脚本外置参数设置

文章目录 添加脚本设置参数bulid 一下 Godot Engine 4.2 简体中文文档 C# exports 添加脚本 设置参数 Godot 添加脚本后,设置参数。两种形式都可以 [Export]public int Speed { get; set; } 10;[Export]public string Name ;bulid 一下 私有变量也可以

【网络安全 ---- 靶场搭建】凡诺企业网站管理系统靶场详细搭建过程(asp网站,练习sql注入)

一,资源下载 百度网盘资源下载链接:百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固,支持教育网加速,支持手机端。注册使用百度网盘即可享受免费存储空间https://pan.baidu.com…

Flink---14、Flink SQL(SQL-Client准备、流处理中的表、时间属性、DDL)

星光下的赶路人star的个人主页 你生而真实,而非完美 文章目录 1、Flink SQL1.1 SQL-Client准备1.1.1 基于yarn-session模式1.1.2 常用配置 1.2 流处理中的表1.2.1 动态表和持续查询1.2.2 将流转换为动态表1.2.3 用SQL持续查询1.2.4 将动态表转换为流 1.3 时间属性1.…

影剧院音乐厅微信小程序源码

音乐厅小程序,包括资讯动态,演出信息,艺术教育,经典 剧目,商务合作,关于我们,公益演出预约,商业演出预约,演出日历,我的今日预约,我的预约码&…

TypeScript 笔记:基础类型

1 any类型(任意值类型) 声明为 any 的变量可以赋予任意类型的值。 any类型是Typescript 针对编程时类型不明确的变量使用的一种数据类型,常用于: 变量的值会动态改变 ——>任意值类型可以让这些变量跳过编译阶段的类型检查 let x: any …

顺序栈与链式栈

目录 栈的定义与结构 栈的实现 顺序栈的实现 初始化空栈 销毁栈 压栈 获取栈顶元素 出栈 判断栈是否为空 获取栈中有效数据的个数 链式栈的实现 初始化空栈 销毁栈 压栈 获取栈顶元素 出栈 判断栈是否为空 获取栈中有效数据的个数 顺序栈与链栈的对比 栈的定义…

32个uniapp项目源码 涵盖商城团购等

IT之家小程序版客户端(使用 Mpvue 开发,兼容 Web)ithome-lite-master.zip mpvue 仿网易严选mpvue-shop-master.zip mpvue-音乐播放器mpvue-music-master.zip mpvue性能测试与体验miniweibo-master.zip mpvue改造的日历.zip mpvue框架仿滴滴出行didi-master.zip mpVu…

华为云云耀云服务器L实例评测使用 | 云耀云服务器L实例Docker可视化Portainer容器管理

一、使用背景 之前一直在用阿里云或者腾讯云的服务器,现在接触了一下华为云的服务器实例,点开产品列表发现有弹性云服务器ECS、云耀云服务器HECS等,本文主要使用云耀云服务器,看到官方简介: 华为云耀云服务器&#x…

TensorFlow入门(十三、动态图Eager)

一个图(Graph)代表一个计算任务,且在模型运行时,需要把图放入会话(session)里被启动。一旦模型开始运行,图就无法修改了。TensorFlow把这种图一般称为静态图。 动态图是指在Python中代码被调用后,其操作立即被执行的计算。 它与静态图最大的区别是不需要使用session来建立会话…

从创作到表演的全方位改变,数字时代中的和声之音

随着ChatGPT的现象级走红,AIGC在全球范围内掀起热潮。 所谓AIGC(Al-Generated Content),是指利用人工智能来根据用户需求,借助已有的材料库生成对应的内容。事实上,除了强大的文本能力之外,图像…

【Linux】工具:Bundle 库的安装和简单使用

文章目录 1. 下载 buddle 库2. 从 Win 传输文件到 Linux3. 解压缩 Bundle 库压缩解压缩 1. 下载 buddle 库 要求联网,笔者使用云服务器,在 Xshell 7 上完成的虚拟机操作。 安装 git 工具,通过代码 clone (大概率连接不上&#x…

CVE-2021-4034 polkit提权漏洞复现

CVE-2021-4034 polkit提权漏洞复现 1.前期准备2.复现 1.前期准备 Github地址: https://github.com/berdav/CVE-2021-4034polkit是一个授权管理器,其系统架构由授权和身份验证代理组成,pkexec是其中polkit的其中一个工具,他的作用…

UML简介

UML,全称为Unified Modeling Language(统一建模语言),是一种用于软件工程和系统设计的标准化建模语言。它提供了一套图形化的符号和标记,用于描述和表示软件系统、系统架构、流程、数据结构、行为和交互。UML的设计旨在…

docker安装wiki

1.docker pull mediawiki 2.docker run -d --name mywiki -p 8666:80 mediawiki 访问ip:8666,就可以看到配置页面了 3.docker pull mysql docker run -d --name my-mysql -e MYSQL_ROOT_PASSWORD123456 -p 3307:3306 mysql 4.在配置页面链接ip:3307,连接数据库,接下…

Excel 快速填充

文章目录 利用快速填充进行提取数据利用快速填充进行拆分重组 2013 及以上版本才有的功能. 利用快速填充进行提取数据 有一列的数据已有, 需要提取部分数据到另一列, 只需要输入部分内容, 后面内容可以自动显示, 按下回车即可快速填充. 只要前面手动输入的内容没有错得太离谱…

迅为龙芯开发板开发板系统烧写-启动系统

上面所有的步骤我们都做完以后,输入命令 sync 确保我们之前的步骤都可以保存到 ssd,接着拔下 U盘,最后输入命令 reboot 重启开发板,如下图所示: 如果启动成功,我们会看到 pmon 从硬盘加载 linux 内核和文件…

视频怎么压缩?这样做视频变小还清晰

在我们的日常生活和工作中,视频已经成为了不可或缺的一部分。然而,随着视频文件的增大,如何有效地压缩视频以方便存储和传输成了一个重要的问题,如果你还不知道怎么压缩视频大小,不妨试试下面的方法吧~ 方法一&#xf…

1.3 Linux目录操作

文章目录 零、学习目标一、导入新课二、新课讲解(一)常用权限操作1、常用权限操作(1)chgrp命令(2)chown命令(3)chmod命令 2、权限操作实战任务1、创建文件,设置其用户组任…

【C++设计模式之亨元模式:结构型】分析及示例

简介 享元模式(Flyweight Pattern)是一种结构型设计模式,旨在通过共享对象,有效地支持大量细粒度的对象,从而减少内存和性能消耗。它通过将对象分为可共享的内部状态和不可共享的外部状态,从而实现对象共享…