从位运算理解位图

news2024/11/17 21:33:05

位图是一种较难理解的数据结构,想了解位图,我需要先温习一下基础,复习下一些二进制的知识

位运算

1个字节=8个二进制位

二进制每逢二进一,下面是二进制对应的十进制转换方式

二进制十进制
0000 00012^0=1
0000 00102^1=2
0000 001121+20=3

左移

每个二进制位都向左移动一位
1 << 1
移动前
0000 0001
移动后
0000 0010

右移

每个二进制位都向右移动一位
1 >> 1
移动前
0000 0001
移动后
0000 0000

与运算

两个位都是1,结果为1。否则为0

  0000 0010
 &0000 0011
	=
  0000 0010

或运算

两个位都是0,结果为0。否则为1

    0000 0010
   |0000 0011
     =
    0000 0011

位图

位图的思想用利用每个二进制位的值来存储数据,优点是可以极大的节省空间

我们举个例子。有 1 千万个整数,整数的范围在 1 到 1 亿之间。如何快速查找某个整数是否在这 1 千万个整数中呢?

我们需要存储1000w个整数范围1-1亿之前的整数,用做已经使用过的数据。那么我们会选择怎么存储?我们可以使用hashSet来存储着1000w个数据,但是这样这个hashSet占据了4byte*1000w=40mb

我们试试用位图,假设我们用一亿个二进制位的数组表示位图,然后把每个数字放入位图。怎么放入呢,比如我们要放入4这个整数,那个我们就把数组第4个下标的值设置成1,以此类推。当我们要判断4是否存在,那么我们只需要取出下标为4的值判断是否为1,为1则存在了。

例如 [0,0,0,0,1,1,0,0],表示位图存储了2和3两个整数,这样我们只需要1亿个bit=12mb的内存


我们还可以用另一个存储结构来使用位图

我们举一个场景,订单有各种异常状态,大概有几十个。如果我们把订单的各种异常都存储成各个字段的话,那么整个订单表异常的字段会变得非常多。

我们可以使用一个long型运用位图的思想来存储。首先我们先约定各个异常对应的位图的位置,比如缺货异常是1,退款异常是2。如果一个订单标记了缺货和退款两个异常,那我们怎么来存储。首先没有异常情况是,这个字段二进制是0000(简写了,实际是64个二进制位),

这里有个数学公式,我们想要在第n位上标记成1,我们可以使用或运算 原值 | (1<<n) 的公式

然后我们需要标记缺货异常,只需要0|1<<1
00000 | 0010 = 0010
(既 0 | 1<<1 = 0 | 2 = 2)
这样第一个位置就变成1了,然后我们要标记退款异常,
0010 | 0100 = 0110
(既 2 | 1<<2 = 2 | 4 = 6)
这样第二个位置也变成了1

这样我们在订单表只需要存储一个字段,并存储为6就可以了

这样存储怎么查询呢,如果我要查询有缺货异常的订单。我们已知缺货异常对应的二进制位数是1,我们只需要使用与运算

例如
0110 && 0010 = 0010 (既 6&(1<<1)= 2)大于0则表示第一位是1,既有缺货异常

0100 && 0010 = 0000 (既 4&(1<<1)= 0)=0表示第一位是0,既没有缺货异常

进阶:布隆过滤器

我们会发现位图的大小会随着范围的变大而变大,回到之前的题目,如果有 1 千万个整数,整数的范围在 1 到 1 0亿之间。如何快速查找某个整数是否在这 1 千万个整数中呢?

如果我们在使用位图就会发现我们需要使用一个10亿的二进制位来存储,那么则需要120mb的内存,内存占用反而比hashSet还要大。那么我们应该怎么办呢?

不知道大家有没有了解过布隆过滤器这个数据结构。布隆过滤器正是为了解决上述的问题,它是位图的一种改进版。

我们仍仅使用1亿个二进制位数组作为存储结构,然后对存储的值进行hash运算,运算后再对位图的大小进行取模,将对应位置设置为1。如果只有一个hash函数,那么冲突的概率还是很大的,比如1和1亿零1 对1亿取模都等于1,所以布隆过滤器会进行多个hash函数取模运算,并将这些位置都设置为1。经过多个hash函数的运算,hash冲突的概率会小很多。

在这里插入图片描述

布隆过滤器会存在一定的误判率,当我们判断某个整数是否在这 1 千万个整数中,同样会对这个数字进行多次hash取模运算,如果这些位置上都是1,那么可以判断这个整数可能存在如果这些位置上有0,但是可以判断这个整数肯定不存在

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

用户故事地图怎么用?实践才能出真知

在产品设计和交互过程中&#xff0c;用户体验是一个非常重要的部分。 随着产品的逐渐完善&#xff0c;主创团队也需要通过各个维度来了解用户需求&#xff0c;完善用户的整体体验。在这里&#xff0c;我们经常用到的一个实践是用户故事地图。 一、用户故事地图是什么&#xff…

【Linux】指令及权限管理的学习总结

文章目录1️⃣ Linux的文件系统结构简介2️⃣ Linux下的基本指令1. ls2. pwd3. cd4. touch5. mkdir6. rm7. rmdir8. cp9. mv10. cat11. more12. less13. head14. tail15. find16. grep17. zip18. unzip19. tar20. uname3️⃣ Linux下的权限权限管理1. 文件的访问者分类&#xf…

【C++】多态

1.多态 1.1多态的概念&#xff1a; 多态&#xff1a;就是多种形态&#xff0c;具体点就是去完成某个行为&#xff0c;当不同的对象去完成时会产生出不同的状态。李明要吃饭&#xff0c;那就要吃早饭&#xff0c;午饭&#xff0c;晚饭&#xff0c;而不是一天只吃午饭这种单一…

Java多线程(4):ThreadLocal

您好&#xff0c;我是湘王&#xff0c;这是我的CSDN博客&#xff0c;欢迎您来&#xff0c;欢迎您再来&#xff5e; 为了提高CPU的利用率&#xff0c;工程师们创造了多线程。但是线程们说&#xff1a;要有光&#xff01;&#xff08;为了减少线程创建&#xff08;T1启动&#xf…

Synchronized底层核心原理

前言&#xff1a;大家好&#xff0c;我是小威&#xff0c;24届毕业生&#xff0c;在一家满意的公司实习。本篇文章是关于并发编程中Synchronized锁的底层核心原理知识记录&#xff0c;由于篇幅原因&#xff0c;下篇文章将介绍各种锁的优化原理。 本篇文章记录的基础知识&#x…

vue3 异步组件

前端开发经常遇到异步的问题&#xff0c;请求函数&#xff0c;链接库&#xff0c;等&#xff0c;都有可能需要通过promise或者async await 来进行异步的一个封装。 异步组件也由此诞生&#xff0c;我用settimeout来模拟一个vue3的异步组件 异步的子组件 <template><…

spring框架源码十三、spring ioc高级特性-后置处理器

spring ioc高级特性-后置处理器BeanPostProcessor实例MyBeanPostProcessorapplication-context.xmlTestServiceImpl测试BeanFactoryPostProcessorspring提供了两种后置处理bean的扩展接口&#xff0c; 分别为BeanPostProcessor和BeanFactoryPostProcessor&#xff0c; BeanPos…

攻防世界WEB练习 | easyphp

目录 题目场景 代码分析 找到flag 题目场景 代码分析 if(isset($a) && intval($a) > 6000000 && strlen($a) < 3) isset&#xff1a;检查变量是否设置 intval&#xff1a;检查变量是否为int型 strlen&#xff1a;检查变量的长度 要求a存在且大于6…

Matlab之多平台雷达检测融合仿真(附源码)

此示例演示如何融合来自多平台雷达网络的雷达检测。该网络包括两个机载和一个地面远程雷达平台。中央跟踪器以固定的更新间隔处理来自所有平台的检测。这能够根据目标类型、平台机动以及平台配置和位置评估网络的性能。 一、定义中央跟踪器 将trackerGNN用作中央跟踪器&#…

云原生时代下,如何打造开源监控体系?宏时数据在GOPS与你相聚

相聚上海 宏时数据受邀出席2022 GOPS全球运维大会上海站&#xff0c;将分享演讲&#xff01; 时间&#xff1a;2022年10月28日15:20-15:40 AIOps最佳实践及解决方案专场 同时展位在301&#xff0c;现场有丰富礼品&#xff0c;快来做任务夺宝&#xff01; 还有Zabbix高级认…

【CSDN开发云】光速认识Cloud IDE

⌚️⌚️⌚️个人格言&#xff1a;时间是亳不留情的&#xff0c;它真使人在自己制造的镜子里照见自己的真相! &#x1f4d6;Git专栏&#xff1a;&#x1f4d1;Git篇&#x1f525;&#x1f525;&#x1f525; &#x1f449;&#x1f449;&#x1f449;你的一键三连是对我的最大支…

10.26 要尝试让自己安静下来,去做该做的事 而不是让内心烦躁,焦虑,毁掉你本就不多的热情和定力

要尝试让自己安静下来&#xff0c;去做该做的事 而不是让内心烦躁&#xff0c;焦虑&#xff0c;毁掉你本就不多的热情和定力 复习 import torch import torch.nn as nn import math from torch.autograd import Variable# 定义embedding类来实现文本嵌入层&#xff0c;这里的s…

C++多态详解及代码示例

多态 一、基本定义 顾名思义&#xff0c;多种形态。多态是C面向对象的三大特性之一&#xff08;封装、继承和多态&#xff09;。 多态分为两种&#xff1a; 静态多态&#xff1a;函数的重载、运算符的重载动态多态&#xff1a;派生类和虚函数实现运行时多态 区别&#xff…

基于javaweb的企业员工绩效工资管理系统(java+springboot+freemarker+mysql)

基于javaweb的企业员工绩效工资管理系统(javaspringbootfreemarkermysql) 运行环境 Java≥8、MySQL≥5.7 开发工具 eclipse/idea/myeclipse/sts等均可配置运行 适用 课程设计&#xff0c;大作业&#xff0c;毕业设计&#xff0c;项目练习&#xff0c;学习演示等 功能说明…

cadence SPB17.4 - allegro - DRC检查的细节

文章目录cadence SPB17.4 - allegro - DRC检查的细节概述笔记设置约束管理器设置modeDRC检查查看report查看status总结ENDcadence SPB17.4 - allegro - DRC检查的细节 概述 一个板子做完了, 打样回来, 找出一些小问题, 需要改下板子. 将铺铜拆了, 按照原理图补上元件. 将线都…

Qt实现桌面画线、标记,流畅绘制,支持鼠标和多点触控绘制

前言 经常会在网上直播讲课或者点评中看到可以在课件上或者桌面上进行画线标记划重点&#xff0c;其实实现并不难&#xff0c;原理就是在桌面上盖一个透明图层&#xff0c;然后根据鼠标点绘制曲线。 今天分享如何通过Qt的QGraphics体系来实现这个功能&#xff0c;以前的文章已…

23、STM32——CAN

1、CAN 协议简介 CAN 与 I2C、SPI 等具有时钟信号的同步通讯方式不同&#xff0c;CAN 通讯并不是以时钟信号来进行同步的&#xff0c;它是一种异步通讯&#xff0c;只具有 CAN_High 和 CAN_Low 两条信号线&#xff0c;共同构成一组差分信号线&#xff0c;以差分信号的形式进行通…

第31讲:MySQL事务的并发问题以及事务的隔离级别

文章目录1.事务的并发问题1.1.事务并发之脏读1.2.事务并发之不可重复读1.3.事务并发之幻读2.事务的隔离级别3.模拟事务并发问题的产生以及如何避免3.1.事务并发问题脏读的模拟以及避免3.1.1.模拟事务并发脏读的问题3.1.2.解决事务并发脏读的问题3.2.事务并发问题不可重复读的模…

MATLAB函数mesh与surf等绘制三维曲面入门

一、引言 三维曲面在实际应用中被广泛使用&#xff0c;能够更好的展示三维空间中曲面&#xff0c;以实现三维数据的可视化。 Matlab软件中可以使用mesh、fmesh、surf和fsurf等函数来实现三维曲面的绘图。其中mesh和fmesh用来绘制三维网格曲面图&#xff0c;surf和fsurf绘制三维…

使用OpenCV如何确定一个对象的方向

在本教程中&#xff0c;我们将构建一个程序&#xff0c;该程序可以使用流行的计算机视觉库 OpenCV 确定对象的方向&#xff08;即以度为单位的旋转角度&#xff09;。 最常见的现实世界用例之一是当您想要开发机械臂的取放系统时。确定一个物体在传送带上的方向是确定合适的抓…