Redis高级数据结构之HyperLogLog

news2024/11/25 0:26:55

HyperLogLog的介绍

  • 这并不是一种全新的数据结构、实际类型是一种字符串类型。
  • 通过一种基数(不重复的元素数量就是基数)算法,便可以使用很小的内存空间完成独立总数的统计。
  • 数据集可以是IP、Email、ID等
  • 官方给出的统计误差是0.81%,能满足市面上绝大多数的UV统计需求。

HyperLogLog的常用操作命令

操作命令中的pf为了纪念这个算法的提出者 Philippe Flajolet
在这里插入图片描述

  • 向HyperLogLog添加元素、添加成功返回1
  • pfadd key element [element …]
    在这里插入图片描述
  • 计算一个或者多个HyperLogLog的独立总数
    在这里插入图片描述
  • 重复向HyperLogLog中插入元素,统计值会存在误差、存在误差的概率
    在这里插入图片描述
  • 求多个HyperLogLog的并集
  • pfmerge destkey sourcekey [sourcekey … ]
  • 求出的结果放到 sourcekey
    在这里插入图片描述

原理概述

基本原理便是HyperLogLog基于概率论中的伯努利试验并结合了极大的似然估算方法,做了分桶优化。
redis中的HyperLogLog在传统的分桶优化基础之上,还采用调和平均数过滤掉不健康的统计值。

Redis中的原理分析

  • 通过hash函数将传入的数据转化为64位的二进制比特串,并根据比特串的位数求出转化为1的最大位置k_max来求出存入了多少数据
  • 根据转化为的64位比特串的后14位作为分桶的依据,也就是2的14次方,一共分16384个桶。达到降低误判的作用
  • 然后比特串的前50位则依据从左往右第一个出现1的位数分别进入不同的桶中。所以每个桶中最大就存储50,总共是6位二进制比特串。110010

计算一个HyperLogLog的key占用的存储空间

一个key占用16384个桶x6位/8=12288b/1024=12KB

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/608952.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python文本注释数学表达式设置|python绘图中的数学表达式设置

本篇文章将介绍如何在Matplotlib中设置文本、注释和数学表达式,以便更好地呈现数据,提高可视化效果。 文章目录 一、Matplotlib中的文本设置1.1 纯文本设置1.2 含箭头的文本设置 二、Matplotlib中的数学表达式设置三、Matplotlib中的字体设置 一、Matplo…

Vue项目中通过插件pxtorem实现大屏响应式

一、原理 rem单位代表的是根节点的font-size大小,所以当我们在页面上使用rem去替代px的时候,就可以通过修改根节点font-size的值,动态地让页面上的元素根据不同浏览器宽高下去实现变化。 二、工具 1.postcss-pxtorem 作用:在编…

Spring Boot Application.properties和yaml配置文件

文章目录 一、全局配置文件概述二、Application.properties配置文件(一)创建Spring Boot的Web项目PropertiesDemo(二)在应用属性文件里添加相关配置1、配置服务器端口号和web虚拟路径2、对象类型的配置与使用(1&#x…

微应用如何实现自动更新提示

首先, 先讲一下本次文章所讲的场景, 经过调研, 公司内部使用后台, 当有需求功能迭代的时候, 通常使用者会没有感知, 使用者只会在浏览器内一直打开这个页面, 当需要使用的时候, 再切换这个tab来使用. 这就导致使用者一直不知道系统更新了, 一直没有访问最新的页面(由于最新页面…

日志框架——Log4j2

日志框架——Log4j2 日志框架Log4j21. 概述2. Log4j2主要由几个重要的组件构成:3.项目中使用3.1 引入相关依赖pom.xml3.2 加入日志配置文件src/main/resources/log4j2.xml3.3 测试 日志框架Log4j2 1. 概述 Apache Log4j2是一个开源的日志记录组件,使用非常的广泛。…

【Protobuf速成指南】什么是Protobuf?

文章目录 一、序列化和反序列化1.1 概念1.2 场景1.3 如何序列化 二、Protobuf介绍1. 自身特点2.使用特点 一、序列化和反序列化 1.1 概念 🎯[总结]: 序列化:把对象转换为字节序列的过程称为对象的序列化。反序列化:把字节序列恢复为对象的过…

MySQL数据库 8.DML操作

目录 ​编辑 🤔前言: 🤔DML介绍: 🤔语法详情: 😀1.插入数据: 特点: 1.给指定字段添加数据: 代码示例: 运行结果: 2.给所有的字段添加数据&…

好的用户体验和性能:现代前端的双赢之路

部分数据来源:ChatGPT 引言 随着 Web 应用程序的复杂度和重要性逐渐上升,前端开发人员已经开始更加注重应用程序的可用性和性能。在这个快速变化的时代,前端开发是日益增长的一个领域。 在当前的前端领域,用户体验和性能是前端开…

解决在谷歌浏览器下载时文件名包含逗号导致页面显示网页不可用问题

项目场景: 自己开发的文件服务项目在使用时测试反馈在下载文件时,文件名包含逗号时下载失败,无法跳转到下载链接页面。 项目使用springboot开发,文件的上传基于SpringMVC的表单文件上传。但是下载时由于需要下载原文件名&#xf…

【IC设计】基于Verilog的8层矩阵乘法设计

文章目录 项目要求基本要求截断要求低位截断高位饱和 参考结果 项目实现实现思路实现代码matrix_multiplier_16.vtb_mm_mlp.v VCS&Verdi综合前仿真dc综合VCS&Verdi综合后仿真不足之处 项目要求 基本要求 输入有9个矩阵,权重矩阵有8个,分别是We…

win11安装open-ssh server

帮助链接: 安装 OpenSSH | Microsoft Learn step1: 本机管理模式的power shell下查询安装状态 Get-WindowsCapability -Online | Where-Object Name -like OpenSSH* Name : OpenSSH.Client~~~~0.0.1.0 State : InstalledName : OpenSSH.Server~~~~0.0.1.0 Stat…

Kafka生产者与消费者api示例

生产者api示例 一个正常的生产逻辑需要具备以下几个步骤 配置生产者参数及创建相应的生产者实例 构建待发送的消息 发送消息 关闭生产者实例 采用默认分区方式将消息散列的发送到各个分区当中 package com.doitedu;import org.apache.kafka.clients.producer.KafkaProduce…

【人工智能】— 线性分类器、感知机、损失函数的选取、最小二乘法分类、模型复杂性和过度拟合、规范化

【人工智能】— 感知机、线性分类器、感知机、感知机、最小二乘法分类、模型复杂性和过度拟合、规范化 Linear predictions 线性预测分类线性分类器感知机感知机学习策略损失函数的选取距离的计算 最小二乘法分类求解最小二乘分类矩阵解法一般线性分类模型复杂性和过度拟合训练…

重估端到端原则

评价技术迭代的旧的定势眼光来自于该技术诞生时。 1970/80/90 年代,相比传输带宽技术,处理器更强。网络协议倾向于字段多,字段小且紧凑,尽可能减少传输量,用 “算法技巧” 等价,如果 TCP 序列号 48 位&…

【iOS】消息传递和消息转发机制

消息传递机制 在OC语言中,调用对象的方法被叫做消息传递。消息有名称和选择子(selector),可以接受参数,还可能有返回值。 在Objective-C中,如果向某对象传递消息,那就会使用动态绑定机制来决定需要调用的方法。在底层…

C++进阶 —— 范围for(C++11新特性)

目录 一,范围for介绍 二,范围for注意事项 一,范围for介绍 范围for(range-based for loop)是C11新引入的特性,可遍历各种序列结构的容器(如数组、vector、list等);每次循…

【QT】Qt ApplicationManager Compositor源码分析

Qt ApplicationManager的Compositor功能分析 根据Qt ApplicationManager官网介绍,它基于Wayland协议实现了Compositor功能。下述为官网介绍。实际上,QtApplicationManager是使用了QtWayland模块来实现Compositor的。Wayland是一套旨在替代XWindow的 Com…

微机实验:第5章——存储器设计

存储器设计 将两片6116所有的存储单元都写入11H。 提示:6116的存储容量为2K*8b,片内地址为0000H-07FFH,两片一起构成F8000H-F8FFFH的内存空间。 仿真调试时可以看到:每片从0000H-07FFH的每个存储单元均显示11H。 CODE SEGMENTASSUME CS:C…

4-4 哈夫曼编码

博主简介:一个爱打游戏的计算机专业学生博主主页: 夏驰和徐策所属专栏:算法设计与分析 1.什么是哈夫曼编码? 哈夫曼编码(Huffman coding)是一种用于数据压缩的无损编码方法。它是由David A. Huffman在1952…

STM32F4_软件模拟SPI

目录 1. 硬件连接 2. SPI通讯协议 3. W25Q64 简介 4. 程序详解 4.1 main.c 4.2 SPI.c 4.3 SPI.h 4.4 W25Q128.c 4.5 W25Q128.h 4.6 OLED.c 4.7 OLED.h 4.8 OLED_Font.h 5. 实验结果 我们都知道,SPI 和 IIC 一样,都可以通过硬件方式和软件方…