HyperLogLog和Set比较

HyperLogLog

HyperLogLog常用于大数据量的统计，比如页面访问量统计或者用户访问量统计，作为一种概率数据结构，HyperLogLog 以完美的精度换取高效的空间利用率。Redis HyperLogLog 实现最多使用 12 KB，并提供 0.81% 的标准误差。

向HyperLogLog中添加元素，如果集合中没有该元素则返回1，否则返回0
[图片]
在这里插入图片描述

统计HyperLogLog中的数据个数
在这里插入图片描述

将多个HyperLogLog合并为一个HyperLogLog
在这里插入图片描述

Set可以存储232的数据, HyperLogLog可以存储264的数据
HyperLogLog存储为3bytes~12KB, Sett的存储为60bytes~512MB(每添加一个元素增加2bytes)
HyperLogLog的add和count都是O(1), merge是O(n)；Set的add，remove，SISMEMBER是O(1), scard是O(n)
HyperLogLog就是在大数据量级的情况下能够在很小的空间中进行元素去重统计。
如果使用我们平常的数据结构比如set,HashMap,等，虽然也可以实现去重统计的工作，但是当数据量上升到一定级别之后，其占用的空间也是非常的大。
需要注意的是HyperLogLog算法的去重计数方案并不精确，当然不是特别不精确，标准误差只有0.81%当然HyperLogLog虽说占据空间小，但也不是不占空间，当数据量大时它需要占据一定12k存储空间，所以如果我们的统计量可能比较小，使用HyperLogLog可能就是大材小用了，但是如果百万级、千万级，那节省的空间就非常大了。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/170243.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！