面试题
如何快速准备判断某一数据在海量数据中存在 |
了解布隆过滤器吗 |
安全网址判断,黑名单校验,识别垃圾邮件 |
白名单校验,识别合法用户? |
理论
由一个初始值都为0的 bit数组和多个哈希函数构成,用来快速判断集合中是否存在某个元素
设计思想
目的 | 减少内存占用 |
方式 | 不保存数据信息,只是在内存中做一个是否存在的标记flag |
判断具体数据是否存在于一个大集合中
特点
高效的插入和查询,占用空间少,返回的结果是不确定性和不够完美。
一个元素如果判断结果存在时,元素不一定存在,但是判断为不存在时一定不存在。(总结:有是可能有;无是肯定无)