1. 位图概念
1. 面试题 给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在 这40亿个数中。【腾讯】
1. 利用map,set等容器存储遍历 2. 排序(O(NlogN)),利用二分查找:
但是其有40亿个数据,而且是整型,最后估算下来,光是数据就占用了十六个G,何况还要用红黑树,哈希表这样的结构存储下来,这是不现实的。
3. 位图解决
数据是否在给定的整形数据中,结果是在或者不在,刚好是两种状态,那么可以使用一个二进制比特位来代表数据是否存在的信息,如果二进制比特位为1,代表存在,为0 代表不存在。比如:
所谓位图,就是用每一位来存放某种状态,适用于海量数据,数据无重复的场景。通常是用来判断某个数据存不存在的。
2.位图的使用
在STL库中,已经为我们提供了位图bitset
参数为一个非类型模板参数N,其代表位图中要开多少个比特位。
函数声明 | 功能 |
bool operator[ ] (size_t pos) const; | 返回对应位置的引用 |
size_t count() const noexcept; | 计算所有比特位中1的个数 |
constexpr size_t size() noexcept; | 返回比特位的个数 |
bool test (size_t pos) const; | 检测某一个位的状态,是1返回true,是0返回false |
bitset& set() noexcept; | 把某一个位的值改为1 |
bitset& reset() noexcept; | 把某一个位的值改为0 |
3.位图的实现
#include<iostream>
#include<bitset>
#include<vector>
using namespace std;
namespace lbk
{
template<size_t N>
class bitset
{
public:
bitset()
{
_bit.resize(N / 32 + 1,0);
_count = 0;
}
size_t size()
{
return N;
}
size_t count()
{
int bitCnttable[256] = {
0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3, 2, 3, 3, 4, 1, 2, 2, 3, 2, 3, 3, 4, 2,
3, 3, 4, 3, 4, 4, 5, 1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3, 4, 3, 4, 4, 5, 2, 3,
3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3,
4, 3, 4, 4, 5, 2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 2, 3, 3, 4,
3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5,
6, 6, 7, 1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3, 4, 3, 4, 4, 5, 2, 3, 3, 4, 3, 4,
4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5,
6, 3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7, 2, 3, 3, 4, 3, 4, 4, 5,
3, 4, 4, 5, 4, 5, 5, 6, 3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7, 3,
4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7, 4, 5, 5, 6, 5, 6, 6, 7, 5, 6,
6, 7, 6, 7, 7, 8 };
for (auto e : _bit)
{
for (int i = 0; i < 4; i++)
{
unsigned char c = e;
_count += bitCnttable[c];
e >>= 8;
}
}
return _count;
}
bitset& set(size_t x)
{
int i = x / 32;
int j = x % 32;
_bit[i] |= (1 << j);
return *this;
}
bitset& reset(size_t x)
{
int i = x / 32;
int j = x % 32;
_bit[i] &= (~(1 << j));
return *this;
}
bool test(size_t x)
{
int i = x / 32;
int j = x % 32;
return _bit[i] & (1 << j);
}
private:
vector<int> _bit;
size_t _count;
};
}