【C++从0到王者】第三十八站:位图和布隆过滤器

news2025/1/4 16:09:24

文章目录

  • 一、哈希桶的改进
    • 1.链表与树结构的结合
    • 2.扩容使用质数
  • 二、位图
    • 1.位图的概念
    • 2.位图的实现
    • 3.位图的其他应用
  • 三、布隆过滤器
    • 1.布隆过滤器的提出
    • 2.布隆过滤器的实现
    • 3.布隆过滤器的应用

一、哈希桶的改进

1.链表与树结构的结合

有时候,在极端场景下,我们的哈希桶会出现某一个桶太长了,而其他的桶却没有结点,即如下图所示

image-20231014002352618

在这种情况下,我们有没有什么办法可以进行优化呢?其实是有的,当某个桶太长的时候,我们可以将这个链表转化为一颗红黑树进行存储,这样的话就会极大的优化效率

image-20231014002717967

那么像这种结构我们该如何定义呢?

如下所示,我们的哈希表每一个结点存储的是结构体,这个结构体有两个变量一个是联合体类型,一个是判断当前是树结构还是链表结构,这个联合体是由两个指针构成,这样可以更好的节约空间。

当链表需要转化为树的时候,只需要将链表结点依次插入一个树中即可,就可以释放掉链表了,最后将树挂上去。

union Type
{
	HashNode* head;
	TreeNode* root;
}
struct HashDate
{
	Type ptr;
	bool isTree = false; //方式一:用布尔值判断是树结构还是链表结构
	//或使用下面的方式
	size_t bucketSize;//方式二:用结点的长度来判断是树结构还是链表结构,比如说如果长度超过8就转化为树结构,小于则退化为链表
}
vector<HashDate> _table;

2.扩容使用质数

对于这一点,其实现在并没有充足的科学依据,但是确实有人提出过这一点

那就是哈希桶的数量使用质数的话会减少冲突

但是在vs2022中并没有使用质数

image-20231014005850086

如下是linux,即g++下面的,可以看到使用了质数

image-20231014010124390

那么在g++中是如何实现的使用素数扩容的呢?其实是直接使用了如下所示的素数表,然后去扩容的

		size_t GetNextPrime(size_t prime)
		{
			static const int __stl_num_primes = 28;
			static const unsigned long __stl_prime_list[__stl_num_primes] =
			{
			  53,         97,         193,       389,       769,
			  1543,       3079,       6151,      12289,     24593,
			  49157,      98317,      196613,    393241,    786433,
			  1572869,    3145739,    6291469,   12582917,  25165843,
			  50331653,   100663319,  201326611, 402653189, 805306457,
			  1610612741, 3221225473, 4294967291
			};

			size_t i = 0;
			for (; i < PRIMECOUNT; ++i)
			{
				if (primeList[i] > prime)
					return primeList[i];
			}

			return primeList[i];
		}

然后我们将这两处进行修改即可

image-20231014011131408

二、位图

1.位图的概念

我们先来看这样一道题

给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在这40亿个数中。【腾讯】

这是腾讯的一道面试题

我们能想到的思路有哪些呢?

  1. 直接暴力遍历,但是时间复杂度是O(N)
  2. 排序+二分,时间复杂度是logN
  3. 使用set,时间复杂度是logN

如上是我们最容易想到的办法,但是这些办法合理吗?可能实现吗?

其实肯定是不可以的,因为这数据量太大了,40亿的数据,相当于160亿字节

而我们知道10亿字节约为1G内存,那么这要用16G内存啊。我们一般的电脑根本跑不动的,更何况还有操作系统还要用分内存给其他软件呢。

使用set系列就更不可能了,因为就单论红黑树,一个结点,就额外需要三个指针,还有一个用来判断颜色的变量。需要消耗的内存一下子变为了80G,这几乎没有几个电脑带的动的,成本太高了

那么我们究竟该如何解决呢?

其实我们陷入了一个思维误区,误以为必须得把这40亿数据存起来才可以,其实我们可以不用存起来的。因为我们只需要判断这个数在不在就可以了。

而标记一个数在不在我们只需要一个比特位就可以搞定了。

那么如何可以只使用一个比特位呢?那我们就是使用哈希了。

我们可以直接开2的32次方个比特位的空间,每一个比特位我们都可以像数组一样给他们一个下标,这个下标就是代表了这个数,这个下标对应的比特位如果是0就代表这个数不在,如果是1就代表在就可以了。

那么为什么必须是2的32次方呢?因为题目要求的是无符号整数,它的范围最大刚好就是2的32次方

这就相当于直接定址法,这样的话我们只需要500MB就可以解决问题了。

2.位图的实现

由于没有一个数据类型只占一个比特位,所以我们只能使用其他的来模拟一个。比如下图就是使用int类型来进行模拟的,一个int代表着32个比特位

image-20231014175013825

不过上面的图其实还存在一些问题,因为对应一个变量而言,而的最右边的位才是第0位,所以上图我们应该在做一些修改

image-20231015150230416

这个就像在内存中的小端机器一样,也是类似于这样的存储方式,如下是当存储一个1的时候,内存就是如下的形式

image-20231015150833568

根据上面的思路,位图应该是这样的框架

image-20231015151403545

然后,我们先完善第一个功能置位,即将某个位置为1

如下所示,这里需要注意的是,小端机器只是机器底层内存的样子,我们不需要关注底层内存的情况,我们只需要关系对于int类型找到它表面上的第j个位就可以了。至于计算机内存底层是如何实现的,那不是我们要关心的事情

		void set(size_t x)
		{
			int i = x / 32;
			int j = x % 32;
			_a[i] |= (1 << j);
		}

然后就是将某一位置为0了,使用位运算就可以轻松解决了

		void reset(size_t x)
		{
			int i = x / 32;
			int j = x % 32;
			_a[i] &= ~(1 << j);
		}

如下是测试某一位是0还是1

		bool test(size_t x)
		{
			int i = x / 32;
			int j = x % 32;
			return _a[i] & (1 << j);
		}

最后我们加上非类型模板参数,最终的位图是这样的

namespace Sim
{
	template<size_t N>
	class bitset
	{
	public:
		bitset()
		{
			_a.resize(N / 32 + 1);
		}
		void set(size_t x)
		{
			int i = x / 32;
			int j = x % 32;
			_a[i] |= (1 << j);
		}
		void reset(size_t x)
		{
			int i = x / 32;
			int j = x % 32;
			_a[i] &= ~(1 << j);
		}
		bool test(size_t x)
		{
			int i = x / 32;
			int j = x % 32;
			return _a[i] & (1 << j);
		}
	private:
		vector<int> _a;
	};
}

使用如下测试用例

void test1()
{
	Sim::bitset<1000> bs;
	bs.set(1);
	bs.set(500);
	bs.set(1000);
	cout << bs.test(1) << endl;
	cout << bs.test(500) << endl;
	cout << bs.test(1000) << endl;
	cout << bs.test(2) << endl;

	cout << endl;


	bs.set(2);
	bs.reset(1);

	cout << bs.test(1) << endl;
	cout << bs.test(500) << endl;
	cout << bs.test(1000) << endl;
	cout << bs.test(2) << endl;

}

image-20231015154637525

现在有了位图,那么我们现在回过头来看一下这道题

给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在这40亿个数中。【腾讯】

现在我们可以使用位图来解决这个问题了,使用位图仅仅只需要500M,注意下面代码中,由于位图开的是范围,所以我们需要开到无符号整数的最大值,我们可以使用很多种方法找到,比如UINT32_MAX就代表无符号整数最大值,-1也是可以的,因为内存中代表全1,也可以使用16进制数都是很方便的找到无符号最大值。但是要注意千万不可以直接使用INT_MAX直接乘以2,这是错误的,还需要+1的,比如对于char,有符号最大值是127,无符号最大值是255。还需要注意的是如果是使用-1的话,一定要将系统设置为32位的。因为size_t在32位和64位是不一样的

image-20231015155608656

我们只需要用这500MB的内存就可以将海量数据依次放入位图中,然后我们就可以很方便的进行检验了

实际上在库里面也有位图

image-20231015161900791

它的操作最常用的就是下面的这些,其实主要还是我们实现的那三个,[]运算符重载使用的并不是很多

image-20231015161937014

3.位图的其他应用

  1. 给定100亿个整数,设计算法找到只出现一次的整数?

对于这道题,我们的想法还是使用位图,但是可以直接使用位图吗,好像不太行,我们似乎需要将我们原来的位图改造一下。因为只出现一次这句话,就代表了我们至少需要两个比特位来存储信息,00代表没有,01代表只存储一次,10代表存储一次以上

image-20231015162741023

这样的话,我们一开将位图的数据全部设置为0,当遇到一个数据,对应的位置改为01,如果又遇到重复的数据,改为10。如果还遇到,那就不变就可以了。这样的话就完美的解决了这个场景。

但是上面的问题有一点很不爽,如果我们不想手写类似于位图容器的话,那该如何处理呢?毕竟库里面的位图就只用一个比特位。我们想用库里面的位图该如何使用呢?

我们可以使用两个位图容器去搞定,一个位图对应的只存储一个位置即可,将这两个位图给封装为一个新的容器就可以了

template<size_t N>
class twobitset
{
public:
    void set(size_t x)
    {
        if (!_bs1.test(x) && !_bs2.test(x))
        {
            _bs2.set(x);
        }
        else if (!_bs1.test(x) && _bs2.test(x))
        {
            _bs1.set(x);
            _bs2.reset(x);
        }
    }
    bool is_once(size_t x)
    {
        return !_bs1.test(x) && _bs2.test(x);
    }
private:
    bitset<N> _bs1;
    bitset<N> _bs2;
};

然后我们使用如下测试用例

void test3()
{
	int a1[] = { 1,2,3,3,4,4,4,4,4,2,3,6,3,1,5,5,8,9 };
	Sim::twobitset<10> tbs;
	for (auto e : a1)
	{
		tbs.set(e);
	}
	for (auto e : a1)
	{
		if (tbs.is_once(e))
		{
			cout << e << " ";
		}
	}
	cout << endl;
}

image-20231015164946345

这个位图的方法对于寻找单身狗的题目也会有奇效

  1. 给两个文件,分别有100亿个整数,我们只有1G内存,如何找到两个文件交集?

对于这个题,我们一开始的想法可能就是,先将一个文件里面的数据使用一个位图中,然后用另外一个文件进行比较判断在不在。不过这个的问题就在于,会出现重复的数据。所以我们需要去重,那我们如果使用set去去重的话,那如何不重复的数据量太多。显然内存不够用。

所以我们的办法是使用两个位图,用两个文件分别映射到两个位图中,然后与一下。还是1的位置就是交集了

image-20231015170844048

比如下面的代码就可以求出交集

void test4()
{
	int a1[] = { 1,2,3,3,4,4,4,4,4,2,3,6,3,1,5,5,8,9 };
	int a2[] = { 8,4,8,4,1,1,1,1 };
	Sim::bitset<10> bs1;
	Sim::bitset<10> bs2;

	for (auto e : a1)
	{
		bs1.set(e);
	}
	for (auto e : a2)
	{
		bs2.set(e);
	}
	for (int i = 0; i < 10; i++)
	{
		if (bs1.test(i) && bs2.test(i))
		{
			cout << i << " ";
		}
	}
	cout << endl;
}

image-20231015171753679

  1. 位图应用变形:1个文件有100亿个int,1G内存,设计算法找到出现次数不超过2次的所有整数

这道题其实和问题一十分类似,可以使用两个位图去解决

00代表没有数据,01代表只出现一次,10代表出现了2次,11代表出现了两次以上

不过我们可能会在意的是int可能是负数,其实没关系,因为我们都会将他变为size_t的,最后打印的时候在强转会int就可以了

三、布隆过滤器

1.布隆过滤器的提出

上面的数据都是针对于整型的

那么当我们的数据为字符串类型呢?我们能否进行映射呢?其实也是可以的,只需要使用字符串转整型算法即可

image-20231015174046673

这样的话,未来想判断这个字符串在不在就可以直接观测位图的这个位置来判断在不在

image-20231015174224660

但是上面还是存在一些问题的,那就是可能有其他字符串映射的值和它一样

image-20231015174422204

这个时候就存在误判了

也就是说,可能存在冲突导致误判,如果一个字符串在的话,那么它有可能是误判放进来的,但是如果一个不在的话,那么一定是精确的

那么这时候我们会发现,这个误判似乎无法消除,但是我们可以去降低这个误判率

而布隆所提出的方法就是,进行多个映射

image-20231015175657568

这样的话只要有一个没有映射上去,那么就说明这个值不存在,只有对应的几个位都为1,才能说这个字符串存在,当然这也有可能会误判,但是这样使用多个映射以后,误判率降低了。只要把位图开的大一点,控制一个合理的类似于负载因子的东西,就可以极大的降低误判率。但是这个切记不可以太密集了,所以要求位图的范围要大

image-20231015175831000

像上面的这种东西,我们也称为布隆过滤器

对于布隆过滤器,它的使用场景很多,比如说下面的场景

首先就是对于不需要特别精确的场景,比如说快速判断一个昵称是否被人注册过。这个时候,我们可以将数据库的全部数据放入一个布隆过滤器。我们控制好误判率当有人输入了一个昵称,虽然这个昵称其实没有被注册过,但是我们提示这个昵称注册过了,这个其实是没有任何问题的当这个昵称被注册过了,那么一定会精确的提醒注册过了

即便如果必须要精确的话,我们也可以使用布隆过滤器先检查一遍,如果某个昵称在的话,直接过滤掉即可,即显示该用户已被注册。如果不在的话,那么我们在去数据库检索一遍,返回数据库的数据。

这样的话就可以极大的降低数据库查询负载压力,从而提高效率

2.布隆过滤器的实现

如下所示是一个简单的布隆过滤器的实现,对于这个布隆过滤器,我们只考虑置位和检测这两个函数就足够了。因为如果使用复位的话可能会影响其他位。如果非要强制支持复位,那么就需要计数了,也就是说每个位还需要一个计数器,删除一个数据,就代表着这个字符串所映射的三个位的计数器都减一就可以了。而这个计数器我们一般而言最少也得需要一个char变量,这就需要消耗八个比特位了,因为我们一般都是几十亿个数据时候才使用布隆过滤器的。为了支持一个删除要多消耗八倍的空间,属实划不来。

我们本来就是为了节省空间才使用的位图,而这个删除却要额外消耗八倍的空间,这就违背了我们一开始的原则

#pragma once


namespace Sim
{
    struct BKDRHash
    {
        size_t operator()(const string& s)
        {
            size_t hash = 0;
            for (auto ch : s)
            {
                hash = hash * 131 + ch;
            }
            return hash;
        }
    };



    struct APHash
    {
        size_t operator()(const string& s)
        {
            size_t hash = 0;
            for (size_t i = 0; i < s.size(); i++)
            {
                char ch = s[i];
                if ((i & 1) == 0)
                {
                    hash ^= ((hash << 7) ^ ch ^ (hash >> 3));
                }
                else
                {
                    hash ^= (~((hash << 11) ^ ch ^ (hash >> 5)));
                }
            }
            return hash;
        }
    };
    
    struct DJBHash
    {
        size_t operator()(const string& s)
        {
            size_t hash = 5381;
            for (auto ch : s)
            {
                hash += (hash << 5) + ch;
            }
            return hash;
        }
    };




    template<size_t N,
			class K = string,
			class Hash1 = BKDRHash,
            class Hash2 = APHash,
            class Hash3 = DJBHash>
	class BloomFilter
	{
	public:
		void set(const K& key)
		{
            size_t hash1 = Hash1()(key) % N;
            _bs.set(hash1);
            size_t hash2 = Hash2()(key) % N;
            _bs.set(hash2);
            size_t hash3 = Hash3()(key) % N;
            _bs.set(hash3);
		}
        bool test(const K& key)
        {
            size_t hash1 = Hash1()(key) % N;
            if (!_bs.test(hash1))
            {
                return false;
            }
            size_t hash2 = Hash2()(key) % N;
            if (!_bs.test(hash2))
            {
                return false;
            }
            size_t hash3 = Hash3()(key) % N;
            if (!_bs.test(hash3))
            {
                return false;
            }
            return true;
        }
	private:
		std::bitset<N> _bs;
	};
};

我们使用如下代码来进行测试

void test5()
{
	Sim::BloomFilter<1000> bf;
	bf.set("孙悟空");
	bf.set("猪八戒");

	cout << bf.test("孙悟空") << endl;
	cout << bf.test("猪八戒") << endl;
	cout << bf.test("沙悟净") << endl;

}

image-20231016125530445

我们可以进一步检测一下每个哈希函数算出位置

只需要在set函数中添加打印下标即可

image-20231016125918374

可见此时还没有出现冲突,当如果长度为10的时候,可见容器产生冲突,但是还好,因为有三个位可以作为判断依据,一个位冲突还有其他位来帮忙检测

image-20231016130040461

对于已经存在的,一定会精确的判断它存在,但是对于不存在的,有可能会产生误判,比如当宽度为5的时候,沙悟净产生了误判

image-20231016130237119

在这里,哈希函数的个数也需要权衡,个数越多则布隆过滤器 bit 位置位 1 的速度越快,且布隆过滤器的效率越低;但是如果太少的话,那我们的误报率会变高。也有人计算出出了了哈希函数的个数和数组的长度与误判率的关系的图片

k 为哈希函数个数,m 为布隆过滤器长度,n 为插入的元素个数,p 为误报率

img

如下就是其他人计算出来的k和m最适合的值

img

相关文章链接如下:布隆过滤器

我们可以用下面这段代码来测试误判率

void test6()
{
	srand(time(0));
	const size_t N = 100000;
	Sim::BloomFilter<N * 5> bf;

	std::vector<std::string> v1;
	std::string url = "https://blog.csdn.net/jhdhdhehej?spm=1010.2135.3001.5343";

	for (size_t i = 0; i < N; ++i)
	{
		v1.push_back(url + std::to_string(i));
	}

	for (auto& str : v1)
	{
		bf.set(str);
	}

	// v2跟v1是相似字符串集(前缀一样),但是不一样
	std::vector<std::string> v2;
	for (size_t i = 0; i < N; ++i)
	{
		std::string urlstr = url;
		urlstr += std::to_string(9999999 + i);
		v2.push_back(urlstr);
	}

	size_t n2 = 0;
	for (auto& str : v2)
	{
		if (bf.test(str)) // 误判
		{
			++n2;
		}
	}
	cout << "相似字符串误判率:" << (double)n2 / (double)N << endl;

	// 不相似字符串集
	std::vector<std::string> v3;
	for (size_t i = 0; i < N; ++i)
	{
		string url = "zhihu.com";
		url += std::to_string(i + rand());
		v3.push_back(url);
	}

	size_t n3 = 0;
	for (auto& str : v3)
	{
		if (bf.test(str))
		{
			++n3;
		}
	}
	cout << "不相似字符串误判率:" << (double)n3 / (double)N << endl;
}

测试结果如下所示

image-20231016141340410

当然我们可以控制M的大小来使得误判率降低

当M为10倍的N的时候,误判率进一步下降

image-20231016141456546

3.布隆过滤器的应用

  1. 给两个文件,分别有100亿个query(查询),我们只有1G内存,如何找到两个文件交集?分别给出精确算法和近似算法

首先对于近似算法就很简单,直接使用布隆过滤器,把其中一个文件放入布隆过滤器中,另外一个判断在不在。在就是交集,不在就不是交集。不过会存在误判

然后是对于精确算法,这就比较麻烦了,我们需要使用一个哈希切分

我们假设一共query是30byte,那么100亿query就是3000亿byte,相当于300G内存

所谓的哈希切分就是:将A和B分别切成很多个小文件,用哈希函数去计算出对应的下标,然后将该数据放入对应的小文件。

用图来描述就是这样的

image-20231016150805721

最终他们就会被切分为如下所示,然后我们直接去找交集即可,因为这里我们会发现,如果是相同的数据一定会落在下标相同的小文件中。而且在切分的时候这里的内存消耗几乎没有,因为切分的策略是将大文件的数据一个一个的读入内存然后写入新的小文件中。

image-20231016150843848

找交集的时候,Ai读出全部读出来放入到一个set中,然后依次读取Bi中的query,判断在不在,如果在就说明是交集。这样就可以遭到Ai和Bi的交集了,但是平均切分是300MB,然而我们这里并不是平均切分,而是哈希切分,如果一旦冲突太多了,会导致某个Ai文件太大,超过1G内存,此时又该如何处理呢?

在这里我们分为两种情况,比如说Ai有5G

  1. 4G都是相同的query,1G是冲突的(那么这时候我们可以放入set,正常执行没有任何问题)
  2. 大多数都是冲突的 (那么这时候我们只能进行二次切分了)

我们最终的解决方案是这样的

  1. 先把Ai所有的query都放入set,如果set的insert报错抛异常(bad_alloc),那么说明大多数是冲突的,我们在换一个哈希函数,采用二次切分
  2. 如果没有报错抛异常,那么就说明大多数是相同的。按照正常流程找交集即可
  1. 给一个超过100G大小的log file, log中存着IP地址, 设计算法找到出现次数最多的IP地址?出现次数最多的K个IP地址?

我们的思路与上一道题很相似,使用哈希切分,那么相同ip一定进入了同一个小文件,用map分别统计每个小文件中出现ip次数即可。然后我们可以使用一个堆,类似于TOP-K问题,每个小文件结束以后将前K个放入其中即可。

image-20231016154022588

以及像前面的这个题目,同样可以使用哈希切分来解决,只不过使用哈希切分的话有点麻烦, 不如使用位图来的方便

给两个文件,分别有100亿个整数,我们只有1G内存,如何找到两个文件交集?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1097832.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一本由红帽专家亲作的Quarkus实战型入门书籍——《Kubernetes原生微服务开发》

Kubernetes原生微服务开发 出版社&#xff1a; 清华大学出版社 作者&#xff1a;[美] 约翰克林甘&#xff08;John Clingan&#xff09;、肯芬尼根(Ken Finnigan) 出版时间&#xff1a;2023年6月 微服务开发并不容易。其中涉及大量的概念与复杂的技术&#xff0c;令很多开发者…

ARP协议(地址解析协议) 的作用和操作过程

目录 1.问题: &#xff08;在同一个LAN局域网内&#xff09;如何在已知目的接口的IP地址前提下确定其MAC地址&#xff1f;2.问题&#xff1a;现在假设主机A要向目的主机B发送一个数据报&#xff0c;怎么发送呢&#xff1f;2.1在一个局域网内时2.1.1情况一&#xff1a;2.1.2情况…

从基础到卷积神经网络(第15天)

1. PyTorch 神经网络基础 1.1 模型构造 1. 块和层 首先,回顾一下多层感知机 import torch from torch import nn from torch.nn import functional as Fnet = nn.Sequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))X = torch.rand(2, 20) # 生成随机输入(批…

年龄越大,越要小心逢九年

老话有云&#xff1a;年龄逢九&#xff0c;灾祸频有。在我国的许多农村地区&#xff0c;至今还流传着这么句话&#xff0c;这句话的大概意思是说&#xff1a;每个人命理年龄逢九&#xff0c;就会有个坎&#xff0c;年龄越大&#xff0c;坎就越厉害&#xff0c;所以&#xff0c;…

【真题T1】[NOIP2022] 种花

一.题目 P8865 [NOIP2022] 种花 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 二.思路&#xff08;80pts&#xff09; &#xff08;1&#xff09;"C"型 则我们可以计算出每一行的前缀和&#xff0c;然后枚举每一列再每枚举每一行&#xff0c;定义为x1&#xff1b…

算法leetcode|84. 柱状图中最大的矩形(rust重拳出击)

文章目录 84. 柱状图中最大的矩形&#xff1a;样例 1&#xff1a;样例 2&#xff1a;提示&#xff1a; 分析&#xff1a;题解&#xff1a;rust&#xff1a;go&#xff1a;c&#xff1a;python&#xff1a;java&#xff1a; 84. 柱状图中最大的矩形&#xff1a; 给定 n 个非负整…

配置文件-依赖注入

文章目录 前言一、如何解决注入依赖顺序&#xff1f;二、不生效的到问题三 解决办法总结 前言 spring注入bean的时候,可以指定某些注入顺序 例如&#xff1a;A B两个bean注入,B依赖A ,所以要先注入A 然后才能注入B,此时如何处理呢? 一、如何解决注入依赖顺序&#xff1f; 通…

pdf怎么压缩?pdf文件过大这样压缩准没错

在日常生活中&#xff0c;我们常常需要处理大量的PDF文件&#xff0c;这些文件不仅占用存储空间&#xff0c;而且在传输时也可能会受阻&#xff0c;为了解决这些问题&#xff0c;我们需要对PDF文件进行压缩&#xff0c;下面就给大家分享几个PDF压缩方法&#xff0c;一起来看看吧…

【Python数据挖掘】自动售货机销售数据分析与应用【送书活动】

目录 前言01 案例背景02 分析目标03 分析过程04数据预处理1.清洗数据1.1 合并订单表并处理缺失值1.2 增加“市”属性1.3 处理订单表中的“商品详情”属性1.4 处理“总金额&#xff08;元&#xff09;”属性 2.属性选择3.属性规约 05销售数据可视化分析1.销售额和自动售货机数量…

【软考-中级】系统集成项目管理工程师-质量管理历年案例

持续更新。。。。。。。。。。。。。。。 目录 2020 下 试题一(18分) 2020 下 试题一(18分) 某公司刚承接了某市政府的办公系统集成项目&#xff0c;急需一名质量管理人员。因公司有类似项目经验&#xff0c;资料比较齐全。项目经理考虑到配置管理员小张工作积极负责&#xff0…

记一次 .NET某新能源检测系统 崩溃分析

一&#xff1a;背景 1. 讲故事 前几天有位朋友微信上找到我&#xff0c;说他的程序会偶发性崩溃&#xff0c;一直找不到原因&#xff0c;让我帮忙看一下怎么回事&#xff0c;对于这种崩溃类的程序&#xff0c;最好的办法就是丢dump过来看一下便知&#xff0c;话不多说&#x…

【CFD小工坊】浅水模型的边界条件

【CFD小工坊】浅水模型的边界条件 前言处理边界条件的原则边界处水力要素的计算水位边界条件单宽流量边界条件流量边界条件固壁边界条件 参考文献 前言 在浅水方程的离散及求解方法一篇中&#xff0c;我们学习了三角形网格各边通量值及源项的求解。但仍有一个问题没有解决&…

nginx报错

故障1&#xff1a;nginx 502错误 故障描述 一个 post 的请求&#xff0c;直接调接口服务数据正常返回&#xff0c;但是通过 nginx 代理后&#xff0c; 什么都没有返回 nginx错误日志 upstream sent invalid chunked response while reading upstream 原因 http协议版本不一致…

掌握 Scikit-Learn: Python 中的机器学习库入门

机器学习 第二课 Sklearn 入门 概述机器学习与 Python 的完美结合Scikit-Learn 的核心组件与结构安装与配置验证安装 数据表示与预处理特征矩阵和目标向量数据处理 估计器模型的选择思考问题的本质研究数据的分布判断任务的复杂性分类问题回归问题 监督学习分类算法回归算法 无…

微信小程序引入阿里巴巴iconfont图标并使用

介绍 在小程序里&#xff0c;使用阿里巴巴的图标&#xff0c;如下所示: 使用方式 搜索自己需要的图标&#xff0c;然后将需要用到的图标加入购物车&#xff0c;如下图所示&#xff1a; 去右上角&#xff0c;点击购物车按钮&#xff1b;这里第一次使用&#xff0c;会有三个提…

华为云云耀云服务器L实例评测|从零快速搭建个人博客指南

文章目录 1. 云耀云服务器L实例特点2. 云耀云服务器L实例购买3. 博客系统搭建3.1. 安装 Docker3.2 Halo 搭建 4. 防火墙配置5. 浏览器访问 1. 云耀云服务器L实例特点 智能不卡顿 瑶光AI智能调度与新一代网络技术&#xff0c;软硬实力驱动性能倍增&#xff0c;成就更流畅、稳定的…

数据结构:链表(2),链表面试题

203. 移除链表元素 - 力扣&#xff08;LeetCode&#xff09; 给你一个链表的头节点 head 和一个整数 val &#xff0c;请你删除链表中所有满足 Node.val val 的节点&#xff0c;并返回 新的头节点 。 示例 1&#xff1a; 输入&#xff1a;head [1,2,6,3,4,5,6], val 6 输出…

Web自动化测试-PO模式实战详解

PO模式 Page Object(简称PO)模式&#xff0c;是Selenium实战中最为流行&#xff0c;并且是自动化测试中最为熟悉和推崇的一种设计模式。在设计自动化测试时&#xff0c;把页面元素和元素的操作方法按照页面抽象出来&#xff0c;分离成一定的对象&#xff0c;然后再进行组织。 …

NI GPIB-140A 使用缓冲传输技术 边缘人工智能

NI GPIB-140A 使用缓冲传输技术 边缘人工智能 GPIB总线扩展器—GPI b-140 a可以将GPIB系统的电缆长度延长一千米&#xff0c;而不会影响GPIB的完整性&#xff0c;也不需要修改软件。该配件使用缓冲传输技术&#xff0c;以高达1.1 Mb/s (IEEE 488.1)或2.8 Mb/s (HS488)的速率传…

初识C++入门(1)

为什么会衍生出C&#xff1f; C语言是结构化和模块化的语言&#xff0c;适合处理较小规模的程序。对于复杂的问题&#xff0c;规模较大的程序&#xff0c;需要高度的抽象和建模时&#xff0c;C语言则不合适。为了解决软件危机&#xff0c;20世纪80年代&#xff0c;计算机界提出…