文章目录
- 前言
- 一、什么是最小生成树
- 二、代码实现
- 1、构建图
- 2、生成树
- 总结
- 原创文章,未经许可,严禁转载
前言
最小生成树算法就是在众多可行的方案中选择代价最小的方法。生活中我们经常会遇到类似可以抽象成最小生成树的例子:比如你要给家中布电线,我们将每个用电器看作是顶点,那你可以从总闸布设到每一电器的电线,也可以从就近点接线。假设我们用从就近点接线,那就存在如何布线更节约的问题。这就是最小生成树可以解决的问题。
一、什么是最小生成树
用数学话来说,存在一个有n个顶点的带权连通图G。如果存在一个包含了G中所有顶点以及部分边的子图G’,且子图G’的各边权值和最小,并且还不形成回路。那么我们就可以称子图G’是图G的最小生成树。前面所说的在家布电线的问题,我们可以将各电器看作是顶点,将电线看作是边。那我们可以给出如下图:
图中蓝点代表了电器,黑线代表了各电器之间可以布线,红字代表了此段距离。没有连通的点说明不能在此两者之间布线。从生活经验来说,我们直接选距离最短的两个点开始布线就是了呗?
计算机科学家:约瑟夫·伯纳德克鲁斯卡(Krusdal)的想法和我们一样,他最著名的工作是计算加权图的最小生成树(MST) 的Kruskal 算法。该算法首先按权重对边进行排序,然后继续通过有序列表向部分 MST 添加一条边,前提是添加新边不会创建循环。
二、代码实现
按照算法逻辑,我们先把图中的边清空,可以得到如下顶点图:
然后我们用代码一步步将图中的顶点按距离的远近一步步连上,最终得到最小树。
1、构建图
很显然用二维数组来生成这个图会方便很多,数组的行列下标分别代表了一个顶点,存储的值就是边权(我们例子中的电器之间的距离)并没有方向的问题,我们要求的只是连通。
代码如下(示例):
#include <vector>
#include <algorithm>
#include <bits/stdc++.h>
using namespace std;
typedef struct { //边构造
int start;
int end;
int val;
}edge;
class Graph{
private:
int vertex; //顶点数
int** matrix; //有向图关系矩阵
int* sign; //标记边所属集合
vector<edge> edges; //存储所有边
vector<edge> mst; //存储最小生成树
int weight = 0; //最小生成树的权重和
public:
Graph(const int n ,vector<vector<int>> &arr){
vertex = n;
matrix = new int* [vertex]; //生成有向图关系矩阵
sign = new int[vertex];
for (int i=0; i<vertex; i++) sign[i]=i; //初始顶点集合标记为自身,表示图是各点独立的森林
for (int i = 0; i < 9; ++i){
matrix[i] = new int[9];
for (int j=0; j<9; j++){
matrix[i][j] = 0;
}
}
edge tmp;
for (int i=0; i<15; ++i){
matrix[arr[i][0]][arr[i][1]] = arr[i][2]; //生成有向图矩阵,演示用
tmp.start = arr[i][0]; //生成所有边
tmp.end = arr[i][1];
tmp.val = arr[i][2];
edges.push_back(tmp);
}
}
~Graph(){
delete[] matrix;
delete[] sign;
}
void show(){ //显示矩阵,演示用,和逻辑无关
for (int i=0; i<9; ++i){
for (int j=0; j<9; ++j){
cout << matrix[i][j] << " ";
}
cout << endl;
}
}
这里我们把顶点间的距离用arr数组来表示,每个元素有3个值,表示了顶点i,j之间存在边,边权为x。如{0,1,9}
就表示了顶点0和顶点1存在权重为9的边。在布线例子中,就是0号电器到1号电器的距离为9。以此类推,然后我们将其存储到matrix这个二维数组中。代码和前面用数组表示的游戏技能树差不多,笔者也是直接复制过来的,删除了一些不需要的代码就行,很方便。这样我们就生成了最前面图一中所示的图。代码中有个show
函数,可以打印出矩阵来看看:
0 9 0 5 9 0 0 0 0
0 0 0 3 0 7 0 0 0
0 0 0 13 0 8 10 0 0
0 0 0 0 0 0 2 0 12
0 0 0 0 0 0 0 5 4
0 0 0 11 0 0 0 0 0
0 0 0 0 0 0 0 6 0
0 0 0 0 0 0 0 0 1
0 0 0 0 0 0 0 0 0
可以看出,顶点8没有连出的边。图中肯定是有的,这是我们只插入了单向的原因,顶点7、4、3都有连接到顶点8的边,在求最小生成树的过程中,我们不需要双向连接,当然你把8->7、8->4、8->3的边写入图中也没有问题,其它顶点也一样。因为从前面的定义我们知道,最小生成树不能有环,所以后面代码中肯定有判断是否形成的环的部分。
2、生成树
代码如下(示例):
int is_inset(edge &e){ //判断边的两个顶点是在哪个集合中,修改标记
if (sign[e.start] == sign[e.end]) return 0;
int dest = sign[e.end];
sign[e.end] = sign[e.start];
for (int j=0; j<vertex; j++){
if(sign[j]==dest) sign[j]=sign[e.start];
}
return 1;
}
void kruskal(){
sort(edges.begin(), edges.end(), [](auto a, auto b){return a.val < b.val;}); //对边以val排序
int i = 0;
while (mst.size() < vertex-1){
if (is_inset(edges[i])){
mst.push_back(edges[i]);
weight += edges[i].val;
}
i++;
}
for (int i=0; i<mst.size(); i++) cout << mst[i].start << " -- " << mst[i].end << endl;
cout << "The weight of the MST tree: " << weight <<endl;
}
这部分有两个函数,函数kruskal
非常简单,按val的值从小到大取出边,交给is_inset函数判断后,放入mst向量。显然is_inset函数才是这个算法的关键。
这里我们采用了一个数组,数组的下标就是顶点编号,我们将此数组的各个值先默认设置为它的下标,这代表了如图二所示的只有根节点的森林,每一顶点都是以它自己为根节点的一棵树。很显然当两个顶点不在一个集合中(sign以顶点为下标的值不同),表示它们没连上。当一条边的两个顶点都在一个集合中(sign以顶点为下标的值相同),肯定这条边的两个顶点已经在同一个集合中,也就是已经连上,再添加就形成环了。比如下图的顶点3和5,{3, 5, 11}
就是不需要的边。
然后,当两个顶点被一条边连上了,代码中就是mst中加入了一条边,此时我们将这条边的end顶点在sign数组中的标记改为start顶点的值。并把所有其它标记为end值的顶点都改成start的标记。这个过程其实可以用不相交集合完成。最后生成如下:
kruskal
函数打印出来的结果:
7 -- 8
3 -- 6
1 -- 3
4 -- 8
0 -- 3
6 -- 7
1 -- 5
2 -- 5
The weight of the MST tree: 36
总结
kruskal算法是以边找顶点的办法,从权重低的边找起,不产生环就加入生成树。逻辑很简单,只要理解了in_inset函数的代码运行逻辑就行。既然有以边找点的算法,聪明的计算机科学家们肯定也想到了以点找边的办法,那就是Prime算法。下回分解…