高阶数据结构-图

图的表示

图由顶点和边构成，可分为有向图和无向图

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CJQ2P9yw-1692191657311)(D:\software\Typora\picture\高阶数据结构-图-16917558553992.png)]$

邻接表法

图的表示方法有邻接表法和邻接矩阵法，以上图中的有向图为例，邻接表法可以表示为

A->[(B,5),(C,10)]
B->[(D,100)]
C->[(B,3)]
D->[(E,7)]
E->[NULL]

邻接表法的特点：

为每一个顶点维护一个顺序表，顺序表中存储与这个顶点直接相连的顶点
可以快速得出与一个顶点直接相连的顶点个数，时间复杂度为O(1)
判断两个顶点是否直接相连需要进行遍历，时间复杂度为O(N)

邻接矩阵法

使用邻接矩阵法可以表示为

顶点(from)/顶点(to)	A	B	C	D	E
A	0	5	10	NONE	NONE
B	NONE	0	NONE	100	NONE
C	NONE	3	0	NONE	NONE
D	NONE	NONE	NONE	0	7
E	NONE	NONE	NONE	NONE	0

邻接矩阵法的特点：

维护一个二维数组，数组中的元素为顶点与顶点之间的距离
可以快速得出两个点之间是否存在直接相连的边，时间复杂度为O(1)
在判断一个顶点直接相连的顶点个数时，需要进行遍历，时间复杂度为O(N)
对于无向图，邻接矩阵沿对角线呈对称分布

图的结构

顶点的结构

图由顶点和边构成，顶点的结构如下

struct Edge;
struct Node {
	Node(string str = "") :value(str) {}
	string value;
	int in = 0;
	int out = 0;
	unordered_set<Node*> nodes;
	unordered_set<Edge*> edges;
};

value，表示顶点对应的值
in，表示顶点的入度，即存在多少个顶点指向自己
out，表示顶点的出度，即该顶点指出的顶点个数
nodes，哈希表结构，存储一个顶点指向的所有顶点
edges，哈希表结构，存储从一个顶点出发的所有边

以图中的A点为例

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-u7lFCddw-1692191657311)(D:\software\Typora\picture\Demo.png)]$

其value=“A”，in=0，out=2，nodes为顶点B和C，edges为权值为5的边和权值为10的边

为什么需要使用哈希表存储顶点和边？

哈希表的增删查改时间复杂度均为O(1)，在实现图相关算法时具有较好的优势

边的结构

struct Edge {
	Edge(Node* f, Node* t, int w = 0) :from(f), to(t), weight(w) {}
	int weight = 0;
	Node* from = nullptr;
	Node* to = nullptr;
};

weight，表示边的权值
from，表示这条边从哪一个顶点出发
to，表示这条边以哪一个顶点作为结束
如果是无向图，使用2条有向边表示即可

图的结构

struct Graph {
	unordered_map<string, Node*> nodes;
	unordered_set<Edge*> edges;
};

nodes中的key为顶点代表的值，value为具体的顶点

抽象表示转化为已知结构

以下图为例

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3Fqnpwkx-1692191657312)(D:\software\Typora\picture\Demo.png)]$

该图可以使用一个二维数组表示

vector<vector<int>> matrixGraph = {
    {'A','B',5},
    {'A','C',10},
    {'B','D',100},
    {'C','B',3},
    {'D','E',7}
};

二维数组中每一个一维数组的第一个元素表示from点，第二个元素表示to点，最后一个元素表示边的权值，二维数组可以表示图，但是在实现图的相关算法不具备通用性，可以将其转化已知结构。

Graph TransforGraph(const vector<vector<int>>& matrixGraph) {
	Graph ansGraph;
	for (auto& elemedge : matrixGraph) {
		string from, to;
		from += elemedge[0];
		to += elemedge[1];//获取from点与to点的值
		int weight = elemedge[2];//获取边的权值
		if (ansGraph.nodes.count(from) == 0) {
			ansGraph.nodes[from] = new Node(from);//点不存在就创建
		}
		if (ansGraph.nodes.count(to) == 0) {
			ansGraph.nodes[to] = new Node(to);
		}
		Edge* edge = new Edge(ansGraph.nodes[from], ansGraph.nodes[to], weight);
		ansGraph.nodes[from]->out++;//from点的出度++
        ansGraph.nodes[from]->edges.insert(edge);//将edge添加到from出发的边
		ansGraph.nodes[from]->nodes.insert(ansGraph.nodes[to]);//将to点添加到from出发的点
		ansGraph.nodes[to]->in++;//to点的入度++
		ansGraph.edges.insert(edge);
	}
	return ansGraph;
}

有关图的抽象表示，均可转化为已知结构，以便于实现图的相关算法

图的算法

宽度优先遍历

图结构中可能存在环，宽度优先遍历(bfs)时需要使用哈希表以避免顶点重复进入队列

void bfs(Node* start) {//从start开始进行宽度优先遍历
    queue<Node*> nodeQ;
    unordered_set<Node*> nodeSet;
    nodeQ.push(start);
    while (!nodeQ.empty()) {
        Node* cur = nodeQ.front();
        nodeQ.pop();
        if (nodeSet.count(cur) == 0) {//表示之前没有遍历过这个顶点
            cout << cur->value << endl;//访问该顶点
            nodeSet.insert(cur);//将该顶点加入set,防止重复遍历
            for (Node* node : cur->nodes) {
                if (nodeSet.count(node) == 0) {
                    nodeQ.push(node);
                }
            }
        }
    }
}

深度优先遍历

图的深度优先遍历(dfs)：

使用哈希表记录已经遍历过的顶点
使用栈记录深度优先遍历的路径
在出栈时，已经遍历过的顶点直接跳过

void dfs(Node* start) {
    stack<Node*> nodeStack;
    unordered_set<Node*> nodeSet;
    nodeStack.push(start);
    cout << start->value << endl;//深度优先遍历在入栈时对顶点进行处理
    nodeSet.insert(start);
    while (!nodeStack.empty()) {
        Node* Topnode = nodeStack.top();//取出栈顶元素
        nodeStack.pop();
        for (Node* node : Topnode->nodes) {
            if (nodeSet.count(node) == 0) {//判断是否已经遍历过
                cout << node->value << endl;//访问下一层的元素
                nodeSet.insert(node);
                nodeStack.push(Topnode);
                nodeStack.push(node);//将路径压入栈中
                break;//去往下一层
            }
        }
    }
}

拓扑排序

一个项目可能存在多个模块，模块之间存在一定的依赖关系，可以用图表示

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9fxnvt34-1692191657312)(D:\software\Typora\picture\拓扑排序.png)]$

例如上图，模块B依赖于模块A，模块C依赖于模块A和B，模块D依赖于模块A和C，该项目在进行编译时的顺序应该是A、B、C、D

拓扑排序可以用于确定各个模块之间的编译顺序：

寻找入度(in)为0的模块，这些模块不依赖于任何模块，可以直接进行编译
擦除入度为0的模块对整个项目的影响，入度为0的模块，其指向的模块入度减一
重复步骤2，直到所有模块入度均为0
项目中不能存在循环依赖

queue<Node*> TopologyAlgorithm(const Graph& graph) {
    queue<Node*> ansQ;
    unordered_map<Node*, int> inMap;//保存所有顶点的入度,不直接修改Node
    queue<Node*> zeroQ;//保存入度为0的顶点
    for (auto& [value, node] : graph.nodes) {
        inMap.insert(std::make_pair(node, node->in));
        if (node->in == 0) {
            zeroQ.push(node);
        }
    }
    while (!zeroQ.empty()) {
        Node* zeroNode = zeroQ.front();
        zeroQ.pop();
        ansQ.push(zeroNode);
        for (Node* node : zeroNode->nodes) {
            if (!--inMap[node]) {//在inMap中进行修改
                zeroQ.push(node);
            }
        }
    }
    return ansQ;
}

最小生成树

最小生成树指的是使用最小的代价使得一个图中的所有顶点连通，最小生成树仅适用于无向图。

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OBtUbhOE-1692191657312)(D:\software\Typora\picture\最小生成树.png)]$

生成最小生成树的算法有Kruskal算法和Prim算法，Kruskal算法侧重于从边的角度考虑，Prim算法侧重于从顶点的角度进行考虑

Kruskal算法

Kruskal算法生成最小生成树的流程如下：

将所有的边按照权值由小到大放入小根堆
从小根堆弹出权值最小的边，判断这条边的2个顶点是否在同一个集合，若不在，则将这两个顶点所在的集合合并为一个集合，并将这条边加入最终结果；若在，直接舍弃这条边
重复步骤2，直到小根堆中没有元素

使用Kruskal算法生成最小生成树需要使用并查集结构，并查集结构可以快速判断2个元素是否在同一个集合，以及快速合并2个集合

并查集

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-X7zz5esB-1692191657313)(D:\software\Typora\picture\并查集-16917664853218.png)]$

初始时，并查集中每一个元素各自为一个集合，其父节点均为自身
进行集合合并时，只需将一个集合的父节点指向另外一个集合的父节点
查看2个元素是否处于同一个集合时，只需检查它们最顶层的父节点是否一样
在寻找一个节点最顶层的父节点时，可以将路径上所有节点的父修改为顶层父节点

并查集的实现

template<typename T>
class UnionFindSet {
public:
	template<class Iter>
	UnionFindSet(Iter first, Iter last) {
		for (auto it = first; it != last; it++) {
			fatherMap[*it] = *it;
			sizeMap[*it] = 1;
		}
	}
	bool IsSameSet(T left, T right) {
		if (fatherMap.count(left) == 0 || fatherMap.count(right) == 0) {
			return false;
		}
		return TopLevelNode(left) == TopLevelNode(right);//顶层父节点是否相同
	}
	void Union(T left, T right) {//合并集合
		if (fatherMap.count(left) == 0 || fatherMap.count(right) == 0) {
			return;
		}
		T ltop = TopLevelNode(left);
		T rtop = TopLevelNode(right);
		if (ltop != rtop) {
			size_t lsize = sizeMap[ltop];
			size_t rsize = sizeMap[rtop];
			T maxSet = lsize > rsize ? ltop : rtop;
			T minSet = lsize > rsize ? rtop : ltop;
			sizeMap[maxSet] += sizeMap[minSet];//将小集合合并到大集合
			fatherMap[minSet] = maxSet;
			sizeMap.erase(minSet);
		}
	}
	size_t SetSize(T node) {//获取一个元素所在集合的元素个数
		if (fatherMap.count(node) == 0) {
			return -1;
		}
		return sizeMap[fatherMap[node]];
	}
private:
	T TopLevelNode(T node) {//获取一个顶点最顶层的父节点
		vector<T> nodes;
		while (node != fatherMap[node]) {
			nodes.push_back(node);
			node = fatherMap[node];
		}
		for (auto& it : nodes) {
			fatherMap[it] = node;//压缩路径
		}
		return node;
	}
private:
	unordered_map<T, T> fatherMap;//记录每一个顶点的直接父节点
	unordered_map<T, size_t> sizeMap;//记录每一个大集合中元素的个数
};

使用并查集实现Kruskal算法

使用并查集实现Kruskal算法时，返回值为所有选中的边，根据边即可获取最小生成树的所有信息，需要注意的是，虽然Kruskal算法适用于无向图，但返回值为有向边，这并不影响最小生成树的结构，因为有向边中包含from点、to点、权值

vector<Edge*> Kruskal(const Graph& graph) {
    vector<Edge*> ans;
    vector<Node*> nodes;
    for (auto& [value, node] : graph.nodes) {
        nodes.push_back(node);
    }
    UnionFindSet<Node*> nodeUFS(nodes.begin(), nodes.end());
    auto EdgeCompare = [](const Edge* l, const Edge* r) {
        return l->weight > r->weight;
    };
    priority_queue<Edge*, deque<Edge*>, decltype(EdgeCompare)> edgeHeap(graph.edges.begin(), graph.edges.end(), EdgeCompare);//graph是无向图,edgeHeap中存在权值相同,方向相反的边
    while (!edgeHeap.empty()) {
        Edge* edge = edgeHeap.top();
        edgeHeap.pop();
        Node* from = edge->from;
        Node* to = edge->to;
        if (!nodeUFS.IsSameSet(from, to)) {//选择这条边
            ans.push_back(edge);
            nodeUFS.Union(from, to);
        }
    }
    return ans;
}

Prim算法

Prim算法生成最小生成树侧重于从顶点出发考虑问题，不需要使用并查集

Prim算法流程

任意选取一个顶点作为起点，将该顶点出发的边加入小根堆，并将这个顶点添加到哈希表
从小根堆中选取权值最小的边，若这条边的to点在哈希表中，跳过这条边，否则以to点作为中心，将与to点相连的边添加到小根堆
将边向小根堆添加的过程中，应该检查这个边的to点是否在哈希表中，若不在，才可以添加

Prim算法的实现

vector<Edge*> Prim(const Graph& graph) {
    vector<Edge*> ans;
    Node* start = graph.nodes.begin()->second;//任选一个顶点作为起点
    unordered_set<Node*> nodeSet;
    nodeSet.insert(start);
    auto EdgeCompare = [](const Edge* l, const Edge* r) {
        return l->weight > r->weight;
    };
    priority_queue<Edge*, deque<Edge*>, decltype(EdgeCompare)> edgeHeap(EdgeCompare);
    for (Edge* edge : start->edges) {
        edgeHeap.push(edge);//将从顶点出发的边添加到小根堆
    }
    while (!edgeHeap.empty()) {
        Edge* edge = edgeHeap.top();
        Node* to = edge->to;
        edgeHeap.pop();
        if (nodeSet.count(to) == 0) {//to点没有被添加到哈希表
            nodeSet.insert(to);
            ans.push_back(edge);
            for (Edge* edge : to->edges) {
                edgeHeap.push(edge);
            }
        }
    }
    return ans;
}

Dijikstra算法

Dijikstra(迪杰斯特拉)算法用于寻找最短路径，采用动态规划的思想(本质是逐步尝试)

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NLSarORQ-1692191657313)(D:\software\Typora\picture\Dijikstra.png)]$

图中A到B的最短路径是5，A到C的最短路径是先通过B在达到C，为15。

Dijikstra寻找最短路径的的思想：每次寻找距离最近的点，以该点作为中心尝试进行更新

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ivAup3iN-1692191657314)(D:\software\Typora\picture\Dijikstra-16918203250234.png)]$

Dijikstra算法的实现

pair<unordered_map<Node*, list<Node*>>, unordered_map<Node*, int>> Dijikstra(Node* base) {//求base点到各个点的最短距离
    unordered_map<Node*, int> distanceMap;//distanceMap[a]表示base点到a点的距离,若a不在distanceMap中,表示base点与a点的距离为无穷
    unordered_map<Node*, list<Node*>> pathMap;//pathMap[a]表示base点到a点的路径
    unordered_set<Node*> lockedNode;//表示已经确定最短距离的点
    auto getMinAndUnlockedNode = [&]() {//找到distanceMap中距离最小的点,且这个点没有被锁定
        Node* ans = nullptr;
        for (auto& [node, distance] : distanceMap) {
            if (lockedNode.count(node) == 0) {
                ans = ans == nullptr ? node : (distanceMap[ans] > distance ? node : ans);
            }
        }
        return ans;
    };
    pathMap[base].push_back(base);
    distanceMap[base] = 0;//base->base
    Node* cur;
    while (cur = getMinAndUnlockedNode()) {
        lockedNode.insert(cur);
        for (Edge* edge : cur->edges) {
            Node* to = edge->to;
            //状态转移方程
            if (distanceMap.count(to) == 0) {
                pathMap[to] = pathMap[cur];
                pathMap[to].push_back(to);
                distanceMap[to] = distanceMap[cur] + edge->weight;
            }
            else {
                if (distanceMap[cur] + edge->weight < distanceMap[to]) {
                    pathMap[to] = pathMap[cur];
                    pathMap[to].push_back(to);
                    distanceMap[to] = distanceMap[cur] + edge->weight;
                }
            }
        }
    }
    return std::make_pair(pathMap, distanceMap);
}