高阶数据结构-图

news2024/9/22 5:40:13

高阶数据结构-图

图的表示

图由顶点和边构成,可分为有向图和无向图

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CJQ2P9yw-1692191657311)(D:\software\Typora\picture\高阶数据结构-图-16917558553992.png)]

邻接表法

图的表示方法有邻接表法邻接矩阵法,以上图中的有向图为例,邻接表法可以表示为

A->[(B,5),(C,10)]
B->[(D,100)]
C->[(B,3)]
D->[(E,7)]
E->[NULL]

邻接表法的特点:

  • 为每一个顶点维护一个顺序表,顺序表中存储与这个顶点直接相连的顶点
  • 可以快速得出与一个顶点直接相连的顶点个数,时间复杂度为O(1)
  • 判断两个顶点是否直接相连需要进行遍历,时间复杂度为O(N)

邻接矩阵法

使用邻接矩阵法可以表示为

顶点(from)/顶点(to)ABCDE
A0510NONENONE
BNONE0NONE100NONE
CNONE30NONENONE
DNONENONENONE07
ENONENONENONENONE0

邻接矩阵法的特点:

  • 维护一个二维数组,数组中的元素为顶点与顶点之间的距离
  • 可以快速得出两个点之间是否存在直接相连的边,时间复杂度为O(1)
  • 在判断一个顶点直接相连的顶点个数时,需要进行遍历,时间复杂度为O(N)
  • 对于无向图,邻接矩阵沿对角线呈对称分布

图的结构

顶点的结构

图由顶点和边构成,顶点的结构如下

struct Edge;
struct Node {
	Node(string str = "") :value(str) {}
	string value;
	int in = 0;
	int out = 0;
	unordered_set<Node*> nodes;
	unordered_set<Edge*> edges;
};
  • value,表示顶点对应的值
  • in,表示顶点的入度,即存在多少个顶点指向自己
  • out,表示顶点的出度,即该顶点指出的顶点个数
  • nodes,哈希表结构,存储一个顶点指向的所有顶点
  • edges,哈希表结构,存储从一个顶点出发的所有边

以图中的A点为例

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-u7lFCddw-1692191657311)(D:\software\Typora\picture\Demo.png)]

其value=“A”,in=0,out=2,nodes为顶点B和C,edges为权值为5的边和权值为10的边

为什么需要使用哈希表存储顶点和边?

哈希表的增删查改时间复杂度均为O(1),在实现图相关算法时具有较好的优势

边的结构

struct Edge {
	Edge(Node* f, Node* t, int w = 0) :from(f), to(t), weight(w) {}
	int weight = 0;
	Node* from = nullptr;
	Node* to = nullptr;
};
  • weight,表示边的权值
  • from,表示这条边从哪一个顶点出发
  • to,表示这条边以哪一个顶点作为结束
  • 如果是无向图,使用2条有向边表示即可

图的结构

struct Graph {
	unordered_map<string, Node*> nodes;
	unordered_set<Edge*> edges;
};

nodes中的key为顶点代表的值,value为具体的顶点

抽象表示转化为已知结构

以下图为例

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3Fqnpwkx-1692191657312)(D:\software\Typora\picture\Demo.png)]

该图可以使用一个二维数组表示

vector<vector<int>> matrixGraph = {
    {'A','B',5},
    {'A','C',10},
    {'B','D',100},
    {'C','B',3},
    {'D','E',7}
};

二维数组中每一个一维数组的第一个元素表示from点,第二个元素表示to点,最后一个元素表示边的权值,二维数组可以表示图,但是在实现图的相关算法不具备通用性,可以将其转化已知结构。

Graph TransforGraph(const vector<vector<int>>& matrixGraph) {
	Graph ansGraph;
	for (auto& elemedge : matrixGraph) {
		string from, to;
		from += elemedge[0];
		to += elemedge[1];//获取from点与to点的值
		int weight = elemedge[2];//获取边的权值
		if (ansGraph.nodes.count(from) == 0) {
			ansGraph.nodes[from] = new Node(from);//点不存在就创建
		}
		if (ansGraph.nodes.count(to) == 0) {
			ansGraph.nodes[to] = new Node(to);
		}
		Edge* edge = new Edge(ansGraph.nodes[from], ansGraph.nodes[to], weight);
		ansGraph.nodes[from]->out++;//from点的出度++
        ansGraph.nodes[from]->edges.insert(edge);//将edge添加到from出发的边
		ansGraph.nodes[from]->nodes.insert(ansGraph.nodes[to]);//将to点添加到from出发的点
		ansGraph.nodes[to]->in++;//to点的入度++
		ansGraph.edges.insert(edge);
	}
	return ansGraph;
}

有关图的抽象表示,均可转化为已知结构,以便于实现图的相关算法

图的算法

宽度优先遍历

图结构中可能存在环,宽度优先遍历(bfs)时需要使用哈希表以避免顶点重复进入队列

void bfs(Node* start) {//从start开始进行宽度优先遍历
    queue<Node*> nodeQ;
    unordered_set<Node*> nodeSet;
    nodeQ.push(start);
    while (!nodeQ.empty()) {
        Node* cur = nodeQ.front();
        nodeQ.pop();
        if (nodeSet.count(cur) == 0) {//表示之前没有遍历过这个顶点
            cout << cur->value << endl;//访问该顶点
            nodeSet.insert(cur);//将该顶点加入set,防止重复遍历
            for (Node* node : cur->nodes) {
                if (nodeSet.count(node) == 0) {
                    nodeQ.push(node);
                }
            }
        }
    }
}

深度优先遍历

图的深度优先遍历(dfs):

  1. 使用哈希表记录已经遍历过的顶点
  2. 使用栈记录深度优先遍历的路径
  3. 在出栈时,已经遍历过的顶点直接跳过
void dfs(Node* start) {
    stack<Node*> nodeStack;
    unordered_set<Node*> nodeSet;
    nodeStack.push(start);
    cout << start->value << endl;//深度优先遍历在入栈时对顶点进行处理
    nodeSet.insert(start);
    while (!nodeStack.empty()) {
        Node* Topnode = nodeStack.top();//取出栈顶元素
        nodeStack.pop();
        for (Node* node : Topnode->nodes) {
            if (nodeSet.count(node) == 0) {//判断是否已经遍历过
                cout << node->value << endl;//访问下一层的元素
                nodeSet.insert(node);
                nodeStack.push(Topnode);
                nodeStack.push(node);//将路径压入栈中
                break;//去往下一层
            }
        }
    }
}

拓扑排序

一个项目可能存在多个模块,模块之间存在一定的依赖关系,可以用图表示

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9fxnvt34-1692191657312)(D:\software\Typora\picture\拓扑排序.png)]

例如上图,模块B依赖于模块A,模块C依赖于模块A和B,模块D依赖于模块A和C,该项目在进行编译时的顺序应该是A、B、C、D

拓扑排序可以用于确定各个模块之间的编译顺序:

  1. 寻找入度(in)为0的模块,这些模块不依赖于任何模块,可以直接进行编译
  2. 擦除入度为0的模块对整个项目的影响,入度为0的模块,其指向的模块入度减一
  3. 重复步骤2,直到所有模块入度均为0
  4. 项目中不能存在循环依赖
queue<Node*> TopologyAlgorithm(const Graph& graph) {
    queue<Node*> ansQ;
    unordered_map<Node*, int> inMap;//保存所有顶点的入度,不直接修改Node
    queue<Node*> zeroQ;//保存入度为0的顶点
    for (auto& [value, node] : graph.nodes) {
        inMap.insert(std::make_pair(node, node->in));
        if (node->in == 0) {
            zeroQ.push(node);
        }
    }
    while (!zeroQ.empty()) {
        Node* zeroNode = zeroQ.front();
        zeroQ.pop();
        ansQ.push(zeroNode);
        for (Node* node : zeroNode->nodes) {
            if (!--inMap[node]) {//在inMap中进行修改
                zeroQ.push(node);
            }
        }
    }
    return ansQ;
}

最小生成树

最小生成树指的是使用最小的代价使得一个图中的所有顶点连通,最小生成树仅适用于无向图。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OBtUbhOE-1692191657312)(D:\software\Typora\picture\最小生成树.png)]

生成最小生成树的算法有Kruskal算法和Prim算法,Kruskal算法侧重于从边的角度考虑,Prim算法侧重于从顶点的角度进行考虑

Kruskal算法

Kruskal算法生成最小生成树的流程如下:

  1. 将所有的边按照权值由小到大放入小根堆
  2. 从小根堆弹出权值最小的边,判断这条边的2个顶点是否在同一个集合,若不在,则将这两个顶点所在的集合合并为一个集合,并将这条边加入最终结果;若在,直接舍弃这条边
  3. 重复步骤2,直到小根堆中没有元素

使用Kruskal算法生成最小生成树需要使用并查集结构,并查集结构可以快速判断2个元素是否在同一个集合,以及快速合并2个集合

并查集

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-X7zz5esB-1692191657313)(D:\software\Typora\picture\并查集-16917664853218.png)]

  1. 初始时,并查集中每一个元素各自为一个集合,其父节点均为自身
  2. 进行集合合并时,只需将一个集合的父节点指向另外一个集合的父节点
  3. 查看2个元素是否处于同一个集合时,只需检查它们最顶层的父节点是否一样
  4. 在寻找一个节点最顶层的父节点时,可以将路径上所有节点的父修改为顶层父节点

并查集的实现

template<typename T>
class UnionFindSet {
public:
	template<class Iter>
	UnionFindSet(Iter first, Iter last) {
		for (auto it = first; it != last; it++) {
			fatherMap[*it] = *it;
			sizeMap[*it] = 1;
		}
	}
	bool IsSameSet(T left, T right) {
		if (fatherMap.count(left) == 0 || fatherMap.count(right) == 0) {
			return false;
		}
		return TopLevelNode(left) == TopLevelNode(right);//顶层父节点是否相同
	}
	void Union(T left, T right) {//合并集合
		if (fatherMap.count(left) == 0 || fatherMap.count(right) == 0) {
			return;
		}
		T ltop = TopLevelNode(left);
		T rtop = TopLevelNode(right);
		if (ltop != rtop) {
			size_t lsize = sizeMap[ltop];
			size_t rsize = sizeMap[rtop];
			T maxSet = lsize > rsize ? ltop : rtop;
			T minSet = lsize > rsize ? rtop : ltop;
			sizeMap[maxSet] += sizeMap[minSet];//将小集合合并到大集合
			fatherMap[minSet] = maxSet;
			sizeMap.erase(minSet);
		}
	}
	size_t SetSize(T node) {//获取一个元素所在集合的元素个数
		if (fatherMap.count(node) == 0) {
			return -1;
		}
		return sizeMap[fatherMap[node]];
	}
private:
	T TopLevelNode(T node) {//获取一个顶点最顶层的父节点
		vector<T> nodes;
		while (node != fatherMap[node]) {
			nodes.push_back(node);
			node = fatherMap[node];
		}
		for (auto& it : nodes) {
			fatherMap[it] = node;//压缩路径
		}
		return node;
	}
private:
	unordered_map<T, T> fatherMap;//记录每一个顶点的直接父节点
	unordered_map<T, size_t> sizeMap;//记录每一个大集合中元素的个数
};

使用并查集实现Kruskal算法

使用并查集实现Kruskal算法时,返回值为所有选中的边,根据边即可获取最小生成树的所有信息,需要注意的是,虽然Kruskal算法适用于无向图,但返回值为有向边,这并不影响最小生成树的结构,因为有向边中包含from点、to点、权值

vector<Edge*> Kruskal(const Graph& graph) {
    vector<Edge*> ans;
    vector<Node*> nodes;
    for (auto& [value, node] : graph.nodes) {
        nodes.push_back(node);
    }
    UnionFindSet<Node*> nodeUFS(nodes.begin(), nodes.end());
    auto EdgeCompare = [](const Edge* l, const Edge* r) {
        return l->weight > r->weight;
    };
    priority_queue<Edge*, deque<Edge*>, decltype(EdgeCompare)> edgeHeap(graph.edges.begin(), graph.edges.end(), EdgeCompare);//graph是无向图,edgeHeap中存在权值相同,方向相反的边
    while (!edgeHeap.empty()) {
        Edge* edge = edgeHeap.top();
        edgeHeap.pop();
        Node* from = edge->from;
        Node* to = edge->to;
        if (!nodeUFS.IsSameSet(from, to)) {//选择这条边
            ans.push_back(edge);
            nodeUFS.Union(from, to);
        }
    }
    return ans;
}

Prim算法

Prim算法生成最小生成树侧重于从顶点出发考虑问题,不需要使用并查集

Prim算法流程

  1. 任意选取一个顶点作为起点,将该顶点出发的边加入小根堆,并将这个顶点添加到哈希表
  2. 从小根堆中选取权值最小的边,若这条边的to点在哈希表中,跳过这条边,否则以to点作为中心,将与to点相连的边添加到小根堆
  3. 将边向小根堆添加的过程中,应该检查这个边的to点是否在哈希表中,若不在,才可以添加

Prim算法的实现

vector<Edge*> Prim(const Graph& graph) {
    vector<Edge*> ans;
    Node* start = graph.nodes.begin()->second;//任选一个顶点作为起点
    unordered_set<Node*> nodeSet;
    nodeSet.insert(start);
    auto EdgeCompare = [](const Edge* l, const Edge* r) {
        return l->weight > r->weight;
    };
    priority_queue<Edge*, deque<Edge*>, decltype(EdgeCompare)> edgeHeap(EdgeCompare);
    for (Edge* edge : start->edges) {
        edgeHeap.push(edge);//将从顶点出发的边添加到小根堆
    }
    while (!edgeHeap.empty()) {
        Edge* edge = edgeHeap.top();
        Node* to = edge->to;
        edgeHeap.pop();
        if (nodeSet.count(to) == 0) {//to点没有被添加到哈希表
            nodeSet.insert(to);
            ans.push_back(edge);
            for (Edge* edge : to->edges) {
                edgeHeap.push(edge);
            }
        }
    }
    return ans;
}

Dijikstra算法

Dijikstra(迪杰斯特拉)算法用于寻找最短路径,采用动态规划的思想(本质是逐步尝试)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NLSarORQ-1692191657313)(D:\software\Typora\picture\Dijikstra.png)]

图中A到B的最短路径是5,A到C的最短路径是先通过B在达到C,为15。

Dijikstra寻找最短路径的的思想:每次寻找距离最近的点,以该点作为中心尝试进行更新

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ivAup3iN-1692191657314)(D:\software\Typora\picture\Dijikstra-16918203250234.png)]

Dijikstra算法的实现

pair<unordered_map<Node*, list<Node*>>, unordered_map<Node*, int>> Dijikstra(Node* base) {//求base点到各个点的最短距离
    unordered_map<Node*, int> distanceMap;//distanceMap[a]表示base点到a点的距离,若a不在distanceMap中,表示base点与a点的距离为无穷
    unordered_map<Node*, list<Node*>> pathMap;//pathMap[a]表示base点到a点的路径
    unordered_set<Node*> lockedNode;//表示已经确定最短距离的点
    auto getMinAndUnlockedNode = [&]() {//找到distanceMap中距离最小的点,且这个点没有被锁定
        Node* ans = nullptr;
        for (auto& [node, distance] : distanceMap) {
            if (lockedNode.count(node) == 0) {
                ans = ans == nullptr ? node : (distanceMap[ans] > distance ? node : ans);
            }
        }
        return ans;
    };
    pathMap[base].push_back(base);
    distanceMap[base] = 0;//base->base
    Node* cur;
    while (cur = getMinAndUnlockedNode()) {
        lockedNode.insert(cur);
        for (Edge* edge : cur->edges) {
            Node* to = edge->to;
            //状态转移方程
            if (distanceMap.count(to) == 0) {
                pathMap[to] = pathMap[cur];
                pathMap[to].push_back(to);
                distanceMap[to] = distanceMap[cur] + edge->weight;
            }
            else {
                if (distanceMap[cur] + edge->weight < distanceMap[to]) {
                    pathMap[to] = pathMap[cur];
                    pathMap[to].push_back(to);
                    distanceMap[to] = distanceMap[cur] + edge->weight;
                }
            }
        }
    }
    return std::make_pair(pathMap, distanceMap);
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/887959.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AgentBench::AI Agent 是大模型的未来

最有想象力、最有前景的方向 “Agent 是 LLM(大语言模型)的最有前景的方向。一旦技术成熟,短则几个月,长则更久,它可能就会创造出超级个体。这解释了我们为何对开源模型和 Agent 兴奋,即便投产性不高,但是我们能想象自己有了 Agent 之后就可以没日没夜地以百倍效率做现在…

Collada .dae文件格式简明教程【3D】

当你从互联网下载 3D 模型时&#xff0c;可能会在格式列表中看到 .dae 格式。 它是什么&#xff1f; 推荐&#xff1a;用 NSDT编辑器 快速搭建可编程3D场景。 1、Collada DAE概述 COLLADA是COLLAborative Design Activity&#xff08;中文&#xff1a;协作设计活动&#xff09…

剑指offer43.1~n整数中1出现的次数

看到这么大的数据规模就直到用暴力法肯定会超时&#xff0c;但是还是花一分钟写了一个试一下&#xff0c;果然超时 class Solution {public int countDigitOne(int n) {int count 0;for(int i1;i<n;i){countdigitOneInOneNum(i);}return count;}public int digitOneInOneNu…

从零实战SLAM-第九课(后端优化)

在七月算法报的班&#xff0c;老师讲的蛮好。好记性不如烂笔头&#xff0c;关键内容还是记录一下吧&#xff0c;课程入口&#xff0c;感兴趣的同学可以学习一下。 --------------------------------------------------------------------------------------------------------…

字符个数统计(同类型只统计一次)

思路&#xff1a;因为题目圈定出现的字符都是 ascii 值小于等于127的字符&#xff0c;因此只需要定义一个标记数组大小为128 &#xff0c;然后将字符作为数组下标在数组中进行标记&#xff0c;若数组中没有标记过表示第一次出现&#xff0c;进行计数&#xff0c;否则表示重复字…

Layui列表复选框根据条件禁用

// 禁用客服回访id有值的复选框res.data.forEach(function (item, i) {if (item.feedbackEmpId) {let index res.data[i][LAY_TABLE_INDEX];$(".layui-table tr[data-index"index"] input[typecheckbox]").prop(disabled,true);$(".layui-table tr[d…

探索Chevereto图床:使用Docker Compose快速搭建个人图床

家人们!图片在今天的社交媒体、博客和论坛中扮演着至关重要的角色。然而&#xff0c;随着图片数量的增加&#xff0c;寻找一个可靠的图片托管解决方案变得越来越重要。Chevereto图床是一个备受赞誉的解决方案&#xff0c;而使用Docker Compose搭建它更是一种高效、可维护的方法…

【内容安全】微服务学习笔记八:使用腾讯云T-Sec天御对文本及图片内容进行安全检测

个人简介&#xff1a; > &#x1f4e6;个人主页&#xff1a;赵四司机 > &#x1f3c6;学习方向&#xff1a;JAVA后端开发 > &#x1f4e3;种一棵树最好的时间是十年前&#xff0c;其次是现在&#xff01; > ⏰往期文章&#xff1a;SpringBoot项目整合微信支付 &g…

安装paddlepadddle-gpu的正确方式

正确安装paddlepadddle-gpu的方式 1.查看系统CUDA版本2.参照飞桨官网快速pip安装 安装paddlepaddle时&#xff0c;pip install paddlepaddle是直接安装的CPU版本&#xff0c;要安装GPU版本的话&#xff0c;就要注意适配的CUDA版本&#xff0c;安装GPU版本可参照官网教程&#x…

做一个超简单的Python运行

作为一名专业的爬虫代理产品供应商&#xff0c;我知道很多人对Python爬虫有兴趣&#xff0c;但可能不知道该从何处入手。今天&#xff0c;我就来分享一个超简单的Python爬虫入门教程&#xff0c;希望能帮助到你们&#xff01;快点准备起来&#xff0c;让我们开始吧&#xff01;…

【C语言】数据在内存中的存储

大家好&#xff0c;我是苏貝&#xff0c;本篇博客介绍数据在内存中的存储&#xff0c;如果你觉得我写的不错的话&#xff0c;可以给我一个赞&#x1f44d;吗&#xff0c;感谢❤️ 使用的编译器为VS2019 文章目录 一.数据类型介绍类型的基本归类 二.整形在内存中的存储2.1 原码…

DMA技术

先总结: DMA是指外部设备不通过CPU而直接与系统内存交换数据的接口技术 主要工作是由DMA控制器来完成的. 下面开始正文 ---------------------------------------------------------------------------- 1、DMA由来 DMA(Direct Memory Access,直接存储器访问)。在&#xf…

主成分分析Python代码

对于主成分分析详细的介绍&#xff1a;主成分分析&#xff08;PCA&#xff09;原理详解https://blog.csdn.net/zhongkelee/article/details/44064401 import numpy as np import pandas as pd标准PCA算法 def standeredPCA(data,N): #data:…

Visualizing and Understanding Convolutional Networks阅读笔记

Visualizing and Understanding Convolutional Networks阅读笔记 摘要1. 前言 [ 1 ] ^{[1]} [1]2. 使用反卷积网络可视化3. 卷积网络可视化 [ 2 ] ^{[2]} [2]3.1 特征可视化3.2 训练过程中特征的演化3.3 特征不变性3.4 架构选择3.5 遮挡敏感性 参考文章 摘要 CNN模型已经取得了…

Linux 5种IO模型

Linux IO模型 网络IO的本质是socket的读取&#xff0c;socket在linux系统被抽象为流&#xff0c;IO可以理解为对流的操作。刚才说了&#xff0c;对于一次IO访问&#xff08;以read举例&#xff09;&#xff0c;数据会先被拷贝到操作系统内核的缓冲区中&#xff0c;然后才会从操…

【测试开发】基于 MeterSphere 的接口测试流程

基于 MeterSphere 的接口测试流程 MeterSphere 接口测试模块提供了 接口定义、接口自动化 等接口测试相关功能。 用户可以使用树状多级模块来分级分组管理项目下的接口列表&#xff0c;创建执行接口用例测试接口&#xff0c;组合编排多个接口用例进行场景自动化测试。 1 接口定…

caffe专题五——回归中——检测框架

一&#xff1a;Bounding-box regression回归 1.问题理解(为什么要做 Bounding-box regression&#xff1f; )如图 1 所示&#xff0c; 绿色的框为飞机的 Ground Truth, 红色的框是 Selective Search 提取的 Region Proposal。 那么即便红色的框被分类器识别为飞机&#xff0c;但…

Win10系统pytorch安装教程

前提&#xff1a;安装后Anaconda和NVIDIA显卡驱动 1. 确定支持的最高CUDA版本 确定支持的最高CUDA版本 记住这个CUDA版本&#xff0c;后面要用。 2. 新建conda虚拟环境 2.1 为conda配置清华镜像源 conda常用命令 打开Anaconda prompt窗口&#xff0c;使用如下命令&#xf…

学习心得01:STM32开发板

嵌入式开发也不难&#xff0c;相关知识需要学习。对于某个具体内容&#xff0c;需要反复测试、修改。 这是我买的一个开发板&#xff0c;各个范例都跑了一遍&#xff0c;有问题的还问过客服&#xff08;更新代码后解决&#xff09;。

[C++]笔记-函数的栈空间(避免栈空间溢出)

错误1 当数组的内存占用较大时,会引发异常 #include <iostream> using namespace std; int main() {char buff[2000000];cout << (int)buff[sizeof(buff) - 1] << endl; 错误 2 当调用次数较小的时候,栈内存还没有满,可以输出,该地址相减除以1024等于100,就…