【数据结构:树与堆】向上/下调整算法和复杂度的分析、堆排序以及topk问题

news2024/10/5 16:36:24

文章目录

  • 1.树的概念
    • 1.1树的相关概念
    • 1.2树的表示
  • 2.二叉树
    • 2.1概念
    • 2.2特殊二叉树
    • 2.3二叉树的存储
  • 3.堆
    • 3.1堆的插入(向上调整)
    • 3.2堆的删除(向下调整)
    • 3.3堆的创建
      • 3.3.1使用向上调整
      • 3.3.2使用向下调整
      • 3.3.3两种建堆方式的比较
    • 3.4堆排序
    • 3.5TopK问题

在这里插入图片描述

1.树的概念

树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。如下图:

在这里插入图片描述
有一个特殊的结点,称为根结点,根节点没有前驱结点。例如A节点

除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。
例如:B节点又可以分成一棵树,该树只有根,没有子树。
          D节点可以分为根节点和子树。D为根节点,只有一棵子树H。

因此树可以拆分为:根和子树。 每棵子树的根结点有且只有一个前驱,可以有0个或多个后继;所以,树是递归定义的。

注意:树形结构中,子树之间不能有交集,否则就不是树形结构,即:树中不能有环!。例如:
在这里插入图片描述
在这里插入图片描述

1.1树的相关概念

  • 节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A的为6
  • 叶节点或终端节点度为0的节点称为叶节点; 如上图:B、C、H、I…等节点为叶节点
  • 分支节点或非终端节点度不为0的节点; 如上图:D、E、F、G…等节点为分支节点
  • 双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
  • 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点,H是D的孩子节点
  • 兄弟节点:具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
  • 树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
  • 节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
  • 树的高度或深度:树中节点的最大层次; 如上图:树的高度为4
  • 堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点
  • 节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先;P的祖先是A、E、J
  • 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
  • 森林:由m(m>0)棵互不相交的树的集合称为森林;

1.2树的表示

树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间的关系。所以树的结构应该怎么定义呢?

//假设树的度为6
#define N 6
struct TreeNode
{
	int val;
	struct TreeNode* Child[N];
};

如果这样定义的话,不管你子树有没有孩子都开辟了空间,会比较浪费。

struct TreeNode
{
	int val;
	struct TreeNode** Child;//使用顺序表存储孩子
	int size;//当前个数
	int capacity;//容量
};

既然浪费了空间,那咱们就动态申请,有几个孩子由size决定,不够就扩容,但这种结构好像也不太好。

struct TreeNode
{
	int val;
	struct TreeNode* leftChile;//左孩子
	struct TreeNode* nextBrother;//右兄弟
};

左孩子右兄弟法:这种方法设计的非常巧妙,每个节点只记录它左边第一个孩子,其它孩子是第一个孩子的兄弟,由第一个孩子记录。这种方法好像看起来是最好的
在这里插入图片描述

2.二叉树

2.1概念

二叉树是从树衍生出来的。
那什么叫二叉树呢?
二叉树:首先它是一棵树,其次它每个节点最多有两个分支;并且对两个分支进行区分,分别叫做左子树和右子树。如下图
在这里插入图片描述
从上图可以看出:

  1. 二叉树不存在度大于2的结点
  2. 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树

注意:对于任意的二叉树都是由以下几种情况复合而成的:
在这里插入图片描述

2.2特殊二叉树

  1. 满二叉树

满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。
满二叉树的前n-1层全是满的(度为2),叶子全在最后一层
如果一个二叉树的层数为K,且结点总数是2k-1,则这个二叉树就是满二叉树。

在这里插入图片描述

  1. 完全二叉树

完全二叉树跟满二叉树的区别是:完全二叉树的前n-1层也都是满的,最后一层不一定满,但是要求从左到右的节点连续,不能空。(没有左孩子就不能有右孩子)

在这里插入图片描述

2.3二叉树的存储

二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。

  1. 顺序存储

顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树
在这里插入图片描述
使用顺序存储存在一个规律

  • leftChild = parent*2+1  

    • 例:C的左孩子的下标为2 * 2+1 = 5
  • rightChild = parent*2+2

    • 例:C的右孩子的下标为2 * 2+2 = 6
  • parent = (Child - 1) / 2  

    • 例:F的父亲下标为(5-1)/ 2 = 2     G的父亲下标为(6-1)/ 2 = 2
  • 有了这个规律我就不需要存储我的孩子或父亲在哪里,我使用下标算就可以了。

  1. 链式存储

二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别 用来给出该结点左孩子和右孩子所在的链结点的存储地址,链式结构又分为二叉链和三叉链, 。
该结构一般用来存储非完全二叉树,不会有空间的浪费。
在这里插入图片描述

3.堆

  • 普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。
  • 完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储

堆:

  1. 堆是一棵完全二叉树。
  2. 小堆:任何一个父亲 <= 孩子
  3. 大堆:任何一个父亲 >= 孩子
  4. 根节点最大的堆叫做最大堆或大根堆根节点最小的堆叫做最小堆或小根堆

在这里插入图片描述
使用堆这种数据结构有什么好处呢?

TopK问题(找最值),最值就在根上。

3.1堆的插入(向上调整)

假设已存在一个堆,现需向堆中插入元素5。
在这里插入图片描述

void Swap(HeapDataType* x, HeapDataType* y)
{
	HeapDataType tmp = *x;
	*x = *y;
	*y = tmp;
}

void AdjustUp(HeapDataType* a, int child)
{
	int parent = (child - 1) / 2;
	//while(parent >= 0)

	while (child)
	{
		//孩子小于父亲
		if (a[child] < a[parent])
		{
			//交换
			Swap(&a[child], &a[parent]);
			//改变下标
			child = parent;

			//继续找父亲
			parent = (child - 1) / 2;
		}
		else
		{
			break;
		}
	}
}

// 堆的插入
void HeapPush(Heap* php, HeapDataType x)
{
	assert(php);
	//扩容
	if (php->size == php->capacity)
	{
		int newcapacity = php->capacity == 0 ? 4 : 2 * php->capacity;
		HeapDataType* tmp = (HeapDataType*)realloc(php->a, sizeof(HeapDataType)*newcapacity);
		if (tmp == NULL)
		{
			perror("realloc");
			return;
		}
		php->a = tmp;
		php->capacity = newcapacity;
	}

	//将数据先插入到堆中
	php->a[php->size] = x;
	php->size++;

	//插入后向上调整,使其仍然是堆
	//开始调整的位置为数组末尾位置:size-1
	AdjustUp(php->a, php->size - 1);
}

思考:如何让一个数组变成堆?

将数组的值插入堆中即可

int main()
{
	Heap* heap = HeapCreate();
	int arr[] = { 1,4,7,3,9,10 };
	for (int i = 0; i < sizeof(arr)/sizeof(int); i++)
	{
		HeapPush(heap, arr[i]);
	}
	HeapDestroy(heap);
	return 0;
}

3.2堆的删除(向下调整)

在这里插入图片描述

void AdjustDown(HeapDataType* a, int n, int parent)
{
	int child = parent * 2 + 1;
	while (child < n)//有左孩子就继续
	{
		//找小的孩子
		//若右孩子存在 且 右孩子小于左孩子,右孩子是小孩子
		if (child+1 < n && a[child+1] < a[child])
		{
			child++;
		}

		//小孩子小于父亲,交换
		if (a[child] < a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

// 堆的删除
void HeapPop(Heap* php)
{
	assert(php);
	assert(php->size);

	Swap(&php->a[0], &php->a[php->size - 1]);//交换
	php->size--;//删除数组尾位置

	AdjustDown(php->a, php->size, 0);
}

3.3堆的创建

下面我们给出一个数组,这个数组逻辑上可以看做一颗完全二叉树,但是还不是一个堆,现在我们通过算法,把它构建成一个堆。根节点左右子树不是堆,我们怎么调整呢?

3.3.1使用向上调整

从数组的第二个元素开始,使其按照小堆/大堆的规则调整成堆
在这里插入图片描述

void HeapCreat(Heap* php, HeapDataType* a, int n)
{
	assert(php);
	php->a = (HeapDataType*)malloc(sizeof(HeapDataType) * n);//申请和数组同样大的空间
	if (php->a == NULL)
	{
		perror("malloc fail");
		return;
	}
	memcpy(php->a, a, sizeof(HeapDataType) * n);//将数组中的元素拷贝进堆
	php->size = n;
	php->capacity = n;

	//向上调整,使其成堆
	for (int i = 1; i < n; i++)
	{
		AdjustUp(php->a, i);
	}
}

3.3.2使用向下调整

用向下调整法,我们从倒数的第一个非叶子节点的子树开始调整,一直调整到根节点的树,就可以调整成堆。
其实本质上就是:从下往上,将根的每个子树调整成堆
在这里插入图片描述
由于最后一个元素的下标为n-1,所以它的父亲应该是:(其下标-1)/2,也就是(n-1-1)/2。

void HeapCreat(Heap* php, HeapDataType* a, int n)
{
	assert(php);
	php->a = (HeapDataType*)malloc(sizeof(HeapDataType) * n);//申请和数组同样大的空间
	if (php->a == NULL)
	{
		perror("malloc fail");
		return;
	}
	memcpy(php->a, a, sizeof(HeapDataType) * n);//将数组中的元素拷贝进堆
	php->size = n;
	php->capacity = n;
	//向下调整,使其成堆
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(php->a, n, i);
	}
}

3.3.3两种建堆方式的比较

  1. 树的高度与节点个数的关系

在这里插入图片描述

  1. 向上调整法建堆时间复杂度的分析

在这里插入图片描述

因此,向上调整建堆的时间复杂度为:O(N*log2N)

  1. 向下调整法建堆时间复杂度的分析

在这里插入图片描述

因此,向下调整建堆的时间复杂度为:O(N)

O(N*log2N) 与O(N)看来两种方法的效率差别还是挺大的。为什么差别这么大呢?
在这里插入图片描述

3.4堆排序

堆排序即利用堆的思想来进行排序,总共分为两个步骤:

  1. 建堆
    升序:建大堆
    降序:建小堆

  2. 利用堆删除思想来进行排序
    首位交换
    最后一个值不看做堆里面的,向下调整选出次大的数据

在这里插入图片描述

#include<stdio.h>
void _Swap(int* a, int* b)
{
	int tmp = *a;
	*a = *b;
	*b = tmp;
}

void _AdjustDown(int* a, int n, int parent)
{
	int child = parent * 2 + 1;
	while (child < n)
	{
		//右孩子存在,且大于左孩子
		if (child + 1 < n && a[child + 1] > a[child])
		{
			child++;
		}
		//孩子大于父亲,交换
		if (a[child] > a[parent])
		{
			_Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;//孩子不大于父亲,调整结束
		}
	}
}

int main()
{
	int arr[] = { 3,1,9,18,22,16 };
	int sz = sizeof(arr) / sizeof(arr[0]);

	//向下调整建堆
	for (int i = (sz - 1 - 1) / 2; i >= 0; i--)
	{
		_AdjustDown(arr, sz, i);
	}

	int end = sz - 1;
	while (end > 0)
	{
		_Swap(&arr[0], &arr[end]);//首位交换
		_AdjustDown(arr, end, 0);
		end--;
	}

	for (int i = 0; i < sz; i++)
	{
		printf("%d ", arr[i]);
	}
	return 0;
}

在这里插入图片描述

3.5TopK问题

TOP-K问题:即求数据中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:

  1. 用数据集合中前K个元素来建堆
    k个最大的元素,则建小堆
    k个最小的元素,则建大堆
  2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素
  3. 将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素。
void TopK(int k)
{
	FILE* fp = fopen("data.txt", "r");
	if (fp == NULL)
	{
		return;
	}
	int* heap = (int*)malloc(sizeof(int) * k);
	if (heap == NULL)
	{
		perror("malloc fail");
		return;
	}
	//先读取k个数据
	for (int i = 0; i < k; i++)
	{
		fscanf(fp, "%d", &heap[i]);
	}

	//根据k个数据建小堆
	for (int i = (k - 1 - 1) / 2; i >= 0; i--)
	{
		_AdjustDown(heap, k, i);
	}

	int num = 0;
	while (fscanf(fp, "%d", &num) != EOF)
	{
		//读取堆顶数据,比它大就替换它,进堆
		if (num > heap[0])
		{
			heap[0] = num;
			_AdjustDown(heap, k, 0);
		}
	}

	for (int i = 0; i < k; i++)
	{
		printf("%d ", heap[i]);
	}
	fclose(fp);
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1508323.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于Spring Boot+ Vue的房屋租赁系统

末尾获取源码作者介绍&#xff1a;大家好&#xff0c;我是墨韵&#xff0c;本人4年开发经验&#xff0c;专注定制项目开发 更多项目&#xff1a;CSDN主页YAML墨韵 学如逆水行舟&#xff0c;不进则退。学习如赶路&#xff0c;不能慢一步。 目录 一、项目简介 二、开发技术与环…

水电站泄洪闸预警系统技术改造项目方案

一、工期安排 2024年1月10日至1月30日&#xff0c;共20天&#xff0c;水电站泄洪闸预警系统建设项目主要以计划工作任务为依据开展并控制工期。 二、预警系统建设项目 水电站泄洪闸预警系统技术改造项目实施内容主要是在每个确定后的预警广播站点采用基础开挖预制地笼浇筑混凝…

【Python】一文详细介绍 plt.rcParamsDefault 在 Matplotlib 中的原理、作用、注意事项

【Python】一文详细介绍 plt.rcParamsDefault 在 Matplotlib 中的原理、作用、注意事项 &#x1f308; 个人主页&#xff1a;高斯小哥 &#x1f525; 高质量专栏&#xff1a;Matplotlib之旅&#xff1a;零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程…

GeoPy1.1 地理数据处理入门

原作者&#xff1a;Damon 高校教师&#xff0c;中科院 GIS 博士 本文为原文章基础上&#xff0c;加上自己以及GPT4.0的总结整理而来 原活动链接 目录 前言小练习&#xff1a;求一周的平均温度小练习&#xff1a;将文件夹下的文件路径都打印出来&#xff1a;小练习&#xff1a…

ManualResetEvent 在线程中的使用C#

ManualResetEvent 用于表示线程同步事件&#xff0c;可以使得线程等待信号发射之后才继续执行下一步&#xff0c;否则一直处于等待状态中。 ManualResetEvent 的常用方法 构造函数ManualResetEvent(bool); ManualResetEvent manualResetEvent new ManualResetEvent(false…

医疗健康机器人_血压血糖血氧中医AI远程医疗定制方案

为人们提供了更加便捷、全面的健康管理服务&#xff0c;开发一款智能医疗健康机器人产品&#xff0c;为用户提供了多项便捷的服务&#xff0c;包括多体征检测、在线问诊、预约挂号、在线购药、健康科普教育等。这些服务构成了从疾病咨询到问诊再到健康管理的闭环&#xff0c;使…

系统学习c++类和对象——深度理解默认成员函数

前言&#xff1a;类和对象是面向对象语言的重要概念。 c身为一门既面向过程&#xff0c;又面向对象的语言。 想要学习c&#xff0c; 首先同样要先了解类和对象。 本节就类和对象的几种构造函数相关内容进行深入的讲解。 目录 类和对象的基本概念 封装 类域和类体 访问限定符…

ICLR 2024 | Meta AI提出ViT寄存器结构,巧妙消除大型ViT中的伪影以提高性能

论文题目&#xff1a;Vision Transformers Need Registers 论文链接&#xff1a;https://arxiv.org/abs/2309.16588 视觉Transformer&#xff08;ViT&#xff09;目前已替代CNN成为研究者们首选的视觉表示backbone&#xff0c;尤其是一些基于监督学习或自监督学习预训练的ViT&a…

前端实现生成图片并批量下载,下载成果物是zip包

简介 项目上有个需求&#xff0c;需要根据表单填写一些信息&#xff0c;来生成定制的二维码图片&#xff0c;并且支持批量下载二维码图片。 之前的实现方式是直接后端生成二维码图片&#xff0c;点击下载时后端直接返回一个zip包即可。但是项目经理说后端实现方式每次改个东西…

elasticsearch(学习笔记)(分布式搜索引擎)(黑马)(kibana操作)

一、索引库操作 索引库就类似数据库表&#xff0c;mapping映射就类似表的结构。 我们要向es中存储数据&#xff0c;必须先创建“库”和“表”。 1、mapping映射属性 mapping是对索引库中文档的约束&#xff0c;常见的mapping属性包括&#xff1a; type&#xff1a;字段数据类型…

树莓派安装Nginx服务搭建web网站结合内网穿透实现公网访问本地站点

文章目录 1. Nginx安装2. 安装cpolar3.配置域名访问Nginx4. 固定域名访问5. 配置静态站点 安装 Nginx&#xff08;发音为“engine-x”&#xff09;可以将您的树莓派变成一个强大的 Web 服务器&#xff0c;可以用于托管网站或 Web 应用程序。相比其他 Web 服务器&#xff0c;Ngi…

龙迅#LT8711UXE1 适用于Type-C/DP1.2/EDP转HDMI2.0方案,支持音频剥离和HDCP功能。

1. 描述 LT8711UXE1是一款高性能的 Type-C/DP1.2 转 HDMI2.0 转换器&#xff0c;设计用于将 USB Type-C 源或 DP1.2 源连接到 HDMI2.0 接收器。该LT8711UXE1集成了符合 DP1.2 标准的接收器和符合 HDMI2.0 标准的发射器。此外&#xff0c;还包括两个用于 CC 通信的 CC 控制器&a…

Python——读写属性

采用读写属性的目的就是把录入的数据控制在合理区间。 如&#xff1a;学生的年龄&#xff08;age&#xff09;&#xff0c;学生的身高&#xff08;height&#xff09;... 方法一&#xff1a;利用实例方法来控制 class Student:def __init__(self,name"",age0):self.…

MySQL技能树学习

MySQL三大范式&#xff1a; 第一范式主要是确保数据表中每个字段的值必须具有原子性&#xff0c;也就是说数据表中每个字段的值为不可再次拆分的最小数据单元。 第二范式是指在第一范式的基础上&#xff0c;确保数据表中除了主键之外的每个字段都必须依赖主键。 第三范式是在…

SQL 中: 索引的建立和删除

目录 实验过程创建索引修改索引删除索引查询索引查看索引信息分析索引待续、更新中 实验过程 1 在STUDENT表的sno列上创建一个非聚簇索引&#xff0c;索引名为“student_sno_idx”。 CREATE INDEX student_sno_idx ON STUDENT (sno);2.在STUDENT表上按sno的升序&#xff0c;…

Project_Euler-10 题解

Project_Euler-10 题解 题目 思路 没有思路&#xff0c;一个线性筛秒了,只不过最近没发博客有点手生哈哈哈哈哈。 代码 /*************************************************************************> Author: Royi > Mail: royi990001gmail.com > From: > Lan…

ipad电容笔哪个牌子好?五款年度实力派电容笔推荐,小白必看

在数字化时代&#xff0c;电容笔已经成为了许多人日常生活和工作中不可或缺的工具。但是&#xff0c;市场上琳琅满目的电容笔品牌和型号让选择变得有些困难。作为一名资深的数码爱好者&#xff0c;我在选购电容笔上也有一定的经验&#xff0c;下面我来给大家分享一下2024电容笔…

基于RK3588+Codesys+Xenomai的ARM+LINUX实时硬件平台的软PLC解决方案

产品概述 公司推出基于瑞芯微RK3588架构的AI边缘计算主板&#xff0c;RK3588是新一代国产旗舰高性能64位八核处理器&#xff0c;采用8nm工艺&#xff0c;具有高算力、低功耗、超强多媒体、丰富数据接口等特点。搭载四核A76四核A55的八核CPU和ARM G610MP4 GPU&#xff0c;内置6…

Python中starmap有什么用的?

目录 前言 starmap函数的作用 starmap函数的用法 starmap函数的示例 1. 对每个元组元素进行求和 2. 对每个元组元素进行乘积 实际应用场景 1. 批量处理函数参数 2. 并行处理任务 3. 批量更新数据库 总结 前言 在Python中&#xff0c; starmap 是一个非常有用的函数&…

【2024泰迪杯】B 题:基于多模态特征融合的图像文本检索Python代码实现

【2024泰迪杯】B 题&#xff1a;基于多模态特征融合的图像文本检索Python代码实现 1 题目 2024 年&#xff08;第 12 届&#xff09;“泰迪杯”数据挖掘挑战赛—B 题&#xff1a;基于多模态特征融合的图像文本检索 一、问题背景 随着近年来智能终端设备和多媒体社交网络平台…