堆的概念和结构以及堆排序

news2024/11/27 14:53:13

前言

普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结 构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统 虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。

堆的概念及结构

**堆(数据结构)**在逻辑上是一个完全二叉树而在物理上是一个数组。

是一种顺序存储结构(采用数组方式存储),仅仅是利用完全二叉树的顺序结构的特点进行分析。
已知二叉树根结点的下标是root,那么它左孩子的下标left=2*root+1,右孩子的下标right=2*root+2
已知孩子结点的下标(不区分左右)为child,那么双亲的下标为(child-1)/2。

将满足根的值小于等于所有子树结点的值,称为小堆;根的值大于等于所有子树结点的值称为大堆

在这里插入图片描述

堆的实现

我们实现堆还是要用三个文件,来让堆的代码看起来更加的简单易懂,
test.c,用来让测试堆的代码
Heap.c,我们些堆的函数
Heap.h,包括堆函数的头文件

(1)创建一个堆

这就是用一个结构体将这些内容,包括起来。
还是很简单的就不多介绍了

typedef int HPDatatype;
typedef struct Heap
{
	HPDatatype* a;
	int sz;
	int capacity;
}HP;

(2).堆的初始化

//堆的初始化
void HeapInit(HP* php)
{
	assert(php);
	php->a = NULL;
	php->sz = 0;
	php->capacity = 0;
}

(2)堆的销毁

我们用malloc申请了空间,我们就要销毁。

//堆的销毁
void HeapDestory(HP* php)
{
	assert(php);
	free(php->a);
	php->a = NULL;
	php->sz = 0;
	php->capacity = 0;
}

(3).打印堆

//打印堆
void HeapPrint(HP* php)
{
	assert(php);
	for (int i = 0; i < php->sz; i++)
	{
		printf("%d ", php->a[i]);
	}
	printf("\n");
}

(4)堆的添加元素

我们堆添加元素的思路,就是在数组的最后一位添加元素,然后看他的父节点是不是比他大或者小(创建大堆和创建小堆),如果是大堆,父节点比他小,就交换,然后知道最后交换到头结点。

这时我们就用到一种算法,叫做向上调整算法。

向上调整算法

//向上调整函数
void AdjustUp(HPDatatype* a,int child)
{
	int parent = (child - 1) / 2;
	while (child > 0)
	{
		if (a[child] < a[parent])
		{
			Swap(&a[child], &a[parent]);
			child = parent;
			parent = (child - 1) / 2;
		}
		else
		{
			break;
		}

	}
}

交换函数

j进行数据的交换,因为后面用的会很多,就做成一个函数

//交换函数
void Swap(HPDatatype* p1,HPDatatype* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}

添加堆元素的代码

//堆的添加元素
void HeapPush(HP* php, HPDatatype x)
{
	assert(php);
	//扩容
	if (php->sz == php->capacity)
	{
		int newcapacity = php->capacity == 0 ? 4 : php->capacity * 2;
		HPDatatype* tmp = (HPDatatype*)realloc(php->a, sizeof(HPDatatype) * newcapacity);
		if (tmp == NULL)
		{
			perror("realloc");
			exit(-1);
		}
		php->a = tmp;
		php->capacity = newcapacity;
	}

	php->a[php->sz] = x;
	php->sz++;
	//向上调整函数
	AdjustUp(php->a,php->sz-1);
}

(5)删除堆顶的元素

我们堆删除元素,都是删除堆顶的元素,那么怎么删除元素了,
我们数组,最好删除的元素就是尾删,所以我们将第一个 元素和最后一个元素交换,然后我们sz--.

然后我们要保持他是一个堆,用到一个向下调整算法。

这个算法就是将最上面的元素,和他的最大的子节点进行交换,然后在进行到最后。

向下调整算法

void AdjustDown(HPDatatype* a, int n, int  parent)
{
	//选大的子节点进行交换
	int child = parent * 2 + 1;
	while (child < n)
	{
		//确认child指向大的孩子
		if (child + 1 < n && a[child + 1] < a[child])
		{
			child++;
		}
		//孩子大于父亲,就进行交换,继续向下调整
		//孩子小于父亲,则调整结束
		if (a[child] < a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}

	}

删除元素的框架

//删除堆顶的数据,并保持他还是一个堆、
void HeapPop(HP* php)
{
	assert(php);
	assert(php->sz);
	//第一个和最后一个交换然后尾删
	Swap(&php->a[0], &php->a[php->sz - 1]);
	php->sz--;
	AdjustDown(php->a, php->sz, 0);
}

(6)找堆顶的元素

//找堆顶的元素
HPDatatype* HeapTop(HP* php)
{
	assert(php);
	assert(php->sz > 0);


	return php->a[0];
}

(7)查看堆的大小

//查看堆的大小
int HeapSize(HP* php)
{
	assert(php);
	return php->sz;
}

(8)判断堆是否为空

//判断堆是否为空
bool HeapEmpty(HP* php)
{
	assert(php);
	return php->sz==0;
}

堆的构建

我们堆的构建用的算法是我们在删除元素的时候向下调整算法。

在排序之前,我们需要做一个准备工作,将数组放进去。看下面代码。

//堆的构建
void HeapCreate(HP* php, HPDatatype* a, int n)
{
	assert(php);
	//创建空间,将数组的的内容拷贝到我们的堆中,然后zai
	php->a = (HPDatatype*)malloc( sizeof(HPDatatype) * n);
	if (php->a == NULL)
	{
		perror("realloc");
		exit(-1);
	}
	memcpy(php->a, a, sizeof(HPDatatype)*n);
	php->sz = php->capacity = n;

}

经过上面的操作,我们将一个无序的数组放进去了,但是现在数组的内容并不是一个堆,现在我们用两种算法将这个数组变成堆。

向下调整的建堆算法

思路就是:我们想将最后一个叶子结点和他的父节点,先构成一个堆,然后我们再将父节点的上一个结点的子节点,将这个构建一个堆,知道最后到根结点。看下面我画的解释图。

在这里插入图片描述

向下调整的建堆算法构建一个堆的代码

n表示这个数组有几个元素,而i表示我们的最后一个结点的父节点,然后就可以依次向下排序了,

//建堆算法
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(php->a, n, i);
	}

堆排序

我们想要堆排序,首先我们就要建堆,有了堆我们才可以排序,所以我们怎么将一个数组变成一个堆呢?
首先有两种方法,
1.第一种就是用插入的思想,将每一个数一个一个插进去,这时就要用我们的向上调整算法。
2.第二种方法就是用我们的上面用向下调整算法的思想建堆

向上调整算法建堆

其实这个思想就是将我们的每一个数插入堆的方法,肯定大家又点不理解,下来画个图,大家就理解了

在这里插入图片描述

<1>向上调整算法建堆代码

就是如此的简单,将每个数遍历遍,依次使用建堆算法就ok了。

	//向上调整建堆
	for (int i = 1; i < n; i++)
	{
		AdjustUp(a, i);
	}

<2>向上调整建堆的时间复杂度

我们向上调整算法将每个数遍历一遍,然后将每个数的都要进行向上调整算法,我们就可以通过计算算,高度为h,
第一层不需要调整,
第二层开始调整,第二层有 2 1 2^1 21个元素,每个再向上调整中进行了一次调整。
第三层有 2 2 2^2 22,每个数最多调整2次
依次类推,在第n层,有 2 h − 1 2^{h-1} 2h1个元素,每个元素换h-1次。

所以可以算出
f ( h ) = 2 1 ∗ 1 + 2 2 ∗ 2 + 2 3 ∗ 3 … … 2 h − 1 ∗ ( h − 1 ) f(h)=2^1*1+2^2*2+2^3*3……2^{h-1}*(h-1) f(h)=211+222+233……2h1(h1)
然后我们又知道N和h的关系, N = 2 h − 1 N=2^h-1 N=2h1

算所有的太复杂,所以我们直接算最后一个,因为最后一层的结点最多,而且调整次数最多,可以代表整个的时间复杂度将h换成N。
F ( N ) ≈ ( ( N + 1 ) ( l o g 2 ( N + 1 ) − 1 ) ) / 2 F(N)≈((N+1)(log_2(N+1)-1))/2 F(N)((N+1)(log2(N+1)1))/2
所以我们可以算出他的时间复杂对是 O ( N ∗ l o g 2 ( N ) ) O(N*log_2(N)) O(Nlog2(N))

向下调整算法建堆

我们在堆的构建用的就是向下调整算法,思路和代码都讲了,但是我们为什们用向下调整算法,等我们算完下面的时间复杂度就知道。

<1>向下调整算法的时间复杂度

有的同学,看都不看,看到了两个循环,直接就说他的时间复杂度是O( N 2 N^2 N2),这样都是打错特错了

首先分析一下,因为我们是从我们的最后一个数的父节点才开始算,我们的最后的叶子结点就不进行计算,而且我们想一下,我们的最多的结点不算,这种算法,一看这个时间复杂度就可以。
所以我们的最后一层没有进行堆排,
在我们的倒数第二层就进行一次调整
在倒数第三层进行2次调整
所以依次类推,第一层就进行h-1次调整

所以就可以计算
F ( h ) = 2 h − 2 ∗ 1 + 2 h − 3 ∗ 2 … … 2 2 ∗ ( h − 2 ) + 2 1 ∗ ( h − 1 ) F(h)=2^{h-2}*1 + 2^{h-3}*2……2^2*(h-2)+2^1*(h-1) F(h)=2h21+2h32……22(h2)+21(h1)

所以我们可以看出这是一个等差数列*等比数列,用一个错位相减法我们就可以算出 F ( h ) = 2 h − 1 − h F(h)=2^h-1-h F(h)=2h1h
我们又知道 N = 2 h − 1 N=2^h-1 N=2h1,将h换成N就可以得到。
所以可以得出 F ( h ) = N − l o g 2 ( N + 1 ) F(h)=N-log_2(N+1) F(h)=Nlog2(N+1)
所以他的时间复杂度就是O(N).

比较两种算法

我们比较算法就是通过时间复杂度和空间复杂度进行比较,我们很容易就比较出来了,明显是向下调整算法好。他的时间复杂度底。

其实这个我们也可以通过画思路图就可以看明白了,
在向上调整算法中,我们的最后的结点最多,并且向上进行最多次,
而在向下调整算法中,我们最后一层的结点都不进行排序,并且在倒数第二层最多的结点才进行一次,而到了最高层最少的结点进行最多次。

如果我们要升序,建大堆还是建小堆

首先先说答案:建大堆
思路:为什们建大堆,我们大堆的头就是最大的数,这是无容置疑的,然后我们将最大的数和堆最后一个数进行交换,我们的再用向下调整算法调整堆不包括最后一个最大的数,(利用我们堆的删除的思路)知道我们的堆就剩下一个。

	for (int i = 0; i < n; i++)
	{
		Swap(&a[0], &a[n - 1 - i]);
		AdjustDown(a, n - 1 -i, 0);
	}

这就是我们的堆排序

堆排序的时间复杂度

先说答案 O ( N ∗ l o g 2 ( N ) ) O(N*log_2(N)) O(Nlog2(N))

可以类比一下,我们的向上调整算法,我们的最后一层是最多的一层,同时进行向下调整的次数也是最多的,所以我们直接算最后一层的就可以了,
而最后一层的个数是 N = 2 h − 1 N=2^{h-1} N=2h1,向下调整算法的时间复杂度为 O ( N ) O(N) O(N),
最后看 F ( h ) = 2 h − 1 ∗ ( h − 1 ) F(h)=2^{h-1}*(h-1) F(h)=2h1(h1)次然后进行换算一下,
O ( N ∗ l o g 2 ( N ) ) O(N*log_2(N)) O(Nlog2(N))

Top-K问题

什们是Top-K问题?
即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
解决方法
  1. 用数据集合中前K个元素来建堆
    前k个最大的元素,则建小堆,
    前k个最小的元素,则建大堆
  1. 用剩余的N-K个元素依次与堆顶元素来比较,
    不满足则替换堆顶元素将剩余N-K个元素依次与堆顶元素比完之后,
    堆中剩余的K个元素就是所求的前K个最小或者最大的元素

时间复杂度: K + ( N − K ) ∗ l o g k K+(N-K)*logk K+(NK)logk=> O ( N ∗ l o g k ) O(N*logk) O(Nlogk)
空间复杂度:O(K)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/364558.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Sofa-jraft的Rpc调用服务端分析

在sofa-jraft中&#xff0c;关于RPC的服务端是RpcServer在RpcServer中的init方法中&#xff1a;初始化了连接事件监听器&#xff0c;这个里面就是一个map&#xff0c;然后可以添加事件监听的处理器&#xff0c;初始化userProcessors, codec 是一个编码和解码器的工厂&#xff0…

VPS使用ProxySU搭建节点服务器

本文所有教程及源码、软件仅为技术研究。不涉及计算机信息系统功能的删除、修改、增加、干扰&#xff0c;更不会影响计算机信息系统的正常运行。不得将代码用于非法用途&#xff0c;如侵立删&#xff01; VPS使用ProxySU搭建节点服务器 环境 contos8win10 64位ProxySU 4.1.7 服…

02-mysql高级-

文章目录mysql高级1&#xff0c;约束1.1 概念1.2 分类1.3 非空约束1.4 唯一约束1.5 主键约束1.6 默认约束1.7 约束练习1.8 外键约束1.8.1 概述1.8.2 语法1.8.3 练习2&#xff0c;数据库设计2.1 数据库设计简介2.2 表关系(一对多)mysql高级 今日目标 掌握约束的使用 掌握表关系…

自动化测试——css元素定位

文章目录一、css定位场景二、css相对定位的优点三、css的调试方法1、表达式中含有字符串&#xff1a;表达式中的引号一定和外面字符串的引号相反四、css基础语法1、标签定位2、class定位特别注意&#xff1a;当class类型的属性值包含多个分割值&#xff0c;$(.s_tab s_tab_1z9n…

快捷式~node.js环境搭建

1、安装包官网下载&#xff1a;Node.js (nodejs.org) 2、安装完成后修改环境变量 在上面已经完成了 node.js 的安装&#xff0c;即使不进行此步骤的环境变量配置也不影响node.js的使用 但是&#xff0c;若不进行环境变量配置&#xff0c;那么在使用命令安装 node.js全局模块 …

Linux服务:Nginx服务配置及相关模块

目录 一、Nginx配置文件 1、主配置文件解析 2、子配置文件启用 二、子配置文件使用 1、创建虚拟主机实验 2、基于端口虚拟主机实验 三、Nginx模块 1、access模块 2、自定义错误页面 3、状态页开启 一、Nginx配置文件 1、主配置文件解析 ①yum安装主配置文件位置&…

docker上发布 sunnyNgrok 实现内外网穿透,容器内执行命令

最近在使用内外网穿透的工具时发现国内版的Ngrok还挺好用的&#xff0c;但是在dockerHub上搜镜像时发现不知道使用哪一个&#xff0c;索性便自己创建一个docker容器。 1、创建自己想要创建docker镜像的文件夹&#xff0c;我创建的名为“sunny-Ngrok” 2、在文件内创建Dockerfi…

【C语言】预处理器

目录 1. 预处理器的工作原理 2. 预处理指令 3. 宏定义 3.1 简单的宏&#xff08;对象式宏&#xff09; 3.2 带参数的宏&#xff08;函数式宏&#xff09; 3.3 #define替换规则 3.4 #和## 3.5 带副作用的宏参数 3.6 宏和函数对比 3.7 命名约定 3.8 #undef 3.9 预定义…

支持向量机SVM详细原理,Libsvm工具箱详解,svm参数说明,svm应用实例,神经网络1000案例之15

目录 支持向量机SVM的详细原理 SVM的定义 SVM理论 Libsvm工具箱详解 简介 参数说明 易错及常见问题 SVM应用实例&#xff0c;基于SVM的股票价格预测 支持向量机SVM的详细原理 SVM的定义 支持向量机&#xff08;support vector machines, SVM&#xff09;是一种二分类模型&a…

Scala面向对象详解(第六章:Scala包、类和对象、封装、继承和多态、抽象、单例、特质)(尚硅谷笔记)

面向对象第 6 章 面向对象6.1 Scala 包6.1.1 包的命名6.1.2 包说明&#xff08;包语句&#xff09;6.1.3 包对象6.1.4 导包说明6.2 类和对象6.2.1 定义类6.2.2 属性6.3 封装6.1.5 访问权限6.2.3 方法6.2.4 创建对象6.2.5 构造器6.2.6 构造器参数6.4 继承和多态6.5 抽象类6.5.1 …

基于机器学习的二手车价格预测及应用实现(预测系统实现)

1.摘要 随着中国汽车工业的迅速发展&#xff0c;国内的汽车数量也在迅速增长。新车销售市场已经逐渐饱和&#xff0c;而二手车交易市场正在兴起。但是&#xff0c;由于中国的二手车市场尚未成熟&#xff0c;与发达国家相比仍存在较大差距。其中一个重要原因是二手车的市场价格难…

信息系统项目管理师试题精选(四)

【1】关于区块链的描述&#xff0c;不正确的是&#xff08; &#xff09;。A. 区块链的共识机制可有效防止记账节点信息被篡改B. 区块链可在不可信的网络进行可信的信息交换C. 存储在区块链的交易信息是高度加密D. 区块链是一个分布式共享账本和数据库【2】&#xff08; &#…

记录一次Android视频播放音画不同步问题的定位及分析

1.何为音画不同步 音画不同步很简单就是视频播放过程中声音和画面出现的时间点不一致&#xff0c;滞后或者提前。 2.音画不同步问题分析思路 2.1.音画不同步问题的证明 对于滞后或者提前很多的音画不同步可以直接认为发生了该问题&#xff0c;但是滞后或者提前不是很多的就…

Linux系统安装MySQL8.0版本详细教程【亲测有效】

首先官网下载安装包&#xff1a;https://downloads.mysql.com/archives/community/ 一、上传到安装服务器 二、解压 tar -xvf mysql-8.0.31-linux-glibc2.12-x86_64.tar.xz三、移动位置并重新命名 mv mysql-8.0.31-linux-glibc2.12-x86_64 /usr/local/mysql四、创建mysql用户…

信息安全基础概要(二)——安全保护等级,安全服务与安全机制

目录 一、OSI/RM七层模型 二、各个网络层次的安全保障 三、计算机信息系统安全保护等级划分准则(GB17859-1999) 四、信息安全体系结构——安全服务与安全机制 前篇&#xff1a; https://blog.csdn.net/superSmart_Dong/article/details/125690697 一、OSI/RM七层模型 广播…

每日一题——L1-070 吃火锅(15)

L1-070 吃火锅 分数 15 以上图片来自微信朋友圈&#xff1a;这种天气你有什么破事打电话给我基本没用。但是如果你说“吃火锅”&#xff0c;那就厉害了&#xff0c;我们的故事就开始了。 本题要求你实现一个程序&#xff0c;自动检查你朋友给你发来的信息里有没有 chi1 huo…

字节是真的难进,测开4面终上岸,压抑5个月,终于可以放声呐喊

这次字节的面试&#xff0c;给我的感触很深&#xff0c;意识到基础的重要性。一共经历了五轮面试&#xff1a;技术4面&#xff0b;HR面。 下面看正文 本人自动专业毕业&#xff0c;压抑了五个多月&#xff0c;终于鼓起勇气&#xff0c;去字节面试&#xff0c;下面是我的面试过…

Mysql 索引(二)—— InnoDB 与 MyISAM 索引方式的比较(聚簇索引 VS 非聚簇索引)

在上一部分了解到&#xff0c;主键索引的本质其实就是一棵B树&#xff0c;通过每一层的目录页来找到记录所在的page页。根据 page页是否保存了数据&#xff0c;我们可以将主键索引分为 聚簇索引 和 非聚簇索引。 1、MyISAM (1) 非聚簇索引 非聚簇索引的目录和数据记录是分开存…

NPE:记一次脑残NPE的排查过程

目录 碎碎念&#xff1a; 如下这行报NPE&#xff1a; 排查过程&#xff1a; 解解方案&#xff1a; 小结&#xff1a; 空指针出现的几种情况&#xff1a; 如何从根源避免空指针&#xff1a; 赋值时自动拆箱出现空指针&#xff1a; 1、变量赋值自动拆箱出现的空指针 2、…

接了ChatGPT的NewBing如何评价CodeGeeX

一篇《如何用 CodeGeeX 替代 GitHub Copilot》的文章在开发者社区登上热榜&#xff0c;开发者关注的AI生成代码工具CodeGeeX&#xff0c;这款插件产品目前支持在VSCode市场和Jetbrains IDEs下载使用&#xff0c;是国产对标Copilot目前安装量最大的开发者工具。 之所以引发开发…