数据结构——利用堆进行对数组的排序

news2024/11/28 12:44:38

在这里插入图片描述

今天文章的内容是关于我们如何利用堆的特性对我们的数组进行排序,还有就是我们的TopK的问题,这次我们放在的是文件种,我们放入一亿个数字,然后我们取出一亿个数字中最大的十个数,利用上章堆的问题进行解决。

首先就是我们如果对一个数组要进行排序,这个数组是没有任何规律的,就像下面的这个数组。

int arr[] = { 9,4,3,19,12,13,5,8,9 };

那我们得利用我们堆的特性,因为我们知道堆的特性,首先堆顶的数据一定是最小的,那我们要进行排序之前的话,要做的一个最重要的步骤就是先建立一个堆出来,我们可以用两种方法,一种是向上建堆,另一种就是向下建堆,这两个方法我们都会讲。

向上建堆

首先我们这里给的例子是升序,但是在升序的时候,我们是建立大堆还是小堆呢?答案是大堆,那我们先来看看减小堆的时候,会产生怎样的问题,再来看看大堆,两者相互比较之后,我们就会发现升序就应该建立大堆。

首先就是复用我们上次堆的内容的向上建堆的那个方法,就是AdjustUp,如果这里大家不明白可以回头看看,我这里直接给出代码。

void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}
void AdjustUp(int* a, int child)
{
	int parent = (child - 1) / 2;
	while (child > 0)
	{
		if (a[child] < a[parent])
		{
			Swap(&a[child], &a[parent]);
			child = parent;
			parent = (child - 1) / 2;
		}
		else
		{
			break;
		}
	}
}

我们可以看到这是向上调整,那我们建堆的过程是不是从二叉树的第二层开始往上建堆,比较的就是孩子和父亲的关系,那我们这里就可以写一个循环来完成这个建立堆的过程。

int arr[] = { 9,4,3,19,12,13,5,8,9 };
	for (int i = 1; i < sizeof(arr) / sizeof(arr[0]); i++)
	{
		AdjustUp(arr, i);
	}

然后我们这个过程建立出来堆的样子就是我们的小堆

在这里插入图片描述
小堆建好之后,我们后面一步就是进行排序,但是排序有个问题,虽然我们保证了一开始堆顶的元素是最下的,但是我们怎么找出第二小,和第三小的数,如果我们这里有人说,我们可以利用堆的向下调整方法,然后重新建立堆,找出次小的,一次这样往下走就没问题,虽然说这样是可以完成排序,但是这样的排序方法甚至比冒泡还慢,看似用了堆的特性,其实时间复杂度比冒泡排序还高,那这样就没能完成我们堆的作用,但是如果我们建立大堆的话,结果·就·有所·不一样,我们可以不找小的,我们先排序后面的。

在这里插入图片描述
建立大堆后的样子,那我们可以先交换第一个元素和最后一个元素,然后再进行 向下调整,我们后面也会详细计算向下调整和向上调整的时间复杂度的,我们先来看如果交换第一个和最后一个元素的位置,那就变成下面这样。
在这里插入图片描述
这是进行交换之后的样子,但是还是有问题,我们要保证我们这个还是大堆,那该怎么做呢,首先就是得向下调整,向下调整就是堆顶的元素往下调整,我们利用堆的特性之间写的AdjustDown,调整好之后,是下面的这个图。

在这里插入图片描述
这个时候我们发现最后一个元素是最大的,有序的,而且我们还是大堆,那现在堆顶的元素就是次·大的数,所以现在要做的就是第一个和倒数第二个换位置,然后再进行调整,这样倒数两个的就是有序,有序之后他还是大堆,堆顶的元素就是第三个最大的数,这样一次循环,一直到最后就变成有序了。

那我们的代码就是下面这个,其实代码很简答的主要可能难理解。

AdjustDown
void AdjustDown(int* a, int size, int parent)
{
	int child = 2 * parent + 1;
	while (child < size)
	{
		if (a[child + 1] > a[child] && child+1 < size)
		{
			child++;
		}
		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = 2 * parent + 1;

		}
		else
		{
			break;
		}
	}
}

这个就是AdjustDown的代码,再堆里讲过,这样就不将了,来看我们如何进行排序的部分代码

int end = n - 1;
	while (end > 0)
	{
		Swap(&arr[0], &arr[end]);
		AdjustDown(arr, end, 0);
		//这里的end是元素个数,如果是下标的话就是指最后一个元素的后一个
		end--;
	}

end = 0的时候就说明已经排序好了,所以这个就是判断条件,然后来看我们的end一开始就是指向最后一个元素,因为是数组,所以这里表示的就是下标,我们这里就是要注意这个,然后先是交换堆顶元素和最后一个元素的问题,就直接开始调整,但是调整的时候我们end并没有进行–,因为AdjustDown的size位置的参数表示的就是元素个素,然后我们调整的时候因为最后一个元素已经有序了,所以就不用在进行调整了。

我们来看看结果
在这里插入图片描述
可以发现我们也是排好序了,这里呢还有要讲一个内容就是建堆,我们那个时候建堆是向上调整,是从第二层开始的,我们也可以用向下建堆的方法,向下建堆要保证两边的子树都是堆,比如我们现在是大堆,所以子数就得是大堆,我们第一次进行调整得应该是第一个父亲节点,我们可以用(size - 1- 1)/ 2找到第一个父亲节点。因为我们堆虽然看起来是个二叉树,但是实际上就是一个数组,我们这里来看代码是如何实现得。

int main()
{
	int arr[] = { 9,4,3,19,12,13,5,8,9 };
	int n = sizeof(arr) / sizeof(arr[0]);
	for (int i = (n - 1 - 1) / 2; i >= 0; i--)
	{
		AdjustDown(arr, n, i);
	}
	for (int i = 0; i < sizeof(arr) / sizeof(arr[0]); i++)
	{
		printf("%d ", arr[i]);
	}
	printf("\n");
	int end = n - 1;
	while (end > 0)
	{
		Swap(&arr[0], &arr[end]);
		AdjustDown(arr, end, 0);
		//这里的end是元素个数,如果是下标的话就是指最后一个元素的后一个
		end--;
	}
	for (int i = 0; i < sizeof(arr) / sizeof(arr[0]); i++)
	{
		printf("%d ", arr[i]);
	}

	return 0;
}

这个就是只用了向下调整进行排序,建堆得方法也是用的向下调整得这个方法,那我们后面得来计算一下向上调整和向下调整得时间复杂度,这里先给出得结论就是向下建堆的方法才是最高效的,我们下面给出一个图来分别计算出他们的时间复杂度。
在这里插入图片描述
我们给出这样的一个图,首先就是假设这颗数的高度就是H,然后我们在旁边写出他们每一层的节点数。

在这里插入图片描述
那我们可以再来计算一下他们如果是向上调整的话需要进行的调整次数。
在这里插入图片描述
那这个时候我们只要帮他们相乘起来得到一个需要裂项相消的函数。

在这里插入图片描述
又因为我们的高度和我们节点个数有个等式,我们就可以把h变成N表示,我们来看看。
在这里插入图片描述
这个就是我们向上调整的方式,如果是向下调整的话一样的道理,只是我们是从倒数第二层开始,其实大家自己试试就行了,计算起来是一样的方法,时间复杂度是O(N)我们其实也可以通过分析得出,因为向上调整的方法是和向下的一样的,我这里就讲一个,我们不难看出向上调整的时间复杂度是高于向下的,这是为什么,我们可以看他们最多层,向上调整的时候,我们最多层是最后一层,他的节点数最多,高度也是最高的,所以是多对多,时间复杂度就是要比我们的向下调整,我们向下调整时从最后面的父亲节点开始的,而且只要调整一次就行了,这就是多对少,倒数第二层的节点基本上是整个节点的最后一个,所以我们这里得出的结论就是向下调整是最快的。我们后面就可以直接只用一个向下建堆就可以解决问题了。其实我们这里的排序本质上还是选择排序。
在这里插入图片描述
这个是向下建立堆的计算过程,大家可以看看,实在不会就私信小编,谢谢大家。

还有一个TopK问题放在下一篇文章里,因为这样流量多哈哈哈哈哈,下篇文章见。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1259208.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

函数指针数组指针数组传参的本质字符指针

&#x1f680; 作者&#xff1a;阿辉不一般 &#x1f680; 你说呢&#xff1a;不服输的你&#xff0c;他们拿什么赢 &#x1f680; 专栏&#xff1a;爱上C语言 &#x1f680;作图工具&#xff1a;draw.io(免费开源的作图网站) 如果觉得文章对你有帮助的话&#xff0c;还请点赞…

​ 云计算的尽头是轻量应用服务器?带你了解亚马逊Lightsail的卓越优势

很多小伙伴可能都在好奇&#xff0c;轻量应用服务器有什么特点&#xff1f;为什么相较于普通的云服务器&#xff0c;很多用户现在都更青睐于轻量应用服务器?这个“轻”就是它独特的优势所在。轻量应用服务器以其“开箱即用、应用优质、轻松上手、投入划算、运维便捷和稳定可靠…

最近得了一场病 差点要了我的命

最近得了一场病&#xff0c;前后持续了有十多天&#xff0c;时至今日感觉脑袋还是昏昏沉沉的不在状态&#xff0c;感觉像是药吃的&#xff0c;毕竟连着吃了十多天西药&#xff0c;可能人也吃傻了吧&#xff0c;中间还挂了五天水&#xff0c;算是补充了能量。 起因是和老婆去吃…

【Shell】Shell基础学习

一、shell脚本 (1)第一个shell脚本 #!/bin/bash #this is a comment echo "hello world"一个shell脚本永远以“#!”开头,这是一个脚本开始的标记,它是告诉系统执行这个文件需要用某个解释器,后面的/bin/bash就是指明解释器的具体位置。 “#”开头是注释 …

MBA-历年数学题

xx题 甲从1&#xff0c;2&#xff0c;3中抽取一数&#xff0c;记为α;乙从1&#xff0c;2&#xff0c;3&#xff0c;4中抽取一数&#xff0c;记为b规定当a>b或a1<b时甲获胜&#xff0c;则甲获胜的概率为&#xff1f; 倍数题 若实数a&#xff0c;b&#xff0c;c满足a∶b…

2024黑龙江省职业院校技能大赛暨国赛选拔赛“GZ034软件测试”赛项规程

2024黑龙江省职业院校技能大赛暨国赛选拔赛 “GZ034软件测试”赛项规程 一、赛项信息 赛项类别 每年赛 隔年赛&#xff08;单数年/双数年&#xff09; 赛项组别 中等职业教育 高等职业教育 学生赛&#xff08;个人/团体&#xff09; 教师赛 师生同赛 涉及专业大类、…

前缀和——1314. 矩阵区域和

文章目录 &#x1f3a4;1. 题目&#x1f3a4;2. 算法原理&#x1f3a4;3. 代码实现 &#x1f3a4;1. 题目 题目链接&#xff1a;1314. 矩阵区域和 - 力扣&#xff08;LeetCode&#xff09; 给你一个 m x n 的矩阵 mat 和一个整数 k &#xff0c;请你返回一个矩阵 answer &#…

easyExcel 注解开发 快速以及简单上手 以及包含工具类

easyExcel 简单快速使用 1. mevan 这里版本我这里选的是 poi 4.1.2和 ali的easyexcel 的 3.3.1。 因为阿里easy是根据poi的依赖开发的有关系&#xff0c;两者需要对应要不然就会有很多bug和错误在运行时发生。需要版本对应&#xff0c;然而就是easy的代码也会有bug这个版本是比…

【06】ES6:数组的扩展

一、扩展运算符 扩展运算符&#xff08;spread&#xff09;是三个点&#xff08;…&#xff09;。它是 rest 参数的逆运算&#xff0c;将一个数组转为用逗号分隔的参数序列。 1、基本语法 [...array] // array表示要转换的数组console.log(...[1, 2, 3]) // 1 2 3 console.l…

1233:单词倒置(C语言)

题目描述 最近birdfly收到了女友的几份信件&#xff0c;为了只要他俩知道信件的秘密&#xff0c;女友把信件里的每个单词都倒置了。这样只有birdfly将它们倒置过来才能明白女友的心思了。为此birdfly还特意请你编写程序帮他解决一下这个问题。 简单起见假定每封信只包含英文单词…

PC行内编辑

点击编辑&#xff0c;行内编辑输入框出现&#xff0c;给列表的每条数据定义编辑标记&#xff0c;最后一定记得 v-model双向绑定&#xff0c;使数据回显。 步骤&#xff1a; 1、给行数据定义编辑标记 2、点击行编辑标记&#xff08;isedit&#xff09; 3、插槽根据标记渲染表单 …

【ZYNQ】SD 卡读写及文件扫描实验

SD 卡控制器&#xff08;SD/SDIO Controller&#xff09; ZYNQ 中的 SD 卡控制器符合 SD2.0 协议规范&#xff0c;接口兼容 eMMC、MMC3.31、SDIO2.0、SD2.0、SPI&#xff0c;支持 SDHC、SDHS 器件。SD 卡控制器支持 SDMA&#xff08;单操作 DMA&#xff09;、ADMA1&#xff08…

【腾讯云云上实验室】用向量数据库——实现高效文本检索功能

文章目录 前言Tencent Cloud VectorDB 简介Tencent Cloud VectorDB 使用实战申请腾讯云向量数据库腾讯云向量数据库使用步骤腾讯云向量数据库实现文本检索 结论和建议 前言 想必各位开发者一定使用过关系型数据库MySQL去存储我们的项目的数据&#xff0c;也有部分人使用过非关…

vue3安装eslint和prettier,最简单的步骤

第1步&#xff1a; 安装eslint yarn add eslint -D 第2步&#xff1a; 在根文件夹中&#xff0c;创建.eslintrc.js文件 第3步&#xff1a; 在package.json文件中新增命令 "lint": "eslint --fix --ext .ts,.tsx,.vue src --quiet","prettier"…

编程学习及常见的技术难题

文章目录 编程学习及常见的技术难题引言如何学习编程学习参考开发工具推荐编程中常见的技术难题 编程学习及常见的技术难题 引言 学习编程是一件有趣也有挑战的事情&#xff0c;它可以让你创造出各种有用的软件&#xff0c;解决各种复杂的问题&#xff0c;甚至改变世界。 编程中…

数据结构与算法编程题30

层次遍历二叉树(队列&#xff1a;先进先出) #define _CRT_SECURE_NO_WARNINGS#include <iostream> using namespace std;typedef char ElemType; #define ERROR 0 #define OK 1 #define Maxsize 100 #define STR_SIZE 1024typedef struct BiTNode {ElemType data;BiTNode…

西南科技大学数字电子技术实验一(数字信号基本参数与逻辑门电路功能测试及FPGA 实现)FPGA部分

一、 实验目的 1、掌握基于 Verilog 语言的 diamond 工具设计全流程。 2、熟悉、应用 Verilog HDL 描述数字电路。 3、掌握 Verilog HDL 的组合和时序逻辑电路的设计方法。 4、掌握“小脚丫”开发板的使用方法。 二、 实验原理 与门逻辑表达式:Y=AB 原理仿真图: 2 输入…

Flask SocketIO 实现动态绘图

Flask-SocketIO 是基于 Flask 的一个扩展&#xff0c;用于简化在 Flask 应用中集成 WebSocket 功能。WebSocket 是一种在客户端和服务器之间实现实时双向通信的协议&#xff0c;常用于实现实时性要求较高的应用&#xff0c;如聊天应用、实时通知等&#xff0c;使得开发者可以更…

FreeRTOS源码阅读笔记6--event_groups.c

通常用的事件标志组是一个32位的变量uxEventBits&#xff0c;可设置的位有24位&#xff0c;一共就是24 种事件。 事件组的结构体类型&#xff1a; 6.1创建事件组xEventGroupCreate() 6.1.1函数原型 返回值&#xff1a;事件组句柄&#xff0c;指向事件组。 6.1.2函数框架 ①…

【牛客网】SQL必知必会题解

SQL 必知必会题解 地址&#xff1a;牛客网在线编程_SQL篇_SQL必知必会 (nowcoder.com) 检索数据 从 Customers 表中检索所有的 ID 现有表 Customers 如下&#xff1a; cust_idABC 【问题】编写 SQL 语句&#xff0c;从 Customers 表中检索所有的 cust_id 答案&#xff1a;…