堆排序和Top-K问题(C语言实现)

news2024/11/26 2:34:16

文章目录:

  • 1.堆排序
    • 1.1向上调整和向下调整建堆对比
    • 1.2堆排序实现
      • 1.2.1升序
      • 1.2.2降序
  • 2.Top-K问题
    • 2.1解决思路
    • 2.2代码实现

前面的文章讲了堆的结构和基础接口实现,不熟的友友们可以去看看堆(C语言实现),点击跳转

1.堆排序

堆排序即利用堆的思想来进行排序

  • 升序:建大堆
  • 降序:建小堆

1.1向上调整和向下调整建堆对比

上一篇文章我们讲了建堆的接口,咱么用的是向下调整建堆,那为什么不用向上调整建堆呢?下面我们就来对比一下那种方法更优

向上调整建堆时间复杂度图解:

向下调整建堆时间复杂度图解:

由图解我们得到结论:
向上调整建堆的时间复杂度为:O(N*log2(N));向下调整建堆的时间复杂度为:O(N)

1.2堆排序实现

1.2.1升序

升序,建大堆
首先交换堆的首尾数据,把最大的数放在尾部,再从根节点开始向下调整size-1个数据(递减:从size-1开始每放一个数据就 -1,也就是不对交换到尾部的元素进行调整)

//交换函数
void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}

//向下调整(建大堆)
void AdjustDown(int* a, int n, int parent)
{
	int child = parent * 2 + 1;//假定左孩子
	while (child < n)
	{
		//大堆:保证child指向大的那个孩子
		if (a[child + 1] > a[child] && child + 1 < n)
		{
			child++;
		}
		//大堆:孩子大于父亲就交换,并继续向下比较调整,反之则调整结束
		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

//堆排序
//升序:建大堆
void HeapSort(int* a, int n)
{
	//建堆算法
	//从最后一个元素的父节点开始依次向前可以遍历到每颗子树的父节点
	for (int i = (n - 1 - 1) / 2; i >= 0; --i)
	{
		AdjustDown(a, n, i);
	}

	int end = n - 1;
	while (end > 0)
	{
		//交换首尾数据
		Swap(&a[0], &a[end]);
		//从首元素开始向下调整
		AdjustDown(a, end, 0);
		--end;
	}
}

1.2.2降序

降序,建小堆
首先交换堆的首尾数据,把最小的数放在尾部,再从根节点开始向下调整size-1个数据(递减:从size-1开始每放一个数据就 -1,也就是不对交换到尾部的元素进行调整)

//交换函数
void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}

//向下调整(建小堆)
void AdjustDown(int* a, int n, int parent)
{
	int child = parent * 2 + 1;//假定左孩子
	while (child < n)
	{
		//小堆:保证child指向小的那个孩子
		if (a[child + 1] < a[child] && child + 1 < n)
		{
			child++;
		}
		//小堆:孩子小于父亲就交换,并继续向下比较调整,反之则调整结束
		if (a[child] < a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

//堆排序
//降序:建小堆
void HeapSort(int* a, int n)
{
	//建堆算法
	//从最后一个元素的父节点开始依次向前可以遍历到每颗子树的父节点
	for (int i = (n - 1 - 1) / 2; i >= 0; --i)
	{
		AdjustDown(a, n, i);
	}

	int end = n - 1;
	while (end > 0)
	{
		//交换首尾数据
		Swap(&a[0], &a[end]);
		//从首元素开始向下调整
		AdjustDown(a, end, 0);
		--end;
	}
}

2.Top-K问题

什么是Top-K问题?

TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大
比如:专业前10名、世界500强、富豪榜、游戏中战力前100的玩家等

2.1解决思路

对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:

1.用数据集合中前K个元素来建堆

  • 前k个最大的元素,则建小堆
  • 前k个最小的元素,则建大堆

2.用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素

  • 将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素

2.2代码实现

根据上面的思路,来举两个栗子

1.求有10000个数据的数组中最大的10个数

//Top-K问题
void Topk()
{
	int n = 10000;
	int* a = (int*)malloc(sizeof(int) * n);
	srand(time(0));
	//使数组中的数都在1000000以内
	for (size_t i = 0; i < n; ++i)
	{
		a[i] = rand() % 1000000;
	}
	//手动设置10个大于1000000的数
	a[12] = 1000000 + 1;
	a[1231] = 1000000 + 2;
	a[531] = 1000000 + 3;
	a[5121] = 1000000 + 4;
	a[115] = 1000000 + 5;
	a[2335] = 1000000 + 6;
	a[9999] = 1000000 + 7;
	a[76] = 1000000 + 8;
	a[423] = 1000000 + 9;
	a[3144] = 1000000 + 10;
	//将数组a中前k个数据读到数组minHeap中
	int k = 10;
	int* minHeap = (int*)malloc(sizeof(int) * k);
	if (minHeap == NULL)
	{
		perror("malloc fail");
		return;
	}
	for (int i = 0; i < k; ++i)
	{
		a[i] = minHeap[i];
	}
	//建一个k个大小的小堆minHeap
	for (int h = (k - 1 - 1) / 2; h >= 0; --h)
	{
		AdjustDown(minHeap, k, h);
	}
	//遍历数组中的剩余数与堆顶比较,大于则替换并向下调整
	for(int j = k;j < n; ++j)
	{
		if (a[j] > minHeap[0])
		{
			minHeap[0] = a[j];
			AdjustDown(minHeap, k, 0);
		}
	}
	//打印小堆数据即为数组a中最大的10个数
	for (int g = 0; g < k; ++g)
	{
		printf("%d ", minHeap[g]);
	}
	printf("\n");
}

2.从文件中读取数据求最大的前k的

//Top-K问题
void Topk()
{
	//写数据到文件中
	int n, k;
	printf("请输入在n个数中选取最大的k个数:>");
	scanf("%d%d", &n, &k);
	srand(time(0));
	FILE* fin = fopen("data.txt", "w");
	if (fin == NULL)
	{
		perror("fopen fail");
		return;
	}
	for (size_t i = 0; i < n; ++i)
	{
		int val = rand();
		fprintf(fin, "%d\n", val);
	}
	fclose(fin);

	//找topk
	FILE* fout = fopen("data.txt", "r");
	if (fout == NULL)
	{
		perror("fopen fail");
		return;
	}
	//开辟k个大小的数组
	int* minHeap = (int*)malloc(sizeof(int) * k);
	if (minHeap == NULL)
	{
		perror("malloc fail");
		return;
	}
	//将文件中的前k个数据读到数组中
	for (int i = 0; i < k; ++i)
	{
		fscanf(fout, "%d", &minHeap[i]);
	}
	//建一个k个大小的小堆
	for (int i = (k - 1 - 1) / 2; i >= 0; --i)
	{
		AdjustDown(minHeap, k, i);
	}
	int val = 0;
	while (fscanf(fout, "%d", &val) != EOF)
	{
		if (val > minHeap[0])
		{
			minHeap[0] = val;
			AdjustDown(minHeap, k, 0);
		}
	}
	for (int i = 0; i < k; ++i)
	{
		printf("%d ", minHeap[i]);
	}
	printf("\n");

	fclose(fout);
}

运行结果:
TopK问题图解(最大的前k个数举例):


堆排序和TopK问题到这里就介绍结束了,期待大佬们的三连!你们的支持是我最大的动力!
文章有写的不足或是错误的地方,欢迎评论或私信指出,我会在第一时间改正。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/52168.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Jenkins pipeline stash实现文件跨节点共享

概述 stas unstash 函数允许在流水线的节点间和/或阶段间保存和获取&#xff08;分别地&#xff09;文件。它们的格式&#xff1a; stash(name: "<name>",includes: "<pattern>",excludes: "<pattern>") unstash("<…

狂神说Go语言学习笔记(四)

狂神说Go语言学习笔记&#xff08;一&#xff09; 狂神说Go语言学习笔记&#xff08;二&#xff09; 狂神说Go语言学习笔记&#xff08;三&#xff09; 一、什么是函数 func main() {//调用函数 函数名()fmt.Println(add(1, 2)) //3 }func add(a, b int) int {c : a breturn …

[附源码]JAVA毕业设计高校在线办公系统(系统+LW)

[附源码]JAVA毕业设计高校在线办公系统&#xff08;系统LW&#xff09; 目运行 环境项配置&#xff1a; Jdk1.8 Tomcat8.5 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术…

【配电网重构】基于粒子群算法的配电网重构问题研究附matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;修心和技术同步精进&#xff0c;matlab项目合作可私信。 &#x1f34e;个人主页&#xff1a;Matlab科研工作室 &#x1f34a;个人信条&#xff1a;格物致知。 更多Matlab仿真内容点击&#x1f447; 智能优化算法 …

Nacos config 配置相关

Nacos config 相关关于配置文件bootstrap和application异同点加载顺序优先级注意事项关于.properties和.yml比较加载顺序优先级别区别关于Nacos配置官方文档注意关于配置文件bootstrap和application SpringCloud项目中存在bootstrap和application两种配置&#xff0c;下面分别…

[附源码]计算机毕业设计springboot社区住户信息管理系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

【正版软件】Navicat Monitor 实时数据库监控工具,一套安全、简单而且无代理的远程服务器监控工具。

简言 Navicat Monitor 是一套安全、简单而且无代理的远程服务器监控工具。它具有强大的功能使你的监控发挥最大效用。受监控的服务器包括 MySQL、MariaDB 和 SQL Server&#xff0c;并与 Amazon RDS、Amazon Aurora、Oracle Cloud、Microsoft Azure、阿里云、腾讯云和华为云等…

[附源码]Python计算机毕业设计Django高校商铺管理系统论文

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

Java+JSP+MySQL基于SSM的雷锋车队管理系统的设计与实现-计算机毕业设计

项目介绍 随着我国国民经济的发展和人文素质的不断提高&#xff0c;越来越多的爱心人士出现在了社会的各种角落之中&#xff0c;其中的哥和爱心人士&#xff0c;组织了一种基于交通和车辆之间的互助的民间组织&#xff0c;这种组织叫做雷锋爱心车队&#xff0c;而且雷锋爱心车…

【lambda表达式】变量作用域和lambda 表达式的处理

变量作用域 通常&#xff0c; 你可能希望能够在 lambda 表达式中访问外围方法或类中的变量。 public static void repeatMessage(String text, int delay){ActionListener listener event ->{ System.out.println(text);Toolkit.getDefaultToolkitO.beep();}new Timer(de…

PowerShell 打开十六进制文件

1&#xff0c;打开PowerShell 2&#xff0c;进入文件所在路径 3&#xff0c;Format-Hex -Path ./bootloader.bin 4&#xff0c;效果

selenium UI使用小技巧集合

selenium这个工具就不用我多介绍了吧&#xff0c;咱们已经说过很多很多次咯&#xff0c;所以就直接上主题&#xff1a; 窗口截图 webdriver 提供了 get_screenshot_as_file()函数来截取当前窗口 from selenium import webdriver from time import sleepdriver webdriver.Ch…

超详细的Python实现MySQL数据库基本操作,今天小编给大家整理好了

一、SQL语句 (mysql 数据库中的语言) show databases;查看数据库 use "database_ name" ;进入数据库 show tables; 查看当前数据库中有哪些表 select * from "table_ name";查询数据表中的所有内容 describe "table_ name"; 查看表结构 desc &q…

外包干了2年,彻底废了...

先说一下自己的情况。大专生&#xff0c;17年通过校招进入湖南某软件公司&#xff0c;干了接近2年的点点点&#xff0c;今年年上旬&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落&#xff01;而我已经在一个企业干了五年的功能测试…

【Linux】Linux下基本指令(一)

作者&#xff1a;一个喜欢猫咪的的程序员 专栏&#xff1a;《Linux》 喜欢的话&#xff1a;世间因为少年的挺身而出&#xff0c;而更加瑰丽。 ——《人民日报》 目录 一、浅谈操作系统&#xff1a; 1.1什么是操作系统&#xff1f;&#xff…

力扣46:全排列(Java回溯)

一、题目描述 给定一个不含重复数字的数组 nums &#xff0c;返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 示例 1&#xff1a; 输入&#xff1a;nums [1,2,3] 输出&#xff1a;[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]]示例 2&#xff1a; 输入&…

[附源码]计算机毕业设计springboot汽配管理系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

python 如何根据索引快速删除列表中的多个元素

一、批量删除列表中不同位置的元素 列表是python中经常用到的一种数据结构&#xff0c;因python提供了很多方法对其增、删、查、改&#xff0c;故使用起来比较灵活&#xff0c;下面就介绍下如何快速删除列表中多个元素的方法。 二、具体用法 例如&#xff1a;待处理列表为[‘…

实体-联系模型--E-R图

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;元宇宙-秩沅 hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! 本文由 秩沅 原创 收录于专栏 数据库干货铺 ⭐E-R图⭐ 文章目录⭐E-R图⭐一&#xff0c;E-R模型的基本概念&#x1f468;‍&#x1f4bb;概…

setCharacterEncoding和setContentType有什么不同

如果仅仅从服务器的角度来看&#xff0c;这两个方法其实本质是一样的&#xff0c;以下内容是摘抄自oracle的官网&#xff1a; Defines an object to assist a servlet in sending a response to the client. The servlet container creates a ServletResponse object and passe…