【手撕数据结构】Topk问题

news2024/11/24 10:44:25

目录

  • 题目
  • 思路
  • 代码

题目

TOP-K问题:即求数据结合中前K个最⼤的元素或者最⼩的元素,⼀般情况下数据量都⽐较⼤。
⽐如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。
对于Top-K问题,能想到的最简单直接的⽅式就是排序,但是:如果数据量⾮常⼤,排序就不太可取了
(可能数据都不能⼀下⼦全部加载到内存中)。最佳的⽅式就是⽤堆来解决,基本思路如下:

思路

1)⽤数据集合中前K个元素来建堆
前k个最⼤的元素,则建⼩堆
前k个最⼩的元素,则建⼤堆

2)⽤剩余的N-K个元素依次与堆顶元素来⽐较,不满⾜则替换堆顶元素
将剩余N-K个元素依次与堆顶元素⽐完之后,然后向下调整,堆中剩余的K个元素就是所求的前K个最⼩或者最⼤的元素

  • 有人说为什么建小堆,建大堆,直接把元素和堆顶交换就行了吗,这样堆顶一定是最大的。
  • 那么万一交换的是第二个大的数据呢?他们就直接出堆了?所以我们建小堆,通过向下调整,保证前k个数据一定在堆里面。

代码

/*TopK*/
void HeapTopK()
{
	//1.使用一个文件指针指向这个文件
	FILE* fout = fopen("data.txt", "r");
	if (fout == NULL)
	{
		perror("fopen fail");
		return;
	}

	//2.读出前k个数放入数组中
	int k = 5;
	int max[5];
	for (int i = 0; i < k; ++i)
	{
		fscanf(fout, "%d", &max[i]);
	}

	//3.建立k个堆
	for (int i = ((k - 1) - 1) / 2; i >= 0; --i)
	{
		Adjust_Down(max, k, i);
	}

	//4.继续读取剩下的数据
	/*
	* 不断和堆顶数据做比较,比堆顶大就入堆,然后继续向下调整
	*/
	int val = 0;
	while ((fscanf(fout, "%d", &val)) != EOF)		//不停读取剩下的数据
	{
		if (val > max[0])
		{
			max[0] = val;		//替换为堆顶
			Adjust_Down(max, k, 0);		//将其做向下调整
		}
	}

	//5.打印数组中的数据,观看TopK个最大的数
	for (int i = 0; i < k; ++i)
	{
		printf("%d ", max[i]);
	}
	printf("\n");
	fclose(fout);
}

  • 可以看到,我这里使用的是一个随机值的写入,这一块也是我们在C语言中讲到过的,要使用到rand()和srand(),过程很简单,当然这里的【n】和【k】是由我自己来输入,因此下面的数组我们要设置成动态开辟。代码如下
	int n, k;
	puts("请输入n和k的值:");
	scanf("%d%d", &n, &k);
	srand((unsigned int)time(NULL));		//随机种子

	FILE* fin = fopen("data2.txt", "w");		//若有,则打开写入;若无,则创建写入
	
	int randVal = 0;
	for (int i = 0; i < n; ++i)
	{
		randVal = rand() % 1000000;		//随机生成数字
		fprintf(fin, "%d\n", randVal);		//将每次随机生成的数字写入文件中
	}
	fclose(fin);

	///
	// 获取文件中前TopK个值
	//1.使用一个文件指针指向这个文件
	FILE* fout = fopen("data2.txt", "r");
	if (fout == NULL)
	{
		perror("fopen fail");
		return;
	}

	//2.读出前k个数放入数组中
	int* max = (int*)malloc(sizeof(int) * k);

	for (int i = 0; i < k; ++i)
	{
		fscanf(fout, "%d", &max[i]);		//此处无需加\n,因为读取时空格和回车自动作为分隔
	}

	//3.建立k个堆
	for (int i = ((k - 1) - 1) / 2; i >= 0; --i)
	{
		Adjust_Down(max, k, i);
	}

	//4.继续读取剩下的数据
	/*
	* 不断和堆顶数据做比较,比堆顶大就入堆,然后继续向下调整
	*/
	int val = 0;
	while ((fscanf(fout, "%d", &val)) != EOF)		//不停读取剩下的数据
	{
		if (val > max[0])
		{
			max[0] = val;		//替换为堆顶
			Adjust_Down(max, k, 0);		//将其做向下调整
		}
	}

	//5.打印数组中的数据,观看TopK个最大的数
	for (int i = 0; i < k; ++i)
	{
		printf("%d ", max[i]);
	}
	printf("\n");
	fclose(fout);

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2045997.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

智联云采 SRM2.0 runtimeLog/download 任意文件读取漏洞复现

0x01 产品简介 智联云采是一款针对企业供应链管理难题及智能化转型升级需求而设计的解决方案&#xff0c;针对企业供应链管理难题&#xff0c;及智能化转型升级需求&#xff0c;智联云采依托人工智能、物联网、大数据、云等技术&#xff0c;通过软硬件系统化方案&#xff0c;帮…

Python 中的 SHAP 简介

本文中有多篇计划文章&#xff0c;后期会补充相关链接。鉴于公众号内无法后期修改文章&#xff0c;请关注原文链接。 如何创建和解释 SHAP 图&#xff1a;瀑布图、力图、平均 SHAP 图、蜂群图和依赖图 可直接在橱窗里购买&#xff0c;或者到文末领取优惠后购买&#xff1a; SHA…

iOS替代商店AltStore PAL获得EPIC的资助 即日起取消1.5欧元的年度订阅费

知名游戏开发商 EPIC 日前宣布通过 EPIC MegaGrant 计划向 iOS 替代商店 AltStore PAL 进行捐赠&#xff0c;该商店是在欧盟市场经过苹果批准的合规的第三方应用商店。 按苹果规定第三方替代商店需要缴纳核心技术费并且没有豁免条款&#xff0c;因此该商店每被一名用户安装&am…

RIP学习笔记

1.RIP简介 Rip&#xff1a;routing information protocol&#xff0c;路由信息协议。属于动态路由协议的一种。 RIP是应用较早、使用较普遍的内部网关协议(InteriorGatewayProtocol,简称IGP)&#xff0c;适用于小型同类网络&#xff0c;是典型的距离向量(distance-vector)协议…

OKR 与 KPI 的区别

OKR出现后&#xff0c;大家经常会拿KPI与之一起比较&#xff0c;结果两级分化&#xff1a;爱KPI的一如既往KPI&#xff0c;把OKR说的一无是处。爱OKR的&#xff0c;搞起了“去KPI”化。Tita作为OKR应用软件的服务商&#xff0c;我们也必须对OKR和KPI有充分的理解。对此我认真做…

Ubuntu离线安装docker

查看操作系统版本&#xff1a; rootzyh-VMware-Virtual-Platform:~/install# lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 24.04 LTS Release: 24.04 Codename: noble rootzyh-VMware-Virtual-Platform:~/install#…

微服务架构设计中的常见的10种设计模式

微服务架构设计的概念 微服务架构&#xff08;Microservices Architecture&#xff09;是一种用于构建分布式系统的软件设计模式。它将大型应用程序拆分成一组小型、自治的服务&#xff0c;每个服务都运行在其独立的进程中&#xff0c;服务之间通过轻量级的通信机制&#xff08…

重塑商业生态:技术驱动下的批发供应系统开发与革新

在当今这个快速变化的商业环境中&#xff0c;批发供应系统作为连接生产商、分销商与零售商的关键纽带&#xff0c;其效率与智能化水平直接影响着整个供应链的运作效率与市场竞争力。随着信息技术的飞速发展&#xff0c;特别是大数据、云计算、人工智能&#xff08;AI&#xff0…

D. 二进制

1.题意&#xff1a;给出2中操作 1)&#xff1a;将段排序 2)&#xff1a;将段输出为十进制数 思路&#xff1a; 1.考虑第一种操作。只需要查询l-r中1的个数即可。如果递增&#xff0c;则中为1&#xff0c;否则中为1&#xff0c;需要一个覆盖tag 2.考虑如何维护十进制的值。…

基于Java的美妆购物网站的设计与实现

TOC springboot323基于Java的美妆购物网站的设计与实现 第1章 绪论 1.1选题动因 当前的网络技术&#xff0c;软件技术等都具备成熟的理论基础&#xff0c;市场上也出现各种技术开发的软件&#xff0c;这些软件都被用于各个领域&#xff0c;包括生活和工作的领域。随着电脑和…

在 S7-1200/S7-1500 中,如何测量一个完整程序、子程序或特定组织块的运行时间?

RUNTIME"指令的第一次调用用来设置测量时间的起点,并将其保存在DB变量 "Memory"中来为第二次调用做参考。然后调用 "TestBlock" 程序块。当程序块被执行后,"RUNTIME" 指令第二次调用,第二次调用来计算 "TestBlock"程序块的运行…

电影《白蛇:浮生》观后感

上周看了电影《白蛇&#xff1a;浮生》&#xff0c;动画的特效方面&#xff0c;中国动画这几年确实做的非常不错了&#xff0c;不过整个故事&#xff0c;还是老的那套&#xff0c;并没有感觉特别新意。 &#xff08;1&#xff09;老套故事 《白娘子传奇》的故事&#xff0c;几…

NCBI批量下载序列

根据提供的accession编号批量下载 下载地址 NCBI_batch 点击选择文件&#xff0c;导入需要下载的accession编号文件&#xff0c;点击Retrieveji下载

eNSP 华为划分VLAN

SW1&#xff1a; <Huawei>system-view [Huawei]sysname SW1 [SW1]VLAN batch 10 20 //批量划分vlan [SW1]interface GigabitEthernet0/0/1 [SW1-GigabitEthernet0/0/1]port link-type access //设置为access口&#xff0c;access口允许单个vlan通过 [SW1-GigabitEth…

数据结构day02(链表)

【1】链表 Link list 链表又称单链表/链式存储结构&#xff0c;用于存储逻辑关系为“一对一”的数据 和顺序表不同&#xff0c;使用链表存储数据&#xff0c;不强制要求在内存中集中存储&#xff0c;各个元素可以分散存储在内存中。 所以在链表中&#xff0c;每个数据元素可以配…

K7系列FPGA多重启动(Multiboot)

Xilinx 家的 FPGA 支持多重启动功能&#xff08;Multiboot&#xff09;&#xff0c;即可以从多个 bin 文件中进行选择性加载&#xff0c;从而实现对系统的动态更新&#xff0c;或系统功能的动态调整。 这一过程可以通过嵌入在 bit 文件里的 IPROG 命令实现上电后的自动加载。而…

计算机网络体系结构【★★★】

&#xff08;★★&#xff09;代表非常重要的知识点&#xff0c;&#xff08;★&#xff09;代表重要的知识点。 一、计算机网络概述 1. 计算机网络的性能指标&#xff08;★★&#xff09; 1&#xff09;速率&#xff08;speed&#xff09; 指连接到计算机网络上的节点在数…

用爬虫玩转石墨文档详细操作步骤

石墨文档是一款强大的在线文档编辑和协作工具&#xff0c;它支持文字处理、表格制作、演示文稿等多种功能&#xff0c;适用于个人和团队的办公需求。以下是一些玩转石墨文档的详细步骤和技巧&#xff1a; 1. 注册和登录 注册&#xff1a;访问石墨文档官网&#xff0c;点击“注…

【漏洞复现】某骋BPM系统——Handler.ashx——sql注入

声明&#xff1a;本文档或演示材料仅供教育和教学目的使用&#xff0c;任何个人或组织使用本文档中的信息进行非法活动&#xff0c;均与本文档的作者或发布者无关。 文章目录 漏洞描述漏洞复现测试工具 漏洞描述 某骋BPM系统是一款功能全面的商业流程管理平台,旨在帮助企业实现…

车辆横向控制的参考路径估计

Reference Path Estimation for Lateral Vehicle Control 车辆横向控制的参考路径估计 Abstract Autonomous driving cars have been a hot topic in the media in recent years, with more and more tech companies and universities presenting projects with fully autom…