Top-K问题

news2024/11/28 22:45:38

Top-K简介

😄Top-k算法常用于对诸如前几名,前几个最大值,前几个最小值这样的问题的求解,并且在数据量较大时力求在最短的时间内求出问题的解。例如:

世界500强公司世界上年龄最大的几个人某知名app月度活跃时间最长的几个用户

😄这些问题的规模以及数据量占比都比较大,如果继续使用排序算法加取值的方式,可能会比较占用资源耗费时间,接下来我们来看下Top-k问题的求解思路:

Top-K算法实现思路

Top-k算法的实现需要借助堆来实现,下面我们一块来由浅入深的实现一下“数组中最小的k个数”的问题的求解过程。

 

😄既然借助堆来实现,那我们可能想:既然求解前k个最小的数,那我直接建一个小根堆,然后依次取出前k个,不就是答案吗?我们来试着实现一下:

import java.util.PriorityQueue;

class Solution {
    public int[] smallestK(int[] arr,int k) {
        int[] res = new int[k];
        //先检验数据的合法性
        if(arr == null || k == 0 || arr.length == k) {
            return res;
        }
        //建立小根堆(PriorityQueue默认是小根堆)
        PriorityQueue<Integer> priorityQueue = new PriorityQueue<>();
        for(int i = 0;i < arr.length;i++) {
            priorityQueue.offer(arr[i]);
        }
        //从小根堆中取出k个数据
        for(int i =0;i< k;i++) {
            res[i] = priorityQueue.poll();
        }
        return res;
    }
}

这种解答算法当然没有问题,提交oj也通过测试了。但这并不是top-k问题的解答思路。我们可以发现上面算法的时间负责都为n*log2n,当问题规模比较大时,这种解答方法锁耗费的时间还是相当长的,下面我们来开下top-k问题的正确求解办法:

Top-k问题正确解答思路

  • 如果要求前K个最大的数,则建小根堆
  • 如果要求前K个最小的数,则建大根堆
  • 剩余的n-k个数依次与所建堆的堆顶元素进行比较,满足条件时入堆,否则直接跳过,这样就可以实现在时间复杂度为O(N)的情况下解答问题。接下来我们用这种方法来实现一下上面oj中的top-k问题的求解

分析上述oj练习:

      题目中要求的是前K个最小的数,根据上面的思路分析,我们可以知道此处应该建立一个大小为K的大根堆;

      假设数组的规模为N,接下来则将剩余的N-K个数依次与大根堆的堆顶元素进行比较;

      大根堆堆顶元素已经是堆中元素的最大值,如果剩余的N-K个元素中比较元素比堆顶元素大,可以说明这个数比堆中的K个数都要大,则跳过继续向后比较,如果这个数比堆顶元素小,则说明这个数是最小的K个数中的一员,那么将堆顶元素出堆,向下调整一次;将比较元素入堆并向上调整一次使堆依然保持大根堆的状态;

      这样一轮进行下来,我们就能够在时间复杂度为O(N)的情况下求解出这个问题:

 

import java.util.PriorityQueue;
import java.util.Comparator;

class Solution {
    public int[] smallestK(int[] arr,int k) {
        int[] res = new int[k];
        //进行形参数据合法性的校验
        if(arr == null || k == 0 || arr.length == k) {
            return res;
        }

        //建立大根堆,将前K个数据元素入堆
        //因为优先级队列的默认建堆种类为小根堆,我们需要在其构造方法中传入比较器让其建立大根堆
        PriorityQueue<Integer> priorityQueue = new PriorityQueue<>(new Comparator<Integer>() {
            public int compare(Integer o1,Integer o2) {
                return o2 - o1;
            }
        });
        for(int i=0;i<k;i++) {
            priorityQueue.offer(arr[i]);
        }
        
        //将剩余的N-k个元素与堆的堆顶元素进行比较,如果比堆顶元素小,则入堆,否则直接跳过
        for(int i=k;i<arr.length;i++) {
            if(priorityQueue.peek() > arr[i]) {
                priorityQueue.poll();
                priorityQueue.offer(arr[i]);
            }
        }
        //取出堆中的K个元素即为求解问题中最小的前K个元素
        for(int i=0;i<k;i++) {
            res[i] = priorityQueue.poll();
        }
        return res;
    }
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/474240.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3.7 Linux shell脚本编程(分支语句、循环语句)

目录 分支语句&#xff08;对标C语言中的if&#xff09; 多路分支语句&#xff08;对标C语言中的swich case&#xff09; 分支语句&#xff08;对标C语言中的if&#xff09; 语法结构: if 表达式 then 命令表 fi 如果表达式为真, 则执行命令表中的命令; 否则退出if语句,…

数据湖Data Lakehouse支持行级更改的策略:COW、MOR、Delete+Insert

COW:写时复制,MOR:读时合并,Delete+Insert:保证同一个主键下仅存在一条记录,将更新操作转换为Delete操作和Insert操作 COW和MOR的对比如下图,而Delete+Insert在StarRocks主键模型中用到。 目前COW、MOR在三大开源数据湖项目的使用情况,如下图。 写入时复制【Copy-On…

浙大的SAMTrack,自动分割和跟踪视频中的任何内容

Meta发布的SAM之后&#xff0c;Meta的Segment Anything模型(可以分割任何对象)体验过感觉很棒&#xff0c;既然能够在图片上面使用&#xff0c;那肯定能够在视频中应用&#xff0c;毕竟视频就是一帧一帧的图片的组合。 果不其然浙江大学就发布了这个SAMTrack&#xff0c;就是在…

编译预处理以及相关面试

编译预处理 1、宏定义1.1、 无参宏定义1.2、使用宏定义的优点1.3、宏定义注意点1.4、带参数的宏(重点)1.5、条件编译1.6、宏定义的一些巧妙用法(有用)1.7、结构体占用字节数的计算原则&#xff08;考题经常考&#xff0c;要会画图&#xff09;1.8、#在宏定义中的作用&#xff0…

[Android Studio Tool]如何将AS的gradle文件迁移到D盘

解决学习安卓的过程中&#xff0c;使用Android Studio来进行开发导致的C盘空间占用的问题。 首先&#xff0c;找到C盘中的.gradle文件的位置 一般会在我们的系统盘的用户文件下。 然后把一整个.gradle文件剪切&#xff0c;粘贴到其它盘(比如D盘)的根目录下 打开Androdi Stu…

QT菜单样式Ribbon Control for Qt, Office ribbon control

基于Qt&#xff08;最低要求Qt5&#xff0c;支持C11的编译器&#xff09;开发的一个轻量级的Ribbon控件(Office样式UI) 使用Qt Creator直接打开SARibbon.pro&#xff0c;并编译即可&#xff0c;会编译出SARibbonBar库和一个&#xff08;目前只有一个例子&#xff09;例子&#…

7.0、Java继承与多态 - 多态的特性

7.0、Java继承与多态 - 多态的特性 面向对象的三大特征&#xff1a;封装性、继承性、多态性&#xff1b; extends继承 或者 implements实现&#xff0c;是多态性的前提&#xff1b; 用学生类创建一个对象 - 小明&#xff0c;他是一个 学生&#xff08;学生形态&#xff09;&…

nginx(七十二)nginx中与cookie相关的细节探讨

背景知识铺垫 一 nginx中与cookie相关 ① Cookie请求头内容回顾 cookie的形式和属性 ② nginx获取cookie值的两种方法 1) $http_cookie -->获取Cookie请求头"所有值"2) $COOKIE_flag -->获取Cookie请求头的"某个key"[1]、脱敏场景在日志中只…

【操作系统复习】第6章 虚拟存储器 1

前面所介绍的各种存储器管理方式&#xff0c;有一个共同特点&#xff1a;作业全部装入内存后方能运行 问题&#xff1a; ➢ 大作业装不下 ➢ 少量作业得以运行 解决办法&#xff1a; ➢ 方法一&#xff1a;从物理上增加内存容量&#xff0c;成本高 ➢ 方法二&#xff1a;…

Android Input系统事件分发分析

“本文基于Android13源码&#xff0c;分析Input系统中&#xff0c;事件分发的实现原理“ 整个事件分发到事件的确认过程很长&#xff0c;如果读者只是想大概了解一下&#xff0c;可以直接看末尾总结部分的流程图。 1. 前言 在文章之前&#xff0c;有必要提一下InputReader。其…

创建NAT模式KVM虚拟机

创建NAT模式KVM虚拟机 1 添加脚本执行权限&#xff08;上传脚本文件至root目录&#xff09;。 首先需要给脚本赋予执行权限。 # chmod x qemu-ifup-NAT 2 启动虚拟机。 通过命令启动虚拟机。(记得安装net-tools) # yum install net-tools -y # qemu-kvm -m 1024 -drive fi…

注解-Annotation

一. 注解解析 1.1 注释和注解的区别&#xff1f;&#xff08;掌握&#xff09; 共同点&#xff1a;都可以对程序进行解释说明。不同点&#xff1a;注释&#xff0c;是给程序员看的。只在Java中有效。在class文件中不存在注释的。当编译之后&#xff0c;会进行注释擦除。 注释…

了解标量、向量和点积

数据科学基础数学&#xff1a;线性代数简介 了解标量、向量和点积 机器只能按着算法理解和处理数据结构存储的数字. 例如创建垃圾邮件检测器&#xff0c;则首先必须将文本数据转换为数字(通过单词嵌入)。 两个句子之间的余弦相似性 两个句子之间的余弦相似性可以通过它们的向量…

【软件相关】Proteus仿真STM32记录

文章目录 0 前期教程1 前言2 先说说建议的流程3 需要注意的事项3.1 供电网配置不要忘了3.2 ADC模块的使用3.3 元器件查询手册 4 一些小技巧 0 前期教程 【软件相关】Proteus 8入门教程 1 前言 最近接了一个项目&#xff0c;是基于Proteus仿真STM32的&#xff0c;虽然此前有听…

软件开发过程中,前期准备的重要性

需求人员&#xff0c;有时候&#xff0c;一开始&#xff0c;并不完全确定自己想要的是什么 因此&#xff0c;值得花费时间&#xff0c;找出他们真正想要的东西 因为&#xff0c;改动的代价&#xff0c;可能代价会是巨大的 构建之前清除一个错误的成本 ( 1 10 ∼ 1 100 ) 开发过…

Mysql 触发器 -> 监控 -> 表 修改前后的 数据 -> 日志

0. 课程视频 https://www.bilibili.com/video/BV1Kr4y1i7ru?p116&spm_id_frompageDriver&vd_sourceff8b7f852278821525f11666b36f180a 1. 简介 1.1 是对象->与表有关 1.2 校验数据完整性 -> 日志记录 1.3 在 insert / update /delete 前后触发 1.4 支持行…

权限提升:Mysql 数据库 .(UDF || 启动项 || 反弹)

权限提升&#xff1a;Mysql 数据库. 权限提升简称提权&#xff0c;由于操作系统都是多用户操作系统&#xff0c;用户之间都有权限控制&#xff0c;比如通过 Web 漏洞拿到的是 Web 进程的权限&#xff0c;往往 Web 服务都是以一个权限很低的账号启动的&#xff0c;因此通过 Web…

〖ChatGPT实践指南 - 零基础扫盲篇⑨〗- OpenAI API 的数据使用政策以及使用限制

文章目录 ⭐ OpenAI API 数据使用政策⭐ 关于 API 数据的一些通用型问题⭐ OpenAI API 数据使用政策的限制 该章节为各位小伙伴介绍以下 OpenAI 的API 数据使用政策&#xff0c;这部分的内容是 OpenAI 官方为我们提供的一份文档&#xff0c;这份文档说明了官方在为我们提供的AP…

Python小姿势 - ## 一、Python多进程编程

一、Python多进程编程 在上一节&#xff0c;我们学习了Python的多线程编程&#xff0c;这节我们学习一下Python的多进程编程。 多进程和多线程比较类似&#xff0c;区别在于多进程是指在一个应用程序中同时运行多个进程&#xff0c;而多线程是指在一个进程中同时运行多个线程。…

ovs-vsctl 命令详解

ovs-vsctl 命令详解 网桥Bridge 创建 Bridge ovs-vsctl add-br br0 删除 Bridge ovs-vsctl del-br br0 列出 Bridge ovs-vsctl list-br 显示详情 ovs-vsctl show 端口 Port 添加端口 ovs-vsctl add-port br0 p1 其中br0 为上面添加的bridge p1可以是物理端口或者vN…