力扣347. 前 K 个高频元素(java,最小堆,快速排序法)

news2025/1/23 9:26:49

Problem: 347. 前 K 个高频元素

文章目录

  • 前言
  • 题目描述
  • 思路
  • 解题方法
  • 复杂度
  • Code

前言

对于求取Top K一般有如下两种题型:

1.针对静态数据(查询TopK操作)
2.针对动态数据(包括添加数据操作和查询TOPK操作)

一般解决思路有如下三种:

1.排序,然后取数组中的第k个元素(一般针对静态数据)
2.利用快速排序算法的思想,做到 O ( n ) O(n) O(n)(一般针对静态数据)
3.利用堆,插入 O ( l o g k ) O(logk) O(logk),获取 O ( 1 ) O(1) O(1)(一般针对动态数据)

题目描述

给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。
在这里插入图片描述

思路

思路1:堆

1.维护一个大小为K的小顶堆,当有数据被添加到集合中时,
2.如果堆中的数据个数小于k,我们将新的数据直接插入到小顶堆,
3.如果堆中的数据等于K,我们就拿新添加的数据与堆顶元素比较

3.1. 如果新添加的数据大于堆顶元素,我们就把堆顶元素删除,并且这个新添加的数据插入到堆中;
3.2. 如果新添加的数据小于等于堆顶元素,则不对堆做处理。

即小堆顶中一直都是维护当前数据集合中的Top K,每次询问当前数据的Top K操作就变得比较高效,直接输出小顶堆中的元素即可。

思路2:快速排序

我们先统计出每个元素出现的频率,再以出现频率为基准进行快排

解题方法

解法1:堆

1.创建内部类,便于后面在构建小顶堆时记录每个元素出现与其出现的次数
2.利用HashMap统计每个元素与其出现的次数
3.利用思路中的步骤3维护小顶堆
4.取出k次当前小顶堆的堆顶元素到结果数组中

解法2:快速排序

1.先利用HashMap统计每个元素与其出现的次数
2.将频率字典处理为 List,以便按频率排序
3.编写并执行快速排序,按频率的从高到低排序
4.将前k高频率的元素添加到结果数组并返回

复杂度

堆:
时间复杂度:

O ( n l o g k ) O(nlogk) O(nlogk)

空间复杂度:

O ( n ) O(n) O(n)

快速排序:
时间复杂度:

O ( n l o g n ) O(nlogn) O(nlogn)

空间复杂度:

O ( n ) O(n) O(n)

Code

最小堆代码:

class Solution {
    private class QElement {
        int val;
        int count;

        public QElement(int val, int count) {
            this.val = val;
            this.count = count;
        }
    }

    /**
     * 利用最小堆维护前K大元素
     *
     * @param nums 待查询的数组
     * @param k    整数k
     * @return     int[]
     */
    public int[] topKFrequent(int[] nums, int k) {
        //哈希表统计每个数字出现的count
        Map<Integer, Integer> counts = new HashMap<>();
        for (int num : nums) {
            counts.put(num, counts.getOrDefault(num, 0) + 1);
        }
        //按照count构建小顶堆
        PriorityQueue<QElement> minQueue = new PriorityQueue<>(new Comparator<QElement>() {
            @Override
            public int compare(QElement o1, QElement o2) {
                return o1.count - o2.count;
            }
        });
        //求取top k
        for (Map.Entry<Integer, Integer> entry : counts.entrySet()) {
            int key = entry.getKey();
            int count = entry.getValue();
            //如果堆中元素的个数小于k,直接加入
            if (minQueue.size() < k) {
                minQueue.offer(new QElement(key, count));
            } else {
                //如果堆顶元素小于当前数字的频率
                //则删除原来堆顶元素,重新加入
                //当前的数字的频率
                if (minQueue.peek().count < count) {
                    minQueue.poll();
                    minQueue.offer(new QElement(key, count));
                }
            }
        }
        int[] result = new int[k];
        for (int i = 0; i < k; ++i) {
            result[i] = minQueue.poll().val;
        }
        return result;
    }
}

快速排序代码:

class Solution {
    /**
     * 求取数组中的频率前K大函数
     *
     * @param nums 待求取数组
     * @param k    给定的数字
     * @return int[]
     */
    public int[] topKFrequent(int[] nums, int k) {
        if (nums.length == 1) {
            return new int[]{nums[0]};
        }
        /* 以下计算频率 */
        Map<Integer, Integer> frequentMap = new HashMap<>();
        for (int num : nums) {
            frequentMap.put(num, frequentMap.getOrDefault(num, 0) + 1);
        }
        int n = frequentMap.size();

        /* 以下将频率字典处理为 List,以便按频率排序(这里元素类型选择 int[] 而不是 Entry,可以避免后续排序阶段拆箱) */
        List<int[]> frequentList = new ArrayList<>(n);
        for (Map.Entry<Integer, Integer> entry : frequentMap.entrySet()) {
            frequentList.add(new int[]{entry.getKey(), entry.getValue()});
        }

        /* 执行快速排序(选择), 注意这里讲频率高的排在前面 */
        quickSort(frequentList, 0, n - 1);

        /* 将频率列表中最右边 K 个元素返回即可 */
        int[] ans = new int[k];
        for (int i = 0; i < k; i++) {
            ans[i] = frequentList.get(i)[0];
        }
        return ans;
    }

    /**
     * 快速排序函数
     *
     * @param list  待排序的数组
     * @param left  待排序数组的左端点
     * @param right 待排序数组的右端点
     */
    public void quickSort(List<int[]> list, int left, int right) {
        if (left >= right) {
            return;
        }
        int q = partition(list, left, right);
        quickSort(list, left, q - 1);
        quickSort(list, q + 1, right);
    }

    /**
     * 找出数组分区点
     *
     * @param nums  待分区数组
     * @param left  待分区数组的左端点
     * @param right 待分区数组的右端点
     * @return int
     */
    public int partition(List<int[]> nums, int left, int right) {
        /* CLRS 中的写法 */
        int[] pivot = nums.get(right);
        int i = left - 1;
        for (int j = left; j < right; j++) {
            // 频率高的元素排在前面
            if (nums.get(j)[1] >= pivot[1]) {
                i++;
                Collections.swap(nums, i, j);
            }
        }
        Collections.swap(nums, ++i, right);
        return i;
    }
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1268437.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据结构】八大排序 (三)

目录 前言&#xff1a; 快速排序 快速排序非递归实现 快速排序特性总结 归并排序 归并排序的代码实现 归并排序的特性总结 计数排序 计数排序的代码实现 计数排序的特性总结 前言&#xff1a; 前文快速排序采用了递归实现&#xff0c;而递归会开辟函数栈帧&#xff0…

Echarts大屏-数据可视化

使用原生htmljavascript实现大屏展示,较为麻烦的为边框的四个小角使用伪元素生成,其余echarts使用如下快速上手 - Handbook - Apache ECharts 效果如下:

Docker、Kubernetes、OCI、CRI-O、containerd、runc 之间的关系以及它们是如何一起工作的?

最近网上看到一张图片&#xff0c;能够很清晰地展现出 Docker、Kubernetes、OCI、CRI-O、containerd、runc 之间的关系以及它们是如何在一起工作的&#xff0c;如下&#xff1a; 本文可以作为之前一篇文章&#xff08;《K8s、Docker、CRI、OCI 之间的爱恨情仇》&#xff09;的…

最新消息:滴滴 P0 事故原因,原因出来了

最新消息滴滴P0故障原因&#xff0c;是由于k8s集群升级导致的&#xff0c;后面又进行版本回退&#xff0c;由于现在大型互联网公司基本都是基于K8s进行部署的&#xff0c;如果K8s集群一出问题&#xff0c;上面运行的业务Pod和运维系统全部都得宕机&#xff0c;导致没法回滚。 …

算法通关村-----超大规模数据场景的问题

对20GB文件进行排序 问题描述 假设有一个20GB的文件&#xff0c;每行一个字符串&#xff0c;请说明如何对这个文件进行排序 问题分析 20GB的文件很难一次加载到内存中&#xff0c;可以采用分块策略&#xff0c;先使块内有序&#xff0c;在使块间有序。 实现思路 按照给定…

python安装PyHook3

pyhook 报错 “TypeError: KeyboardSwitch() missing 8 required positional arguments: ‘msg’, ‘vk_code’, ‘scan_code’, ‘ascii’, ‘flags’, ‘time’, ‘hwnd’, and ‘win_name’” 一、PyHook3简介 pyHook包为Windows中的全局鼠标和键盘事件提供回调。Python应…

Ubuntu上的常用软件配置

《立冬》——李白 〔唐代〕 冻笔新诗懒写&#xff0c;寒炉美酒时温。 醉看墨花月白&#xff0c;恍疑雪满前村。 对于Android开发者而言&#xff0c;折腾Android源码那是其乐无穷啊。但是有时候在Linux系统下会很不方便&#xff0c;这里特此记录一下常用的软件配置&#xff0c;希…

NX二次开发UF_CURVE_create_isocline 函数介绍

文章作者&#xff1a;里海 来源网站&#xff1a;https://blog.csdn.net/WangPaiFeiXingYuan UF_CURVE_create_isocline Defined in: uf_curve.h int UF_CURVE_create_isocline(int face_cnt, tag_t faces [ ] , double direction [ 3 ] , const char * start_angle, const ch…

Python Xorbits库:编程无限可能性的新开端

更多资料获取 &#x1f4da; 个人网站&#xff1a;ipengtao.com Xorbits是一个Python库&#xff0c;旨在扩展Python语言的功能&#xff0c;使开发者能够更加轻松地进行创新性编程。该库提供了各种工具和功能&#xff0c;包括但不限于&#xff1a; 异步编程支持&#xff1a; Xo…

HTML-CSS知识速查

HTML/CSS知识速查 文章目录 HTML/CSS知识速查[toc]网页的组成浏览器**为什么需要Web标准&#xff1a;** **web标准的构成&#xff1a;**HTMLHTML语法导读**1.1 HTML语法规则&#xff1a;**1.2 基本结构标签**1.3 标签的关系&#xff1a;**1. **包含关系&#xff08;Parent-Chil…

PostgreSQL-SQL联表查询LEFT JOIN 数据去重复

我们在使用left join联表查询时&#xff0c;如果table1中的一条记录对应了table2的多条记录&#xff0c;则会重复查出id相同的多条记录。 1、解决方法一 SELECT t1.* FROM table1 t1 LEFT JOIN table2 t2 ON t1.id t2.tid 第一种方法我们发现还是有重复数据 2、解决方法二…

Diffusion:通过扩散和逆扩散过程生成图像的生成式模型

在当今人工智能大火的时代&#xff0c;AIGC 可以帮助用户完成各种任务。作为 AIGC 主流模型的 DDPM&#xff0c;也时常在各种论文中被提起。DDPM 本质就是一种扩散模型&#xff0c;可以用来生成图片或者为图片去噪。 扩散模型定义了一个扩散的马尔科夫过程&#xff0c;每一步逐…

删除排序链表的重复元素I和II,多种解法和思考

删除排序链表的重复元素I https://leetcode.cn/problems/remove-duplicates-from-sorted-list/description/ 一个循环就可以了&#xff0c;如果当前节点和下一个节点值一样&#xff0c;当前节点不移动让next后移动一个&#xff0c;如果不一样则当前节点后移。 一个循环就可以…

mysql8报sql_mode=only_full_group_by(存储过程一直报)

1&#xff1a;修改数据库配置(重启失效) select global.sql_mode;会打印如下信息 ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ENGINE_SUBSTITUTION里面包含 ONLY_FULL_GROUP_BY&#xff0c;那么就重新设置&#xff0c;在数据库中输入以下代码&#xff0c;去掉ONLY_FULL_GROU…

水果编曲软件FL Studio21最新中文版本2023年最新FL 21中文版如何快速入门教程

水果编曲软件FL Studio介绍 各位&#xff0c;大家晚上好&#xff0c;今天给大家带来最新最新2023水果编曲软件FL Studio 21中文版下载安装激活图文教程。我们一起先了解一些FL Studio 。FL Studio21是目前流行广泛使用人数最多音乐编曲宿主制作DAW软件&#xff0c;这款软件相信…

PyQt基础_007_ 按钮类控件QCombox

import sys from PyQt5.QtCore import * from PyQt5.QtGui import * from PyQt5.QtWidgets import *class ComboxDemo(QWidget):def __init__(self, parentNone):super(ComboxDemo, self).__init__(parent)self.setWindowTitle("combox 例子") self.resize(300, 90) …

【智能算法】改进粒子群优化算法及对比分析

程序名称&#xff1a;改进粒子群优化算法及对比分析 实现平台&#xff1a;matlab 代码简介&#xff1a;基本粒子群算法(BPSO)中&#xff0c;每个优化问题的解都可以看作粒子在搜索空间中的位置&#xff0c;粒子通过飞行速度决定它们的搜索方向和搜索范围&#xff0c;粒子群通…

C语言基础--#if与#endif

目录 一、C语言中的 #if()和 #end if 用法 1. #if 表达式 程序段 #endif 形式 2. #ifdef标示符 标识符 #endif 形式 3. #if 0/ #if 1 #endif 形式 4. \可用于一行的结尾&#xff0c;表示本行与下一行连接起来 二、xTaskCreate函数 三、指针相关…

投资者要不要更换黄金代理?

有一些投资者会问&#xff0c;要不要更换自己的黄金代理&#xff1f;笔者认为&#xff0c;换代理这个问题有一些东西需要关注。因此&#xff0c;我们今天就来讨论一下投资者该不该更改代理&#xff1f;如果要换&#xff0c;新的代理如何选择&#xff1f; 其实很简单&#xff0c…

数据结构-构造哈夫曼树【详解+代码+图示】一文解惑!

哈夫曼树 (Huffman Tree) 文章目录 哈夫曼树 (Huffman Tree)导论构造哈夫曼树语言描绘图形化理解 证明结论代码实现测试结果对照总结 导论 我们在学习哈夫曼树之前需要先了解 什么是哈夫曼树? 哈夫曼树 是一种最优树,是一类带权路径长度最短的二叉树,通过哈夫曼算法可以构建一…