算法的学习笔记—数据流中的中位数(牛客JZ41)

news2024/9/20 18:45:38

img

😀前言
在处理动态数据时,实时计算中位数是一个经典问题。中位数是排序后处于中间位置的数值,数据流中的中位数计算面临两个挑战:首先是数据量的动态变化,其次是需要保持元素的有序性。为了高效地解决这个问题,我们可以利用堆(Heap)结构。

🏠个人主页:尘觉主页

文章目录

  • 😀数据流中的中位数
    • 题目链接
    • 😄问题描述
    • 💖示例1
    • 💖示例2
    • 😊解题思路
    • 🤔代码实现
      • 代码解析
    • 😄总结

😀数据流中的中位数

题目链接

牛客网

😄问题描述

假设我们从数据流中不断读取数值,如果从中读取奇数个数值,中位数就是所有数值排序后位于中间的数值;如果读取偶数个数值,中位数就是排序后中间两个数值的平均值。

例如,输入数据流 [5, 2, 3, 4, 1, 6, 7, 0, 8],我们需要依次计算数据流的中位数,得到的结果为:5.00 3.50 3.00 3.50 3.00 3.50 4.00 3.50 4.00

💖示例1

输入:[5,2,3,4,1,6,7,0,8]

返回值:"5.00 3.50 3.00 3.50 3.00 3.50 4.00 3.50 4.00 "

说明:数据流里面不断吐出的是5,2,3…,则得到的平均数分别为5,(5+2)/2,3…

💖示例2

输入:[1,1,1]

返回值:"1.00 1.00 1.00 "

😊解题思路

为了高效地计算数据流的中位数,我们可以使用两个堆:大顶堆和小顶堆。

  • 大顶堆(Max-Heap):用于存储数据流中较小的一半元素,堆顶元素是这部分元素中的最大值。
  • 小顶堆(Min-Heap):用于存储数据流中较大的一半元素,堆顶元素是这部分元素中的最小值。

操作流程:

  1. 每当有新元素插入时,首先根据当前元素个数决定插入哪个堆。
    • 如果总数为偶数,则新元素应插入小顶堆。但为了保证小顶堆的元素都大于大顶堆中的元素,我们可以先将新元素插入大顶堆,再将大顶堆堆顶的最大值弹出并插入小顶堆。
    • 如果总数为奇数,则新元素应插入大顶堆。同样,为了保证大顶堆的元素都小于小顶堆的元素,我们可以先将新元素插入小顶堆,再将小顶堆堆顶的最小值弹出并插入大顶堆。
  2. 插入操作结束后,根据堆中元素的数量计算中位数:
    • 如果总数为偶数,中位数为两个堆顶元素的平均值。
    • 如果总数为奇数,中位数为小顶堆的堆顶元素。

🤔代码实现

以下是用 Java 实现的代码示例

import java.util.PriorityQueue;

public class MedianFinder {
    /* 
     * 大顶堆,存储数据流中较小的一半元素 
     * 比较器设为倒序,这样堆顶为最大值
     */
    private PriorityQueue<Integer> left = new PriorityQueue<>((o1, o2) -> o2 - o1);
    
    /* 
     * 小顶堆,存储数据流中较大的一半元素 
     * 默认是最小堆,堆顶为最小值
     */
    private PriorityQueue<Integer> right = new PriorityQueue<>();
    
    /* 当前数据流中元素的总数 */
    private int N = 0;

    /**
     * 插入新元素到数据流中
     * 
     * @param val 要插入的数据流中的新值
     */
    public void Insert(Integer val) {
        /* 插入操作:首先根据当前元素数量的奇偶性,决定插入哪个堆 */
        if (N % 2 == 0) {
            /*
             * 当 N 为偶数时:
             * - 先将新元素插入大顶堆(左半边),确保左半边堆顶最大。
             * - 然后将大顶堆中的最大值弹出并插入小顶堆(右半边),
             *   这样就保证了右半边的元素都大于左半边的元素。
             */
            left.add(val);
            right.add(left.poll());
        } else {
            /*
             * 当 N 为奇数时:
             * - 先将新元素插入小顶堆(右半边),确保右半边堆顶最小。
             * - 然后将小顶堆中的最小值弹出并插入大顶堆(左半边),
             *   这样就保证了左半边的元素都小于右半边的元素。
             */
            right.add(val);
            left.add(right.poll());
        }
        /* 插入完成后,元素总数加一 */
        N++;
    }

    /**
     * 获取当前数据流的中位数
     * 
     * @return 当前数据流的中位数
     */
    public Double GetMedian() {
        /* 
         * 判断元素总数的奇偶性来决定中位数的计算方式 
         * 如果总数为偶数,中位数为两个堆顶元素的平均值
         * 如果总数为奇数,中位数为小顶堆的堆顶元素
         */
        if (N % 2 == 0)
            return (left.peek() + right.peek()) / 2.0;
        else
            return (double) right.peek();
    }

    public static void main(String[] args) {
        MedianFinder mf = new MedianFinder();
        int[] nums = {5, 2, 3, 4, 1, 6, 7, 0, 8};
        
        /* 
         * 逐个插入元素到数据流,并输出当前的中位数 
         */
        for (int num : nums) {
            mf.Insert(num);
            System.out.print(mf.GetMedian() + " ");
        }
    }
}

代码解析

  • 堆的构建:我们使用了 Java 的 PriorityQueue 类来实现大顶堆和小顶堆。大顶堆通过传入自定义比较器来实现,将较大元素优先弹出。小顶堆则是默认的最小堆。
  • 插入逻辑:根据当前元素数量的奇偶性,决定元素插入的顺序。通过先插入一个堆,再将该堆顶元素移动到另一个堆,保证两个堆中的数据始终保持平衡。
  • 获取中位数:根据元素的奇偶性,决定从哪个堆中获取中位数。如果元素总数为偶数,则取两个堆的堆顶元素平均值;如果为奇数,则直接返回小顶堆的堆顶元素。

😄总结

这种使用双堆(大顶堆和小顶堆)的方法使得我们能够高效地从数据流中计算中位数。由于堆结构的特性,插入元素和获取中位数的时间复杂度都为 O(log n),满足了题目对时间复杂度的要求。这种方法不仅适用于题目给定的范围,还可以扩展到更大规模的数据流处理中。

😁热门专栏推荐
想学习vue的可以看看这个

java基础合集

数据库合集

redis合集

nginx合集

linux合集

手写机制

微服务组件

spring_尘觉

springMVC

mybits

等等等还有许多优秀的合集在主页等着大家的光顾感谢大家的支持

🤔欢迎大家加入我的社区 尘觉社区

文章到这里就结束了,如果有什么疑问的地方请指出,诸佬们一起来评论区一起讨论😁
希望能和诸佬们一起努力,今后我们一起观看感谢您的阅读🍻
如果帮助到您不妨3连支持一下,创造不易您们的支持是我的动力🤞

img

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2099341.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【高校科研前沿】三峡大学黄进副教授等人在环境科学Top期刊JCP发文:人类活动如何在气候变化下影响和降低生态敏感性:以中国长江经济带为例

文章简介 论文名称&#xff1a;How human activities affect and reduce ecological sensitivity under climate change: Case study of the Yangtze River Economic Belt, China&#xff08;人类活动如何在气候变化下影响和降低生态敏感性&#xff1a;以中国长江经济带为例&am…

Facebook的AI进化:如何用智能技术提升内容推荐

在数字时代&#xff0c;社交媒体平台不仅是信息传播的重要渠道&#xff0c;也是个人和品牌互动的关键平台。Facebook作为全球领先的社交媒体网络&#xff0c;其内容推荐系统的优化在很大程度上提升了用户体验。本文将探讨Facebook如何通过人工智能&#xff08;AI&#xff09;技…

Android Studio gradle下载太慢了!怎么办?(已解决)

Android Studio&#xff01;你到底干了什么&#xff1f;&#xff01; 不能高速下载gradle&#xff0c;我等如何进行app编程&#xff1f;&#xff01; 很简单&#xff0c;我修改gradle地址不就是了。 找到gradle-wrapper.properties文件 修改其中distributionUrl的地址。 将 ht…

基于LDA模型的经济金融政策文本研究与分析设计与实现,很详细

摘 要 经济金融政策文本的研究与分析对于理解国家经济发展方向和政策制定逻辑至关重要。近年来&#xff0c;随着信息技术的发展&#xff0c;基于文本的定量分析方法在经济金融领域得到广泛应用。LDA&#xff08;Latent Dirichlet Allocation&#xff09;作为一种典型的主题模型…

OpenSea收到SEC韦尔斯通知,NFT赛道提前预定大败局?

NFT赛道需要寻找下一个突破口&#xff0c;回到数字艺术&#xff0c;或者走向应用型技术。 作者&#xff1a;Wenser&#xff1b;编辑&#xff1a;郝方舟 出品 | Odaily星球日报&#xff08;ID&#xff1a;o-daily&#xff09; 就在昨日&#xff0c;曾经最大的 NFT 交易平台 Open…

前端宝典二十五:vue2高阶用法mixin、transition、slot

本文主要探讨vue2中几个高阶的用法&#xff1a;mixin、transition、slot 一、mixin 在 Vue 中&#xff0c;mixin&#xff08;混入&#xff09;是一种用于在多个组件之间共享代码的机制。它允许你定义可重用的选项对象&#xff0c;并将其混入到不同的组件中。 1、使用方法 创…

重新修改 Qt 项目的 Kit 配置

要重新修改 Qt 项目的 Kit 配置&#xff0c;你可以按照以下步骤进行操作&#xff1a; 1. 打开 Qt Creator 首先&#xff0c;启动 Qt Creator&#xff0c;确保你的项目已经打开。 2. 进入项目设置 在 Qt Creator 中&#xff0c;点击菜单栏的 “Projects” 标签&#xff08;通…

python3兼容python2吗

不兼容&#xff0c;最明显的是print变成了函数。 最重要的变化&#xff1a; 第一点是python2里的str变为了python3里的byte&#xff0c;而str由unicode str取代&#xff0c;因此一些网络编程&#xff0c;hash加密的函数需要将参数encode处理。 第二点是大量的python2库没有被…

C++入门8——vector的使用

目录 1.什么是vector&#xff1f; 2.vector的常见构造 2.1 无参默认构造 2.2 构造并初始化n个val 2.3 拷贝构造 2.4 使用迭代器区间构造 2.5 验证 3.vector的遍历和访问 3.1 下标[]访问 3.2 iterator迭代器访问 3.3 范围for访问 3.4 at访问 4.vector的容量操作 …

挂载磁盘时有多个文件系统

mount: /opt/storage/data1/: more filesystems detected on /dev/md5; use -t or wipefs(8). 1、解决方法一 mount -t ext4 /dev/md5 /opt/data2、解决方法二 #返回磁盘有那些文件系统和格式 wipefs /dev/md5 #清除文件系统和元数据 wipefs -a -f /dev/md5 #再次查看将没有任…

c++习题29-大整数的因子

目录 一&#xff0c;题目 二&#xff0c;思路 三&#xff0c;代码 一&#xff0c;题目 描述 已知正整数k满足2≤k≤9&#xff0c;现给出长度最大为30位的十进制非负整数c&#xff0c;求所有能整除c的k。 输入描述 一个非负整数c&#xff0c;c的位数≤30。 输出描述 若…

开学要买什么?出门少不了续电神器充电宝!性价比超高充电宝

宝子们&#xff0c;开学季又来啦&#xff01;新的学期&#xff0c;新的开始&#xff0c;大家是不是都在忙着准备各种学习用品和生活好物呢&#xff1f;在众多开学必备物品中&#xff0c;有一个东西可千万不能忘记&#xff0c;那就是我们的续电神器 —— 充电宝&#xff01;出门…

chrome插件模拟isTrusted的事件

文章目录 方法原理 使用js模拟的事件isTrusted的值时false。有的时候我们想要模拟sTrusted未true的事件就比较麻烦了。 我们可以利用chrome插件的 chrome.debugger解决改问题。 方法 大体思路是&#xff1a;模拟事件的请求从content_script.js发出&#xff0c;到达background…

通过 GitHub Actions 执行数据库 Schema 变更工作流

原文地址 https://www.bytebase.com/docs/tutorials/github-ci/ 教程库&#xff1a;https://github.com/bytebase/github-action-example 开发者们喜欢将 Schema 变更脚本与应用程序代码一起保存在 Git 中&#xff0c;这样变更脚本就能像应用程序代码一样接受审核和版本控制&…

2024年06月 C/C++(六级)真题解析#中国电子学会#全国青少年软件编程等级考试

C/C++编程(1~8级)全部真题・点这里 第1题:区块反转 给定一个单链表 L,我们将每 K 个结点看成一个区块(链表最后若不足 K 个结点,也看成一个区块),请编写程序将 L 中所有的区块链反转。例如:给定 L 为 1→2→3→4→5→6→7→8,K 为 3,则输出应该为 7→8→4→5→6→1→…

百度地图绘制电子围栏(包括移动端绘制操作)以及检测坐标是否在电子围栏内

由于本人在PC端仅使用了多边形绘制&#xff0c;但矩形跟多边形用法基本一样&#xff0c;圆形并未使用&#xff0c;如不符合读者需求也可以参考一下。 绘制后得到的数据可能不同&#xff0c;但绘制方法仅仅是传递的参数不同。 关于给坐标数组在地图绘制图形的效果在移动端部分包…

【读书笔记-《30天自制操作系统》-14】Day15

本篇内容开始讲解多任务。本篇内容结构很简单&#xff0c;先讲解任务切换的原理&#xff0c;再讲解任务切换的代码实践。但是涉及到的知识不少&#xff0c;理解上也有些难度。 1. 任务切换与多任务原理 1.1 多任务与任务切换 所谓多任务&#xff0c;指的是操作系统同时运行多…

ambari-hdp启动yarn报错Corruption: checksum mismatch

ambari-hdp启动yarn报错Corruption: checksum mismatch 页面报错 Traceback (most recent call last):File "/var/lib/ambari-agent/cache/stacks/HDP/3.0/services/YARN/package/scripts/nodemanager.py", line 102, in <module>Nodemanager().execute()Fil…

万字文档带你走进Python的世界

目录 Python基本使用语法 老生常谈 Python中的注释 Python变量 定义变量 变量类型 Python变量的特点 Python中的输入与输出 Python中的运算符 算术运算符 /和// **运算符 关系运算符 逻辑运算符 赋值运算符 Python运算符优先级 Python分支语句 if语句和if-else语句 if-else if-…

Java | Leetcode Java题解之第386题字典序排数

题目&#xff1a; 题解&#xff1a; class Solution {public List<Integer> lexicalOrder(int n) {List<Integer> ret new ArrayList<Integer>();int number 1;for (int i 0; i < n; i) {ret.add(number);if (number * 10 < n) {number * 10;} els…