【Python 千题 —— 算法篇】寻找两个正序数组的中位数

news2024/9/20 8:10:09

请添加图片描述

Python 千题持续更新中 ……
脑图地址 👉:⭐https://twilight-fanyi.gitee.io/mind-map/Python千题.html⭐

字符串处理

题目背景

在处理大规模数据时,我们经常需要对数据进行排序和分析。一个常见问题是如何高效地从两个正序数组中找出它们的中位数。该问题不仅是算法面试中的经典题目之一,还在数据分析、统计学等多个领域有实际应用。

求解两个正序数组的中位数是一种复杂的计算,因为它要求我们在保证时间复杂度足够低的情况下,不破坏正序数组的性质。理解和解决这个问题,可以大幅提升我们在算法设计与优化上的能力。

题目描述

给定两个大小分别为 mn 的正序(从小到大)数组 nums1nums2。请你找出这两个正序数组的中位数,要求算法的时间复杂度为 O(log(m+n))。

你需要实现一个函数 findMedianSortedArrays(),该函数接收两个正序数组 nums1nums2 作为输入,并返回它们的中位数。

输入描述

  • 两个正序数组 nums1nums2,每个数组的长度在 [0, 1000] 之间,且元素是有序的整数。

输出描述

  • 一个浮点数,表示两个数组合并后的中位数,结果需要保留到小数点后 1 位。

示例

示例 ①

输入:

# 调用 findMedianSortedArrays() 函数
print(findMedianSortedArrays([1, 3], [2]))

输出:

2.0

解释:合并数组 [1, 2, 3],中位数是 2。

示例 ②

输入:

print(findMedianSortedArrays([1, 2], [3, 4]))

输出:

2.5

解释:合并数组 [1, 2, 3, 4],中位数是 (2 + 3) / 2 = 2.5。


代码讲解与多种解法

解法一:合并排序法

一种直观的解法是将两个数组合并为一个,然后对合并后的数组进行排序。排序后,根据数组长度的奇偶性判断并找到中位数。这种方法虽然易于理解,但时间复杂度为 O((m + n)log(m + n)),在效率上不够理想。

def findMedianSortedArrays(nums1, nums2):
    merged = sorted(nums1 + nums2)
    n = len(merged)
    
    if n % 2 == 1:
        return merged[n // 2]
    else:
        return (merged[n // 2 - 1] + merged[n // 2]) / 2

优点:

  • 思路清晰,容易实现。

缺点:

  • 时间复杂度较高 O((m + n)log(m + n)),尤其在数据规模较大的情况下效率较低。

解法二:双指针法

双指针法通过利用两个数组已经排序的特点,不需要完整合并数组,而是使用双指针遍历两个数组,逐步找到中位数位置。这种方法的时间复杂度为 O(m + n),比合并排序法有所改进,但不符合 O(log(m + n)) 的要求。

def findMedianSortedArrays(nums1, nums2):
    m, n = len(nums1), len(nums2)
    merged = []
    i, j = 0, 0
    
    while i < m and j < n:
        if nums1[i] < nums2[j]:
            merged.append(nums1[i])
            i += 1
        else:
            merged.append(nums2[j])
            j += 1
    
    merged += nums1[i:] + nums2[j:]
    total_len = m + n
    
    if total_len % 2 == 1:
        return merged[total_len // 2]
    else:
        return (merged[total_len // 2 - 1] + merged[total_len // 2]) / 2

优点:

  • 时间复杂度降为 O(m + n),相较于合并排序法更加高效。

缺点:

  • 时间复杂度仍然不满足 O(log(m + n)) 的要求。

解法三:二分查找法

为了满足时间复杂度 O(log(m + n)) 的要求,我们可以采用二分查找的方法。在两个数组中使用二分查找法寻找中位数,核心思想是通过划分两个数组,使得左半部分的所有元素都小于右半部分的所有元素。

我们可以通过在较短的数组中使用二分查找,不断调整两个数组的划分位置,直到找到合适的中位数。

def findMedianSortedArrays(nums1, nums2):
    if len(nums1) > len(nums2):
        nums1, nums2 = nums2, nums1
    
    m, n = len(nums1), len(nums2)
    imin, imax, half_len = 0, m, (m + n + 1) // 2
    
    while imin <= imax:
        i = (imin + imax) // 2
        j = half_len - i
        
        if i < m and nums1[i] < nums2[j - 1]:
            imin = i + 1
        elif i > 0 and nums1[i - 1] > nums2[j]:
            imax = i - 1
        else:
            if i == 0: max_of_left = nums2[j - 1]
            elif j == 0: max_of_left = nums1[i - 1]
            else: max_of_left = max(nums1[i - 1], nums2[j - 1])
            
            if (m + n) % 2 == 1:
                return max_of_left
            
            if i == m: min_of_right = nums2[j]
            elif j == n: min_of_right = nums1[i]
            else: min_of_right = min(nums1[i], nums2[j])
            
            return (max_of_left + min_of_right) / 2

优点:

  • 时间复杂度为 O(log(min(m, n))),效率非常高。
  • 只需在较短的数组上进行二分查找,避免了不必要的计算。

缺点:

  • 实现起来稍微复杂一些,需要对二分查找和数组的划分有深入理解。

总结与思考

在处理寻找两个正序数组中位数的问题时,使用不同的方法可以得到不同的效率:

  1. 合并排序法:易于理解,但时间复杂度较高,适合小规模数据。
  2. 双指针法:通过双指针合并数组,时间复杂度 O(m + n),适合中等规模数据。
  3. 二分查找法:通过二分查找,在较短数组上进行划分,时间复杂度为 O(log(min(m, n))),是处理大规模数据的最佳选择。

对于这种涉及高效搜索和排序的题目,掌握二分查找的应用至关重要。通过本题目,我们不仅能够提升对数组和中位数的理解,还能够学到如何优化时间复杂度,使算法在处理大规模数据时更加高效。


扩展思考

  1. 统计学应用:中位数在统计分析中起着重要作用,掌握高效的中位数计算方法可以帮助我们在大数据处理中更快得出结论。
  2. 二分查找应用:本题目中的二分查找方法,不仅适用于数组合并中位数问题,还可以拓展到其他查找问题中,比如查找区间、寻找特定元素等。
  3. 复杂数据结构的处理:在实际应用中,数据可能并非简单的正序数组,而是树、图等复杂数据结构,学会如何在这些结构中寻找中位数同样是算法设计的重要内容。

希望通过本文的讲解,你能够深入理解寻找两个正序数组中位数的各种方法,并掌握高效的算法技巧。

持续关注博客,获取更多编程练习与技巧!
作者信息

作者 : 繁依Fanyi
CSDN: https://techfanyi.blog.csdn.net
掘金:https://juejin.cn/user/4154386571867191

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2114565.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

今天又学到了——图编号关联章节号,QGIS下载文件存储的瓦片

记录教程来源&#xff1a;​​​​​​【Word图编号关联章节号】图片分章节 编号&#xff0c;图1-1、图2-1_哔哩哔哩_bilibili 上面链接这个实现的是这个效果&#xff1a; word自动目录及章节自动编号教程_哔哩哔哩_bilibili&#xff0c;这个的效果是自己设计多级列表&#xf…

Pr:首选项 - 音频

Pr菜单&#xff1a;编辑/首选项 Edit/Preferences Premiere Pro 首选项中的“音频” Audio选项卡主要作用是控制音频的处理设置&#xff0c;包括音量调整、波形生成、音频渲染等选项&#xff0c;这些设置有助于优化音频的处理和编辑工作&#xff0c;适用于不同的剪辑需求和项目…

【Qt】Qt与Html网页进行数据交互

前言&#xff1a;此项目使用达梦数据库&#xff0c;以Qt制作服务器&#xff0c;Html制作网页客户端界面&#xff0c;可以通过任意浏览器访问。 1、Qt与网页进行数据交互 1.1、第一步&#xff1a;准备qwebchannel.js文件 直接在qt的安装路径里复制即可 1.2、第二步&#xf…

海外云手机是否适合运营TikTok?

随着科技的迅猛发展&#xff0c;海外云手机逐渐成为改变工作模式的重要工具。这种基于云端技术的虚拟手机&#xff0c;不仅提供了更加便捷、安全的使用体验&#xff0c;还在电商引流和海外社媒管理等领域展示了其巨大潜力。那么&#xff0c;海外云手机究竟能否有效用于运营TikT…

Jenkins+Svn+Vue自动化构建部署前端项目(保姆级图文教程)

目录 介绍 准备工作 配置jenkins 构建部署任务 常见问题 介绍 在平常开发前端vue项目时,我们通常需要将vue项目进行打包构建,将打包好的dist目录下的静态文件上传到服务器上,但是这种繁琐的操作是比较浪费时间的,可以使用jenkins进行自动化构建部署前端vue 准备工作 准备…

Java 面试题:通过JProfile排查OOM问题 内存溢出与内存泄漏问题 --xunznux

文章目录 如何通过JProfile排查OOM或内存泄漏问题1、启动工具观测程序执行状态2、使用默认设置采样3、查看memory&#xff0c;Run GC无效4、查看 Live Memory发现两个byte大数组存在5、通过快照查看堆中的内存使用情况6、找到Full GC无法清除的对象通过大对象列表定位内存泄漏问…

MES系统如何支持企业进行数字化转型

MES系统&#xff08;Manufacturing Execution System&#xff0c;制造执行系统&#xff09;在企业数字化转型中扮演着至关重要的角色&#xff0c;它通过提供实时的生产数据、优化生产流程、提升质量管理水平、实现设备智能化管理以及促进企业内部协同和沟通等多种方式&#xff…

行政组织理论-第十二章:政府再造流程

章节章节汇总第一章&#xff1a;绪论第二章&#xff1a;行政组织的演变第三章&#xff1a;科层制行政组织理论第四章&#xff1a;人本主义组织理论第五章&#xff1a;网络型组织理论第六章&#xff1a;行政组织目标第七章&#xff1a;行政组织结构第八章&#xff1a;行政组织体…

MarkdownEditor 配置以及使用

MarkdownEditor 配置以及使用 MarkdownEditor是一款基于浏览器的 Markdown 编辑器&#xff0c;虽然他是独立软件&#xff0c;但该软件内嵌一个浏览器。功能非常简单实用、反应速度很快&#xff0c;号称是Markdown领域的NotePad&#xff08;记事本&#xff09;。 MarkdownEdit…

港科夜闻 | 叶玉如校长出席2024科技+新质生产力高峰论坛发表专题演讲,贡献国家科技强国战略...

关注并星标 每周阅读港科夜闻 建立新视野 开启新思维 1、叶玉如校长出席“2024科技新质生产力高峰论坛”&#xff0c;做了题为“三个创新&#xff1a;培育和发展新质生产力、贡献国家科技强国战略”的主题演讲。该论坛于9月2日在香港召开。论坛围绕夯实基础科研、推动源头创新、…

【VUE】Vue 项目基本开发结构介绍

&#x1f4dd;个人主页&#x1f339;&#xff1a;个人主页 ⏩收录专栏⏪&#xff1a;VUE &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339;&#xff0c;让我们共同进步&#xff01; 在 Vue 开发中&#xff0c;了解 Vue 项目的基本结构是进行 Vue 开发的基础…

爬虫基础知识+豆瓣电影实战

什么是爬虫 简单来说&#xff0c;爬虫就是获取网页并提取和保存信息的自动化程序&#xff0c;爬虫能够自动请求网页&#xff0c;并将所需要的数据抓取下来。通过对抓取的数据进行处理&#xff0c;从而提取出有价值的信息进行存储使用。 为什么用Python做爬虫 首先您应该…

python 中使用tkinter构建一个图片的剪切器-附源码

由于项目需要&#xff0c;需要构建一个间的软件&#xff0c;方便查看图片的剪切的位置&#xff0c;并对其中的图像进行分析&#xff0c;实现如下的功能 简单的UI加载图片剪切图片显示剪切后的图片 针对图片的内容进行识别 图片质量分析 前端的具体代码如下&#xff0c; 有需…

5.8 切换保护模式(5)

1 首先测试 了&#xff0c; 之前的代码 是 没有问题的&#xff0c;确实会 停在 汇编处。 1 首先是 设置 除了 CS 之外的寄存器 进入 32为模式 //为了使除了 cs 之外的 段选择寄存器也进入 32位模式。mov $16, %ax // 16为数据段选择子mov %ax, %dsmov %ax, %ssmov %ax, %esmov…

axure动态面板

最近转管理岗了&#xff0c;作为项目负责人&#xff0c;需要常常与客户交流沟通&#xff0c;这时候画原型的能力就是不可或缺的本领之一了&#xff0c;关于axure可能很多it行业者都不是很陌生&#xff0c;简单的功能呢大家就自行去摸索&#xff0c;我们这次从动态面板开始讲起。…

C语言进阶版第8课—指针(2)

文章目录 1. 数组名的理解2. 指针访问数组3. 一维数组传参本质4. 冒泡排序5. 二级指针6. 指针数组7. 指针数组模拟二维数组 1. 数组名的理解 sizeof&#xff08;数组名&#xff09;— 这里的数组名代表整个数组&#xff0c;计算的也是整个数组的大小&数组名 — 这里的数组名…

adb devices找不到设备

重新启动ADB服务。在命令行窗口中输入adb kill-server&#xff0c;然后再输入adb start-server&#xff0c;重新启动ADB服务 再重启插入手机连入电脑的线&#xff0c;再次启动开发模式。 在在命令行窗口中输入adb version

【大数据】深入浅出Hadoop,干货满满

【大数据】深入浅出Hadoop 文章脉络 Hadoop HDFS MapReduce YARN Hadoop集群硬件架构 假设现在有一个PB级别的数据库表要处理。 在单机情况下&#xff0c;只能升级你的内存、磁盘、CPU&#xff0c;那么这台机器就会变成 “超算”&#xff0c;成本太高&#xff0c;商业公司肯…

Java基础知识回顾-匿名内部类

文章目录 知识学习实现案例第一步、父类定义方法第二步、子类中定义匿名内部类第三步、执行方法 最近在复习Java知识点的时候&#xff0c;在看匿名内部类&#xff0c;记录下来&#xff0c;方便备查。 知识学习 匿名内部类&#xff0c;即一种特殊的局部内部类&#xff0c;不需要…

java opencv no opencv_java490 in java.library.path

java使用opencv处理图片&#xff0c;idea运行程序&#xff0c;报错异常信息&#xff1a; Exception in thread "main" java.lang.UnsatisfiedLinkError: no opencv_java490 in java.library.path: /Users/carter/Library/Java/Extensions:/Library/Java/Extensions:…