算法排序基础(全版)

news2025/1/17 18:08:41

一、简单排序

这大概是我整理的最全的有关算法排序的内容啦!欢迎大家前来学习,同时也希望多多支持一下博主哦!

在我们的程序中,排序是非常常见的一种需求,提供一些数据元素,把这些数据元素按照一定的规则进行排序。比如查询一些订单,按照订单的日期进行排序;再比如查询一些商品,按照商品的价格进行排序等等。所以,接下来我们要学习一些常见的排序算法。

在Java的开发工具包JDK中,已经给我们提供了很多数据结构与算法的实现,比如List、Set、Map、Math等等,都是以API的方式提供,这种方式的好处在于一次编写,多处使用。我们借鉴JDK的方式,也把算法封装到某个类中,那如果是这样,在我们写Java代码之前,就需要先进行API的设计,设计好之后,再对这些API进行实现。

就比如我们先设计一套API如下:

image-20221127015228303

​ 然后再使用Java代码去实现它。以后我们讲任何数据结构与算法都是以这种方式讲解。

1.1 Comparable接口介绍

​ 由于我们这里要讲排序,所以肯定会在元素之间进行比较,而 Java提供了一个接口Comparable就是用来定义排序规则的,在这里我们以案例的形式对Comparable接口做一个简单的回顾。

需求:

  1. 定义一个学生类Student,具有年龄age和姓名username两个属性,并通过Comparable接口提供比较规则;
  2. 定义测试类Test,在测试类Test中定义测试方法Comparable getMax(Comparable c1 , Comparable c2)完成测试

image-20221127020623599

1.2 冒泡排序

冒泡排序(Bubble Sort),是一种计算机科学领域的较简单的排序算法。

需求:

​ 排序前:{4,5,6,3,2,1}

​ 排序后:{1,2,3,4,5,6}

排序原理:

  1. 比较相邻的元素。如果前一个元素比后一个元素大,就交换这两个元素的位置。
  2. 对每一对相邻元素做同样的工作,从开始第一对元素到结尾的最后一对元素。最终最后位置的元素就是最大值。
image-20221127021106065

冒泡排序API设计:

image-20221127021632398

image-20221127022242633

冒泡排序的代码实现:

冒泡排序使用了双层for循环,其中内层循环的循环体是真正完成排序的代码,所以,我们分析冒泡排序的时间复杂度,主要分析一下内层循环体的执行次数即可。

最坏情况下,也就是假如要排序的元素为 {6,5,4,3,2,1} 逆序,那么:

image-20221127094443411

1.3 选择排序

选择排序 是一种更加简单直观的排序方法。

需求:

​ 排序前:{4,6,8,7,9,2,10,1}

​ 排序后:{1,2,4,5,7,8,9,10}

排序原理:

​ 1、每一次遍历的过程中,都假定第一个索引处的元素是最小值,和其它索引处的值依次进行比较,如果当前索引处的值大于其他某个索引处的值,则假定其他某个索引出的值为最小值,最后可以找到最小值所在的索引

2、交换第一个索引处和最小值所在的索引处的值
在这里插入图片描述

选择排序API设计:

image-20221127095826976

选择排序的代码实现:

在这里插入图片描述

image-20221127101017830

选择排序的时间复杂度分析:

选择排序 使用了双层for循环,其中外层循环完成了数据交换,内层循环完成了数据比较,所以我们分别统计数据交换次数和数据比较次数:

image-20221127131728422

1.4 插入排序

插入排序(Insertion sort)是一个简单直观且稳定的排序算法。

插入排序 的工作方式非常像人们排序一手扑克牌一样。开始时,我们的左手为空并且桌子上的牌面朝下。然后,我们每次从桌子上拿走一张牌并将它插入左手中正确的位置。为了找到一张牌的正确位置,我们从右到左将它与已在手中的每张牌进行比较,如下图所示:

image-20221127132249977

需求:

​ 排序前:{4,3,2,10,12,1,5,6}

​ 排序后:{1,2,3,4,5,6,10,12}

排序原理:

  1. 把所有的元素分为两组,已经排序和未排序的;
  2. 找到未排序的组中的第一个元素,向已经排序的组中进行插入;
  3. 倒叙遍历已经排序的元素,依次和待插入的元素进行比较,直到找到一个元素小于等于待插入元素,那么就把待插入元素放到这个位置,其他的元素向后移动一位;

image-20221127132707977

插入排序API设计:

image-20221127133334207

插入排序代码实现:

image-20221127134100816

image-20221127134225745

插入排序的时间复杂度分析

插入排序使用了双层for循环,其中,内层循环的循环体是真正完成排序的代码,所以,我们分析插入排序的时间复杂度主要分析一下内层循环体的执行次数即可。

image-20221127152800601

二、高级排序

​ 之前我们学过的基础排序,包括冒泡排序,选择排序还有插入排序,并且对他们在最坏情况下的时间复杂度做了分析,发现都是==O(N^2),==而平方阶通过我们之前学习算法分析我们知道,随着输入规模的增大,时间成本将急剧上升,所以这些基本排序方法不能处理更大规模的问题,接下来我们学习一些高级的排序算法,争取降低算法的时间复杂度最高阶次幂。

2.1 希尔排序

希尔排序 是插入排序的一种,又称 ”缩小增量排序“,是插入排序算法的一种更高效的改进版本。

​ 前面学习插入排序的时候,我们会发现一个很不友好的事儿,如果已排序的分组元素为{2,5,7,9,10},未排序的分组元素为{1,8},那么下一个待插入的元素为1,我们需要拿着1从后往前,依次和10,9,7,5,2进行交换位置,才能完成真正的插入,每次交换只能和相邻的元素交换位置。那如果我们要提高效率,直观的想法就是一次交换,能把1放到更前面的位置,比如一次交换就能把1插到2和5之间,这样一次交换1就向前走了5个位置,可以减少交换的次数,这样的需求如何实现呢?接下来我们来看看希尔排序的原理。

需求:

​ 排序前:{9,1,2,5,7,4,8,6,3,5}

​ 排序前:{1,2,3,4,5,5,6,7,8,9}

排序原理:

  1. 选定一个增长量h,按照增长量h作为数据分组的依据,对数据进行分组;
  2. 对分好组的每一组数据完成插入排序;
  3. 减少增长量,最小减为1,重复第二步操作。

image-20221127155739870

增常量h的确定:增长量h的值每一固定的规则,我们这里采用以下规则:

image-20221127160721393

希尔排序的API设计:

在这里插入图片描述

希尔排序的代码实现:

在这里插入图片描述

image-20221127165546891

希尔排序的时间复杂度分析

在希尔排序中,增长量h并没有固定的规则,有很多论文研究了各种不同的递增序列,但都无法证明某个序列是最好的,对于希尔排序的时间复杂度分析,已经超出了我们课程设计的范畴,所以在这里就不做分析了。

​ 我们可以使用事后分析法希尔排序和插入排序做性能比较。

​ 在资料的测试数据文件夹下有一个reverse_shell_insertion.txt文件夹,里面存放的是从100000到1的逆向数据,我们可以根据这个批量数据完成测试。测试的思想:在执行排序前记录一个时间,在排序完成后记录一个时间,两个时间的时间差就是排序的耗时。

希尔排序和插入排序性能比较测试代码:

在这里插入图片描述

在这里插入图片描述

image-20221127213959344

2.2 归并排序

2.2.1 递归

​ 正式学习归并排序之前,我们得先学习一下递归算法。

定义:

定义方法时,在方法内部调用方法本身,称之为递归。

image-20221127214337852

作用:

​ 它通常把一个大型复杂的问题,层层转换为一个与原问题相似的,规则较小的问题来求解。递归策略只需要少量的程序就可以描述出解题过程所需的多次重复计算,大大地减少了程序的代码量。

注意事项:

​ 在递归中,不能无限制的调用自己,必须要有边界条件,能够让递归结束,因为每一次递归调用都会在栈内存开辟新的空间,重新执行方法,如果递归的层级太深,很容易造成栈内存溢出。

image-20221127220008469

需求:

请定义一个方法,使用递归完成求N的阶乘:

image-20221127220200845

代码实现:

image-20221127220243273

image-20221127221848887

2.2.2 归并排序

归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为**二路归并**。

需求:

​ 排序前:{8,4,5,7,1,3,6,2}

​ 排序后:{1,2,3,4,5,6,7,8}

排序原理:

  1. 尽可能的一组数据拆分成两个元素相等的子组,并对每一个子组继续拆分,直到拆分后的每个子组的元素个数是1为止;
  2. 将相邻的两个子组进行合并成一个有序的大组;
  3. 不断重复步骤2,直到最终只有一个组为止。
    在这里插入图片描述

归并排序API设计:

在这里插入图片描述

代码演示:

image-20221127224219555

image-20221127224321083

image-20221127224352918

归并原理:

image-20221127225318758

image-20221127230025186

image-20221127230055332

image-20221127230224391

image-20221127230248538

image-20221127230405551

image-20221127230455778

image-20221127230509832

代码演示

在这里插入图片描述

image-20221127231822923

归并排序时间复杂度分析:

归并排序 是分治思想的最典型的例子,上面的算法中,对a[lo … hi]进行排序,先将它分为a[lo … mid]和a[mid+1 … hi]两部分,分别通过递归调用将他们单独排序,最后将有序的子数组归并为最终的排序结果。该递归的出口在于如果一个数组不能再被分为两个子数组,那么就会执行merge进行归并,在归并的时候判断元素的大小进行排序。

image-20221128020424097

​ 树状图来描述归并,如果一个数组有8个元素,那么它将每次除以2找最小的子数组,共拆log8次,值为3,所以树共有3层,那么自顶向下第k层有2k个子数组,每个数组的长度为2(3-k),归并最多需要2(3-k)次比较。因此每层的比较次数为2k*2(3-k)=23,那么3层总共为 3 *2^3。

​ 假设元素的个数为n,那么使用归并排序拆分的次数为log2(n),所以共log2(n)层,那么使用log2(n)替换上面 3*23中的3这个层数,最终得出的归并排序的时间复杂度为:log2(n)*2(log2(n)) = log2(n)*n,根据大O推导法则,忽略底数,最终归并排序的时间复杂度为O(nlogn);

归并排序的缺点:

​ 需要申请额外的空间,导致空间复杂度提升,是典型的以空间换时间的操作。

归并排序与希尔排序性能测试:

​ 之前我们通过测试可以知道希尔排序的性能是由于插入排序的,那现在学习了归并排序之后,归并排序的效率与希尔排序的效率哪个高呢?我们使用同样的测试方式来完成一样这两个排序算法之间的性能比较。

​ 在资料的测试数据文件夹下有一个reverse_arr.txt文件,里面存放的是从100000到1的逆向数据,我们可以根据这个批量数据完成测试。==测试的思想:==在执行排序前记录一个时间,在排序完成后记录一个时间,两个时间的时间差就是排序的耗时。

希尔排序和插入排序性能比较测试代码:

在这里插入图片描述

在这里插入图片描述

通过测试,发现希尔排序和归并排序在处理大批量数据时差别不是很大。

2.3 快速排序

快速排序 是对冒泡排序的一种改进。**它的基本思想是:**通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。

需求:

​ 排序前:{6,1,2,7,9,3,4,5,8}

​ 排序后:{1,2,3,4,5,6,7,8,9}

排序原理:

  1. 首先设定一个分界值,通过该分界值将数组分成左右两部分;
  2. 将大于或等于分界值的数据放到数组右边,小于分界值的数据放到数组的左边。此时左边部分中各元素都小于或等于分界值,而右边部分中各元素都大于或等于分界值;
  3. 然后,左边和右边的数据可以独立排序。对于左侧的数组数据,又可以取一个分界值,将该部分数据分成左右两部分,同样在左边放置较小值,右边放置较大值。右侧的数组数据也可以做类似处理。
  4. 重复上述过程,可以看出,这是一个递归定义。通过递归将左侧部分排好右侧部分的顺序。当左侧和右侧两个部分的数据排完序后,整个数组的排序也就完成了。

image-20221128023738385

快速排序API设计:

image-20221128024204610

切分原理:

把一个数组切分成两个子数组的基本思想:

  1. 找到一个基准值,用两个指针分别指向数组的头部和尾部;
  2. 先从尾部向头部开始搜索一个比基准值小的元素,搜索到即停止,并记录指针的位置;
  3. 再从头部向尾部开始搜索一个比基准值大的元素,搜索到即停止,并记录指针的位置;
  4. 交换当前左边指针位置和右边指针位置的元素;
  5. 重复2,3,4步骤,直到左边指针的值大于右边指针的值停止。

image-20221128110119029

image-20221128110331272
在这里插入图片描述

在这里插入图片描述

代码演示(切分原理):

在这里插入图片描述

在这里插入图片描述

快速排序代码实现:

在这里插入图片描述

image-20221128112950530

快速排序和归并排序的区别:

快速排序 是另外一种分治的排序算法,它将一个数组分成两个子数组,将两部分独立的排序。快速排序和归并排序是互补的:归并排序将数组分成两个子数组分别排序,并将有序的子数组归并从而将整个数组排序,而快速排序的方式则是当两个数组都有序时,整个数组自然就有序了。在归并排序中,一个数组被等分为两半,归并调用发生在处理整个数组之前,在快速排序中,切分数组的位置取决于数组的内容,递归调用发生在处理整个数组之后。

快速排序时间复杂度分析:

​ 快速排序的一次切分从两头开始交替搜索,直到left和right重合,因此,一次切分算法的时间复杂度为O(n),但整个快速排序的时间复杂度和切分的次数相关。

最优情况:每一次切分选择的基准数字刚好将当前序列等分。

image-20221128132400026

​ 如果我们把数组的切分看做是一个树,那么上图就是它的最优情况的图示,共切分了logn次,所以,最优情况下快速排序的时间复杂度为O(nlogn)

最坏情况,每一次切分选择的基准数字是当前序列中最大数或者最小数,这使得每次切分都会有一个子组,那么总共就得切分n次,所以,最坏情况下,快速排序的时间复杂度为O(n^2)
在这里插入图片描述

平均情况:每一次切分选择的基准数字不是最大值和最小值,也不是中值,这种情况我们也可以用数学归纳法证明,快速排序的时间复杂度为O(nlogn),由于数学归纳法有很多数学相关的知识,容易使我们混乱,所以这里就不对平均情况的时间复杂度做证明了。

2.4 排序的稳定性

稳定性的定义:

​ 数组arr中有若干元素,其中A元素和B元素相等,并且A元素在B元素前面,如果使用某种排序算法排序后,能够保证A元素依然在B元素的前面,可以说这个该算法是稳定的。

image-20221128145634677

稳定性的意义:

​ 如果一组数据只需要一次排序,则稳定性一般是没有意义的,如果一组数据需要多次排序,稳定性是有意义的。例如要排序的内容是一组商品对象,第一次排序按照价格由低到高排序,第二次排序按照销量由高到低排序,如果第二次排序使用稳定性算法,就可以使得相同销量的对象依旧保持着价格高低的顺序展现,只有销量不同的对象才需要重新排序。这样既可以保持第一次排序的原有意义,而且可以减少系统开销。

  • 第一次按照价格从低到高排序:

image-20221128150206387

  • 第二次按照销量进行从高到低排序;

image-20221128150254103

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/44607.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++ STL容器】:vector存放数据以及存放自定义的数据类型

前言 时不可以苟遇&#xff0c;道不可以虚行。 STL 中最常用的容器为&#xff1a;vector&#xff0c;暂且把它理解为我们之前学过的数组Array。 一、创建一个vector容器&#xff08;数组&#xff09; 添加头文件&#xff1a;#include <vector> vector<int> v;二、…

VauditDemo靶场代码审计

靶场搭建 将下载好的VAuditDemo_Debug目录复制到phpstudy的www目录下&#xff0c;然后将其文件名字修改成VAuditDemo&#xff0c;当然你也可以修改成其他的 运行phpstudy并且访问install目录下的install.php&#xff0c;这里我访问的是http://127.0.0.1/VAuditDemo/install/in…

Linux 性能分析工具- Atop安装和使用

Atop下载&#xff1a;Atoptool.nl 安装时&#xff0c;可能会出现报错&#xff1a;error: Failed dependencies 提示很需要安装python3&#xff0c;所以yum -y install python3&#xff0c;然后再装atop就没问题了。 atop 常用命令 您可在打开日志文件后&#xff0c;使用以下命…

R语言使用马尔可夫链对营销中的渠道归因建模

介绍 在这篇文章中&#xff0c;我们看看什么是渠道归因&#xff0c;以及它如何与马尔可夫链的概念联系起来。最近我们被客户要求撰写关于马尔可夫链的研究报告&#xff0c;包括一些图形和统计输出。我们还将通过一个电子商务公司的案例研究来理解这个概念如何在理论上和实践上…

QT开发教程:QScroller实现home界面滑动效果

在上章我们学习了QScroller实现home界面滑动效果,但是该界面是实现的上下滑动效果,如果想模拟手机home滑动界面,则需要实现左右滑动效果. 本章,则重写QStackedWidget类,来真正的模拟手机,来实现home界面左右滑动效果. 1.SmoothStackedWidget类实现 demo界面如下图所示(创建了…

[附源码]计算机毕业设计springboot第三方游戏零售平台

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

Discourse 在 2022-11 的最新版本中提供了新的边栏

官方有关这个边栏的说明和解释文章请参考链接&#xff1a; Try out the new sidebar and notification menus! - announcements - Discourse Meta 中的内容。 在这个新设计的边栏中包含了一些所有人都需要使用的快捷链接&#xff0c;同时还包括一些定义的快捷分类链接和 Tag 链…

haproxy keepalive实践

1 安装haproxy wget http://download.openpkg.org/components/cache/haproxy/haproxy-2.6.6.tar.gz tar -zxvf haproxy-2.6.6.tar.gz cd haproxy-2.6.6 mkdir -p /app/haproxy # 安装依赖,解决haproxy.c:80:31的问题 sudo yum -y install gcc openssl-devel pcre-devel system…

【Python】一、Python程序运行方式

文章目录实验目的一、熟悉Python的安装二、熟悉PyCharm安装三、启动IDLE&#xff0c;进入Python Shell&#xff0c;熟悉环境&#xff0c;运行教材案例&#xff1a;输出“hello world&#xff01;”四、打开“命令提示符”窗口&#xff0c;使用pip安装管理pygame、numpy等第三方…

算法训练Day30 回溯算法专题 | LeetCode332. 重新安排行程;51.N皇后(棋盘问题);37.解数独(二维的递归)

前言&#xff1a; 算法训练系列是做《代码随想录》一刷&#xff0c;个人的学习笔记和详细的解题思路&#xff0c;总共会有60篇博客来记录&#xff0c;计划用60天的时间刷完。 内容包括了面试常见的10类题目&#xff0c;分别是&#xff1a;数组&#xff0c;链表&#xff0c;哈…

android 自定义view: 跑马灯-光圈

本系列自定义View全部采用kt **系统: **mac android studio: 4.1.3 **kotlin version:**1.5.0 gradle: gradle-6.5-bin.zip 本篇效果: 前沿 最近在bilibili看到一个跑马灯光圈效果挺好, 参考着思路写了一下. bilibili地址,美中不足的是这是html代码 QaQ 实现思路 将效果…

Spark系列之Spark启动与基础使用

title: Spark系列 第三章 Spark启动与基础使用 3.1 Spark Shell 3.1.1 Spark Shell启动 安装目录的bin目录下面&#xff0c;启动命令&#xff1a; spark-shell$SPARK_HOME/bin/spark-shell \ --master spark://hadoop10:7077 \ --executor-memory 512M \ --total-executor-…

长短期记忆网络(LSTM)重点!(自己汇集了很多资料在这篇博客)

文章目录参考资料推荐基础知识评论区精髓代码实现底层实现简洁实现参考资料推荐 心心念念 学了这么久 &#xff0c;终于学到第57集了。 参考一篇掘金的图文LSTM 李宏毅老师的手撕视频配套课件 27:39 开始手撕 看完了李沐老师的LSTM又去找了李宏毅老师的课程然后发现又多了个导…

西门子机床联网

一、设备信息确认 1、确认型号 数控面板拍照确认&#xff1a; 此系统为&#xff1a;西门子828D 还有一种情况是面板无任何版本信息&#xff0c;这时就需要进入系统里面再确认。 2、确认通讯接口 1、数控面板的后面 X130为网络标号 2、其他位置 其他位置一般是前面位置用…

H3C mstp+vrrp实验 新华三杯拆解

H3C mstpvrrp实验一、实验拓扑二、实验要求局域网规划&#xff1a;可靠性&#xff1a;三、实验配置&#xff08;一&#xff09;链路聚合1.创建链路聚合组2.检查&#xff08;二&#xff09;VLAN1.创建vlan2.放行vlan3.检查&#xff08;三&#xff09;MSTP1.配置MSTP域2.配置主备…

通俗易懂的java设计模式(1)-单例模式

什么是单例模式&#xff1f; 单例模式是java中最简单的一种设计模式 需要注意的问题&#xff1a; 1.单例类有且只能有一个实例 2.单例类必须自己创建出这个实例&#xff0c;并提供给外界 那么如何自己创建实例而不让外界创建呢&#xff1f;很简单&#xff0c;我们将无参的构造函…

麦芽糖-刀豆球蛋白A,maltose-ConcanavalinA,刀豆球蛋白A-PEG-麦芽糖

麦芽糖-刀豆球蛋白A,maltose-ConcanavalinA,刀豆球蛋白A-PEG-麦芽糖 中文名称&#xff1a;麦芽糖-刀豆球蛋白A 英文名称&#xff1a;maltose-ConcanavalinA 别称&#xff1a;刀豆球蛋白A修饰麦芽糖&#xff0c;ConA-麦芽糖 还可以提供PEG接枝修饰麦芽糖&#xff0c;麦芽糖…

SpringCloud-alibaba-Nacos 从理论到落地使用

Nacos: Dynamic Naming and Configuration Service 就是&#xff1a; 一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。、 下面是生态图&#xff1a; Nacos EurekaConfig Bus 即 Nacos就是注册中心 配置中心的组合 他能干什么呢&#xff1f; 1、替代Eu…

防火墙firewalld

RHEL7中有几种防火墙共存&#xff1a;firewalld、iptables、ebtables等。基于iptables的防火墙默认不启动&#xff0c;但仍然可以继续使用。RHEL7默认使用firewalld作为防火墙&#xff0c;管理工具是firewall-cmd。RHEL7的内核版本是3.10&#xff0c;在此版本的内核里防火墙的包…

论文阅读2 Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction

目录 问题 创新 1、Introduction 2、相关工作 3、HAKE模型 原文&#xff1a;[1911.09419] Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction (arxiv.org) 问题 现有的知识图嵌入模型主要关注对称/反对称、反转和复合symmetry/antisymmetry, i…