【数据结构与算法】——第八章:排序

news2024/9/29 18:06:57

文章目录

      • 1、基本概念
        • 1.1 什么是排序
        • 1.2 排序算法的稳定性
        • 1.3 排序算法的分类
        • 1.4 内排序的方法
      • 2、插入排序
        • 2.1 直接插入排序
        • 2.2 直接插入排序
        • 2.3 希尔排序
      • 3、交换排序
        • 3.1 冒泡排序
        • 3.2 快速排序
      • 4、选择排序
        • 4.1 简单选择排序
        • 4.2 树形选择排序
        • 4.3 堆排序
        • 4.4 二路归并排序
      • 5、基数排序
        • 5.1 链式基数排序
      • 6、各种内部排序方法的比较

 ============================ 【说明】 ===================================================
  大家好,本专栏是 数据结构与算法该科目是计算机类专业必修课之一,比较重要也比较基础,有想从事算法研究的同学,这些内容是专/本科、甚至硕士期间较为基础的内容,适用范围较广:大学专业课学习、考研复习等。
  通过自己的理解进行整理,希望大家积极交流、探讨,多给意见。后面也会给大家更新其他一些知识。若有侵权,联系删除!共同维护网络知识权利!


1、基本概念

1.1 什么是排序

   给定一个记录集合( r1,r2,…,rn),其相应的关键码分别为(k1,k2,…,kn),排序是将这些记录排成顺序为(rs1,rs2,…,rsn)的一个序列,使得相应的关键码满足ks1≤ks2≤…≤ksn(非降序或升序)或ks1≥ks2≥…≥ksn(非升序或降序)。

1.2 排序算法的稳定性

   若对任意的数据元素序列,使用某个排序方法,对它按关键码进行排序

      (1) 若相同关键码元素间的位置关系,排序前与排序后保持一致,称此排序方法是稳定的
      (2) 不能保持一致的排序方法则称为不稳定的

1.3 排序算法的分类

   (1) 内排序和外排序

   按照参加排序的数据元素(记录)是否全部放置在内存中可把排序分为内排序和外排序

      内排序:指待排序列完全存放在内存中所进行的排序过程,适合不太大的元素序列。
      外排序:指排序过程中还需访问外存储器,足够大的元素序列,因不能完全放入内存,只能使用外排序。

   (2) 单键排序和多键排序

  按照排序所依据的关键码的个数可以把排序分为单键排序和多键排序。

      单键排序:根据一个关键码进行的排序。
      多键排序:根据多个关键码进行的排序。

   (3) 基于比较和不基于比较

   按照排序的方法是否建立在关键码比较的基础上可以把排序分为:

    基于比较:主要是通过关键码之间的比较和记录的移动这两种操作来实现的排序。
    不基于比较:根据待排序数据的特点所采取的其它方法,通常是没有大量的关键码之间的比较和记录的移动操作的排序。

1.4 内排序的方法

  内部排序的过程是一个逐步扩大记录的有序序列长度的过程。

  内排序有如下几大类:

  下面对各种排序算法做个详细介绍:


2、插入排序

2.1 直接插入排序

  算法思想:仅有一个记录的表总是有序的,因此,对于n个记录的表,可从第二个记录开始直到第n个记录,逐个向有序表中进行插入操作,从而得到n个记录按关键码有序的表。

  步骤
    (1) 从第一个元素开始,该元素可以认为已经被排序;
    (2) 取出下一个元素,在已经排序的元素序列中从后向前扫描;
    (3) 如果该元素(已排序)大于新元素,将该元素移到下一位置;
    (4) 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置;
    (5) 将新元素插入到该位置后;
    (6) 重复步骤2~5。

  算法分析

    空间效率:仅用了一个辅助单元O(1)
    时间效率
      最好情况下:初始序列是顺序的
      最坏情况下:初始序列是逆序的
      平均情况下:初始序列是无序的
    稳定性:是一种稳定的排序方法。


2.2 直接插入排序

  算法思想:设在顺序表中有一 个对象序列 V[0], V[1], …, V[n-1]。其中, V[0], V[1], …, V[i-1] 是已经排好序的对象。在插入V[i] 时, 利用折半查找法寻找V[i] 的插入位置。

  步骤
  折半插入排序与直接插入排序算法原理相同。只是,在向已排序的数据中插入数据时,采用来折半查找(二分查找)。先取已经排序的序列的中间元素,与待插入的数据进行比较,如果中间元素的值大于待插入的数据,那么待插入的数据属于数组的前半部分,否则属于后半部分。依次类推,不断缩小范围,确定要插入的位置。

    Step1: 顺序表中前j-1个记录有序,将第j个记录插入。令low=1;high=j-1;r[0]=r[j];
    Step2: 若low>high,得到插入位置,转Step5;
    Step3: 若low≤high,则取有序子表的中点m=(low+high)/2
    Step4: 若r[0].key<r[m].key,则插入位置在低半区,令high=m-1;否则插入位置在高半区,令low=m+1;转Step2;
    Step5: high+1即为待插入位置,从j-1到high+1的记录,逐个后移,r[high+1]=r[0];放置待插入记录。

  案例

  (1) 待排序数据:2,1,6,7,4
  取第一个元素作为有序表,剩余的元素作为无序表;其中有序表:2;无序表:1,6,7,4

  (2) 第一次比较,从无序表中取出第一个数 1,与中间值2比较,1<2,1插到2的前面,得到:有序表:1,2;无序表:6,7,4

  (3) 第二次比较,从无序表中取出第一个数 6,与中间值1比较,6>1,要放在1的后面,再与后半区(有序表:2)的中间值2比较,6>2,6插入到2的后面,得到: 有序表:1,2,6;无序表:7,4

  (4) 第三次比较,从无序表中取出第一个数 7,与中间值2比较,7>2,7放在2后面,再与后半区(有序表:6)的中间值6比较,7>6,7放在6后面,得到:有序表:1,2,6,7;无序表:4

  (5) 第四次比较,从无序表中取出第一个数 4,与中间值2比较,4>2,4放在2后面,再与后半区(有序表:6,7)的中间值6比较,4<6,4放在6前面,最终得到:1,2,4,6,7

  算法分析

    时间复杂度:O( n 2 n^2 n2)。
    空间复杂度:O(1)。
    稳定性:是一种稳定的排序方法。


2.3 希尔排序

  算法思想:先将整个待排记录分割成若干个子序列,在子序列中分别进行直接插入排序,待整个序列基本有序的时候,再对全体序列进行一次直接插入排序。

  步骤

    Step1: 选择一个步长序列t1,t2,…,tk,其中 ti>tj,tk=1;

    Step2: 按步长序列个数k,对序列进行k趟排序;

    Step3: 每趟排序,根据对应的步长ti,将待排序列分割成若干长度为m的子序列,分别对各子表进行直接插入排序。仅步长因子为1时,整个序列作为一个表来处理,表长度即为整个序列的长度。

  案例

  算法分析

    时间复杂度:由于希尔排序是依赖于增量的选取,它的时间复杂度是在O(nlog2n)-O( n 2 n^2 n2)之间。
    空间复杂度:在希尔排序的过程中只需要一个辅助空间用于暂存当前待插入的记录,因此,希尔排序的空间复杂度为O(1)
    稳定性:希尔排序方法是一种不稳定的排序方法。


3、交换排序

3.1 冒泡排序

  算法思想:对n个记录的表,第一趟冒泡得到一个关键码最大的记录r[n],第二趟冒泡对n-1个记录的表,再得到一个关键码最大的记录r[n-1],如此重复,直到n个记录按关键码有序的表。

  步骤

    (1) 比较相邻的元素。如果第一个比第二个大,就交换它们两个;
    (2) 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;
    (3) 针对所有的元素重复以上的步骤,除了最后一个;
    (4) 重复步骤1~3,直到排序完成。

  一趟冒泡方法:

    Step1: i=1; //设置从第一个记录开始进行两两比较
    Step2: 若i≥j,一趟冒泡结束。
    Step3: 比较r[i].key与r[i+1].key,若 r[i].key≤r[i+1].key,不交换,转Step5;
    Step4: 当r[i].key>r[i+1].key时, r[0]=r[i];r[i]=r[i+1];r[i+1]=r[0]; // 将r[i]与r[i+1]交换
    Step5: i=i+1;对下两个记录进行两两比较,转Step2;

  算法分析

    空间复杂度:冒泡排序的空间复杂度为O(1)。
    时间复杂度:总共要进行n-1趟冒泡,对j个记录的表进行一趟冒泡需要j-1次关键码比较。 冒泡排序的时间复杂度为O( n 2 n^2 n2)。
    稳定性:冒泡排序是一种稳定的排序方法。


3.2 快速排序

  算法思想:找一个记录,以它的关键字作为“枢轴”,凡其关键字小于枢轴的记录均移动至该记录之前,反之,凡关键字大于枢轴的记录均移动至该记录之后。致使一趟排序之后,记录的无序序列R[s…t]将分割成两部分:R[s..i-1]R[i+1..t],且R[j].key≤ R[i].key ≤ R[j].key (s≤j≤i-1) 枢轴 (i+1≤j≤t)

  步骤

    Step1: 如果待排子序列中元素的个数大于1,则以L.r[low]作为枢轴,进行一次划分;否则排序结束。
    Step2: 对枢轴左半子序列重复Step1;
    Step3: 对枢轴右半子序列重复Step1;

  案例

  算法分析
    空间复杂度:快速排序是递归的,递归调用层次数与其二叉树的深度一致。因而,存储开销在理想情况下为O(log2n);在最坏情况下,为O(n)
    时间复杂度:最好情况下为O(nlog2n) ,最坏情况,快速排序蜕化为冒泡排序。
    稳定性:快速排序是一个不稳定的排序方法。


4、选择排序

4.1 简单选择排序

  算法思想第一趟,从n个记录中找出关键码最小的记录与第一个记录交换;第二趟,从第二个记录开始的n-1个记录中再选出关键码最小的记录与第二个记录交换;如此,第i趟,则从第i个记录开始的n-i+1个记录中选出关键码最小的记录与第i个记录交换,直到整个序列按关键码有序。

  步骤

    Step1: 从L.key[i]~ 从L.key[length]记录中选择一个关键字值最小的记录,将其下标保存至min中;
    Step2: 若L.key[i]≥L.key[min];则交换这两个记录;否则转Step3;
    Step3: i=i+1,若i≤L.length,则转Step1;否则排序结束。

  算法分析

    时间复杂度:从算法中可看出,简单选择排序移动记录的次数较少,但关键码的比较次数依然是,算法的时间复杂度仍是O( n 2 n^2 n2)。
    空间复杂度:简单选择排序算法只需要一个辅助空间来作为交换记录用的暂存单元。因此,它的空间复杂度O(1)。
    稳定性:简单选择排序是一种不稳定的排序方法。


4.2 树形选择排序

  步骤

    Step1:从最底层叶子结点开始,按层一一进行兄弟间的比赛,关键字值较大者上升为子树根结点,直到树的顶层为止;
    Step2:将树的根结点输出,把底层叶子中值相同的结点值改为0;如果输出的结点总数小于初始时树的叶子结点总数,则重复Step1;否则结束排序。

  案例

  首先对n个记录的关键字两两进行比较,然后在n/2个较小者之间再进行两两比较,如此重复,直至选出最小关键字的记录。整个过程可用一个含有n个叶结点的二叉树表示;
  选出最小记录后,将树中的该最小记录修改为∞,然后从该叶子结点所在子树开始,修改到达树根的路径上的结点;

  算法分析

    时间复杂度:除了最大关键字之外,每选择一个次大的关键字只需要进行log2n次比较,因此,它的时间复杂度为O(nlogn)。
    空间复杂度:需要附加n个辅助空间用来保存排序的结果,还要n-1个辅助空间作为排序过程中使用。因此,它的空间复杂度O(n)。
    稳定性:树形选择排序是一种不稳定的排序方法。这是因为在比较的过程中是跳跃式进行的。


4.3 堆排序

  定义

  第一种定义方式:
    设有n个元素的序列 {k1,k2,…,kn},当且仅当满足下述关系之一时,称之为堆。

  第二种定义方式
    堆是具有下列性质的完全二叉树:每个结点的值都小于或等于其左右孩子结点的值(称为小根堆或小顶堆);或者每个结点的值都大于或等于其左右孩子结点的值(称为大根堆或大顶堆)。

  算法思想:设有n个元素,将其按关键码排序。首先将这n个元素按关键码建成堆,将堆顶元素输出,得到n个元素中关键码最小(或最大)的元素然后,再对剩下的n-1个元素建成堆,输出堆顶元素,得到n个元素中关键码次小(或次大)的元素。如此反复,便得到一个按关键码有序的序列。称这个过程为堆排序

  堆排序需解决的两个问题

    1.怎样建堆:如何将n个元素的序列按关键码建成堆;
    2. 怎样调整:输出堆顶元素后,怎样调整剩余n-1个元素,使其按关键码成为一个新堆。

  建堆方法

    (1) 先把待排序序列构造成一棵完全二叉树;
    (2) 然后从下往上,自右而左进行筛选,最终得到堆。

  步骤

    Step1: i=1,对顺序表L[1…L.lengh-i+1]中的建大顶堆;
    Step2: 将堆顶元素和L[L.lengh-i+1]交换;
    Step3: i=i+1,若i<L.lengh,则将L[1…L.lengh-i+1]调整;使之成为新的大顶堆;转Step2;否则排序结束。

  算法分析

    时间复杂度:在建好堆后,排序过程中的筛选次数不超过 O(nlog2n),而建堆时的比较次数不超过4n次,因此堆排序最坏情况下,时间复杂度也为O(nlog2n)。
    空间复杂度:堆排序中,只需要一个用来交换的暂存单元,因此它的空间复杂度为O(1)。
    算法的稳定性:由于记录的比较和交换是跳跃式进行的,因此,堆排序是一种不稳定的排序方法。


4.4 二路归并排序

  算法思想:归并排序的基本思想是基于将两个或两个以上的有序子序列 “归并” 为一个有序序列。

  步骤

    Step1: 设置两个子表的起始下标及辅助数组的起始下标:i=u;j=v;k=u;
    Step2: 若i>v 或 j>t,则比较选取结束转Step4;
    Step3: 选取r[i]和r[j]中关键码较小的存入辅助数组rf。如果 r[i].key<r[j].key,则rf[k]=r[i]; i++; k++;否则,rf[k]=r[j]; j++; k++。 转Step2;
    Step4: 将尚未处理完的子表中元素存入rf:
    Step5: 合并结束。

  递归算法操作步骤

    Step1: 将待排序的记录序列分为两个相等的子序列,分别将这两个子序列进行排序;
    Step2: 调用一次归并算法Merge,将这两个有序子序列合并成一个含有全部记录的有序序列。

  案例

  算法分析

    时间复杂度:归并过程对应由叶向根生成一棵二叉树的过程,所以归并趟数约等于二叉树的高度-1,即log2n,每趟归并需移动记录n次,故时间复杂度为O(nlog2n)。
    空间复杂度:需要一个与表等长的辅助元素数组空间,所以空间复杂度为O(n)。
    稳定性:由一次归并算法中的if语句可知,二路归并算法是一种稳定的算法。


5、基数排序

  基数排序是一种借助“多关键字排序”的思想来实现“单关键字排序”的内部排序算法

5.1 链式基数排序

  基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。

  案例

  算法分析

    时间效率:设待排序列为n个记录,d个关键码,关键码的取值范围为radix,则进行链式基数排序的时间复杂度为O(d(n+radix))
    空间效率:需要2*radix个指向队列的辅助空间,以及用于静态链表的n个指针。
    稳定性:在基数排序的过程中,并没有交换记录的前后位置,因此该排序方法是一种稳定的排序方法。


6、各种内部排序方法的比较

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/375185.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Benchmark测试——fio——源码分析

1. main 1.1 parse_options() 解析选项&#xff0c;更新数据结构 1.1.1 fio_init_options() 1.1.2 fio_test_cconv(&def_thread.o) <cconv.c> 1.1.2.1 convert_thread_options_to_cpu() 传递options给数据结构 1.1.3 parse_cmd_line() switch语句多路选择&am…

Vue3电商项目实战-商品详情模块8【23-商品详情-评价组件-图片预览、24-商品详情-评价组件-★分页组件】

文章目录23-商品详情-评价组件-图片预览24-商品详情-评价组件-★分页组件23-商品详情-评价组件-图片预览 目的&#xff1a;封装一个组件展示 图片列表 和 预览图片 功能。 大致步骤&#xff1a; 准备一个组件导入goods-comment.vue使用起来&#xff0c;传入图片数据展示图片列…

华为OD机试模拟题 用 C++ 实现 - 快递货车(2023.Q1)

最近更新的博客 【华为OD机试模拟题】用 C++ 实现 - 最多获得的短信条数(2023.Q1)) 文章目录 最近更新的博客使用说明快递货车题目输入输出示例一输入输出Code使用说明 参加华为od机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高。 华为 OD 清单…

逻辑地址和物理地址转换

在操作系统的学习中&#xff0c;很多抵挡都会涉及虚拟地址转换为物理地址的计算&#xff0c;本篇就简单介绍一下在分页存储管理、分段存储管理、磁盘存储管理中涉及的地址转换问题。 虚拟地址与物理地址 编程一般只有可能和逻辑地址打交道&#xff0c;比如在 C 语言中&#x…

常用逻辑运算符

逻辑符号表格 逻辑符号含义描述&按位与将数字转成二进制计算&#xff0c;两个位都为1时&#xff0c;结果才为1|或两个位都为0时&#xff0c;结果才为0 &#xff0c;反知任何一个为1结果为1^异或两个位相同为0&#xff0c;不同为1<<左移整体二进位全部左移若干位&…

《数据库系统概论》学习笔记——第五章:数据库完整性

教材为数据库系统概论第五版&#xff08;王珊&#xff09; 本章概念比较多&#xff0c;稍微记一下 数据库的完整性 数据库的完整性指的是数据的正确性和相容性 完整性&#xff1a;指数据是符合现实世界语义、反映当前实际状况的 相容性&#xff1a;数据库同一对象在不同关系表…

操作系统——7.进程的定义,组成,组成方式和特征

目录 1.概述 ​编辑2.定义 2.1单道程序 2.2多道程序 2.3进程定义 3.进程的组成 3.1进程的组成内容 3.2 PCB中的内容 4.进程的组织 4.1进程的两种组织方式 4.2链接方式 4.3索引方式 5.进程的特征 6.小结 这篇文章&#xff0c;我们主要来学习一下进程的定义&#xff0…

深度剖析Java集合之Properties

Properties 前面我们介绍了各种各样的Map ,今天我们介绍一个我们常用来保存程序运行配置参数的一个类,Properties 它的操作和Map 非常像,不一样的是它提供了和文件的交互操作,也就是说我们的配置可以保存到文件里或者是从文件里加载。 源代码 首先我们看一下这个类的继承…

[FI业务流程] - 未清项管理 (XOPVW, XLGCLR, X_UJ_CLR)

1 业务背景 未清项管理&#xff08;OIM: Open Item Management&#xff09;是SAP系统中针对资产负债表科目&#xff08;Balance Sheet Accounts&#xff09;的一个功能。 对于过账到未清项管理类型的科目下的凭证&#xff0c;首先会被标记为“未清项”也即open状态&#xff1b…

解密游戏推荐系统的建设之路

作者&#xff1a;vivo 互联网服务器团队- Ke Jiachen、Wei Ling 本文从零开始介绍了游戏推荐项目的发展历程&#xff0c;阐述了大型项目建设中遇到的业务与架构问题以及开发工程师们的解决方案&#xff0c;描绘了游戏推荐项目的特点以及业务发展方向&#xff0c;有着较好的参考…

内存保护_1:Tricore芯片MPU模块介绍

上一篇 | 返回主目录 | 下一篇 内存保护_1&#xff1a;Tricore芯片MPU模块介绍1 何为MPU2 MPU相关的硬件子系统2.1 基于地址范围保护逻辑说明2.1.1 地址范围寄存器2.1.2 读、写、执行权限寄存器2.1.3 保护集设置位2.1.4 内存保护功能使能位2.1.5 核的内存保护范围获取说明2.1.6…

【Proteus仿真】【STM32单片机】粮仓温湿度控制系统设计

文章目录一、功能简介二、软件设计三、实验现象联系作者一、功能简介 本项目使用Proteus8仿真STM32单片机控制器&#xff0c;使用声光报警模块、LCD1602显示模块、DHT11温湿度模块、继电器模块、加热加湿除湿风扇等。 主要功能&#xff1a; 系统运行后&#xff0c;LCD1602显示…

Atlassian Server用户新选择 | 数据中心产品是否适合您的企业(2)?

2024年2月&#xff0c;也就是一年不到&#xff0c;Atlassian将终止对Server产品及插件的所有支持。 此公告发布后&#xff0c;许多用户需要了解怎样的前进方向才是最适合企业的。为此&#xff0c;Atlassian提供了本地部署的数据中心&#xff08;Data Center&#xff09;版&…

如何基于MLServer构建Python机器学习服务

文章目录前言一、数据集二、训练 Scikit-learn 模型三、基于MLSever构建Scikit-learn服务四、测试模型五、训练 XGBoost 模型六、服务多个模型七、测试多个模型的准确性总结参考前言 在过去我们训练模型&#xff0c;往往通过编写flask代码或者容器化我们的模型并在docker中运行…

我要测网2022优秀检测机构评选活动举办,径硕科技分享数字营销趋势

2023年2月17号&#xff0c;由我要测网主办的「数字营销韧性增长&#xff5c;2023TIC营销人开年报告」圆满举办。来自南京市产品质量监督检验院、中国检科院测试评价中心、径硕科技JINGdigital等企业的3位“重量级”嘉宾进行了精彩纷呈的分享&#xff0c;为在低谷中前行的检测机…

svg和D3.js

一、svg绘制图形 像素图由一个个像素块组成&#xff0c;矢量图由多个数学公式绘制曲线组成&#xff0c;这样即使我们缩放&#xff0c;数学公式会重新计算&#xff0c;所以矢量图不会出现失真。 <!DOCTYPE html> <html lang"en"><head><meta ch…

日本知名动画公司东映动画加入 The Sandbox 元宇宙

与 Minto 合作将东映动画的 IP 呈现在元宇宙。 The Sandbox 很荣幸能与东映动画合作&#xff0c;与 Minto 携手在 The Sandbox 元宇宙中创建基于东映动画 IP 的相关体验。 作为日本动画的先驱&#xff0c;东映动画制作了日本最大和世界领先的动画作品&#xff0c;包括《龙珠》、…

Python实现贝叶斯优化器(Bayes_opt)优化LightGBM分类模型(LGBMClassifier算法)项目实战

说明&#xff1a;这是一个机器学习实战项目&#xff08;附带数据代码文档视频讲解&#xff09;&#xff0c;如需数据代码文档视频讲解可以直接到文章最后获取。1.项目背景贝叶斯优化器(BayesianOptimization) 是一种黑盒子优化器&#xff0c;用来寻找最优参数。贝叶斯优化器是基…

Spring Cloud融合Nacos实现服务的注册与发现 | Spring Cloud 4

一、前言 服务发现是微服务架构体系中最关键的组件之一。如果尝试着用手动的方式来给每一个客户端来配置所有服务提供者的服务列表是一件非常困难的事&#xff0c;而且也不利于服务的动态扩缩容。 Spring Cloud Alibaba Nacos Discovery通过自动配置以及其他Spring 编程模型的…

独立产品灵感周刊 DecoHack #049 - 开发者如何学习UI设计

本周刊记录有趣好玩的独立产品设计开发相关内容&#xff0c;每周发布&#xff0c;往期内容同样精彩&#xff0c;感兴趣的伙伴可以点击订阅我的周刊。为保证每期都能收到&#xff0c;建议邮件订阅。欢迎通过 Twitter 私信推荐或投稿。&#x1f4bb; 产品推荐 1. method.ac 这个…