【数据结构(六)】排序算法介绍和算法的复杂度计算(1)

news2024/9/24 21:20:52

文章目录

  • 1. 排序算法的介绍
    • 1.1. 排序的分类
  • 2. 算法的时间复杂度
    • 2.1. 度量一个程序(算法)执行时间的两种方法
    • 2.2. 时间频度
      • 2.2.1. 忽略常数项
      • 2.2.2. 忽略低次项
      • 2.2.2. 忽略系数
    • 2.3. 时间复杂度
    • 2.4. 常见的时间复杂度
    • 2.5. 平均时间复杂度和最坏时间复杂度
  • 3. 算法的空间复杂度


1. 排序算法的介绍

排序也称排序算法(Sort Algorithm),排序是将一组数据,依指定的顺序进行排列的过程。

1.1. 排序的分类

  1. 内部排序:
    指将需要处理的所有数据都加载到**内部存储器(内存)**中进行排序。
  2. 外部排序法:
    数据量过大,无法全部加载到内存中,需要借助**外部存储(文件等)**进行排序。

常见的排序算法分类(见下图):

在这里插入图片描述

2. 算法的时间复杂度

2.1. 度量一个程序(算法)执行时间的两种方法

  1. 事后统计的方法
    这种方法可行, 但是有两个问题:
    一是要想对设计的算法的运行性能进行评测,需要实际运行该程序;
    二是所得时间的统计量依赖于计算机的硬件、软件等环境因素, 这种方式,要在同一台计算机的相同状态下运行,才能比较那个算法速度更快。

  2. 事前估算的方法
    通过分析某个算法的时间复杂度来判断哪个算法更优。

2.2. 时间频度

基本介绍:

时间频度:一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为 T ( n ) T(n) T(n)

举例说明-基本案例

比如计算 1-100 所有数字之和, 可设计两种算法:
在这里插入图片描述

2.2.1. 忽略常数项

在这里插入图片描述

结论:
2 n + 20 2n+20 2n+20 2 n 2n 2n 随着 n n n 变大,执行曲线无限接近, 20 20 20 可以忽略
3 n + 10 3n+10 3n+10 3 n 3n 3n 随着 n n n 变大,执行曲线无限接近, 10 10 10 可以忽略

2.2.2. 忽略低次项

在这里插入图片描述

结论:
2 n 2 + 3 n + 10 2n^2+3n+10 2n2+3n+10 2 n 2 2n^2 2n2 ,随着 n n n 变大, 执行曲线无限接近, 可以忽略 3 n + 10 3n+10 3n+10
n 2 + 5 n + 20 n^2+5n+20 n2+5n+20 n 2 n^2 n2 ,随着 n n n 变大,执行曲线无限接近, 可以忽略 5 n + 20 5n+20 5n+20

2.2.2. 忽略系数

在这里插入图片描述

结论:
① 随着 n n n 值变大, 5 n 2 + 7 n 5n^2+7n 5n2+7n 3 n 2 + 2 n 3n^2 + 2n 3n2+2n ,执行曲线重合, 说明 这种情况下, 5 5 5 3 3 3 可以忽略。
② 而 n 3 + 5 n n^3+5n n3+5n 6 n 3 + 4 n 6n^3+4n 6n3+4n ,执行曲线分离,说明多少次方是关键

2.3. 时间复杂度

    一般情况下,算法中的基本操作语句的重复执行次数是问题规模 n n n 的某个函数,用 T ( n ) T(n) T(n)表示,若有某个辅助函数 f ( n ) f(n) f(n),使得当 n n n 趋近于无穷大时, T ( n ) f ( n ) \frac {T(n)}{f(n)} f(n)T(n) 的极限值为不等于零的常数,则称 f ( n ) f(n) f(n) T ( n ) T(n) T(n)的同数量级函数。记作 T ( n ) = O ( f ( n ) ) \pmb{T(n)=O( f(n) )} T(n)=(f(n)),称 O ( f ( n ) ) O( f(n) ) (f(n)) 为算法的渐进时间复杂度,简称时间复杂度
    
     T ( n ) T(n) T(n) 不同,但时间复杂度可能相同。 如: T ( n ) = n 2 + 7 n + 6 T(n)=n^2+7n+6 T(n)=n2+7n+6 T ( n ) = 3 n 2 + 2 n + 2 T(n)=3n^2+2n+2 T(n)=3n2+2n+2 它们的 T ( n ) T(n) T(n) 不同,但时间复杂度相同,都为 O ( n 2 ) \pmb{O(n²)} O(n2)

    

计算时间复杂度的方法:
(以 T ( n ) = n 2 + 7 n + 6 T(n)=n^2+7n+6 T(n)=n2+7n+6 为例)
①用常数 1 1 1 代替运行时间中的所有加法常数。

T ( n ) = n 2 + 7 n + 6 T(n)=n^2+7n+6 T(n)=n2+7n+6 --> T ( n ) = n 2 + 7 n + 1 T(n)=n^2+7n+1 T(n)=n2+7n+1

②修改后的运行次数函数中,只保留最高阶项。

T ( n ) = n 2 + 7 n + 1 T(n)=n^2+7n+1 T(n)=n2+7n+1 --> T ( n ) = n 2 T(n) = n^2 T(n)=n2

③去除最高阶项的系数。

T ( n ) = n 2 T(n) = n^2 T(n)=n2 --> T ( n ) = n 2 T(n) = n^2 T(n)=n2 --> O ( n 2 ) O(n^2) O(n2)

2.4. 常见的时间复杂度

  1. 常数阶 O ( 1 ) O(1) O(1)
  2. 对数阶 O ( l o g 2 n ) O(log_2n) O(log2n)(其中, l o g log log以2为底,也可以是以3、4、5……为底)
  3. 线性阶 O ( n ) O(n) O(n)
  4. 线性对数阶 O ( n l o g 2 n ) O(nlog_2n) O(nlog2n)(其中, l o g log log以2为底,也可以是以3、4、5……为底)
  5. 平方阶 O ( n 2 ) O(n^2) O(n2)
  6. 立方阶 O ( n 3 ) O(n^3) O(n3)
  7. k 次方阶 O ( n k ) O(n^k) O(nk)
  8. 指数阶 O ( 2 n ) O(2^n) O(2n)

常见的时间复杂度对应的图:

在这里插入图片描述

说明:

  1. 常见的算法时间复杂度由小到大依次为: O ( 1 ) Ο(1) O(1) O ( l o g 2 n ) Ο(log_2n) O(log2n) O ( n ) Ο(n) O(n) O ( n l o g 2 n Ο(nlog_2n O(nlog2n)< O ( n 2 ) Ο(n^2) O(n2) O ( n 3 ) Ο(n^3) O(n3) O ( n k ) Ο(n^k) O(nk) O ( 2 n ) Ο(2^n) O(2n) ,随着问题规模 n 的不断增大,上述时间复杂度不断增大,算法的执行效率越低。
  2. 从图中可见,我们应该尽可能避免使用指数阶的算法。

① 常数阶 O ( 1 ) O(1) O(1)

无论代码执行了多少行,只要是没有循环等复杂结构,那这个代码的时间复杂度就都是 O ( 1 ) O(1) O(1)

int i = 1;
int j =2;
++i;
j++;
int m = i + j;

    上述代码在执行的时候,它消耗的时候并不随着某个变量的增长而增长,那么无论这类代码有多长,即使有几万几十万行,都可以用O(1)来表示它的时间复杂度。


② 对数阶 O ( l o g 2 n ) O(log_2n) O(log2n)

int i =1;
while(i < n){
	i= i * 2;
}

说明:
    在while循环里面,每次都将 i i i 乘以 2 2 2,乘完之后, i i i 距离 n n n 就越来越近了。假设循环 x x x 次之后, i i i 就大于 n n n 了,此时这个循环就退出了,也就是说 2 2 2 x x x 次方等于 n n n,那么 x = l o g 2 n x=log_2n x=log2n也就是说当循环 l o g 2 n log_2n log2n 次以后,这个代码就结束了。因此这个代码的时间复杂度为: O ( l o g 2 n ) O(log_2n) O(log2n)
     O ( l o g 2 n ) O(log_2n) O(log2n) 中的2是根据代码变化的,若 i = i ∗ 3 i = i * 3 i=i3 ,则是 O ( l o g 3 n ) O(log_3n) O(log3n)

    如果 N = a x ( a > 0 , a ≠ 1 ) N= a^x(a > 0,a ≠1) N=ax(a>0,a=1),即 a a a x x x 次方等于 N ( a > 0 , a ≠ 1 ) N(a>0,a≠1) N(a>0,a=1),那么数 x x x 叫做以 a a a 为底 N N N 的对数 ( l o g a r i t h m ) (logarithm) (logarithm),记作 x = l o g a N x = log_aN x=logaN 。其中, a a a 叫做对数的底数 N N N 叫做真数 x x x 叫做 “以 a a a 为底 N N N对数” 。


③ 线性阶 O ( n ) O(n) O(n)

for(i = 1; i <= n; ++i){
	j = i;
	j++;
}

说明:
    这段代码,for循环 里面的代码会执行 n n n 遍,因此它消耗的时间是随着 n n n 的变化而变化的,因此这类代码都可以用 O ( n ) O(n) O(n) 来表示它的时间复杂度。 T ( n ) = n + 1 T(n)=n+1 T(n)=n+1 --> O ( n ) O(n) O(n)


④ 线性对数阶 O ( n l o g 2 n ) O(nlog_2n) O(nlog2n)

for(m = 1; m < n; m++){
	i = 1;
	while(i < n){
		i = i * 2;
	}
}

说明:
    线性对数阶 O ( n l o g 2 N ) O(nlog_2N) O(nlog2N) 其实非常容易理解,将时间复杂度为 O ( l o g 2 n ) O(log_2n) O(log2n) 的代码循环 N N N 遍的话,那么它的时间复杂度就是 n ∗ O ( l o g 2 N ) n * O(log_2N) nO(log2N),也就是了 O ( n l o g 2 N ) O(nlog_2N) O(nlog2N)


⑤ 平方阶 O ( n 2 ) O(n^2) O(n2)

for(x = 1; x <= n; x++){
	for(i = 1; i <= n; i++){
		j = i;
		j++;
	}
}

说明:
    平方阶 O ( n 2 ) O(n²) O(n2) 就更容易理解了,如果把 O ( n ) O(n) O(n) 的代码再嵌套循环一遍,它的时间复杂度就是 O ( n 2 ) O(n²) O(n2),这段代码其实就是嵌套了2层 n n n 循环,它的时间复杂度就是 O ( n ∗ n ) O(n*n) O(nn),即 O ( n 2 ) O(n²) O(n2) 如果将其中一层循环的 n n n 改成 m m m ,那它的时间复杂度就变成了 O ( m ∗ n ) O(m*n) O(mn)


⑥ 立方阶 O ( n 3 ) O(n^3) O(n3) ⑦ k 次方阶 O ( n k ) O(n^k) O(nk)

说明: 参考上面的 O ( n 2 ) O(n²) O(n2) 去理解就好了, O ( n 3 ) O(n³) O(n3) 相当于3层 n n n 循环,其它的类似。

2.5. 平均时间复杂度和最坏时间复杂度

    平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,该算法的运行时间。
    最坏情况下的时间复杂度称最坏时间复杂度一般讨论的时间复杂度均是最坏情况下的时间复杂度。这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限,这就保证了算法的运行时间不会比最坏情况更长。

平均时间复杂度和最坏时间复杂度是否一致,和算法有关(如下图所示)。

排序法平均时间最差情况稳定度额外空间备注
冒泡 O ( n 2 ) O(n^2) O(n2) O ( n 2 ) O(n^2) O(n2)稳定 O ( 1 ) O(1) O(1) n n n小的情况较好
交换 O ( n 2 ) O(n^2) O(n2) O ( n 2 ) O(n^2) O(n2)不稳定 O ( 1 ) O(1) O(1) n n n小的情况较好
选择 O ( n 2 ) O(n^2) O(n2) O ( n 2 ) O(n^2) O(n2)不稳定 O ( 1 ) O(1) O(1) n n n小的情况较好
插入 O ( n 2 ) O(n^2) O(n2) O ( n 2 ) O(n^2) O(n2)稳定 O ( 1 ) O(1) O(1)大部分已排序时较好
基数 O ( l o g R B ) O(log_RB) O(logRB) O ( l o g R B ) O(log_RB) O(logRB)稳定 O ( n ) O(n) O(n)B是真数(0~9)
R是基数(个十百)
Shell O ( n l o g n ) O(nlogn) O(nlogn) O ( n s ) , 1 < s < 2 O(n^s) ,1<s<2 O(ns),1<s<2不稳定 O ( 1 ) O(1) O(1)s是所选分组
快速 O ( n l o g n ) O(nlogn) O(nlogn) O ( n 2 ) O(n^2) O(n2)不稳定 O ( n l o g n ) O(nlogn) O(nlogn) n n n大的情况较好
归并 O ( n l o g n ) O(nlogn) O(nlogn) O ( n l o g n ) O(nlogn) O(nlogn)稳定 O ( 1 ) O(1) O(1) n n n大的情况较好
O ( n l o g n ) O(nlogn) O(nlogn) O ( n l o g n ) O(nlogn) O(nlogn)不稳定 O ( 1 ) O(1) O(1) n n n大的情况较好

3. 算法的空间复杂度

    类似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)定义为该算法所耗费的存储空间,它也是问题规模 n n n 的函数。
    空间复杂度是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用的临时工作单元数与解决问题的规模 n n n 有关,它随着 n n n 的增大而增大,当 n n n 较大时,将占用较多的存储单元,例如快速排序、归并排序、 基数排序就属于这种情况。

    在做算法分析时,主要讨论的是时间复杂度。从用户使用体验上看,更看重的程序执行的速度。一些缓存产品(redis, memcache)和算法(基数排序)本质就是用空间换时间

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1285128.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

编码器-解码器(seq-seq)

1. 背景 encoder-decoder和seq-seq模型可以解决输入与输出都是不定长序列的问题。它们都用到了两个循环NN&#xff0c;分别叫做编码器(用来分析输入序列)与解码器(用来生成输出序列)。 2. 编码器 把一个不定长的输入序列变换成一个定长的背景变量c&#xff0c;并在其中编码输入…

分享72个节日PPT,总有一款适合您

分享72个节日PPT&#xff0c;总有一款适合您 72个节日PPT下载链接&#xff1a;https://pan.baidu.com/s/17Lmlvd_xN-xRSKu3FZUS9w?pwd6666 提取码&#xff1a;6666 Python采集代码下载链接&#xff1a;采集代码.zip - 蓝奏云 学习知识费力气&#xff0c;收集整理更不易…

驱动开发--内核添加新功能

Ubuntu下这个文件为开发板ls命令的结果 内核的内容&#xff1a; mm&#xff1a;内存管理 fs&#xff1a;文件系统 net&#xff1a;网络协议栈 drivers&#xff1a;驱动设备 arch与init&#xff1a;跟启动相关 kernel与ipc&#xff1a;任务&#xff0c;进程相关 向内核增…

java项目日常运维需要的文档资料

一、前言 java项目开发完成&#xff0c;部署上线&#xff0c;进入项目运维阶段&#xff0c;日常工作需要准备哪些资料和文档?当项目上线后&#xff0c;运行一段时间&#xff0c;或多或少会遇到一些运维上的问题&#xff0c;比如服务器磁盘饱满&#xff0c;服务器CPU&#xff0…

分享 | 顶刊高质量论文插图配色(含RGB值及16进制HEX码)(第一期)

我在很早之前出过一期高质量论文绘图配色&#xff0c;但当时觉得搜集太麻烦于是就没继续做&#xff0c;后来用MATLAB爬了上万张顶刊绘图&#xff0c;于是又想起来做这么一个系列&#xff0c;拿了一个多小时写了个提取论文图片颜色并得出RGB值和16进制码并标注在原图的代码&…

GPTs每日推荐--生化危机【典藏版】

今天给大家推荐一个游戏性质的GPTs&#xff0c;叫做生化危机典藏版&#xff0c;国内点击可玩。 开篇&#xff1a;玩家从末日中醒来。 选择&#xff1a;玩家会遇到各种资源、任务、剧情&#xff0c;需要自行选择相关的分支剧情&#xff0c;一旦选错&#xff0c;无法重选。 结局…

一次北斗接收机调试总结

作者&#xff1a;朱金灿 来源&#xff1a;clever101的专栏 为什么大多数人学不会人工智能编程&#xff1f;>>> 最近项目中要用到北斗接收机&#xff0c;它的样子是长这样的&#xff1a; 这部机器里面是没有操作系统的&#xff0c;由单片机控制。最近我们要根据协议…

Linux socket编程(10):UDP详解、聊天室实现及进阶知识

首先来回顾以下TCP的知识&#xff0c;TCP是一种面向连接的、可靠的传输协议&#xff0c;具有以下特点&#xff1a; TCP通过三次握手建立连接&#xff0c;确保通信的可靠性和完整性使用流控制和拥塞控制机制&#xff0c;有效地调整数据传输的速率&#xff0c;防止网络拥塞TCP提…

使用 PyTorch 进行 K 折交叉验证

一、说明 中号机器学习模型在训练后必须使用测试集进行评估。我们这样做是为了确保模型不会过度拟合&#xff0c;并确保它们适用于现实生活中的数据集&#xff0c;与训练集相比&#xff0c;现实数据集的分布可能略有偏差。 但为了使您的模型真正稳健&#xff0c;仅仅通过训练/测…

OneNote for Windows10 彻底删除笔记本

找了超多方法&#xff0c;都没有用&#xff0c;我的OneNote都没有文件选项&#xff0c;要在OneDrive中删除&#xff0c;但是一直登不进&#xff0c;然后又找到一个方法&#xff1a; 在网页中打开Office的控制面板 "Sign in to your Microsoft account" 在“最近”一…

k8s volumes and data

Overview 传统上&#xff0c;容器引擎(Container Engine)不提供比容器寿命更长的存储。由于容器被认为是瞬态(transient)的&#xff0c;这可能会导致数据丢失或复杂的外部存储选项。Kubernetes卷共享 Pod 生命周期&#xff0c;而不是其中的容器。如果容器终止&#xff0c;数据…

ctfhub技能树_web_信息泄露

目录 二、信息泄露 2.1、目录遍历 2.2、Phpinfo 2.3、备份文件下载 2.3.1、网站源码 2.3.2、bak文件 2.3.3、vim缓存 2.3.4、.DS_Store 2.4、Git泄露 2.4.1、log 2.4.2、stash 2.4.3、index 2.5、SVN泄露 2.6、HG泄露 二、信息泄露 2.1、目录遍历 注&#xff1…

POI Excel导入导出(下)

作者简介&#xff1a;大家好&#xff0c;我是smart哥&#xff0c;前中兴通讯、美团架构师&#xff0c;现某互联网公司CTO 联系qq&#xff1a;184480602&#xff0c;加我进群&#xff0c;大家一起学习&#xff0c;一起进步&#xff0c;一起对抗互联网寒冬 上一篇通过四个简单的小…

力扣刷题day1(两数相加,回文数,罗马数转整数)

题目1&#xff1a;1.两数之和 思路1和解析&#xff1a; //1.暴力枚举解法(历遍两次数组&#xff0c;时间复杂度O&#xff08;N^2)&#xff0c;空间复杂度O&#xff08;1&#xff09; int* twoSum(int* nums, int numsSize, int target, int* returnSize) {for (int i 0; i &…

短波红外相机的原理及应用场景

短波红外 (简称SWIR&#xff0c;通常指0.9~1.7μm波长的光线) 是一种比可见光波长更长的光。这些光不能通过“肉眼”看到&#xff0c;也不能用“普通相机”检测到。由于被检测物体的材料特性&#xff0c;一些在可见光下无法看到的特性&#xff0c;却能在近红外光下呈现出来&…

使用Python Flask搭建Web问答应用程序并发布到公网远程访问

使用Python Flask搭建web问答应用程序框架&#xff0c;并发布到公网上访问 文章目录 使用Python Flask搭建web问答应用程序框架&#xff0c;并发布到公网上访问前言1. 安装部署Flask并制作SayHello问答界面2. 安装Cpolar内网穿透3. 配置Flask的问答界面公网访问地址4. 公网远程…

AI Agent 结构与分类

一、什么是AI agent 在人工智能中&#xff0c;智能代理AI Agent是以智能方式行事的代理&#xff1b;它感知环境&#xff0c;自主采取行动以实现目标&#xff0c;并可以通过学习或获取知识来提高其性能。人其实就是一种复杂代理。 为了理解智能代理的结构&#xff0c;我们应该熟…

go写文件后出现大量NUL字符问题记录

目录 背景 看看修改前 修改后 原因 背景 写文件完成后发现&#xff1a; size明显也和正常的不相等。 看看修改前 buf : make([]byte, 64) buffer : bytes.NewBuffer(buf)// ...其它逻辑使得buffer有值// 打开即将要写入的文件&#xff0c;不存在则创建 f, err : os.Open…

Ruby和HTTParty库下载代码示例

ruby require httparty require nokogiri # 设置服务器 proxy_host "" proxy_port "" # 定义URL url "" # 创建HTTParty对象&#xff0c;并设置服务器 httparty HTTParty.new( :proxy > "#{proxy_host}:#{proxy_port}" ) …

不止有console.log()可以打印日志

1.带错误的打印 //1.醒目的打印 2.方便筛选器筛选 console.log("正常打印") console.warn("警告打印") console.error("错误打印") console.info("信息打印") console.log("%c带样式的打印", "color: red; font-size…