数据结构与算法1:引入概念

news2024/12/23 9:17:31

接下来系统的学一下数据结构与算法的知识,本章节是第一部分:数据结构与算法的进入与基本概述

第一章:引入概念

【铁打的算法demo】先来看到题:

如果 a + b + c = 1000,且 a2 + b2 = c2(a, b , c 为⾃然数),如何求出所有 a、b、c 可能的组合?

方法一:直接干

思路:既然 a + b + c = 1000,说明 a、b、c 都在 0 ~ 1000 之内(不考虑负数),则可以用 for 循环 + if 直接写代码

# 导入time,用来计时运行程序所耗时间
import time

start = time.time()

for a in range(1000):
    for b in range(1000):
        for c in range(1000):
            if a ** 2 + b ** 2 == c ** 2 and a + b + c == 1000:
                print('a, b, c:%d, %d, %d' % (a, b, c))

end = time.time()
print('耗时:%fs.'.format(end - start))

运行结果:

a, b, c:0, 500, 500
a, b, c:200, 375, 425
a, b, c:375, 200, 425
a, b, c:500, 0, 500
耗时:251.520628s.

方法二:想想如何优化代码

优化一:优化 b 的 for 循环 for b in range(1000 - a)

  • a b 都在 0 ~ 1000 之内,a 循环范围是 0 ~ 1000,则循环 b 时可在此基础上用 1000 - a 即可,没必要再从 0 到 1000 循环一遍,因为 a b c 三者之和才只有 1000,如果 a = 500,循环到 b >= 500 时,会在后面判断 a ** 2 + b ** 2 == c ** 2 时被过滤掉(从结果看 c 也不能是 0,不符合逻辑),从而造成多余的没必要的循环,白白浪费资源,还拉长运行时间

优化二:优化 c 去掉for循环,改为 1000 - a - b

  • 一共三个数,在循环两个数后,第三个数就是 1000 减掉前两个数,相比于再 for 循环一遍,使用它们共同的和减掉前两个数得到第三个数的方式更简单,且是由 1000 的量级直接降到一个简单的减法了,还省去了后续的一个 if 判断

优化后的代码:

import time

start = time.time()

for a in range(1000):
    for b in range(1000):
        c = 1000 - a - b
        if a ** 2 + b ** 2 == c ** 2:
            print('a, b, c:%d, %d, %d' % (a, b, c))

end = time.time()

print('耗时:%fs.' % (end - start))

运行结果:

a, b, c:0, 500, 500
a, b, c:200, 375, 425
a, b, c:375, 200, 425
a, b, c:500, 0, 500
耗时:0.510947s

发现执行时间明显缩短了!

1. 算法的概念

算法是计算机处理信息的本质,因为计算机程序本质上是⼀个算法来告诉计 算机确切的步骤来执⾏⼀个指定的任务。⼀般地,当算法在处理信息时,会 从输⼊设备或数据的存储地址读取数据,把结果写⼊输出设备或某个存储地 址供以后再调⽤。 算法是独⽴存在的⼀种解决问题的⽅法和思想。 对于算法⽽⾔,实现的语⾔并不重要,重要的是思想。 算法可以有不同的语⾔描述实现版本(如C描述、C++描述、Python描述 等),我们现在是在⽤ Python 语⾔进⾏描述实现。

2. 算法的五⼤特性

  1. 输⼊: 算法具有 0 个或多个输⼊
  2. 输出: 算法⾄少有 1 个或多个输出
  3. 有穷性: 算法在有限的步骤之后会⾃动结束⽽不会⽆限循环,并且每⼀个步骤可以在可接受的时间内完成
  4. 确定性:算法中的每⼀步都有确定的含义,不会出现⼆义性
  5. 可⾏性:算法的每⼀步都是可⾏的,也就是说每⼀步都能够执⾏有限的次数完成

3. 算法效率衡量

1. 执⾏时间反应算法效率

对于同⼀问题,我们给出了两种解决算法,在两种算法的实现中,我们对程 序执⾏的时间进⾏了测算,发现两段程序执⾏的时间相差悬殊,由此我们可以得出结论:实现算法程序的执⾏时间可以反映出算法的效率,即算法的优劣。

2. 单靠时间值绝对可信吗?

假设我们将第⼆次尝试的算法程序运⾏在⼀台配置古⽼性能低下的计算机 中,情况会如何?很可能运⾏的时间并不会⽐在我们的电脑中运⾏算法⼀的 214.583347秒快多少。
单纯依靠运⾏的时间来⽐较算法的优劣并不⼀定是客观准确的!
程序的运⾏离不开计算机环境(包括硬件和操作系统),这些客观原因会影 响程序运⾏的速度并反应在程序的执⾏时间上。那么如何才能客观的评判⼀ 个算法的优劣呢?

3. 时间复杂度与 “⼤O记法”

我们假定计算机执⾏算法每⼀个基本操作的时间是固定的⼀个时间单位,那 么有多少个基本操作就代表会花费多少时间单位。显然对于不同的机器环境 ⽽⾔,确切的单位时间是不同的,但是对于算法进⾏多少个基本操作(即花 费多少时间单位)在规模数量级上却是相同的,由此可以忽略机器环境的影 响⽽客观的反应算法的时间效率。 对于算法的时间效率,我们可以⽤ “⼤O记法” 来表示。

“⼤O记法”:对于单调的整数函数 f,如果存在⼀个整数函数 g 和实常数 c>0, 使得对于充分⼤的 n 总有 f(n)<=c*g(n) ,就说函数 g 是 f 的⼀个渐近函数(忽略常数),记为 f(n)=O(g(n))。也就是说,在趋向⽆穷的极限意义下,函数 f 的增⻓速度受到函数 g 的约束,亦即函数 f 与函数 g 的特征相似。

时间复杂度:假设存在函数 g,使得算法 A 处理规模为 n 的问题示例所⽤时间为 T(n)=O(g(n)),则称 O(g(n)) 为算法 A 的渐近时间复杂度,简称时间复杂度,记为T(n)

4. 如何理解“⼤O记法”

对于算法进⾏特别具体的细致分析虽然很好,但在实践中的实际价值有限。 对于算法的时间性质和空间性质,最重要的是其数量级和趋势,这些是分析算法效率的主要部分。⽽计量算法基本操作数量的规模函数中那些常量因⼦可以忽略不计。例如,可以认为 3n2 和 100n2 属于同⼀个量级,如果两个算法处理同样规模实例的代价分别为这两个函数,就认为它们的效率 “差不多”, 都为 n2 级。

5. 最坏时间复杂度

分析算法时,存在⼏种可能的考虑:

  • 算法完成⼯作最少需要多少基本操作,即最优时间复杂度
  • 算法完成⼯作最多需要多少基本操作,即最坏时间复杂度
  • 算法完成⼯作平均需要多少基本操作,即平均时间复杂度

分析:

  • 对于最优时间复杂度,其价值不⼤,因为它没有提供什么有⽤信息,其反映的只是最乐观最理想的情况,没有参考价值;
  • 对于最坏时间复杂度,提供了⼀种保证,表明算法在此种程度的基本操作中 ⼀定能完成⼯作;
  • 对于平均时间复杂度,是对算法的⼀个全⾯评价,因此它完整全⾯的反映了这个算法的性质。但另⼀⽅⾯,这种衡量并没有保证,不是每个计算都能在这个基本操作内完成。⽽且,对于平均情况的计算,也会因为应⽤算法的实例分布可能并不均匀⽽难以计算。

因此,我们主要关注算法的最坏情况,亦即最坏时间复杂度

6. 时间复杂度的⼏条基本计算规则

  1. 基本操作,即只有常数项,认为其时间复杂度为 O(1)
  2. 顺序结构,时间复杂度按加法进⾏计算
  3. 循环结构,时间复杂度按乘法进⾏计算
  4. 分⽀结构,时间复杂度取最⼤值
  5. 判断⼀个算法的效率时,往往只需要关注操作数量的最⾼次项,其它次要项和常数项可以忽略
  6. 在没有特殊说明时,我们所分析的算法的时间复杂度都是指最坏时间复杂度

7. 空间复杂度

类似于时间复杂度的讨论,⼀个算法的空间复杂度S(n)定义为该算法所耗费 的存储空间,它也是问题规模n的函数。
渐近空间复杂度也常常简称为空间复杂度。
空间复杂度(SpaceComplexity) 是对⼀个算法在运⾏过程中临时占⽤存储空间⼤⼩的量度。
算法的时间复杂度和空间复杂度合称为算法的复杂度。

4. 算法分析

第⼀次尝试的算法核⼼部分

for a in range(0, 1001):
	for b in range(0, 1001):
		for c in range(0, 1001):
			if a**2 + b**2 == c**2 and a+b+c == 1000:
				print("a, b, c: %d, %d, %d" % (a, b, c))

时间复杂度:T(n) = O(n*n*n) = O(n3)

第⼆次尝试的算法核⼼部分

for a in range(0, 1001):
	for b in range(0, 1001 - a):
		c = 1000 - a - b if a**2 + b**2 == c**2:
			print("a, b, c: %d, %d, %d" % (a, b, c))

时间复杂度: T(n) = O(n*n*(1+1)) = O(n*n) = O(n2)

由此可⻅,我们尝试的第⼆种算法要⽐第⼀种算法的时间复杂度好多的。

5. 常⻅时间复杂度

执⾏次数函数举例⾮正式术语
12O(1)常数阶
2n+3O(n)线性阶
3n2+2n+1O(n2)平⽅阶
5log2n+20O(logn)对数阶
2n+3nlog2n+19O(nlogn)nlogn阶
6n3+2n2+3n+4O(n3)⽴⽅阶
2nO(2n)指数阶

注意,经常将 log2n(以 2 为底的对数)简写成 logn

常⻅时间复杂度之间的关系为:

在这里插入图片描述
所消耗的时间从⼩到⼤:

O(1) < O(logn) < O(n) < O(nlogn) < O(n2) < O(n3) < O(2n) < O(n!) < O(nn)

6. Python内置类型性能分析

1. timeit 模块

timeit 模块可以⽤来测试⼀⼩段 Python 代码的执⾏速度

class timeit.Timer(stmt=‘pass’, setup=‘pass’, timer=<timer function>)

参数说明:

  • Timer 是测量⼩段代码执⾏速度的类
  • stmt 参数是要测试的代码语句(statment)
  • setup 参数是运⾏代码时需要的设置
  • timer 参数是⼀个定时器函数,与平台有关

timeit.Timer.timeit(number=1000000)

  • Timer 类中测试语句执⾏速度的对象⽅法。number 参数是测试代码时的测试次数,默认为 1000000 次。⽅法返回执⾏代码的平均耗时,⼀个 float 类型的秒数

2. list 的操作测试

1. 添加元素的四种方式效率比较
from timeit import Timer

def t1():
    l = []
    for i in range(1000):
        l = l + [i]

def t2():
    l = []
    for i in range(1000):
        l.append(i)

def t3():
    l = [i for i in range(1000)]

def t4():
    l = list(range(1000))

timer1 = Timer("t1()", "from __main__ import t1")
print("concat", timer1.timeit(number=1000), "s")
timer2 = Timer("t2()", "from __main__ import t2")
print("append", timer2.timeit(number=1000), "s")
timer3 = Timer("t3()", "from __main__ import t3")
print("comprehension", timer3.timeit(number=1000), "s")
timer4 = Timer("t4()", "from __main__ import t4")
print("list_range", timer4.timeit(number=1000), "s")

'''
concat 1.0436126479980885 s
append 0.08462878499994986 s
comprehension 0.03660322499490576 s
list_range 0.014424725006392691 s
'''
2. 删除元素的两种方式效率比较
  • 从结果可以看出,pop 最后⼀个元素的效率远远⾼于 pop 第⼀个元素
x = list(range(2000000))
pop_zero = Timer("x.pop(0)", "from __main__ import x")
print("pop_zero", pop_zero.timeit(number=1000), "s")
y = list(range(2000000))
pop_end = Timer("y.pop()", "from __main__ import y")
print("pop_end", pop_end.timeit(number=1000), "s")

'''
pop_zero 0.9256400320009561 s
pop_end 9.138700261246413e-05 s
'''

3. list 内置操作的时间复杂度

在这里插入图片描述

4. dict 内置操作的时间复杂度

在这里插入图片描述

7. 数据结构

我们如何⽤Python中的类型来保存⼀个班的学⽣信息? 如果想要快速的通过学⽣姓名获取其信息呢?

实际上当我们在思考这个问题的时候,我们已经⽤到了数据结构。列表和字 典都可以存储⼀个班的学⽣信息,但是想要在列表中获取⼀名同学的信息时,就要遍历这个列表,其时间复杂度为 O(n),⽽使⽤字典存储时,可将学⽣姓名作为字典的键,学⽣信息作为值,进⽽查询时不需要遍历便可快速获取到学⽣信息,其时间复杂度为 O(1)。

我们为了解决问题,需要将数据保存下来,然后根据数据的存储⽅式来设计 算法实现进⾏处理,那么数据的存储⽅式不同就会导致需要不同的算法进⾏处理。我们希望算法解决问题的效率越快越好,于是我们就需要考虑数据究竟如何保存的问题,这就是数据结构。

在上⾯的问题中我们可以选择 Python 中的列表或字典来存储学⽣信息。列表和字典就是 Python 内建帮我们封装好的两种数据结构。

1. 概念

数据是⼀个抽象的概念,将其进⾏分类后得到程序设计语⾔中的基本类型。 如:int,float,char 等。数据元素之间不是独⽴的,存在特定的关系,这些关系便是结构。

数据结构指数据对象中数据元素之间的关系。 Python 给我们提供了很多现成的数据结构类型,这些系统⾃⼰定义好的,不需要我们⾃⼰去定义的数据结构叫做 Python 的内置数据结构,⽐如列表、元 组、字典。⽽有些数据组织⽅式,Python 系统⾥⾯没有直接定义,需要我们⾃⼰去定义实现这些数据的组织⽅式,这些数据组织⽅式称之为 Python 的扩展数据结构,⽐如栈,队列等。

2. 算法与数据结构的区别

数据结构只是静态的描述了数据元素之间的关系。
⾼效的程序需要在数据结构的基础上设计和选择算法。

程序 = 数据结构 + 算法
总结:算法是为了解决实际问题⽽设计的,数据结构是算法需要处理的问题载体

3. 抽象数据类型(Abstract Data Type)

抽象数据类型(ADT) 的含义是指⼀个数学模型以及定义在此数学模型上的⼀ 组操作。即把数据类型和数据类型上的运算捆在⼀起,进⾏封装。引⼊抽象 数据类型的⽬的是把数据类型的表示和数据类型上运算的实现与这些数据类 型和运算在程序中的引⽤隔开,使它们相互独⽴。

最常⽤的数据运算有五种:

  • 插⼊
  • 删除
  • 修改
  • 查找
  • 排序

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/504956.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

快进来,带你了解FPGA基础知识---lattice莱迪斯深力科MachXO2 FPGA系列简介

FPGA基础知识---lattice莱迪斯深力科MachXO2 LCMXO2-4000HC-4TG144I FPGA简介 FPGA基础知识&#xff1a;FPGA是英文Field&#xff0d;Programmable Gate Array的缩写&#xff0c;即现场可编程门阵列&#xff0c;它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它…

《程序员面试金典(第6版)》面试题 16.17. 连续数列(贪心算法思想,动态规划算法思想,C++)

题目描述 给定一个整数数组&#xff0c;找出总和最大的连续数列&#xff0c;并返回总和。 示例&#xff1a; 输入&#xff1a; [-2,1,-3,4,-1,2,1,-5,4] 输出&#xff1a; 6 解释&#xff1a; 连续子数组 [4,-1,2,1] 的和最大&#xff0c;为 6。进阶&#xff1a; 如果你已经实…

elementUI tabs切换 echarts宽度挤压到一起 由100%变成100px

被压缩的图表&#xff1a; 正常显示 <el-tabs v-model"activeName" type"card" tab-click"handleClick"><el-tab-pane name"first"></el-tab-pane><el-tab-pane name"second" label"未达成原因…

如何在Kali Linux中获得root权限?

根用户名或账户在Linux或任何其他类似Unix的操作系统中拥有所有可用命令和文件的默认权限。它也被称为超级用户、根账户和根用户。用户名&#xff1a;"kali "是登录新Kali系统的标准凭证。这建立了一个用户 "kali "的会话&#xff0c;你必须在 "Sudo …

Java—JDK8新特性—方法引用【内含思维导图】

目录 4.方法引用 思维导图 4.1 什么是方法引用 4.2 为什么要使用方法引用 4.3 方法引用语法 4.4 方法引用的5种情况使用示例 4.方法引用 思维导图 4.1 什么是方法引用 方法引用就是Lambda表达式&#xff0c;也就是函数式接口的一个实例&#xff0c;通过方法的名称来指向一…

Word怎么分页,提高效率就靠这3种方法!

案例&#xff1a;Word怎么分页 【文档要进行分页处理&#xff0c;但是我尝试了好多次还是不行&#xff01;大家知道Word怎么分页吗&#xff1f;】 在使用Microsoft Word处理文档时&#xff0c;我们常常需要进行分页操作。Word的分页功能可以将文档分成多个页面&#xff0c;以…

【Vue3 插件篇】GSAP 动画库与 图片预览插件

GSAP 动画库 GSAP&#xff08;GreenSock Animation Platform&#xff09;是一个专业的动画库&#xff0c;可以用它完成你想要的各种效果 官网地址&#xff1a;https://greensock.com/ 参考文章一&#xff1a;https://www.jianshu.com/p/a8e150f0e569 参考文章二&#xff1a…

利用MQ事务消息实现分布式事务

MQ事务消息使用场景 消息队列中的“事务”&#xff0c;主要解决的是消息生产者和消息消费者的数据一致性问题。 拿我们熟悉的电商来举个例子。一般来说&#xff0c;用户在电商 APP 上购物时&#xff0c;先把商品加到购物车里&#xff0c;然后几件商品一起下单&#xff0c;最后…

为游客提供完美旅程:携程集团携手亚马逊云科技联合创新

刚刚过去的“五一”假期&#xff0c;旅游行业展现出了强劲的复苏势头。经文化和旅游部数据中心测算&#xff0c;全国国内旅游出游合计2.74亿人次&#xff0c;同比增长70.83%。 然而&#xff0c;出行前的航班高铁订票、酒店商旅预订、出游行程安排&#xff0c;就已经让不少家庭为…

C++linux高并发服务器项目实践 day9

Clinux高并发服务器项目实践 day9 信号集信号集相关函数以下信号集相关的函数都是对自定义的信号集进行操作sighandler_t函数sigaction函数 SIGCHLD信号共享内存共享内存使用步骤共享内存操作函数 信号集 许多信号相关的系统调用都需要能表示一组不同的信号&#xff0c;多个信…

深度思考:在 AI 时代,你会被放大一千倍的能力是什么?

Datawhale干货 作者&#xff1a;艾芙&#xff0c;复旦大学&#xff0c;百姓AI教育负责人 前言 大家晚上好&#xff0c;我是艾芙&#xff0c;百姓 AI 的 AI 教育负责人。 先做一下自我介绍&#xff0c;我是一个在技术圈和教育圈反复横跳的斜杠中年了。大约在 5 年前&#xff0c…

C++格式输入输出

&#x1f436;博主主页&#xff1a;ᰔᩚ. 一怀明月ꦿ ❤️‍&#x1f525;专栏系列&#xff1a;线性代数&#xff0c;C初学者入门训练&#xff0c;题解C&#xff0c;C的使用文章&#xff0c;「初学」C&#xff0c;数据结构 &#x1f525;座右铭&#xff1a;“不要等到什么都没…

常用的数据中心部署架构

说起数据中心&#xff0c;相信大家并不陌生。随着互联网行业的蓬勃发展&#xff0c;大数据时代的快速到来&#xff0c;数据中心同我们的生活紧密联系&#xff0c;息息相关。我们日常生活中的各种数据几乎都存储在数据中心里&#xff0c;例如&#xff1a;手机照片的云端备份、放…

Python小姿势 - # Python相关技术知识点

Python相关技术知识点 标题 在Python中如何处理文件 如果你要处理文件&#xff0c;那么在Python中你需要使用到os模块中的一些方法。 首先&#xff0c;你需要使用os.path.exists方法来判断文件是否存在&#xff1a; python if os.path.exists(file.txt): print(文件存在) else:…

asp.net企业员工考勤管理系统

企业员工管理系统主要是为企业内部管理员工使用的&#xff0c;主要功能分为员工和管理员两部分&#xff0c;主要的功能有用户登录&#xff0c;管理员信息管理&#xff0c;公告信息管理&#xff0c;文件审批管理&#xff0c;员工信息管理&#xff0c;工资信息管理&#xff0c;奖…

全景丨0基础学习VR全景制作,平台篇第19章:热点功能-文本

大家好&#xff0c;欢迎观看蛙色VR官方——后台使用系列课程&#xff01; 功能说明 应用场景 热点&#xff0c;指在全景作品中添加各种类型图标的按钮&#xff0c;引导用户通过按钮产生更多的交互&#xff0c;增加用户的多元化体验。 文本热点&#xff0c;即点击热点后会弹出…

一顿饭的事儿,搞懂了Linux5种IO模型

大家好&#xff0c;我是老三&#xff0c;人生有三大难题&#xff0c;事业、爱情&#xff0c;和 ——这顿吃什么&#xff01; 人在家中躺&#xff0c;肚子饿得响&#xff0c;又到了不得不吃的时候&#xff0c;这顿饭该怎么吃&#xff1f;吃什么呢&#xff1f; Linux里有五种I…

【笔记】【HTTP】《图解HTTP》第1章 了解Web及网络基础

前言 有输入就要有产出&#xff0c;该笔记是本人看完《图解HTTP》后对每章涉及到的知识进行汇总博客将会已书的每章为一篇发布&#xff0c;下一篇博客发布时间不确定笔记中有些个人理解后整理的笔记&#xff0c;可能有所偏差&#xff0c;也恳请读者帮忙指出&#xff0c;谢谢。…

在Notion AI 中轻松打造您的AI私人助理,提供卓越的工作体验

大家好&#xff0c;我是瓜叔。 相信平时喜欢做笔记的人对notion 选应该不陌生近年来越来越多人开始把notion 选当做他们的主力笔记软件。 我自己也用了约4年的时间。如果你也是notion的爱好者但还不知道notion AI是什么。那这篇文章&#xff0c;我会分享我是如何实际操作使用技…

Windows terminal+wsl+ohmyzsh+powerlevel10k打造更美丽的终端

安装wsl 安装 WSL 和 Linux 的默认 Ubuntu 发行版。 了解详细信息https://learn.microsoft.com/zh-cn/windows/wsl/install。 还可以使用此命令通过运行 wsl --install 来安装其他 Linux 发行版。 若要获取发行版名称的有效列表&#xff0c;请运行 wsl --list --online。 wsl -…