算法为何重要(《数据结构与算法图解》by 杰伊•温格罗)

news2025/1/17 0:58:52

本文内容借鉴一本我非常喜欢的书——《数据结构与算法图解》。学习之余,我决定把这本书精彩的部分摘录出来与大家分享。 


写在前面

算法这个词听起来很深奥,其实不然。它只是解决某个问题的一套流程。 

准备一碗麦片的流程也可以说是一种算法,它包含以下 4步(对我来说是 4步吧)。

(1) 拿个碗。

(2) 把麦片倒进碗里。
(3) 把牛奶倒进碗里。
(4) 把勺子放到碗里。

在计算机的世界里,算法则是指某项操作的过程。

上一章我们研究了 4种主要操作,包括读取、查找、插入和删除

这一章我们还是会经常提到它们,而且一种操作可能会有不止一种做法。也就是说,一种操作会有

多种算法的实现。

我们很快会看到不同的算法能使代码变快或者变慢——高负载时甚至慢到停止工作。不过,现在先

来认识一种新的数据结构:有序数组。它的查找算法就不止一种,我们将会学习如何选出正确的那

种。


1.有序数组

有序数组跟上一章讨论的数组几乎一样,唯一区别就是有序数组要求其值总是保持有序。即每次插

入新值时,它会被插入到适当的位置,使整个数组的值仍然按顺序排列。

以数组 [3,17,80,202] 为例。

假设这是个常规的数组,你准备将 75插入,那就可以把它放到尾端,如下所示。

如上一章所述,计算机只要 1步就能完成这种操作。

但如果这是一个有序数组,你就必须要找到一个适当的位置,使插入 75 之后整个数组依然有序。

做起来可不像说的那么简单。整个过程不可能一步完成,因为计算机需要先找出那个适当的位置,

然后将其及以后的值右移来腾出空间给 75。

下面就来介绍分解的步骤。

先回顾一下原始的数组。

 第 1步:检查索引 0的值,看 75应该在它的左边还是右边。

因为 75大于 3,所以 75应该在它右边的某个位置。而具体的位置,目前还是不能确定,于是再检查下一个格子。

第 2步:检查下一格的值。

因为 75大于 17,所以继续

第 3步:检查下一格的值。

 

这次是 80,大于 75。因为这是第一次遇到大于 75的值,可想而知,必须把 75放在 80的左侧以使整个数组维持有序。但要在这里插入 75,还得先将它的位置空出来。

第 4步:将最后一个值右移。

第 5步:将倒数第二个值右移。

第 6步:终于可以把 75插入到正确的位置上了。

可以看到,往有序数组中插入新值,需要先做一次查找以确定插入的位置。这是它跟常规数组的关

键区别(在性能方面)之一。虽然插入的性能比不上常规数组,但在查找方面,有序数组却有着特

殊优势。


2.查找有序数组

上一章介绍了常规数组的查找方式:从左至右逐个格子检查直至找到。这种方式称为线性查找

接下来看看有序数组的线性查找跟常规数组有何不同。

设一个常规数组 [17,3,75,202,80] ,如果想在里面查找 22(其实并不存在),那你就得逐个元素

去检查,因为 22 可能在任何一个位置上。要想在到达末尾之前结束检查,那么所找的值必须在末

尾之前出现。

然而对于有序数组来说,即便它不包含要找的值,我们也可以提早停止查找。假设要在有序数组

[3,17,75,80,202] 里查找 22,我们可以在查到 75的时候就结束,因为 22不可能出现在 75的右边。

以下是用C语言实现的有序数组线性查找。

int Search(int arr[], int sz,int val)
{
	//遍历数组的每个元素
	for (int i = 0; i < sz; i++)
	{

		if (arr[i] > val)
		{
			return -1;
		}
		if (arr[i] == val)
		{
			//找到了,返回val的索引
			return i;
		}
	}
	//找不到,返回-1
	return -1;
}

因此,有序数组的线性查找大多数情况下都会快于常规数组。除非要找的值是最后那个,或者比最

后的值还大,那就只能一直查到最后了。

只看到这里的话,可能你还是不会觉得两种数组在性能上有什么巨大区别。

这是因为我们还没释放算法的潜能。这是接下来就要做的

今天我们提到的查找有序数组的方法就只有线性查找。但其实,线性查找只不过是查找算法的其中

一种而已。这种逐个格子检查直至找到为止的过程,并不是查找的唯一途径。

有序数组相比常规数组的一大优势就是它可以使用另一种查找算法。此种算法名为二分查找,它比

线性查找要快得多。


3.二分查找

你小时候或许玩过这样一种猜谜游戏(或者现在跟你的小孩玩过):我心里想着一个 1到 100之间

的数字,在你猜出它之前,我会提示你的答案应该大一点还是小一点。

你应该凭直觉就知道这个游戏的策略。一开始你会先猜处于中间的 50,而不是 1。为什么?

因为不管我接下来告诉你更大或是更小,你都能排除掉一半的错误答案!

如果你说 50,然后我提示要再大一点,那么你应该会选 75,以排除掉剩余数字的一半。如果在  

75之后我告诉你要小一点,你就会选 62或 63。总之,一直都猜中间值,就能不断地缩小一半的范

围。

下面来演示这个过程,但仅以 1到 10为例。

这就是二分查找的通俗描述。

有序数组相比常规数组的一大优势就是它除了可以用线性查找,还可以用二分查找。常规数组因为

无序,所以不可能运用二分查找。 为了看出它的实际效果,假设有一个包含 9个元素的有序数组。

计算机不知道每个格子的值,如下图所示。

然后,用二分查找来找出 7,过程如下。

第 1步:检查正中间的格子。因为数组的长度是已知的,将长度除以 2,我们就可以跳到确切的内

存地址上,然后检查其值。

值为 9,可推测出 7应该在其左边的某个格子里。而且,这下我们也排除了一半的格子,即 9右边

的那些(以及 9本身)。

第 2步:检查 9左边的那些格子的最中间那个。因为这里最中间有两个,我们就随便挑了左边的。

它的值为 4,那么 7就在它的右边了。由此 4左边的格子也就排除了。 

第 3步:还剩两个格子里可能有 7。我们随便挑个左边的。

第 4步:就剩一个了。(如果还没有,那就说明这个有序数组里真的没有 7。) 

终于找到 7了,总共 4步。是的,这个有序数组要是用线性查找也会是 4步,但稍后你就会见识到

二分查找的强大。

以下是二分查找的 C语言实现。

int Search(int arr[], int sz, int val)
{
	int left = 0;                         //定义一个左指针
	int right = sz - 1;                   //定义一个右指针
	while (left <= right)
	{
		int mid = left+(right-left) / 2;  //防止越界
		if (arr[mid] == val)              //找到了,返回下标
		{
			return mid;
		}
		if (arr[mid] < val)
		{
			left = mid + 1;               //让mid+1成为新的左指针
		}
		if (arr[mid] > val)
		{
			right = mid - 1;              //让mid-1成为新的右指针
		}
	}
	return -1;                            //没找到,返回-1
}

4.二分查找与线性查找

对于长度太小的有序数组,二分查找并不比线性查找好多少。但我们来看看更大的数组。

对于拥有 100个值的数组来说,两种查找需要的最多步数如下所示。

 线性查找:100步

 二分查找:7步

用线性查找的话,如果要找的值在最后一个格子,或者比最后一格的值还大,那么就得查遍每个格

子。有 100个格子,就是 100步。

二分查找则会在每次猜测后排除掉一半的元素。100 个格子,在第一次猜测后,便排除了50 个。

再换个角度来看,你就会发现一个规律。

长度为 3的有序数组,二分查找所需的最多步数是 2。

若长度翻倍,变成 7(以奇数为例会方便选择正中间的格子,于是我们把长度翻倍后又增加

了一个数),则最多步数会是 3。

若再翻倍(并加 1),变成 15个元素,那么最多步数会是 4

规律就是,每次有序数组长度乘以 2,二分查找所需的最多步数只会加 1

这真是出奇地高效。

相反,在 3 个元素的数组上线性查找,最多要 3 步,7 个元素就最多要 7 步,100 个元素就最多要

100步,即元素有多少,最多步数就是多少。数组长度翻倍,线性查找的最多步数就会翻倍,而二

分查找则只是增加 1 步。

这种规律可以用下图来展示。

如果数组变得更大,比如说 10 000个元素,那么线性查找最多会有 10 000步,而二分查找最多只

有 14步。再增大到 1 000 000个元素,则线性查找最多有 1 000 000步,二分查找最多只有 20

步。


总结

关于算法的内容就是这些。很多时候,计算一样东西并不只有一种方法,换种算法可能会极大地影

响程序的性能。

同时你还应意识到,世界上并没有哪种适用于所有场景的数据结构或者算法。你不能因为有序数组

能使用二分查找就永远只用有序数组。在经常插入而很少查找的情况下,显然插入迅速的常规数组

会是更好的选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/93738.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

谷歌将于2023年初在Android 13上推出隐私沙盒测试版

©网络研究院 互联网巨头谷歌表示&#xff0c;计划从明年年初开始&#xff0c;在运行Android 13的移动设备上推出安卓隐私沙盒测试版。 该公司表示:“隐私沙盒测试版将面向希望测试广告相关API作为其解决方案一部分的广告技术和应用开发者开放。” 为此&#xff0c;开发者…

解密 MySQL 的主备一致

MySQL 实现主备一致肯定是 binlog。毫不夸张的说&#xff0c;MySQL 能够成为现在最流行的开源数据库&#xff0c;binlog 功不可没。 MySQL主备的基本原理 ​ 主备流程图备库 B 跟主库 A 之间维持了一个长连接。主库 A 内部有一个线程&#xff0c;专门用于服务备库 B 的这个长…

漏洞深度分析|Pgadmin 命令执行漏洞

项目介绍 PostgreSQL是世界上第四大流行的开源数据库管理系统&#xff0c;它在各种规模的应用程序中得到了广泛的使用。而管理数据库的传统方法是使用命令行界面(CLI)工具。 PostgreSQL的图形化用户界面(GUI)工具则可以帮助用户对数据库实现更好的管理、操纵、以及可视化其数…

这些方法助你打好年终收官战

一、减少推文中的链接数量 研究表明&#xff0c;没有链接的推文更容易产生粉丝互动。所以你不必在每条推文中都包含链接。链接的精妙在于精而不在于杂。所以如果你限制包含链接的推文数量&#xff0c;你会发现你推文的粉丝参与度会增加。 少量的链接更有利于和粉丝建立信任&a…

【从零开始学习深度学习】27.卷积神经网络之VGG11模型介绍及其Pytorch实现【含完整代码】

目录1. VGG块介绍2. 构造VGG网络模型3. 获取Fashion-MNIST数据并用VGG-11训练模型4.总结AlexNet在LeNet的基础上增加了3个卷积层。但AlexNet对卷积窗口、输出通道数和构造顺序均做了大量的调整。虽然AlexNet模型表明深度卷积神经网络可以取得出色的结果&#xff0c;但并没有提供…

C++ Reference: Standard C++ Library reference: Containers: map: map: emplace

C官网参考链接&#xff1a;https://cplusplus.com/reference/map/map/emplace/ 公有成员函数 <map> std::map::emplace template <class... Args> pair<iterator,bool> emplace (Args&&... args);构造并插入元素 如果元素的键是唯一的&#xff0c;…

【沙拉查词】沙拉查词配置教程——如何实现截图OCR翻译、截图翻译?

一、问题背景 2022年12月16日&#xff0c;沙拉查词仍然没有截图翻译的功能。 这个功能&#xff0c;在百度翻译上虽然能够实现&#xff0c;但是要额外下一个软件和挂在后台&#xff0c;总是觉得麻烦。 二、解决方法 如果你是一个quicker软件使用者&#xff0c;那么通过添加「…

python中的字典详解

目录 一.思考 二.字典定义 注意 三.字典数据的获取 注意 字典的嵌套 四.字典常用操作 1.新增、更新元素 2.删除元素 3.清空字典 4.获取全部Key 5.利用Key遍历字典 五.字典总结 六.字典实例 一.思考 为什么需要字典? 生活中的字典我们可以根据【字】来找到对应的【含…

QT-Linux安装

1、在虚拟机Ubuntu的环境安装好之后&#xff0c;详细看&#xff1a; QT Linux环境搭建——VM虚拟机和Ubuntu的安装_sgmcy的博客-CSDN博客 下面就可以直接安装linux环境下的QT了 2、唯一要注意的一点是&#xff0c;之前安装虚拟机的时候&#xff0c;磁盘空间一定要大一点&…

第十四届蓝桥杯集训——JavaC组第十四篇——嵌套循环

第十四届蓝桥杯集训——JavaC组第十四篇——循环嵌套 目录 第十四届蓝桥杯集训——JavaC组第十四篇——循环嵌套 循环嵌套是逻辑程序中的方法 对应嵌套的循环复杂度 嵌套循环示例&#xff1a; 名词解析&#xff1a; 笛卡尔积 循序命名 循环嵌套是逻辑程序中的方法 循环嵌…

“无人区”行驶8年,李诞的脱口秀路在何方?

刚从《脱口秀大会5》的舞台上下来的李诞&#xff0c;给自己找了份“新工作”——脱口秀直播带货。 12月10日晚&#xff0c;李诞入淘。讲段子、玩梗手到擒来&#xff0c;李诞将自己风趣幽默的脱口秀风格沿用到了这场“来个彩诞”直播首秀中&#xff0c;给交个朋友贡献了超3200万…

5.单点登录(Vue2.x)

概况 百度百科 单点登录&#xff08;Single Sign On&#xff09;&#xff0c;简称为 SSO&#xff0c;是比较流行的企业业务整合的解决方案之一。SSO的定义是在多个应用系统中&#xff0c;用户只需要登录一次就可以访问所有相互信任的应用系统。 关键词 token、session、cooki…

Java基础之《netty(13)—任务队列taskQueue》

一、任务队列 1、用户程序自定义的普通任务 2、用户自定义定时任务 3、非当前Reactor线程调用Channel的各种方法 例如在推送系统的业务线程里面&#xff0c;根据用户的标识&#xff0c;找到对应的Channel引用&#xff0c;然后调用Write类方法向该用户推送消息&#xff0c;就…

基于java+springmvc+mybatis+vue+mysql的养老院管理系统

项目介绍 管理员后台页面&#xff1a; 功能&#xff1a;主页、个人中心、护工管理、家属管理、楼房资料管理、房间资料管理、床位管理、老人入住管理、老人档案管理、身体状态管理、用药情况管理、转房登记管理、外出登记管理、药品信息管理、药品入库管理、药品出库管理、物品…

【C语言】整型的存储方式(大小端,原码,反码,补码)

目录 一、基本类型 二、原码&#xff0c;反码&#xff0c;补码 2.1 原&#xff0c;反&#xff0c;补的计算方式 2.1.1 正数的原&#xff0c;反&#xff0c;补 2.1.2 负数的原&#xff0c;反&#xff0c;补 2.2 为什么要用补码存放 2.3 大小端是什么&#xff1f; 2.3.1 …

明道云联合契约锁共建人事场景电子签约解决方案

背景介绍 在每个组织的人事管理工作中&#xff0c;从招聘、入职、在职、调岗到离职&#xff0c;整个过程中存在大量的合同、证明、函件、通知等文件需要签字盖章。HR每天都要在“核对文件、敲章、通知员工签合同、催进度、给外地员工寄合同、关注合同到期时间等”繁琐的签署工…

使用vite和Element Plus,实现部署后不修改代码/打包,新增主题/皮肤包

Web前端界面切换主题/皮肤&#xff0c;是一个常见的需求。如果希望在打包部署后实现皮肤的修改甚至增加皮肤&#xff0c;不需要修改源码或者重新打包&#xff0c;类似于我们常见的皮肤包扩展&#xff0c;又该如何实现呢&#xff1f; 我使用类似上一期多语言包功能中介绍的方法来…

基于Xlinx的时序分析与约束(3)----基础概念(下)

1、4种基本的时序路径 下图是一张典型的FPGA与上游器件、下游器件通信的示意图&#xff1a; 其可以划分为4条基本的数据路径&#xff0c;这4条路径也是需要进行时序约束的最基本路径。 &#xff08;1&#xff09;寄存器到寄存器 路径2&#xff0c;FPGA内部的寄存器到另一个寄存…

[附源码]Node.js计算机毕业设计高校医疗健康服务系统的设计与实现Express

项目运行 环境配置&#xff1a; Node.js最新版 Vscode Mysql5.7 HBuilderXNavicat11Vue。 项目技术&#xff1a; Express框架 Node.js Vue 等等组成&#xff0c;B/S模式 Vscode管理前后端分离等等。 环境需要 1.运行环境&#xff1a;最好是Nodejs最新版&#xff0c;我…

【C++初阶】类和对象(下)再谈构造函数、static成员、C++11的成员初始化新玩法、友元类、内部类

文章目录再谈构造函数static成员C11的成员初始化新玩法友元类内部类再谈构造函数 1.构造函数体赋值 在创建对象时&#xff0c;编译器通过调用构造函数&#xff0c;给对象中各个成员变量一个合适的初始值。 虽然上述构造函数调用之后&#xff0c;对象中已经有了一个初始值&am…