[排序]hoare快速排序

news2024/11/24 11:15:27

今天我们继续来讲排序部分,顾名思义,快速排序是一种特别高效的排序方法,在C语言中qsort函数,底层便是用快排所实现的,快排适用于各个项目中,特别的实用,下面我们就由浅入深的全面刨析快速排序。事先声明,快速排序有不同的版本,今天我们讲的是hoare的版本

目录

快排的定义

hoare快排的具体实现

快排的时间复杂度

优化快速排序

三数取中

小区间优化

相遇位置比key小的问题


快排的定义

快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。

hoare快排的具体实现

我们先看一下排序的动态图

快排的思想与其他的排序不同,其他排序的基本思想是将最大或者最小的数找出来,放到某一个位置,而在快排中,是将一个数排到有序的位置,然后将其左右分割。

快排会有key,left,right三个变量,key就是当前排序的数的下标,left就是左端,right就是右端

我们先看一下单趟排序的逻辑

注意:左右寻找比key位置大或小的数时,必须从key的另一侧开始移动不然会出现排序错误的问题,这个问题我们之后会具体讲到

那么我们用代码实现一下单趟排序的逻辑

void swap(int* a, int* b)
{
	int tmp = *a;
	*a = *b;
	*b = tmp;
}
void quicksort(int a[],int left,int right)
{
	int key = left;//我们假设key位于left的位置
	int begin = left;
	int end = right; //用begin和end记录left和right的位置
	//我们之后要用left和right的值,进行分割区间递归,所以不能改变其值
	while (begin < end)
	{
		//右边找小
		while (begin<end&&a[end] >= a[key])
		{
			end--;
		}
		//左边找大
		while (begin<end&&a[begin] <= a[key])
		{
			begin++;
		}
		swap(&a[begin], &a[end]);
	}
	swap(&a[begin], &a[key]);
}

既然单趟排序的逻辑我们已经清楚了,那么我们下一步就该进行多次单趟排序的逻辑,这样我们就能完成快排的逻辑

我们这里先用递归的思想进行实现,看下面的逻辑图

以上便是快排多次进行单词排序的逻辑,即快速排序的全部实现逻辑

下面我们用代码进行实现

void quicksort(int a[],int left,int right)
{
	if (left >= right)
	{
		return;
	}
	int key = left;//我们假设key位于left的位置
	int begin = left;
	int end = right; //用begin和end记录left和right的位置
	//我们之后要用left和right的值,进行分割区间递归,所以不能改变其值
	while (begin < end)
	{
		//右边找小
		while (begin<end&&a[end] >= a[key])
		{
			end--;
		}
		//左边找大
		while (begin<end&&a[begin] <= a[key])
		{
			begin++;
		}
		swap(&a[begin], &a[end]);
	}
	swap(&a[begin], &a[key]);
	key = begin;
	//[left,key-1] key [key+1,right]
	quicksort(a, left, key - 1);//左区间递归排序
	quicksort(a, key+1, right);//右区间递归排序
}

这里我们还要理解一下,递归终止条件

left >= right

以上即快速排序的基本实现

快排的时间复杂度

我们都知道判断一个排序效率的方法就是比较其时间复杂度

那么快排的时间复杂度是多少呢?

如果从代码的角度看,这个时间复杂度是非常难以计算的

我们先来看快排的递归层数,我们根据上面的逻辑图,可以大致的发现,快排是将数组类似分为二叉树的结构

因此递归的层数为logN层,而在单趟排序中end和begin从两边开始走直到相遇一共走了N步

从这个角度看快排的时间复杂度为  O(NlogN)

因此快排是和堆排序,希尔排序位于同一赛道的排序算法,都是极其高效的算法

排序十万个数(单位毫秒ms)

排序一百万个数 (单位毫秒ms)

 排序五百万个数 (单位毫秒ms)

可以看到当前的快排,并没有想象中那么快,甚至在数多的情况下和堆排序以及希尔排序,还显得效率较低。
而且在排有序数组的情况下,不要说一百万个数,在十万个数有序数组中,会发生一个大问题

1,效率变低

2.由于递归层次太深,每次递归都要建立新的栈帧,这就会可能导致栈溢出的问题 

我们来分析一下问题,之前在正常情况下,时间复杂度为N*logN的前提是每次都是二分递归,即key位置的数都是接近中间的值,此时当二分递归时,递归的深度就是logN,但如果按上面有序情况下,递归的深度是N,这就是上面问题的来源

因此我们现在的快排还是有明显的缺陷

优化快速排序

那么我们如何解决这个问题呢?

避免有序情况下,效率退化

我们可以改变key的选取,如果我们每次都选取最左侧值为key或者最右侧值为key,就会导致上面递归过深的问题,所以我们不能固定选key。

1.随机选key

随机数选key虽然能够解决问题,但是还是有些不靠谱,毕竟是随机的

2.三数取中

最左边,最右边,中间,选取不是最大的和最小的作key

为了保证代码的逻辑不发生变化,即还从最左端的为key,我们就将三数取中的值与最左边的值进行交换,再执行代码逻辑。

三数取中

三数取中是取大小是中间的值,然后完成最好的情况就是二分的情况,即效率最高的情况

运用分支语句进行两两比较返回中间值,直接放代码,逻辑比较简单,不作解释

int GetMid(int* a, int left, int right)
{
	int mid = (left + right) / 2;
	//left mid right
	if (a[mid] > a[left])
	{
		if (a[mid] < a[right])
			return mid;
		else if (a[left] > a[right])
			return left;
		else
			return right;
	}
	else
	{
		if (a[mid] > a[right])
			return mid;
		else if (a[right] > a[left])
			return left;
		else
			return right;
	}
}

那么我们的快排中需要将交换left和三数取中mid的位置,即加上两行代码,我们其他的逻辑不发生变化

代码如下

void quicksort(int a[],int left,int right)
{
	if (left >= right)
	{
		return;
	}
	//三数取中
	int mid = GetMid(a, left, right);
	swap(&a[mid], &a[left]);  
	int key = left;//我们假设key位于left的位置
	int begin = left;
	int end = right; //用begin和end记录left和right的位置
	//我们之后要用left和right的值,进行分割区间递归,所以不能改变其值
	while (begin < end)
	{
		//右边找小
		while (begin<end&&a[end] >= a[key])
		{
			end--;
		}
		//左边找大
		while (begin<end&&a[begin] <= a[key])
		{
			begin++;
		}
		swap(&a[begin], &a[end]);
	}
	swap(&a[begin], &a[key]);
	key = begin;
	//[left,key-1] key [key+1,right]
	quicksort(a, left, key - 1);
	quicksort(a, key+1, right);

}

在优化后,我们再来比较一下快排的效率

 可以发现,在三数取中后,快排效率也有了优化,而且避免了在有序情况下,递归过深的问题

小区间优化

我们的快排虽然有了优化,但是还有一点缺陷,描述如下图所示

而我们小区间优化,只需要加一个判断语句,对数据个数进行判断,若小于10就用其他的排序方法,大于10就正常递归排序

那么我们选用其他的排序方法要用哪个比较好呢?

我们有插入,堆排序,选择,冒泡,希尔排序,归并排序

我们可以一一进行比较与排除

希尔排序不适用于小数据的排序,堆排序虽然可以,但是我们想一下,没有必要为10个数再单独进行建堆,不然就得不偿失了;归并也是利用递归,没有必要。

那么我们就剩下了冒泡,选择,插入

而在之前的文章中,我们分析过,冒泡和选择排序是远远不如插入排序的效率的

那么我们就选择插入排序

在快排的底层中,小区间优化也是使用的插入排序,这就是插入排序的实际应用

代码如下

	//小区间优化,不再递归分割排序,减少递归次数
	if ((right - left + 1) < 10)
	{
		InsertSort(a + left, right - left - 1);
	}

以上便是优化快排的全部实现

下面放上优化过快排代码

int GetMid(int* a, int left, int right)
{
	int mid = (left + right) / 2;
	//left mid right
	if (a[mid] > a[left])
	{
		if (a[mid] < a[right])
			return mid;
		else if (a[left] > a[right])
			return left;
		else
			return right;
	}
	else
	{
		if (a[mid] > a[right])
			return mid;
		else if (a[right] > a[left])
			return left;
		else
			return right;
	}
}
void swap(int* a, int* b)
{
	int tmp = *a;
	*a = *b;
	*b = tmp;
}
void quicksort(int a[],int left,int right)
{
	if (left >= right)
	{
		return;
	}
	//小区间优化,不再递归分割排序,减少递归次数
	if ((right - left + 1) < 10)
	{
		InsertSort(a + left, right - left - 1);
	}
    else{
	//三数取中
	int mid = GetMid(a, left, right);
	swap(&a[mid], &a[left]);  
	int key = left;//我们假设key位于left的位置
	int begin = left;
	int end = right; //用begin和end记录left和right的位置
	//我们之后要用left和right的值,进行分割区间递归,所以不能改变其值
	while (begin < end)
	{	
		//右边找小
		while (begin<end&&a[end] >= a[key])
		{
			end--;
		}
		//左边找大
		while (begin<end&&a[begin] <= a[key])
		{
			begin++;
		}
		swap(&a[begin], &a[end]);
	}
	swap(&a[begin], &a[key]);
	key = begin;
	//[left,key-1] key [key+1,right]
	quicksort(a, left, key - 1);
	quicksort(a, key+1, right);

}
}
int main()
{
	int a[] = { 6,1,2,7,9,3,4,5,10,8 };
	int sz = sizeof(a) / sizeof(a[0]);
	quicksort(a, 0, sz - 1);
	for (int i = 0; i < sz - 1; i++)
	{
		printf("%d ", a[i]);
	}
	return 0;
}

相遇位置比key小的问题

之前我们遗留了一个小问题,就是怎么保证eft和right相遇位置的值一定比key位置小,这样交换后,会让key的左右两边分为比key大的和比key小的,如果相遇位置比key要大的话,那就让数据排序毁了。

那么如何保证相遇位置比key小呢?

先说结论,就是我们上面所说的

当左边作key时,就让右边先走,可以保证相遇位置比key小

以下即解释:

以上是便是hoare排序相关问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1943449.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PHP接入consul,注册服务和发现服务【学习笔记】

PHP接入consul,注册服务和发现服务 consul安装 链接: consul安装 启动consul C:\Users\14684>consul agent -dev安装TP5 composer create-project topthink/think5.0.* tp5_pro --prefer-dist配置consul 创建tp5_pro/application/service/Consul.php <?php /*****…

环境变量配置文件中两种路径添加方式

环境变量配置文件中两种路径添加方式 文章目录 环境变量配置文件中两种路径添加方式代码示例区别和作用 代码示例 export HBASE_HOME/opt/software/hbase-2.3.5 export PATH$PATH:$HBASE_HOME/binexport SPARK_HOME/opt/software/spark-3.1.2 export PATH$SPARK_HOME/bin:$PAT…

【MySQL是怎样运行的 | 第一篇】Explain执行计划上

文章目录 1.查询优化-Explain语句详解上1.1前言1.2执行计划输出各列详解1.2.1 table1.2.2 id1.2.3 select_type1.2.4 partitions1.2.5 type1.2.6 possible_keys和key1.2.7 key_len1.2.8 ref1.2.9 rows 世纪晚霞 1.查询优化-Explain语句详解上 1.1前言 一条查询语句在经过 MyS…

在 CentOS 7 上安装 Docker 并安装和部署 .NET Core 3.1

1. 安装 Docker 步骤 1.1&#xff1a;更新包索引并安装依赖包 先安装yum的扩展&#xff0c;yum-utils提供了一些额外的工具&#xff0c;这些工具可以执行比基本yum命令更复杂的任务 sudo yum install -y yum-utils sudo yum update -y #更新系统上已安装的所有软件包到最新…

视频分帧【截取图片】(YOLO目标检测【生成数据集】)

高效率制作数据集【按这个流程走&#xff0c;速度很顶】 本次制作&#xff0c;1059张图片【马路上流动车辆】 几乎就是全自动了&#xff0c;只要视频拍得好&#xff0c;YOLO辅助制作数据集就效率极高 视频中的图片抽取&#xff1a; 【由于视频内存过大&#xff0c;遇到报错执行…

2024导游资格考试,这些材料提前准备✅

2024年导游考试报名本月开始&#xff01; &#x1f499;大家提前准备好报名材料 1、个人近期白底1寸证件照。 2、身份证照片 3、学历照片 4、健康证明或健康承诺书 5、其他需要上传的材料 &#x1f499;照片文件不通过原因汇总&#xff0c;记得避开这些坑&#xff01; &#x1…

网络驱动移植(RTL8189)

1、把驱动放到内核文件夹中&#xff08;linux/drivers/net/wireless&#xff09;&#xff0c;对应的驱动可以在网上下载 2、修改该目录下的Kconfig和Makefile文件 3、配置内核&#xff08;make menuconfig&#xff09; 配置支持IEEE 802.11&#xff0c;选中8189模块&#xff0…

程序员 被辞退后如何赚钱

为啥现在大厂大量裁员&#xff1f;35以上的程序员为啥不被认可&#xff0c;很难找工作&#xff1f; 技术更新换代迅速&#xff1a; 技术领域发展极快&#xff0c;新的编程语言、框架和技术不断涌现。如果大龄程序员未能及时学习新技术和跟上行业变化&#xff0c;可能会被新一代…

SAP第二季度财报和进一步裁员计划

7月22日公布了截至 2024 年 6 月 30 日的第二季度财务报告。以下位总体指标 当前云计算在手订单达 148 亿欧元&#xff0c;按名义货币和固定汇率计算均增长 28%云收入增长 25%&#xff0c;其中云 ERP 套件收入增长 33%&#xff0c;均按名义货币和固定汇率计算总收入增长 10%&a…

【数据结构初阶】复杂度

目录 一、时间复杂度 1、时间复杂度的概念 2、大O的渐进表示法 3、常见的时间复杂度计算举例 二、空间复杂度 1、空间复杂度的概念 2、常见的空间复杂度计算举例 三、常见复杂度对比 正文开始—— 前言 一个算法&#xff0c;并非越简洁越好&#xff0c;那该如何衡量一个算法…

Mamba-yolo|结合Mamba注意力机制的视觉检测

一、本文介绍 PDF地址&#xff1a;https://arxiv.org/pdf/2405.16605v1 代码地址&#xff1a;GitHub - LeapLabTHU/MLLA: Official repository of MLLA Demystify Mamba in Vision: A Linear AttentionPerspective一文中引入Baseline Mamba&#xff0c;指明Mamba在处理各种高…

零基础入门:创建一个简单的Python爬虫管理系统

摘要&#xff1a; 本文将手把手教你&#xff0c;从零开始构建一个简易的Python爬虫管理系统&#xff0c;无需编程基础&#xff0c;轻松掌握数据抓取技巧。通过实战演练&#xff0c;你将学会设置项目、编写基本爬虫代码、管理爬取任务与数据&#xff0c;为个人研究或企业需求奠…

回溯题目的套路总结

前言 昨天写完了LeeCode的7&#xff0c;8道回溯算法的题目&#xff0c;写一下总结&#xff0c;这类题目的共同特点就是暴力搜索问题&#xff0c;排列组合或者递归&#xff0c;枚举出所有可能的答案&#xff0c;思路很简单&#xff0c;实现起来的套路也很通用&#xff0c;一…

poi库简单使用(java如何实现动态替换模板Word内容)

目录 Blue留言&#xff1a; Blue的推荐&#xff1a; 什么是poi库&#xff1f; 实现动态替换 第一步&#xff1a;依赖 第二步&#xff1a;实现word模板中替换文字 模板word&#xff1a; 通过以下代码&#xff1a;&#xff08;自己建一个类&#xff0c;随意取名&#xf…

SpringBoot框架学习笔记(五):静态资源访问、Rest风格请求处理、配置视图解析器、接收参数的相关注解详解

1 WEB开发-静态资源访问 1.1 基本介绍 &#xff08;1&#xff09;只要静态资源放在类路径的以下目录&#xff1a;/static、/public、/resources、/META-INF/resources 可以被直接访问。maven项目的类路径即为main/resources目录--对应SpringBoot源码为WebProperties.java类 …

nginx如何开启优先访问压缩文件

nginx输出gzip有很多条件&#xff1a; 开启了gzip&#xff1a;gzip on;gzip_types定义了content-type&#xff0c;需要注意的是text/html是强制性的&#xff0c;不需要也不能再添加这个响应输出的content-type在gzip_types里输出的content-length大于等于nginx配置的gzip_min_…

【TypeScript 一点点教程】

文章目录 一、开发环境搭建二、基本类型2.1 类型声明2.2 基本类型 三、编译3.1 tsc命令3.2 tsconfig.json3.2.1 基本配置项includeexcludeextendsfiles 3.2.2 compilerOptions编译器的配置项 四、面向对象4.1 类4.2 继承4.3 抽象类4.4 接口 一、开发环境搭建 下载Node.js《Nod…

操作系统——进程与线程(死锁)

1&#xff09;为什么会产生死锁&#xff1f;产生死锁有什么条件&#xff1f; 2&#xff09;有什么办法解决死锁&#xff1f; 一、死锁 死锁:多个程序因竞争资源而造成的一种僵局&#xff08;互相等待对方手里的资源&#xff09;&#xff0c;使得各个进程都被阻塞&#xff0c;…

02.C++入门基础(下)

1.函数重载 C支持在同一作用域中出现同名函数&#xff0c;但是要求这些同名函数的形参不同&#xff0c;可以是参数个数不同或者类型不同。这样C函数调用就表现出了多态行为&#xff0c;使用更灵活。C语言是不支持同一作用域中出现同名函数的。 1、参数类型不同 2、参数个数不同…

volatile,最轻量的同步机制

目录 一、volatile 二、如何使用&#xff1f; 三、volatile关键字能代替synchronized关键字吗&#xff1f; 四、总结&#xff1a; 还是老样子&#xff0c;先来看一段代码&#xff1a; 我们先由我们自己的常规思路分析一下代码&#xff1a;子线程中&#xff0c;一直循环&…