【数据结构与算法篇】手撕八大排序算法之快排的非递归实现及递归版本优化(三路划分)

news2024/11/26 11:36:54

在这里插入图片描述

​👻内容专栏: 《数据结构与算法篇》
🐨本文概括: 利用数据结构栈(Stack)来模拟递归,实现快排的非递归版本;递归版本测试OJ题时,有大量重复元素样例不能通过,导致性能下降,优化快速排序通过将数组划分为三个区域,可以更有效地处理重复元素。
🐼本文作者: 阿四啊
🐸发布时间:2023.8.28

快速排序(非递归)

1.为什么要学习非递归版本?

前面我们使用了三个版本实现快速排序,但都是属于递归类型算法,函数调用会建立函数栈帧,递归深度取决于函数调用的次数。栈空间内存有限,在处理大规模数据集时,递归深度的增加可能导致栈溢出的情况,所以在我们学会了递归版本之后,需要继续强化学习非递归版本,利用之前学习的数据结构栈(Stack)来模拟实现。

2.基本思想

我们知道,我们在写递归版本的时候,快速排序主要处理的是数组的不同区间,将问题分解为较小的子问题并在每个子问题上递归地应用相同的排序算法来完成排序。

在这里插入图片描述
那么我们如何使用栈(Stack)来模拟实现呢?

核心思想是使用一个栈来存储待排序的子数组的起始和结束下标。在每次循环中,从栈中弹出一个子数组并执行分区操作(根据基准值(key),划分区间,这一步骤即递归版本写的Partition函数),选然后根据分区结果将未处理的左右子数组的下标压入栈中,直到栈为空为止。

3.算法分析

👇①:
在这里插入图片描述
👇②:
在这里插入图片描述
👇③:继续重复以上步骤,直到栈中的数据为空。

4.代码实现

因为涉及到使用栈,而本篇数据结构基于C语言讲解,所以讲自己实现的栈的文件源代码也顺便放在这。

void Swap(int* a, int* b)
{
	int tmp = *a;
	*a = *b;
	*b = tmp;
}
//hoare版本
int Partition1(int* a, int left, int right)
{
	int keyi = left;
	while (left < right)
	{
		//注意: 要加上left < right 否则会出现越界
		//若不判断等于基准值,也会出现死循环的情况
		//右边找小
		while (left < right && a[right] >= a[keyi])
		{
			right--;
		}

		//左边找大
		while (left < right && a[left] <= a[keyi])
		{
			left++;
		}

		Swap(&a[left], &a[right]);
	}
	Swap(&a[left], &a[keyi]);

	return left;
}

void QuicksortNonR(int* a, int begin, int end)
{
	Stack st;
	StackInit(&st);

	//注意栈的顺序是后进先出,需要倒着放进去,正着拿出来
	
	//将排序数组的起始和末端下标入栈
	StackPush(&st, end);
	StackPush(&st, begin);

	//栈不为空一直循环
	while (!StackEmpty(&st))
	{
		//弹出子区间(左右两个下标)
		int left = StackTop(&st);
		StackPop(&st);
		int right = StackTop(&st);
		StackPop(&st);

		//执行分区操作
		int keyi = Partition1(a, left, right);
		//[left,keyi - 1] keyi [keyi + 1, right]

		//注意只剩一个数或区间不存在则停止入栈
		if (keyi + 1 < right)
		{
			StackPush(&st,right);
			StackPush(&st,keyi + 1);
		}

		if (left < keyi - 1)
		{
			StackPush(&st, keyi - 1);
			StackPush(&st, left);
		}
	}

}
void PrintArray(int* a, int n)
{
	for (int i = 0; i < n; i++)
	{
		printf("%d ", a[i]);
	}
}
int main()
{
	int a[] = { 9,6,7,1,4,5,5,2,10,1,6,3,7 };
	QuicksortNonR(a, 0, sizeof a / sizeof(int) - 1);
	PrintArray(a, sizeof a / sizeof(int));
}


相关函数声明:

#pragma once
#include <stdio.h>
#include <stdbool.h>
#include <assert.h>
#include <stdlib.h>
typedef int DataType;
typedef struct Stack
{
	DataType* a;
	int top;
	int capacity;

}Stack;

//栈的初始化
void StackInit(Stack* pst);
//入栈
void StackPush(Stack* pst,DataType x);
//出栈
void StackPop(Stack* pst);
//栈的销毁
bool StackEmpty(Stack* pst);
//获取栈顶元素
DataType StackTop(Stack* pst);
//获取栈元素个数
int StackSize(Stack* pst);
//栈的销毁
void StackDestroy(Stack* pst);

相关函数实现:

#define  _CRT_SECURE_NO_WARNINGS 
#include "stack.h"
//栈的初始化
void StackInit(Stack* pst)
{
	assert(pst);
	pst->a = NULL;
	//pst->top = -1;//栈顶元素的位置
	pst->top = 0;//栈顶元素的下一个位置
	pst->capacity = 0;
}
//入栈
void StackPush(Stack* pst,DataType x)
{
	if (pst->top == pst->capacity)
	{
		int newCapacity = pst->capacity == 0 ? 4 : (pst->capacity) * 2;
		DataType* tmp = (DataType*)realloc(pst->a, sizeof(DataType) * newCapacity);
		if (tmp == NULL)
		{
			perror("realloc fail\n");
			return;
		}
		else
		{
			pst->a = tmp;
			pst->capacity = newCapacity;
		}
	}
	pst->a[pst->top++] = x;
}
//出栈
void StackPop(Stack* pst)
{
	assert(pst);
	pst->top--;
}
//判断栈是否为空
bool StackEmpty(Stack* pst)
{
	assert(pst);
	return pst->top == 0;
}
//获取栈顶元素
DataType StackTop(Stack* pst)
{
	return pst->a[pst->top - 1];
}
//获取栈元素个数
int StackSize(Stack* pst)
{
	return pst->top;
}
//栈的销毁
void StackDestroy(Stack* pst)
{
	assert(pst);
	free(pst->a);
	pst->a = NULL;
	pst->top = pst->capacity = 0;
}

总结

时间复杂度:O(N*logN)
空间复杂度:O(logN)
⚠️注意:尽管使用栈实现了递归过程,但栈的使用本质上是在模拟递归调用栈。这种方法可以避免递归深度过大导致栈溢出的问题,并且在一些情况下比递归版本更有效。

递归版本优化(三路划分)

1.缺陷问题:

下面给出一道力扣OJ题:👉传送链接:912.排序数组
题目要求就是给定一些数据,将乱序的数组排列为升序。我们用希尔排序、归并排序、堆排序……一般效率较高的都可以跑过,但是唯独快排用递归、非递归都不能跑过!就很离谱,因为快排有名,也就是这题故意针对快排,下面利用写出的递归版本的快排去跑这个OJ。

/**
 * Note: The returned array must be malloced, assume caller calls free().
 */

void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}
//三数取中
int GetMidIndax(int* a,int left, int right)
{
		int mid = left + (rand() % (right - left));

		if (a[mid] > a[left])
		{
			if (a[right] > a[mid])	return mid;
			else if (a[right] > a[left]) return right;
			else return left;
		}
		else //a[mid] < a[left]
		{
			if (a[right] < a[mid]) return mid;
			else if (a[right] < a[left]) return right;
			else return left;
		}

}

 //hoare版本
int Partition1(int* a, int left, int right)
{
	  int midi = GetMidIndax(a, left, right);
		Swap(&a[left],&a[midi]);
		int keyi = left;
		while (left < right)
		{
			//右边找小
			while (left < right && a[right] >= a[keyi])
			{
				right--;
			}

			//左边找大
			while (left < right && a[left] <= a[keyi])
			{
				left++;
			}

			Swap(&a[left], &a[right]);
		}
		Swap(&a[left], &a[keyi]);

	return left;
}
 //快排(递归版本)
void QuickSort(int* a, int begin, int end)
{
	if (begin >= end) return;

	int keyi = Partition1(a, begin, end);
 
	//前序遍历
	//递归基准值左边的区间
	QuickSort(a, begin, keyi - 1);
	//递归基准值右边的区间
	QuickSort(a, keyi + 1, end);
}

int* sortArray(int* nums, int numsSize, int* returnSize){
    QuickSort(nums, 0, numsSize - 1);
    *returnSize = numsSize;

    return nums;
}

我们发现这题一共21个测试用例,只通过了17个,显示超出时间限制,并且nums里出现了很多2,因为有大量重复元素样例不能通过,这样的基准值key一直是处于数组第一个位置,导致性能下降,出现了最坏的情况,时间复杂度为O(N2)
在这里插入图片描述

2.解决方案:

  • [----------------------------------------------------------------------------------------------------------------------------------------]
    在这里插入图片描述

基本思想:三路划分通过将数组划分为三个部分来解决这个问题:小于、等于和大于基准值的元素。

  • 用随机值三数取中法选择一个基准值key
  • 定义三个指针变量:leftcurrightleft的初始值为区间的起始位置,cur指针的初始值为left + 1right指针的初始值为区间的末尾位置。
  • 遍历数组,通过与基准值的比较将元素分成三部分:
    1. 如果当前元素小于key ,将它与left指针所指的位置交换,然后将left指针和cur指针都向右移动。
    2. 如果当前元素等于key ,将cur指针向右移动。
    3. 如果当前元素大于key ,将它与right指针所指的位置交换,然后将right指针向左移动。
  • left指针和right指针之间的区域(包含leftright)即为与key相等的所有元素,然后前序遍历,对left指针左边区域进行递归,right指针右边区域进行递归。
  • 最终,数组会被划分为三个区域:小于key区域 、等于key区域 和大于key区域。

3.代码参考

/**
 * Note: The returned array must be malloced, assume caller calls free().
 */
void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}
int GetMidIndax(int* a,int left, int right)
{
	int mid = left + (rand() % (right - left));
	if (a[mid] > a[left])
	{
		if (a[right] > a[mid])	return mid;
		else if (a[right] > a[left]) return right;
		else return left;
	}
	else //a[mid] < a[left]
	{
		if (a[right] < a[mid]) return mid;
		else if (a[right] < a[left]) return right;
		else return left;
	}

}
//三路分割 左 l r 右
void QuickSort(int* a, int begin, int end)
{
    
	if (begin >= end) return;

	int left = begin;
	int right = end;
	int cur = left + 1;

    int mid = GetMidIndax(a, begin, end);
    Swap(&a[mid],&a[left]);

	int key = a[left];

	while (cur <= right)
	{
		if (a[cur] < key)
		{
			Swap(&a[cur], &a[left]);
			left++;
			cur++;
		}
		else if (a[cur] > key)
		{
			Swap(&a[cur], &a[right]);
			right--;
		}
		else //a[cur] == key
		{
			cur++;
		}
	}

	// [begin left- 1],[left,right],[right + 1,end]
	QuickSort(a, begin, left - 1);
	QuickSort(a, right + 1, end);
}
 
int* sortArray(int* nums, int numsSize, int* returnSize){
    srand(time(NULL));
    QuickSort(nums, 0, numsSize - 1);
    *returnSize = numsSize;

    return nums;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/940983.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Self-Supervised Learning

Self-Supervised Learning Bert 的数据是 340M parameters 抽象解释&#x1f446; Bert 单个字的预测 把一个字盖住&#xff1a; 1、把一个字替换成特殊字符(MASK)。 2、替换成随机的一个字,进行训练。 next sentence prediction 通过变换两个连起来的句子的顺序&#x…

C. Battle 2023 (ICPC) Jiangxi Provincial Contest -- Official Contest

Problem - C - Codeforces 题目大意&#xff1a;有n堆石子&#xff0c;给出一个数p&#xff0c;A先B后&#xff0c;每个人每次只能取p的幂个石子&#xff08;包括1&#xff09;问A能不能赢 1<n<3e5;1<p<1e18 思路&#xff1a;先递归算出sg函数看看&#xff0c;s…

detour编译问题及导入visual studio

Detours是经过微软认证的一个开源Hook库&#xff0c;Detours在GitHub上&#xff0c;网址为 https://github.com/Microsoft/Detours 注意版本不一样的话也是会出问题的&#xff0c;因为我之前是vs2022的所以之前的detours.lib不能使用&#xff0c;必须用对应版本的x64 Native To…

线性代数的艺术

推荐一本日本网友Kenji Hiranabe写的《线性代数的艺术》。这本书是基于MIT大牛Gilbert Strang教授的《每个人的线性代数》制作的。 虽然《线性代数的艺术》这本书仅仅只有12页的内容&#xff0c;就把线性代数的重点全画完了&#xff0c;清晰明了。 《线性代数的艺术》PDF版本&…

C语言:指针类型的意义

1.指针的类型决定了解引用时访问几个字节 2.指针的类型决定了指针1、-1跳过几个字节 一、指针的类型决定指针解引用时访问几个字节 例如 int 型指针解引用时访问4个字节 char 型指针解引用时访问1个字节 详解代码如下&#xff1a; int b 0x11223344&#xff08;十六进制&…

通过这 5 项 ChatGPT 创新增强您的见解

为什么绝大多数的人还不会使用chatGPT来提高工作效能&#xff1f;根本原因就在还不会循序渐进的发问与chatGPT互动。本文总结了5个独特的chatGPT提示&#xff0c;可以帮助您更好地与Chat GPT进行交流&#xff0c;以获得更清晰的信息、额外的信息和见解。 澄清假设和限制 用5种提…

2023-8-28 n-皇后问题

题目链接&#xff1a;n-皇后问题 第一种搜索顺序 #include <iostream>using namespace std;const int N 20;int n; char g[N][N]; bool row[N], col[N], dg[N], udg[N];void dfs(int x, int y, int s) {if(y n) y 0, x ;if(x n){if(s n){for(int i 0; i < n;…

水源井监控系统整体解决方案

1.1、系统组成水源井远程监控系统主要由监控中心、通信平台、水源井测控终端、现场启动柜设备组成。系统整体结构按功能可划分为采集层、网络层和应用层等三层&#xff0c;水源井测控终端主要实现采集层的功能&#xff0c;数据传输链路主要实现网络层的功能&#xff0c;中心端管…

ModaHub魔搭社区:将图像数据添加至Milvus Cloud向量数据库中

将图像数据添加至向量数据库中 图像分割裁剪完成后,我们就可以将其添加至 Milvus Cloud 向量数据库中了。为了方便上手,本项目中使用了 Milvus Lite 版本,可以在 notebook 中运行 Milvus 实例。接下来,使用 PyMilvus 连接至 Milvus Lite 提供的默认服务器。 这一步骤中,…

python 单向循环(环形)链表

不带头结点的单向循环链表的示意图 循环链表的应用场景【约瑟夫问题】 现假设 n 5&#xff08;一共有 5 个人&#xff09;&#xff0c;k 1&#xff08;从第 1 个人开始报数&#xff09;&#xff0c; m 2&#xff08;数 2 下&#xff09;&#xff0c;则出队编号的序列为&…

文件上传漏洞之条件竞争

这里拿upload-labs的第18关做演示 首先先看代码 $is_upload false; $msg null;if(isset($_POST[submit])){$ext_arr array(jpg,png,gif);$file_name $_FILES[upload_file][name];$temp_file $_FILES[upload_file][tmp_name];$file_ext substr($file_name,strrpos($file_…

如何编译打包OpenSSH 9.4并实现批量升级

1 介绍 openssh 9.4版本已于8月10号发布&#xff0c;安全团队又催着要赶紧升级环境里的ssh版本&#xff0c;本文主要介绍Centos5、Centos6、Centos7下openssh 9.4源码编译rpm包以及批量升级服务器openssh版本的方法。关注公众号后台回复ssh可获取本文相关源码文件。 https://w…

正则的匹配原理以及优化原则

正则之所以能够处理复杂文本&#xff0c;就是因为采用了有穷状态自动机&#xff08;finite automaton&#xff09;。那什么是有穷自动机呢&#xff1f;有穷状态是指一个系统具有有穷个状态&#xff0c;不同的状态代表不同的意义。自动机是指系统可以根据相应的条件&#xff0c;…

朋友圈也可以定时定量发送?

场景1&#xff1a;明天要搞活动&#xff0c;早中晚都得发朋友圈&#xff0c;一天要发3次朋友圈&#xff0c;要在手机上定好3个闹钟&#xff0c;这是一件非常麻烦的事。 场景2&#xff1a;有朋友是房产信息的&#xff0c;每天要发布很多二手房源&#xff0c;手动发圈太耗时间&a…

Eziriz .NET Reactor crack,代码中调用许可系统

Eziriz .NET Reactor crack,代码中调用许可系统 .NET reactor被描述为软件许可程序以及在.NET和程序集框架中编写的应用程序的安全代码。它是非常强大的代码保护以及软件系统的许可。无论用户在为.NET的Microsoft框架编译程序的过程中执行什么&#xff0c;该程序都可以向用户提…

[MyBatis系列⑥]注解开发

&#x1f343;作者简介&#xff1a;准大三本科网络工程专业在读&#xff0c;持续学习Java&#xff0c;努力输出优质文章 ⭐MyBatis系列①&#xff1a;增删改查 ⭐MyBatis系列②&#xff1a;两种Dao开发方式 ⭐MyBatis系列③&#xff1a;动态SQL ⭐MyBatis系列④&#xff1a;核心…

全新版本QStack云管系统3.5.3 附详细安装教程

源码介绍&#xff1a; QStack云管系统3.5.3&#xff0c;全新版本下载安装包详细搭建教程。 涵盖了服务器、云主机、代理IP等多种云产品管理运维和安全存储。 同时&#xff0c;QStack还支持对接运营众多公有云厂商产品资源&#xff0c;满足不同用户的需求。 通过开放API和插…

(java)进程和线程的联系和区别

目录 进程 1.进程具有独立性 ———— 虚拟地址空间 线程 为什么要引入多个线程&#xff1f; 多线程注意点 ⁜⁜总结&#xff1a;线程和进程的区别和联系⁜⁜ 进程 1.进程具有独立性 首先介绍一下 ———— 虚拟地址空间 在这之前还要了解一下 —— “物理内存”…

接口自动化测试攻略,必看!

为什么要做接口自动化 相对于UI自动化而言&#xff0c;接口自动化具有更大的价值。 为了优化转化路径或者提升用户体验&#xff0c;APP/web界面的按钮控件和布局几乎每个版本都会发生一次变化&#xff0c;导致自动化的代码频繁变更&#xff0c;没有起到减少工作量的效果。 而…