八大排序算法之归并排序(递归实现+非递归实现)

news2025/1/12 16:01:50

目录

一.归并排序的基本思想

归并排序算法思想(排升序为例)

二.两个有序子序列(同一个数组中)的归并(排升序)

两个有序序列归并操作代码:

三.归并排序的递归实现

递归归并排序的实现:(后序遍历递归)

递归函数抽象分析: 

四.非递归归并排序的实现

1.非递归归并排序算法思想:

2.算法实现

初步非递归归并排序函数:

一般情况下(所排序数组元素个数不为​编辑)边界条件分析:

经过边界修正后的非递归归并排序函数

排序实测:


一.归并排序的基本思想

  • 归并排序是基于分治思想和归并操作而设计出来的一种高效排序算法
  • 所谓的归并操作就是将两个有序的子序列合并为一个有序序列的操作(归并操作算法时间复杂度O(N+M),N+M分别为两个子数组的元素个数)

归并排序算法思想(排升序为例)

  1. 假设数组有N个元素,先将数组不断地二分,直到将数组划分为N个由单个元素构成的子数组,整个划分过程中所有子数组构成满二叉树(或接近满二叉树)的逻辑结构,如图:
  2. 数组划分完后再逐层向上将二叉树兄弟结点子数组(具有相同前驱结构)两两进行归并操作完成排序:
  3. 归并操作算法时间复杂度O(M1+M2),M1+M2分别为两个子数组的元素个数,因此二叉树一层子数组两两归并操作总时间复杂度为O(N)(N表示原数组的元素个数),而满二叉树层次数量级O(logN),因此归并排序的总体时间复杂度为O(NlogN)
  4. 由于归并排序的数组划分每次都是严格地二分,因此每次排序(无论具体面对怎样的序列)子数组划分结构都是稳定的满二叉树(或接近满二叉树)结构,因此归并排序的时间复杂度各种情况下都不会有变化(不会像快排,希尔排那样由于所处理的序列的逆序数的差异而导致算法时间复杂度有所变化)
  5. 然而由于有序序列归并操作需要额外开辟数组来完成,因此归并排序有较大的空间消耗,这是归并排序的一个缺陷

二.两个有序子序列(同一个数组中)的归并(排升序)

函数首部:

void MergeSort(int* arr,int* tem, int left,int right)

arr是被分割的原数组,tem是用于归并操作的临时数组,left是arr的左端下标,right是arr的右端下标

  • 假设数组arr被二等分为两个子序列(两个子序列都是有序的):
  • 接下来我们将上图中的[left,(left+right)/2)和[(left+right)/2),right)两个子序列(有序)合并到一个tem数组中构成一个新的有序序列(利用三指针操作完成归并):
  • 从算法gif中不难看出,归并操作的时间复杂度两个子数组的元素个数线性关系

两个有序序列归并操作代码:

void MergeSort(int* arr,int* tem, int left,int right)
{
	int mid = left + (right - left) / 2;			//找到数组[left,right]的中间分割点

	int ptr1 = left;								//ptr1指向左子数组的首元素
	int ptr2 = mid;									//ptr2指向右子数组的首元素
	int ptrtem = left;                              //ptrtem用于在tem数组中尾插数据
	while (ptr1 < mid && ptr2 < right)				//ptr1和ptr2其中一个遍历完子数组就停止循环
	{
		//将较小元素尾插进tem数组中
		if (arr[ptr1] > arr[ptr2])
		{
			tem[ptrtem] = arr[ptr2];
			++ptrtem;
			++ptr2;
		}
		else
		{
			tem[ptrtem] = arr[ptr1];
			++ptrtem;
			++ptr1;
		}
	}
	//将未被遍历完的子数组剩下的元素尾插到tem数组中
	while (ptr1 < mid)
	{
		tem[ptrtem] = arr[ptr1];
		++ptrtem;
		++ptr1;
	}
	while (ptr2 < right)
	{
		tem[ptrtem] = arr[ptr2];
		++ptrtem;
		++ptr2;
	}
	
	//将归并好的有序序列拷贝到原数组arr上
	for (int i = left; i < right; ++i)
	{
		arr[i] = tem[i];
	}
}

三.归并排序的递归实现

递归函数首部:

void MergeSort(int* arr,int* tem, int left,int right)

arr是被分割的原数组,tem是用于归并操作的临时数组,left是arr的子数组左端下标,right是arr的子数组右端下标

  • 在进行子数组两两归并之前,我们先要进行数组的二分分治:
  • 我们可以通过分治递归完成数组的整个二分过程(每个子数组的区间端点下标都被存储在递归函数的各函数栈帧中):(数组二分的递归框架)
    void MergeSort(int* arr, int* tem, int left, int right)
    {
    	if (right <= left+1)                  //当子数组只剩一个元素时停止划分
    	{
    		return;
    	}
    	int mid = left + (right - left) / 2;
    	MergeSort(arr, tem, left, mid);      //划分出的左子数组
    	MergeSort(arr, tem, mid, right);     //划分出的右子数组
    
    	//左右子数组都有序后完成左右子数组的归并
    }
  • 观察递归图解,有序序列两两归并的过程只能发生在上图中的第7,第13,第14,第21,第27,第28,第29步骤中,因此整个排序过程满足分治递归的后序遍历逻辑

递归归并排序的实现:(后序遍历递归)

  • 左右子数组(有序)归并的代码段位于函数中两个递归语句之后
void MergeSort(int* arr, int* tem, int left, int right)
{
	if (right <= left+1)                  //当子数组只剩一个元素时停止划分
	{
		return;
	}
	int mid = left + (right - left) / 2;
	MergeSort(arr, tem, left, mid);      //划分出的左子数组
	MergeSort(arr, tem, mid, right);     //划分出的右子数组
    
    
    //后序遍历,归并过程发生在两个递归语句之后
	//左右子数组都有序后完成左右子数组的归并
	int ptr1 = left;								//ptr1指向左子数组的首元素
	int ptr2 = mid;									//ptr2指向右子数组的首元素
	int ptrtem = left;                              //ptrtem用于在tem数组中尾插数据
	while (ptr1 < mid && ptr2 < right)				//ptr1和ptr2其中一个遍历完子数组就停止循环
	{
		//将较小元素尾插进tem数组中
		if (arr[ptr1] > arr[ptr2])
		{
			tem[ptrtem] = arr[ptr2];
			++ptrtem;
			++ptr2;
		}
		else
		{
			tem[ptrtem] = arr[ptr1];
			++ptrtem;
			++ptr1;
		}
	}
	//将未被遍历完的子数组剩下的元素尾插到tem数组中
	while (ptr1 < mid)
	{
		tem[ptrtem] = arr[ptr1];
		++ptrtem;
		++ptr1;
	}
	while (ptr2 < right)
	{
		tem[ptrtem] = arr[ptr2];
		++ptrtem;
		++ptr2;
	}

	//将归并好的有序序列拷贝到原数组arr(相应下标位置)
	for (int i = left; i < right; ++i)
	{
		arr[i] = tem[i];
	}
}
  • 注意细节: 

递归函数抽象分析: 

  • 递归函数MergeSort(arr,tem,left,right)可以抽象为:借助tem数组完成arr数组[left,right)区间序列的排序过程
  • 于是可以抽象出递推公式:MergeSort(arr,tem,left,right) = MergeSort(arr,tem,left,left + (right - left) / 2) + MergeSort(arr,tem,left + (right - left) / 2,right) +{子数组[left,left + (right - left) / 2))和子数组[left + (right - left) / 2,right)的有序合并}
  • 递归公式的含义是:完成arr数组[left,right)区间序列排序的过程可以拆分为如下三个步骤:
  1. 先完成左子区间[left,left + (right - left) / 2)的排序
  2. 再完成右子区间[left + (right - left) / 2,right)的排序
  3. 最后将左右子区间进行归并完成[left,right)区间序列的排序
  • 将MergeSort函数进行一下简单的封装供外界调用:
    void _MergeSort(int* arr, int size)
    {
    	assert(arr);
    	int* tem = (int*)malloc(sizeof(int) * size);
    	assert(tem);
    	MergeSort(arr, tem, 0, size);
        free(tem);
    }
    
  • arr是待排序数组,size是数组的元素个数,MergeSort是归并排序递归函数

四.非递归归并排序的实现

1.非递归归并排序算法思想:

  • 归并排序过程中数组逐步被二分的图示:
  • 归并排序的递归实现通过后序遍历逻辑来完成各个子数组的两两归并的操作: 
  • 然而我们也可以利用类似于层序遍历的逻辑实现子数组两两归并的过程:

从最高层子数组开始进行兄弟子数组的两两归并,完成了一层子数组的归并再继续完成前一层子数组的归并直到最后完成原数组的排序,我们可以通过循环来实现这个过程

2.算法实现

  • 非递归归并排序函数首部:
    void MergeSortNonR(int* arr, int size)

    arr代表待排序的数组,size为待排序数组的元素个数

  • 先假设所处理的数组元素个数:N=2^{n}(即数组刚好能被完全二分n次)
  • gap作为二叉树结构某层次子数组的元素个数:gap初值为1(最深层子数组元素个数为1),随后gap以gap=2*gap的方式递增,用gap来控制排序函数最外层循环:
    	for (int gap = 1; gap < size; gap *= 2)   //完成logN个层次的子数组的归并
    	{
    
    	}

    循环能进行log(size)次,对于每个gap值完成一个层次的子数组的两两归并:

  • 再使用一个变量i来遍历每一个gap情形下各个进行归并的序列组(每个序列组两个子数组构成):

     

    	for (int gap = 1; gap < size; gap *= 2)      //完成logN个层次的子数组的归并
    	{
    		for (int i = 0; i < size; i += 2 * gap)  //i每次跳过一个归并序列组(每个序列组有两个子数组)
    		{
    			//对子数组[i,i+gap)和子数组[i+gap,i+2*gap)进行归并操作
    		}
    	}

     图解:

  • 初步非递归归并排序函数:

    void MergeSortNonR(int* arr, int size)
    {
    	assert(arr);
    	int* tem = (int*)malloc(sizeof(int) * size); //tem数组用于完成归并操作
    	assert(tem);
    
    	
    
    	for (int gap = 1; gap < size; gap *= 2)      //完成logN个层次的子数组的归并
    	{
    		int indextem = 0;						 //用于将数据归并到tem数组中的下标变量
    		for (int i = 0; i < size; i += 2 * gap)  //i每次跳过一个归并序列组(每个序列组有两个子数组)
    		{
    			//对子数组[i,i+gap)和子数组[i+gap,i+2*gap)进行归并操作
    			int begin1 = i;                      //begin1和end1维护一个子数组
    			int end1 = i + gap; 
    			int begin2 = i + gap;				 //begin2和end2维护一个子数组
    			int end2 = i + 2 * gap;
    
    			while (begin1 < end1 && begin2 < end2)
    			{
    				if (arr[begin1] < arr[begin2])
    				{
    					tem[indextem] = arr[begin1];
    					++indextem;
    					++begin1;
    				}
    				else
    				{
    					tem[indextem] = arr[begin2];
    					++indextem;
    					++begin2;
    				}
    			}
    			//将子数组[i, i + gap)或子数组[i + gap, i + 2 * gap)中未完成归并的元素完成归并
    			while (begin1 < end1)
    			{
    				tem[indextem] = arr[begin1];
    				++indextem;
    				++begin1;
    			}
    			while (begin2 < end2)
    			{
    				tem[indextem] = arr[begin2];
    				++indextem;
    				++begin2;
    			}
    
    			//将完成归并的一组序列从tem数组中拷贝回arr数组中对应下标处
    			for (int j = i; j < end2; ++j)
    			{
    				arr[j] = tem[j];
    			}
    		}
    	}
    
        free(tem);
    }
  • 两个子数组的归并操作见前面的章节; 

  • 初步非递归归并排序函数只能处理元素个数为2^{n}(即数组刚好能被完全二分n次)的数组

  • 想要使排序函数能够处理任意元素个数的数组,我们就必须进行算法边界条件分析边界修正

一般情况下(所排序数组元素个数不为2^{n})边界条件分析:

  • 待排序数组的元素个数为size
  • 函数中只有下标end1,begin2,end2存在越界的可能(函数中begin1和end1,begin2和end2分别用于维护两个在数组arr中待归并的相邻子数组)
  • 所处理的数组元素个数不为2^{n}时,可能会出现下图中两种下标越界情况

  1. end1(end1==begin2)越界(end1>size)(此时end2一定也越界)此时可以直接break终止i控制的循环(end1>size说明arr数组按照gap划分后尾部待归并区间数量只有一个,无须进行归并操作)
  2. end2越界(end2>size)(end1没越界即(end1<size))

    此时要将end2修正为size,后续便可以完成arr数组(按照gap划分后)尾部剩余的两个子数组的归并操作:

经过边界修正后的非递归归并排序函数

void MergeSortNonR(int* arr, int size)
{
	assert(arr);
	int* tem = (int*)malloc(sizeof(int) * size); //tem数组用于完成归并操作
	assert(tem);

	

	for (int gap = 1; gap < size; gap *= 2)      //完成logN个层次的子数组的归并
	{
		int indextem = 0;						 //用于将数据归并到tem数组中的下标变量
		for (int i = 0; i < size; i += 2 * gap)  //i每次跳过一个归并序列组
		{
			//对子数组[i,i+gap)和子数组[i+gap,i+2*gap)进行归并操作
			int begin1 = i;                      //begin1和end1维护一个子数组
			int end1 = i + gap; 
			int begin2 = i + gap;				 //begin2和end2维护一个子数组
			int end2 = i + 2 * gap;

			//进行边界修正防止越界,并且保证归并排序能完整进行
			if (end1 > size)
			{
				break;                           //arr数组按照gap划分后尾部待归并区间数量只有一个,无须进行归并操作
			}
			if (end2 > size)
			{
				end2 = size;                     //修正end2边界,以完成arr数组尾部剩余的两个子数组的归并操作
			}
			
			while (begin1 < end1 && begin2 < end2)
			{
				if (arr[begin1] < arr[begin2])
				{
					tem[indextem] = arr[begin1];
					++indextem;
					++begin1;
				}
				else
				{
					tem[indextem] = arr[begin2];
					++indextem;
					++begin2;
				}
			}
			//将子数组[i, i + gap)或子数组[i + gap, i + 2 * gap)中未完成归并的元素完成归并
			while (begin1 < end1)
			{
				tem[indextem] = arr[begin1];
				++indextem;
				++begin1;
			}
			while (begin2 < end2)
			{
				tem[indextem] = arr[begin2];
				++indextem;
				++begin2;
			}

			//将完成归并的一组序列从tem数组中拷贝回arr数组中对应下标处
			for (int j = i; j < end2; ++j)
			{
				arr[j] = tem[j];
			}
		}
	}
	free(tem);
}

排序实测:

int main()
{
    //排序100万个数据
    srand(time(0));
	const int N = 1000000;
	int* a1 = (int*)malloc(sizeof(int) * N);
	for (int i = 0; i < N; ++i)
	{
		a1[i] = rand();
	}

	int begin = clock();
	MergeSortNonR(a1,N);
	int end = clock();
	printf("MergeSortNonR:%d\n", end - begin);
	JudgeSort(a1, N); //判断序列是否有序的函数
	free(a1);
}

  • 非递归归并排序递归归并排序算法思想上没有任何区别(只是子数组归并的顺序不同而已) 两者的时间复杂度都是O(NlogN),空间复杂度都是O(N)(算法中需要开辟额外的数组tem来完成子序列两两归并操作),但是递归归并排序有额外的系统栈开销.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/643607.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C:\Users\BC>conda -V ‘conda‘ 不是内部或外部命令,也不是可运行的程序 或批处理文件。

C:\Users\BC>conda -V ‘conda’ 不是内部或外部命令&#xff0c;也不是可运行的程序 或批处理文件。 注意&#xff01;&#xff1a;Anaconda安装路径和Scripts路径&#xff0c;两个都添加进去Path 解释&#xff1a;将 Anaconda 安装路径和 Scripts 路径都添加到系统的 PA…

css属性计算过程

CSS 属性计算过程 你是否了解 CSS 的属性计算过程呢&#xff1f; 有的同学可能会讲&#xff0c;CSS属性我倒是知道&#xff0c;例如&#xff1a; p{color : red; }上面的 CSS 代码中&#xff0c;p 是元素选择器&#xff0c;color 就是其中的一个 CSS 属性。 但是要说 CSS 属…

丢失d3dcompiler47.dll怎么办,这个五个修复方法都可以解决

打开游戏或者软件的时候&#xff0c;电脑提示由于找不到d3dcompiler_47.dll&#xff0c;无法继续执行此代码怎么办&#xff0c;其实修复起来不难。首先需要先知道怎么是dll文件&#xff0c;dll文件可以简单的把库文件看成一种代码仓库&#xff0c;它提供给使用者一些可以直接拿…

【学习笔记】Spring Cloud

1、Spring Cloud简介&#xff1a; 成熟的微服务框架&#xff0c;定位为开发人员提供工具&#xff0c;以快速构建分布式系统 2、Spring Cloud核心组件 服务注册中心&#xff1a;Spring Cloud Netflix Eureka&#xff0c;会启动一个Eureka Serve&#xff0c;把其他的组件作为E…

Git分布式版本控制系统

Githttps://git-scm.com/ 1. Git简介 Git是一个开源的分布式版本控制系统&#xff0c;可以有效、高速地处理从很小到非常大的项目版本管理。分布式相比于集中式的最大区别在于开发者可以提交到本地&#xff0c;每个开发者通过克隆&#xff08;git clone&#xff09;&#xff…

梳理Retrofit的知识体系

作者&#xff1a;RainyJiang 在学习Retrofit后&#xff0c;由于它本身就是OKHttp的封装&#xff0c;面试中也经常会被一起问到&#xff1b;单纯的解析它的源码学习难免会有点无从下手&#xff0c;往往让人抓不住重点&#xff0c;学习效率并不是很高&#xff0c;本文从提出几个问…

我的创作纪念日 2048 AI 面试 Java GoLang

《突击面试》 《面试1v1》 机缘 提示&#xff1a;可以和大家分享最初成为创作者的初心 例如&#xff1a; 实战项目中的经验分享日常学习过程中的记录通过文章进行技术交流… 收获 提示&#xff1a;在创作的过程中都有哪些收获 例如&#xff1a; 获得了多少粉丝的关注获得…

VMware Workstation 11 安装教程

哈喽&#xff0c;大家好。今天一起学习的是VMware Workstation 11的安装&#xff0c;vm虚拟机是小编非常喜欢的生产力软件&#xff0c;小编之前发布的测试教程钧在vm上进行的实验。 VMware Workstation是一款功能强大的桌面虚拟计算机软件&#xff0c;它能够让用户在宿主机操作…

轻松搞定邮件营销!这些工具可以助你提升转化率

据可靠数据统计&#xff0c;邮件营销得投资回报比达1&#xff1a;44&#xff0c;他高性价比的特性在众多营销方式中脱颖而出。他促使企业能够以较低的成本&#xff0c;和客户建立联系并维持长期联系。邮件营销对企业来讲无疑是极佳的获客渠道和营销方式。 想要做好邮件营销通常…

【Java基础学习打卡04】计算机操作系统

目录 引言一、操作系统基本概念二、Windows操作系统三、进程与线程1.进程2.线程 四、CPU与内存总结 引言 了解操作系统基本概念&#xff0c;熟悉Windows操作系统&#xff0c;理解进程与线程概念&#xff0c;并知晓CPU与内存如何工作。 一、操作系统基本概念 计算机操作系统&a…

使用Scala集成开发环境

一、搭建Scala的IntelliJ IDEA开发环境 &#xff08;一&#xff09;启动IDEA &#xff08;二&#xff09;安装Scala插件 启动IDEA&#xff0c;在欢迎界面中选择Configure→Plugins命令 在上方的搜索框中搜索scala关键字 单击绿色的【Install】按钮&#xff0c;安装完毕&am…

Ubuntu20.04 + 3090 安装nvidia驱动,附加解决重启黑屏卡在 /dev/***: clean, **files,***blocks的问题

目录 准备禁用nouveau解决黑屏问题并安装驱动参考 准备 首先需要知道当前电脑/服务器的显卡型号&#xff0c;这个自行查找自己电脑配置 查找显卡对应的驱动版本 通过命令ubuntu-drivers devices查看当前设备所支持的驱动&#xff0c;带有recommended的驱动为推荐安装的版本 不…

【K8S 从0到1实战】Kubernetes一主多从部署实战指南

目录 前言前置准备安装虚拟机关闭防火墙禁用 SELinux关闭 Swap 分区时区设置和时间同步主机名和域名解析配置转发 IPv4 并让 iptables 看到桥接流量 Docker 安装cri-docker 安装Kubernetes 部署配置 Kubernetes 镜像源Kubernetes 组件安装Master 节点初始化Node 节点加入集群…

基于Ti_AWR2243级联板的发射端波束形成(相控阵)的实践

说明 Ti的级联板功能十分强大&#xff0c;用这块板子做TDM(时分)的发射以及TDM发射模式下的数据处理可能更为大家所熟知&#xff0c;但其实因为AWR2243芯片在每个发射链路上有6bit的移相器&#xff0c;再加上板子上有9个发射天线是排布在同一个水平线上的&#xff0c;所以也可以…

万物的算法日记|第二天

笔者自述&#xff1a; 一直有一个声音也一直能听到身边的大佬经常说&#xff0c;要把算法学习搞好&#xff0c;一定要重视平时的算法学习&#xff0c;虽然每天也在学算法&#xff0c;但是感觉自己一直在假装努力表面功夫骗了自己&#xff0c;没有规划好自己的算法学习和总结&am…

JavaSE进阶——玩转IO流

文章目录 前言一、File类介绍1、概念引入2、实际应用2.1 操作文件2.2 操作文件夹 二、IO流介绍三、字符流1、读文件1.1 一次读一个1.2 一次读多个&#xff0c;使用char数组去装 2、写文件2.1 一次写一个2.2 一次写完&#xff0c;使用字符数组 3、文件复制3.1 综合应用3.2 使用缓…

论文解读:ExamPle:用于预测植物小分泌肽的可解释的深度学习框架

ExamPle: explainable deep learning framework for the prediction of plant small secreted peptides 期刊&#xff1a;Bioinformatics 影响因子&#xff1a;6.931 中科院分区&#xff1a;小类数学与计算生物2区 出版日期&#xff1a;2023年3月10日 Github:https://gith…

Seata客户端的启动过程 学习记录

Seata客户端的启动过程 1.自动装配4个配置类 将在SpringBoot启动时往容器中添加4个类 1. 自动配置类 SeataAutoConfiguration SeataAutoConfiguration将会往容器中添加两个bean failureHandler 事务处理失败执行器globalTransactionScanner failureHandler failureHandle…

03 表达关系的术语

文章目录 表达关系的术语关联关联的语义表达(6点) 泛化细化(也称为实现)依赖例题 UML 基本关系的一般用法① 模型化简单依赖②模型化单继承③模型化结构关系例题 表达关系的术语 关联 定义&#xff1a;关联是类目之间的结构关系&#xff0c;描述了一组具有相同结构、相同语义…

【MySQL数据库一】MySQL数据库初体验

MySQL数据库初体验 1.数据库基本概念1.1 数据Data1.2 表1.3 数据库1.4 数据库管理系统1.5 数据库系统 2.数据库的发展3.主流的数据库介绍3.1 SQL Server&#xff08;微软公司产品&#xff09;3.2 Oracle &#xff08;甲骨文公司产品&#xff09;3.3 DB2&#xff08;IBM公司产品…