【C/C++ 数据结构】-八大排序之 归并排序其它排序

news2024/11/15 18:00:25

作者:学Java的冬瓜
博客主页:☀冬瓜的主页🌙
专栏:【C/C++数据结构与算法】
分享:本王在此,狼狈为奸者,谋权篡位者,倒行逆施者,都得死! ——岐王李茂贞《画江湖之不良人》
主要内容:八大排序选择排序中的归并排序(递归+非递归)、计数排序。以及对排序的总结和稳定性的判断。

在这里插入图片描述
在这里插入图片描述

文章目录

  • 一、归并排序
    • 1. 思路
    • 2. 复杂度
    • 3. 代码
    • 4. 补充:归并非递归写法
  • 二、计数排序(非比较排序)
    • 1. 代码
    • 2. 理解
  • 三、基数排序(桶排序)
    • 思路
  • 四、排序总结
    • 1. 内部排序
    • 2. 稳定性

一、归并排序

1. 思路

  • 利用一个长度为n的数组,利用分治的原理,每次分两个区间,去递归;递归返回后就是左右两个区间已经有序。就把左右两个区间的数归并到新开的数组tmp中;最后再把tmp中的数拷贝回a数组。

例子:
在这里插入图片描述

2. 复杂度

  • 时间复杂度:O(NlogN),(非递归的时间复杂度也是O(NlogN))。每次分两组区间去递归,然后再合起来归并,共n个数,所以需要logn趟。每一趟需要遍历一遍,所以为O(NlogN)。
  • 空间复杂度:O(N),归并排序利用了长度为n的tmp数组,作为辅助空间。

3. 代码

// 归并排序
void _MergeSort(int* a, int left, int right, int* tmp)
{
	if (left >= right) { //表示递归到只有一个数了,就已经有序
		return;
	}

	// 1.递归,去让左右子区间有序
	int mid = (left + right) / 2;
	_MergeSort(a, left, mid, tmp);
	_MergeSort(a, mid + 1, right, tmp);

	// 2.左右区间有序,开始归并(将两组数归并到tmp数组中)
	int begin1 = left, end1 = mid;
	int begin2 = mid + 1, end2 = right;
	int index = left;
	while (begin1 <= end1 && begin2 <= end2) {
		if (a[begin1] <= a[begin2]) { // 这里是"<=",就是稳定的排序
			tmp[index++] = a[begin1++];
		}
		else {
			tmp[index++] = a[begin2++];
		}
	}
	while (begin1 <= end1) {
		tmp[index++] = a[begin1++];
	}
	while (begin2 <= end2) {
		tmp[index++] = a[begin2++];
	}

	// 3.拷贝回a数组
	for (int i = left; i <= right; i++) {
		a[i] = tmp[i];
	}
}
void MergeSort(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	_MergeSort(a, 0, n - 1, tmp);
	free(tmp);
}

4. 补充:归并非递归写法

代码如下:

// 归并排序
void MergeSortNonR(int* a, int n)
{
	int* temp = (int*)malloc(sizeof(int) * n);

	int gap = 1;
	while (gap < n) {
		int index = 0;  // 这个控制temp数组下标的变量,在for循环之外,否则永远是归并结果永远放在前一组
		for (int i = 0; i < n; i += 2 * gap) {
			// 【i,i+gap-1】【i+gap,i+2*gap-1】  这两组数归并,gap=1时,11归2;gap=2时,22归4;gap=4时,44归8
			int begin1 = i, end1 = i + gap - 1;
			int begin2 = i + gap, end2 = i + 2 * gap - 1;

			// 1. 左半区间不完整,或者右半区间没有数据了,比如10个数,11归2,最后一组没有右半区间。
			if (begin2 >= n) {
				break;
			}
			// 2. 当11个数,22归4时,最后一组右半区间不完整,需要修正再去归并,最后一组变成21归并。(可见例子)
			if (end2 >= n) {
				end2 = n - 1;
			}

			// 归并代码
			while (begin1 <= end1 && begin2 <= end2) {
				if (a[begin1] < a[begin2]) {
					temp[index++] = a[begin1++];
				}
				else {
					temp[index++] = a[begin2++];
				}
			}
			while (begin1 <= end1) {
				temp[index++] = a[begin1++];
			}
			while (begin2 <= end2) {
				temp[index++] = a[begin2++];
			}


			// 注意:把范围内的temp数组拷贝回a数组
			for (int j = i; j <= end2; j++) {  // end2是已经修正过的
				a[j] = temp[j];
			}
		}
		gap *= 2;
	}

	free(temp);
}
  • 如何理解归并非递归算法:
    在这里插入图片描述

现在,我们来了解几个可能会出错的地方:

  1. index = 0 要放在for循环之外,这个控制temp数组下标的变量,在for循环之外,否则index不会按顺序给temp数组归并赋值。

  2. 把temp拷贝到a数组,不能gap一趟完成后再拷贝(不能把temp拷贝回a数组放在for循环之外),而且要适当操作才不会数组越界,否则会出现以下问题:
    在这里插入图片描述

  3. 怎么解决越界问题?
    在这里插入图片描述

  4. 怎么解决,产生随机数的问题?
    在这里插入图片描述

  • 小结:怎么实现递归转非递归? 有两种思路:1> 循环 2>利用数据结构的栈或者队列
  • 那为什么快排用栈实现,而归并用循环实现呢?
    因为快排的形式和二叉树遍历的思路很像,利用栈可以轻松实现。而这里的归并,越界时边界end2的修正以及,直接break都需要控制边界,即使利用栈或队列也是需要控制边界的,而且使用栈或者队列还会有额外的空间开销。
  • 此外,归并排序又叫外排序,也就是说:归并排序处理可以内部排序(在主存中),它还可以外部排序(在磁盘上)
    举个例子:有一个8G的文件需要排序,而内存(也可称主存)只有1G的空间,该怎么实现排序?
    方法:首先,把8G内存切割成8个1G的文件,分别再把每个1G的文件读入到内存中,各自用快速排序,排序后每个1G的文件有序。此时内存只有1G,我们要继续让这八个1G的文件有序,可以知道,要想继续在内存中排序是不行了。这时,就用到了外部排序。就是把两个1G的文件在磁盘上进行归并排序(11归2),把归并结果写入另一个文件中(这一组11归2归并完后,这文件大小就是2G),然后重复操作22归4,44归8,不是2的倍数个文件,需要控制好边界。其实就和内部排序归并的思想一样,只是操作对象是文件而不是简单的数了。

二、计数排序(非比较排序)

1. 代码

// 计数排序
void CountSort(int* a, int n) 
{
	int max = a[0], min = a[0];
	for (int i = 1; i < n; i++) {
		if (max < a[i]) {
			max = a[i];
		}
		if (min > a[i]) {
			min = a[i];
		}
	}

	int range = max - min + 1;
	int* count = (int*)malloc(sizeof(int) * range); // 11 12 10 15 17 17
	memset(count, 0, sizeof(int) * range); // count是计算a[i]出现次数的,所以初始化为0

	// count数组统计a[i]出现次数
	for (int i = 0; i < n; i++) { // i控制a数组的下标,a[i]-min为count数组的下标,a[i]次数为count[a[i]-min]的值
		count[a[i] - min]++;
	}

	// 排序拷贝回a数组
	int index = 0;
	for (int i = 0; i < range; i++) {
		while (count[i]--) {
			a[index++] = i + min;
		}
	}
}

2. 理解

  • 思路:先统计,再按照统计范围,拷贝回原数组,利用映射(和哈希函数很相似)。
  • 第一部分:i控制a数组的下标,a[i]-min为count数组的下标,a[i]次数为count[a[i]-min]的值,举个例子:12 16 10 15 18 18 15计数排序。计算出max=18,min=10 => range=9。统计a中值的次数时,count[a[0]-10]++ => count[2]++,2是12的映射,其它统计同理。所以可以推出a[i]-min是a[i]的映射
  • 第二部分:把count数组大于1的值(count(i)表示i+min在a数组中出现的次数),映射回a数组。i代表count的下标,index代表a的下标,i+min是a[index]的映射
  • 那么为什么要用映射?最根本的原因就是为了节省空间。因为如果是10001, 10002 ,10001, 10008这种集中但是较大的数,如果不用映射,count数组前10000个空间都用不到,造成空间大量浪费。
  • 时间复杂度:O(N + range)
  • 在上面的思考中我们也可以发现,计数排序适合范围较小,即比较集中的数,否则空间浪费较大
    在这里插入图片描述

三、基数排序(桶排序)

思路

先按照一组数的个位排序,然后按照十位排序…,结果就是桶排序的结果。

四、排序总结

1. 内部排序

在这里插入图片描述
对于复杂度和代码以及排序的理解可以看该专题栏下其它博客:【数据结构与算法】

2. 稳定性

  • 首先,稳定性的定义是:排序前后,相同的值的数相对位置不变,比如说2 5 7 9 5在排序后,第二个5仍然在第5个5的前面。
  • 接下来我们谈谈这些排序为什么稳定,为什么不稳定。
    冒泡排序:可以在a[j] > a[j+1]才交换,即相等时不交换,人为控制稳定。
    插入排序冒泡排序归并排序都一样,在比较时,可以控制稳定。
  • 不稳定排序分析
    选择排序:5 7 5 8 2 6 5,找小,2和第一个5交换,那么第一个5和第二个5的相对位置就变了,即被动改变了相对位置。
    希尔排序:在预排序时,分为多组数,这多组数里相同的值在自己组的位置不一样,比如这个相同的数是8,在排序前第一组中8在第一个位置,而第二组8在后面的位置,但是8是第一组数的最大值,第二组数的最小值,排序后,相对位置就会改变。
    堆排序:大堆时,把根节点与n-1下标的数交换后,n-1下标的数和与n-1下标相等的数相对位置可能就会改变。
    快速排序:4 2 6 8 2,比如挖坑法,4为key时,右边找小,右边第一个2移动到4的位置,那么和左边第二个2的相对位置改变。
  • 那么稳定性的用处在哪里?举一个很简单的例子,比如上机考试,两个人的成绩一样,但是做题时间不同,那排名在前的一定是用时较短的那一个人。可以作为比较的另一个定性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/391538.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux 静态与动态编译、静态库与动态库

文章目录一、库的简介二、静态链接和动态链接1、静态链接2、动态链接3、GCC 下动态库与静态库三、静态库制作和使用四、动态库制作和使用总结一、库的简介 什么是库文件呢&#xff1f; 所谓库文件&#xff0c;大家可以将其等价为压缩包文件&#xff0c;该文件内部通常包含不止…

MyBatis源码分析(六)MetaObject工具类的使用与源码分析

文章目录一、MetaObject基本使用二、关键类源码分析1、MetaObject的构造方法2、PropertyTokenizer分词器3、BeanWrapper4、MetaClass5、DefaultReflectorFactory6、Reflector7、总结三、MetaObject的getValue源码分析写在后面一、MetaObject基本使用 public class User {priva…

OPT(奥普特)一键测量传感器SmartFlash高精度的四重保证

OPT&#xff08;奥普特&#xff09;一键测量传感器SmartFlash集成了机器视觉的边缘提取、自动匹配、自动对焦、自动学习及图像合成等人工智能技术&#xff0c;采用双远心光路及多角度照明系统设计&#xff0c;搭载高精度运动平台&#xff0c;并通过亚像素边缘提取算法处理图像&…

Mysql全解[中级篇]

目录存储引擎MySQL体系结构1). 连接层2). 服务层3). 引擎层4). 存储层存储引擎介绍存储引擎特点InnoDBMyISAMMemory文件区别及特点存储引擎选择索引无索引情况有索引情况特点索引结构二叉树红黑树B-TreeBTreeMySQL中优化之后的BTreeHash索引分类聚集索引&二级索引回表查询索…

双周赛99(贪心、数学、区间合并计算、换根DP)

文章目录双周赛99[6312. 最小和分割](https://leetcode.cn/problems/split-with-minimum-sum/)贪心[6311. 统计染色格子数](https://leetcode.cn/problems/count-total-number-of-colored-cells/)找规律[6313. 统计将重叠区间合并成组的方案数](https://leetcode.cn/problems/c…

规并排序(Swift版本)

Overview 概述 时间复杂度为 O(nlogn) ;适合大规模的数据排序 ;相比于冒泡排序、插入排序、选择排序这三种排序算法, 更加常用 ;用到了分治思想(即分而治之, 英文叫 “Divide and conquer”)&#xff0c;非常巧妙 ;英文名称: Merge Sort ; 分治思想, 在很多领域都有广泛的应用…

windows系统安装Linux虚拟机教程

虚拟机的安装首先要下载虚拟机的安装包&#xff0c;当前最新版本是VMware 16.2.1。软件我都已经给大家准备好了&#xff08;含序列号&#xff09;&#xff0c;大家在这里下载就好。虚拟机安装包下载完毕之后&#xff0c;将它安装到电脑里。这个安装过程很简单&#xff0c;一路下…

Linux操作系统学习(线程池)

文章目录线程池线程池原理代码示例单例模式饿汉模式懒汉模式饿汉懒汉对比其他的锁线程池 线程池原理 ​ 线程池是一种线程使用模式。在多线程应用中&#xff0c;若每有一个任务&#xff0c;线程就去调度相应的函数去创建&#xff0c;当任务过多时&#xff0c;每次都去调度且每…

CCF大数据专家委员会十周年纪念庆典纪实:拥抱数字时代,展望科技未来

山河远阔&#xff0c;奋进十年&#xff0c;作为国内大数据领域最权威的学术组织&#xff0c;CCF大数据专家委员会&#xff08;以下简称“大专委”&#xff09;不忘初心&#xff0c;凝心聚力&#xff0c;见证并推动了过去10年来大数据技术生态在中国的建立、发展和成熟。 2023年…

HBase安装

文章目录一、安装Zookeeper二、安装HBase三、启动Hbase步骤四、关闭进程顺序五、简单使用Hbase在开始安装HBase之前&#xff0c;请确保您已经安装了Java运行环境和Hadoop分布式文件系统。如果您还没有安装这些软件&#xff0c;请查看之前博文介绍安装。 HBase安装包&#xff1a…

谷歌广告投放步骤流程是什么?一文带你全方位了解实操细节

谷歌&#xff0c;大家都不陌生吧&#xff0c;一个人们很常用的搜索引擎。而谷歌还可以打广告&#xff0c;即谷歌广告&#xff0c;那这跟跨境电商有什么关心呢&#xff1f;东哥告诉大家&#xff0c;关系大了去了&#xff0c;毕竟如果用户搜索与我们相关的关键词&#xff0c;就有…

streaming systems 第二章

The What, Where, When, and How of Data Processing 第一章主要关注三个领域:术语&#xff0c;准确定义我使用重载术语时的意思&#xff0c;如“流”;批处理和流处理&#xff0c;比较两种类型系统的理论能力&#xff0c;并假设使流处理系统超越批处理系统只有两件事是必要的:…

【Netty】第一章 NIO 三大组件、ByteBuffer 和文件编程

【Netty】第一章 NIO 三大组件、ByteBuffer 和文件编程 文章目录【Netty】第一章 NIO 三大组件、ByteBuffer 和文件编程一、Channel & Buffer二、Selector三、ByteBuffer1.ByteBuffer 使用方式2.ByteBuffer 结构3.ByteBuffer 常用方法4.Scattering Reads4.Gathering Write5…

Java SPI机制了解与应用

1. 了解SPI机制 我们在平时学习和工作中总是会听到Java SPI机制&#xff0c;特别是使用第三方框架的时候&#xff0c;那么什么是SP机制呢&#xff1f;SPI 全称 Service Provider Interface&#xff0c;是 Java 提供的一套用来被第三方实现或者扩展的接口&#xff0c;它可以用来…

【java】Java连接mysql数据库及mysql驱动jar包下载和使用

文章目录JDBCJDBC本质&#xff1a;JDBC作用&#xff1a;跟数据库建立连接发送 SQL 语句返回处理结果操作流程和具体的连接步骤如下&#xff1a;操作步骤&#xff1a;需要导入驱动jar包 mysql-connector-java-8.0.22.jar注册驱动获取数据库连接对象 Connection定义sql获取执行sq…

第十届CCF大数据与计算智能大赛总决赛暨颁奖典礼在苏州吴江顺利举办

2月24日-25日&#xff0c;中国计算机学会&#xff08;CCF&#xff09;主办、苏州市吴江区人民政府支持&#xff0c;苏州市吴江区工信局、吴江区东太湖度假区管理办公室、苏州市吴江区科技局、CCF大数据专家委员会、CCF自然语言处理专业委员会、CCF高性能计算专业委员会、CCF计算…

深度剖析C语言符号篇

致前行的人&#xff1a; 人生像攀登一座山&#xff0c;而找寻出路&#xff0c;却是一种学习的过程&#xff0c;我们应当在这过程中&#xff0c;学习稳定冷静&#xff0c;学习如何从慌乱中找到生机。 目录 1.注释符号&#xff1a; 2.续接符和转义符&#xff1a; 3.回车与换行…

独立产品灵感周刊 DecoHack #050 - 基于 ChatGPT 的 API 能做什么产品

ChatGPT 的 API 3.5 开放过去了一周&#xff0c;果然和预想的一样&#xff0c;接入 API 的产品爆炸式地出现了非常多&#xff0c;很多产品已经做的非常好用了&#xff0c;在很多场景方便了太多。本期整理了一些做的很不错的产品。 本周刊记录有趣好玩的独立产品设计开发相关内容…

一款好的风险管理软件可以做什么

风险管理软件哪个好&#xff1f;使用Zoho Projects易于使用的项目风险管理软件&#xff0c;最大限度地减少收入损失并快速调整您的投资组合&#xff0c;保护您的项目投资。Zoho Projects的高级风险管理软件可在您最需要的时候安全的保护您的业务。使用Zoho Projects强大的风险管…

【springmvc】视图

SpringMVC的视图 SpringMVC中的视图是View接口&#xff0c;视图的作用渲染数据&#xff0c;将模型Model中的数据展示给用户 SpringMVC视图的种类很多&#xff0c;默认有转发视图和重定向视图 当工程引入jstl的依赖&#xff0c;转发视图会自动转换为JstlView 若使用的视图技…