[ 数据结构 -- 手撕排序算法第三篇 ] 希尔排序

news2024/9/24 9:27:19

文章目录

  • 前言
  • 一、常见的排序算法
  • 二、希尔排序
    • 2.1 希尔排序(缩小增量排序)
      • 2.1.1 预排序阶段
      • 2.1.2 插入排序阶段
    • 2.2 单趟希尔排序
      • 2.2.1 思路分析
  • 三、希尔排序实现代码
  • 四、希尔排序的时间复杂度
  • 五、希尔排序和直接插入排序效率测试
    • 5.1 测试
    • 5.2 结论
      • 5.2.1 随机数比较
      • 5.2.2 有序数组比较
  • 六、希尔排序特性总结


前言

手撕排序算法第三篇:希尔排序!
从本篇文章开始,我会介绍并分析常见的几种排序,例如像插入排序,冒泡排序,希尔排序,选择排序,快速排序,堆排序,归并排序等等!
这篇文章我先来给大家手撕一下希尔排序

大家可以点下面的链接去阅读其他的排序算法:
C语言手撕排序算法


正文开始!

一、常见的排序算法

在这里插入图片描述
直接插入排序是一种简单的插入排序法,其基本思想是:把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,知道所有的记录插入完为止,得到一个新的有序序列。
实际中我们玩扑克牌的时候,就用了插入排序的思想。

二、希尔排序

2.1 希尔排序(缩小增量排序)

希尔排序又称缩小增量法。希尔排序法的基本思想是:先选定一个整数gap,把待排序文件中所有记录分成个组,所有距离相差gap的记录分在同一组,并对每一组内的记录进行排序。然后去重复上述分组和排序的工作。当到达gap=1时,所有记录在统一组内排好序。

简要理解就是:

  1. 首先进行预排序,使其序列接近有序。
  2. 在进行直接插入排序。

预排序(分组排)就是让大的数更快的到后面,小的数更快的到前面,使其接近有序。

画图分析:

在这里插入图片描述

如果gap越小,就越接近有序。
gap越大的,打的数据可以更快的到后面,小的数可以更快的到前面去,但是它越不接近有序。

2.1.1 预排序阶段

  1. 在第一趟的时候取gap=5,那么{9,4},{1,8},{2,6},{5,3},{7,5}一共被分为了五组,在每一组内在进行插入排序,排完序之后的结果为{4,9},{1,8},{2,6},{3,5},{5,7};此时每组中较大的数就被交换到了后面,较小的数就被交换到了前面。
  2. 在第二趟的时候,我们取gap=gap/3+1(除以3是一个普遍的写法,+1的原因是因为gap如果小于3的话,gap/3会让gap=0,此时就会进入死循环的),这时gap为2,{4,2,5,8,5},{1,3,9,6,7}分成了两组,在每组内再进插入排序,让这一组有序。

2.1.2 插入排序阶段

当gap=1的时候,我们使用的就是插入排序,这时候经过之前的预排序,整个数组已经变得接近有序,较大的数字都会被移到后面,较小的数字都会被移到前面,这时使用插入排序的效率就会很高。

2.2 单趟希尔排序

2.2.1 思路分析

单趟希尔排序就是将差为gap的为一组,大的数字往后面放,小的数字往前面放。
在这里插入图片描述
具体插入排序的思想大家可以参考博文:[ 数据结构 – 手撕排序算法第一篇 ] 插入排序

int gap = 3;
	int end;
	int tmp = a[end + gap];
	while (end>=0)
	{
		if (tmp < a[end])
		{
			a[end + gap] = a[end];
			end -= gap;
		}
		else
		{
			break;
		}
	}
	a[end + gap] = tmp;

三、希尔排序实现代码

在单趟循环循环的基础下,加上一个大循环。

void ShellSort(int* a,int n)
{
	int gap = n;
	while (gap>1)
	{
		gap = gap / 3 + 1;
		for (int i = 0; i < n - gap; i++)
		{
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
				if (tmp < a[end])
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
				{
					break;
				}
			}
			a[end + gap] = tmp;
		}
	}
}
void TestShellSort()
{
	int a[] = { 6,3,1,4,2,5 };
	printf("排序前:");
	PrintArray(a, sizeof(a) / sizeof(a[0]));
	ShellSort(a, sizeof(a) / sizeof(a[0]));
	printf("排序后:");
	PrintArray(a, sizeof(a) / sizeof(a[0]));
}
int main()
{
	TestShellSort();
	return 0;
}

在这里插入图片描述

四、希尔排序的时间复杂度

希尔排序的时间复杂度不好计算,因为gap的取值方法有很多,导致很难去计算,因此有许多书籍给出的希尔排序的时间复杂度都不固定。

但是我们可以将希尔排序的时间复杂度相比之间插入排序进行比较,在最坏的情况下也是逆序排顺序。假设有N个数字,直接插入排序的时间复杂度为O(n^2)。
但是如果使用希尔排序此事进行分组时,对每个组进行排序,在最后gap=1的时候时间复杂度可以认为是O(n),所以结合起来希尔排序的时间复杂度是大于O(n)小于O(n^2).

但是希尔排序也是存在缺陷的,这种情况就是原数组本身有序,那么直接插入排序的时间复杂度为O(n),而使用希尔排序在gap>1的时候进行预排序其实是没有作用的,但是计算机不知道,因此还会做一边预排序,当gap=1的时候在直接插入排序。因此时间复杂度是大于O(n)。但是这毕竟是少数情况,大多数排序都是随机数组或者逆序排顺序。

以下是两本书中对希尔排序时间复杂度的描述:

因为我们的gap是按照Knuth提出的方式取值的,而且Knuth进行了大量的实验统计,我们暂时就按照
在这里插入图片描述来计算。

《数据结构(C语言版)》— 严蔚敏
在这里插入图片描述《数据结构-用面相对象方法与C++描述》— 殷人昆

在这里插入图片描述

五、希尔排序和直接插入排序效率测试

为了更好的比较希尔排序和直接插入排序的效率,我们可以生成一组随机数进行比较查看他们所消耗的时间。

5.1 测试

我们创建一个数组,数组的元素个数有100000个,让其数字全部随机生成,我们通过希尔排序和直接插入排序分别对这个数组进行排序。观察他们所消耗的时间。

//时间对比
void TestOP()
{
	srand(time(0));
	const int N = 100000;
	int* a1 = (int*)malloc(sizeof(int) * N);
	int* a2 = (int*)malloc(sizeof(int) * N);

	for (int i = 0; i < N; ++i)
	{
		a1[i] = rand();
		a2[i] = a1[i];
	}

	int begin1 = clock();
	InsertSort(a1, N);
	int end1 = clock();

	int begin2 = clock();
	ShellSort(a2, N);
	int end2 = clock();


	printf("InsertSort:%d\n", end1 - begin1);
	printf("ShellSort:%d\n", end2 - begin2);

	free(a1);
	free(a2);
}

int main()
{
	TestOP();
	return 0;
}

5.2 结论

5.2.1 随机数比较

在这里插入图片描述
由程序的运行结果我们可以看出对十万的无序数组进行排序的时间,希尔排序要优于直接插入排序很多。

我们也可以改变数组大小再测试测试。

在这里插入图片描述
数据量越大,希尔排序的效率就明显越高。

5.2.2 有序数组比较

在这里插入图片描述
正如我们所分析的那样,当数组本身有序时,希尔排序的预排序阶段就会不起作用,此时希尔排序的效率不及直接插入排序。

六、希尔排序特性总结

  1. 希尔排序是对直接插入排序的优化
  2. 当gap>1时是预排序,目的是让数组更接近于有序。当gap==1时,数组已经接近有序了,这样就会很快。这样对于整体而言,可以达到优化的效果。我们实现后也进行了性能的比较。
  3. 希尔排序的时间复杂度不好计算,因为gap的取值方法有很多,导致很难去计算,因此在很多书中给出希尔排序的时间复杂度是不固定的。
  4. 稳定性:不稳定。

(本篇完!)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/98221.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【二维码识别】灰度+二值化+校正二维码生成与识别【含GUI Matlab源码 635期】

⛄一、二维码生成与识别简介 如今,移动互联网技术日新月异,随着5G时代的来临,广泛应用于数据处理过程中的二维码信息安全日益成为人们越来越关注的问题。以QR码为代表的二维码,以其在信息存储、传输和识别技术领域优异的表现,成为信息共享、移动支付等领域的宠儿。不可避免地,…

利用深度学习生成数据的时间序列预测(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f468;‍&#x1f4bb;4 Matlab代码 &#x1f4a5;1 概述 数据分析研究目前仍是行业热点,相关学者从数据分析关键技术中的异常检测、入侵检测、时间序列预测等角度展开研究。然而,现有研…

Go环境搭建与IDE开发工具配置

安装Go语言编译器 Go语言编译器》编译器将源代码编译为可执行程序》源代码程序员使用高级语言所书写的代码文件》高级语言c/c/go…》机器语言0和1构成&#xff0c;机器能直接识别》汇编语言比机器语言稍微可读一点点的指令集 编译器下载地址 根据系统下载对应的go编译器版本…

微信小程序保存相册授权全过程:第一次授权、已授权、拒绝后再授权

微信小程序部分功能需要使用授权&#xff08;也就是需要用户显式同意&#xff0c;系统会阻止开发者任何静默获取授权行为&#xff09;&#xff0c;以存储相册为例&#xff0c;用户需要获得"scope.writePhotosAlbum"权限 微信系统接口wx.getSetting可以获取已经获得的…

MySQL连接数据库

①MySQLpymysql ②django开发操作数据库&#xff0c;orm框架 安装第三方模块&#xff1a;orm pip install mysqlclient ORM Django链接数据库 在settings.py中修改 查看创建的数据库的端口号和用户名&#xff1a; Django操作表&#xff1a; 创建表 models.py from django…

[附源码]Python计算机毕业设计Django新冠疫苗接种预约系统

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

PDF怎么插入页?将页面添加到 PDF 文档的 3 种简单方法

得益于现代技术&#xff0c;我们现在可以轻松地合并、创建、编辑 PDF 并执行更多操作。使用专业的PDF程序在PDF文档中插入一页问题不大。这篇文章将介绍如何使用 奇客PDF编辑 和其他四个桌面和在线程序向 PDF 添加页面。 如何使用桌面程序将页面添加到 PDF 毫无疑问&#…

Simulink基础【2】- PID控制器

Simulink基础【2】- PID控制器1. Simulink作用回顾1.1 模块化1.2 常用模块1.2.1 输入信号源模块库&#xff08;Sources&#xff09;1.2.2 接收模块库&#xff08;Sinks&#xff09;1.2.3 系统模块1.2.4 数学运算模块1.3 界面布局与使用1.4 自定义模块2. PID算法仿真2.1 PID算法…

配置pytorch环境

一、安装cuda cudnn 1.下载cuda ,根据上一步安装pytorch的cuda版本对应&#xff0c;我的是cuda11.6 安装无脑下一步就可以了。 2.1下载cuDNN cuDNN 其实就是 CUDA 的一个补丁而已&#xff0c;专为深度学习运算进行优化的 2.2 配置cuDNN 解压压缩包&#xff0c;将文件夹里bin、…

Echarts中常用的参数总结以及参数自定义示例

&#x1f431;个人主页&#xff1a;不叫猫先生 &#x1f64b;‍♂️作者简介&#xff1a;前端领域新星创作者、华为云享专家、阿里云专家博主&#xff0c;专注于前端各领域技术&#xff0c;共同学习共同进步&#xff0c;一起加油呀&#xff01; &#x1f4ab;系列专栏&#xff…

Springboot之Actuator的渗透测试和漏洞修复

Actuator 的 REST 接口 Actuator监控分成两类&#xff1a;原生端点和用户自定义端点&#xff1b;自定义端点主要是指扩展性&#xff0c;用户可以根据自己的实际应用&#xff0c;定义一些比较关心的指标&#xff0c;在运行期进行监控。 原生端点是在应用程序里提供众多 Web 接口…

返回字典中的键值对dict.items()

【小白从小学Python、C、Java】 【计算机等级考试500强双证书】 【Python-数据分析】 返回字典中的键值对 dict.items() [太阳]选择题 对下面描述错误的选项为&#xff1f; myDic {"A":1, "B":2} print("【显示】myDic",myDic) print("【显…

安全智能分析技术 模型自动化调优

安全分析模型自动化调优 MLOps&#xff08;Machine Learning Operations&#xff09;是一种人工智能 的工程实践&#xff0c;是面向机器学习项目的研发运营管理体系 。旨在实现 ML 管道的操作、ML 模型的部署和管理标准化&#xff0c;支持ML 模型的发布、激活、监控、性能跟踪…

【有料c++题目周刊 | 第三期】复兴时代

文章目录第一题&#xff1a;最佳圆柱体直径题目描述输入格式输出格式输入样例输出样例解题思路&C题解第二题&#xff1a;贪心国王题目描述输入格式输出格式数据范围输入样例输出样例解题思路&C题解第一题&#xff1a;最佳圆柱体直径 题目描述 在复兴时期&#xff0c;…

DevOps实战系列【第十二章】:详解Shared Libraries共享库

个人亲自录制全套DevOps系列实战教程 &#xff1a;手把手教你玩转DevOps全栈技术 随着jenkins pipeline项目越来越多&#xff0c;冗余代码也越来越多&#xff0c;所以share library诞生。 流水线支持在外部仓库中创建【共享库】&#xff0c;然后加载到现有流水线中使用&#xf…

XXL-Job分布式任务调度框架-- 集群HA的配置3

一 xxl-job集群概述 1.1 xxl-job集群HA的作用 为了避免单点故障&#xff0c;任务调度系统通常需要通过集群实现系统高可用 由于任务调度系统的特殊性&#xff0c;“调度”和“任务”两个模块需要均支持集群部署&#xff0c;由于职责不同&#xff0c;因此各自集群侧重点也有…

AcWing第82场周赛

目录 1.第k个数 2. 多米诺骨牌 3.构造序列 1.第k个数 题目描述 给定一个长度为n的整数序列&#xff0c;a1,a2,...,an,以及一个整数k&#xff0c;请你计算该数列从大到小排序后的第k个数。 输入格式 第一行包含两个整数n&#xff0c;k 第二行n个整数 输出格式 输出一个数&…

Sqoop安装教程

Sqoop安装教程 文章目录Sqoop安装教程一、资料二、安装&#xff08;一&#xff09;上传文件&#xff08;二&#xff09;解压文件&#xff0c;并重命名(三)修改配置文件1、进入到/opt/module/sqoop/conf中2、修改配置文件&#xff08;1&#xff09;将sqoop环境的模板文件&#x…

【M2 VMware Ubuntu】全流程安装指南

这里写自定义目录标题VMware Fusion安装M2 VMware Ubuntu 安装安装桌面环境安装 Open VM 工具禁用 Wayland更新 5.14 内核&#xff08;非必要不要更新&#xff09;VMware Fusion安装 这里就不再阐述如何安装啦&#xff01;当然这也不是本文关注重点&#xff01; M2 VMware Ub…

VB写dll以及调用的具体实例

目录 一.dll的简介 二.VB6中的dll 1.常见的调用的方法: 2.通过vb6写dll&#xff1a; 3.dll的调用 三.出现的一些问题: 一.dll的简介 1.dll被称为动态链接库,是一个可由多个程序或其他dll调用用的代码和的库&#xff0c;使用dll可以让程序可以更加模块化&#xff0c;避免重…