1.排序的概念
排序:所谓排序,就是使⼀串记录,按照其中的某个或某些关键字的⼤⼩,递增或递减的排列起来的 操作。
1.1排序分类
2.排序算法实现
2.1插入排序
直接插⼊排序是⼀种简单的插⼊排序法,其基本思想是:把待排序的记录按其关键码值的⼤⼩逐个插 ⼊到⼀个已经排好序的有序序列 中,直到所有的记录插⼊完为⽌,得到⼀个新的有序序列 。
实际中我们玩扑克牌时,就⽤了插⼊排序的思想
2.1.1直接插入排序
当插⼊第 i(i>=1) 个元素时,前⾯的 array[0],array[1],…,array[i-1] 已经排好序,此时 ⽤ array[i] 的排序码与 array[i-1],array[i-2],… 的排序码顺序进⾏⽐较,找到插⼊位置 即将 array[i] 插⼊,原来位置上的元素顺序后移
void insertsort(int* arr, int n)
{
int i = 0;
int end;
int tmp;
for (i = 1; i < n; i++)
{
end = i - 1;
tmp = arr[i];
while (end >= 0)
{
if (arr[end] >= tmp)
{
arr[end + 1] = arr[end];
--end;
}
else
{
break;
}
}
arr[end + 1] = tmp;
}
}
特点总结:
1. 元素集合越接近有序,直接插⼊排序算法的时间效率越⾼
2. 时间复杂度:O(N^2)
3. 空间复杂度:O(1)
2.1.2希尔排序
希尔排序法⼜称缩⼩增量法。希尔排序法的基本思想是:先选定⼀个整数(通常是gap = n/3+1或n/2),把 待排序⽂件所有记录分成各组,所有的距离相等的记录分在同⼀组内,并对每⼀组内的记录进⾏排 序,然后gap=gap/3+1得到下⼀个整数,再将数组分成各组,进⾏插⼊排序,当gap=1时,就相当于 直接插⼊排序。 它是在直接插⼊排序算法的基础上进⾏改进⽽来的,综合来说它的效率肯定是要⾼于直接插⼊排序算 法的。
void ShellSort(int* a, int n)
{
int gap = n;
while (gap > 1)
{
//推荐写法:除3
gap = gap / 3 + 1;
for (int i = 0; i < n - gap; i++)
{
int end = i;
int tmp = a[end + gap];
while (end >= 0)
{
if (a[end] > tmp)
{
a[end + gap] = a[end];
end -= gap;
}
else
{
break;
}
}
a[end + gap] = tmp;
}
}
}
希尔排序的时间复杂度估算:
外层循环: 外层循环的时间复杂度可以直接给出为: O(log2 n) 或者 O(log3 n) ,即 O(log n) 内层循环:
假设⼀共有n个数据,合计gap组,则每组为n/gap个;在每组中,插⼊移动的次数最坏的情况下为 1 + 2 + 3 + .... + ( gap − ,⼀共是gap组,因此: n 1)) 总计最坏情况下移动总数为: gap ∗ [1 + 2 + 3 + .... + ( − gap n 1)] gap取值有(以除3为例):n/3 n/9 n/27 ...... 2 1
• 当gap为n/3时,移动总数为: ∗ 3 n (1 + 2) = n
• 当gap为n/9时,移动总数为: ∗ 9 n (1 + 2 + 3 + .... + 8) = ∗ 9 n = 2 8(1 + 8) 4n
• 最后⼀躺,gap=1即直接插⼊排序,内层循环排序消耗为n 通过以上的分析,可以画出这样的曲线图: 因此,希尔排序在最初和最后的排序的次数都为n,即前⼀阶段排序次数是逐渐上升的状态,当到达 某⼀顶点时,排序次数逐渐下降⾄n,⽽该顶点的计算暂时⽆法给出具体的计算过程 希尔排序时间复杂度不好计算,因为 gap 的取值很多,导致很难去计算,因此很多书中给出的希尔排 序的时间复杂度都不固定。《数据结构(C语⾔版)》--- 严蔚敏书中给出的时间复杂度为:
2.2选择排序
2.2.1直接选择排序
选择排序的基本思想: 每⼀次从待排序的数据元素中选出最⼩(或最⼤)的⼀个元素,存放在序列的起始位置,直到全部待 排序的数据元素排完 。
1. 在元素集合 array[i]--array[n-1] 中选择关键码最⼤(⼩)的数据元素
2. 若它不是这组元素中的最后⼀个(第⼀个)元素,则将它与这组元素中的最后⼀个(第⼀个)元素 交换
3. 在剩余的 array[i]--array[n-2](array[i+1]--array[n-1]) 集合中,重复上述步 骤,直到集合剩余 1 个元素
void sellectsort(int* arr, int n)
{
int begin = 0;
int end = n - 1;
while (begin < end)
{
int min = begin;
int max = begin;
for (int i = begin; i <= end; i++)
{
if (arr[i] > arr[max])
max = i;
if (arr[i] < arr[min])
min = i;
}
if (begin==max)
max= min;
swap(&arr[min], &arr[begin]);
swap(&arr[max], &arr[end]);
begin++;
end--;
}
}
特点总结
1. 直接选择排序思考⾮常好理解,但是效率不是很好。实际中很少使⽤
2. 时间复杂度: O(N ) 2
3. 空间复杂度: O(1)
2.2.2堆排序
堆排序(Heapsort)是指利⽤堆积树(堆)这种数据结构所设计的⼀种排序算法,它是选择排序的⼀ 种。它是通过堆来进⾏选择数据。需要注意的是排升序要建⼤堆,排降序建⼩堆。 在⼆叉树章节我们已经实现过堆排序,可移步至重生之“我打数据结构,真的假的?”--5.堆(无习题)-CSDN博客
2.3交换排序
2.3.1冒泡排序
前⾯在算法题中我们已经接触过冒泡排序的思路了,冒泡排序是⼀种最基础的交换排序。之所以叫做 冒泡排序,因为每⼀个元素都可以像⼩⽓泡⼀样,根据⾃⾝⼤⼩⼀点⼀点向数组的⼀侧移动。
void bubblesort(int* arr, int n) //冒泡排序
{
bool exchange = false;
for (int i = 0; i < n; i++)
{
for (int j = 0; j < n - i; j++)
{
if (arr[j - 1] > arr[j])
{
int tmp = arr[j];
arr[j] = arr[j - 1];
arr[j - 1] = tmp;
exchange = true;
}
}
if (exchange == false) //如果第一遍没排序,证明原数组有序,不用继续了
{
break;
}
}
}
• 时间复杂度: O(N ) 2
• 空间复杂度: O(1)
2.3.2 快速排序
快速排序是Hoare于1962年提出的⼀种⼆叉树结构的交换排序⽅法,其基本思想为:任取待排序元素 序列中的某元素作为基准值,按照该排序码将待排序集合分割成两⼦序列,左⼦序列中所有元素均⼩ 于基准值,右⼦序列中所有元素均⼤于基准值,然后最左右⼦序列重复该过程,直到所有元素都排列 在相应位置上为⽌。
int partsort(int* arr, int left, int right)
{
int key = left;
while (left < right)
{
while (left < right && arr[right] >= arr[key])
right--;
while (left < right && arr[left] <= arr[key])
left++;
swap(&arr[left], &arr[right]);
}
swap(&arr[left], &arr[key]);
return left;
}
void quicksort(int* arr, int begin, int end)
{
if (begin >= end)
return;
int key = partsort(arr, begin, end);
quicksort(arr, begin, key - 1);
quicksort(arr, key+1, end);
}
快速排序特性总结:
1. 时间复杂度: O(nlogn)
2. 空间复杂度: O(logn)
2.4 归并排序
归并排序(MERGE-SORT)是建⽴在归并操作上的⼀种有效的排序算法,该算法是采⽤分治法(Divide and Conquer)的⼀个⾮常典型的应⽤。将已有序的⼦序列合并,得到完全有序的序列;即先使每个 ⼦序列有序,再使⼦序列段间有序。若将两个有序表合并成⼀个有序表,称为⼆路归并。 归并排序核 ⼼步骤:
void _mergesort(int* arr, int begin, int end, int* brr)
{
if (begin != end)
{
int mid = (begin + end) / 2;
int begin1 = begin;
int begin2 = mid + 1;
int end1 = mid;
int end2 = end;
_mergesort(arr, begin1, end1, brr);
_mergesort(arr, begin2, end2, brr);
int i = begin;
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] < arr[begin2])
{
brr[i++] = arr[begin1++];
}
else
{
brr[i++] = arr[begin2++];
}
}
while(begin1<=end1)
brr[i++] = arr[begin1++];
while (begin2 <= end2)
brr[i++] = arr[begin2++];
memcpy(arr+begin, brr+begin, sizeof(int) * (end - begin + 1)); //用于整数数组间的元素传递,第三个参数为要传的元素个数,需要<string.h>头文件
}
else
return;
}
void mergesort(int* arr, int n)
{
int* brr = (int*)malloc(sizeof(int) * n);
int begin = 0;
int end = n - 1;
_mergesort(arr, begin, end, brr);
}
归并排序特性总结:
1. 时间复杂度: O(nlogn)
2. 空间复杂度: O(n)
3. 排序算法复杂度及稳定性分析
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的 相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,⽽在排序后的序列中,r[i]仍在r[j]之 前,则称这种排序算法是稳定的;否则称为不稳定的。