1.前言
插入排序是把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。实际中我们玩扑克牌时,就用了插入排序的思想。
本章重点:主要着重的介绍两种插入排序的方式--直接插入排序和希尔排序
2.直接插入排序
抓扑克牌思想:当抓了第一张的时候,因为手里没有牌,所以无需插入,直接放在手里。当抓第二张的时候,就要与手里最末尾的那张进行比较,判断大小,如果末尾大于抓上来的牌,那么就依次向前比较,直到找到第一个比刚抓上来的值小的数为止。
直接插入排序思想:借助了抓扑克牌思想的例子,直接插入排序是手里已经有一堆乱序的值,然后这些值需要用到抓扑克牌的思想来把它们进行排序。
void Insert(int * arr,int n)
{
//1.先确定要比较多少次能够把这些数变成有序的,n-1次
for(int i=0;i<n-1;i++)
{
int end=i;
int tmp=arr[end+1];
while(end>=0)
{
if(arr[end]>tmp)
{
arr[end+1]=arr[end];
end--;
}
else break;
}
arr[end+1]=tmp;
}
}
把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。
演示动画如下:
直接插入排序特性总结:
1.当一串数越有序时,直接插入排序的效率越高
2.时间复杂度为:O(N)~O(N^2)
3.空间复杂度为:O(1)
4.稳定性:稳定
3.希尔排序
基本思路:
希尔排序是直接插入排序的优化版本:由于直接插入排序对顺序有序或接近有序的序列排序效率很高。所以希尔排序先通过多次分组预排序使序列接近有序,最后再进行直接插入排序≈O(N),以此来提高效率。
多次分组预排序:就是将序列进行间隔分组,对同一组内的元素进行直接插入排序,并不断缩小分组间距。
如何分组:
1.通过增量gap对序列进行分组控制,gap是组内元素之间的间距,同时也是组数。
2.gap初始化为n; 每次分组预排gap = gap/3+1;除3是进过多次试验得出的最佳缩小系数,加1是为了避免跳过最后一次直接插入排序。
直到gap==1进行最后一次直接插入排序使序列顺序有序。
示例如下:
代码如下:
以升序为例
void ShellSort(int *arr, int n){
assert(arr != NULL);
//写法一(便于理解):排完一组再排下一组
int gap = n;
while (gap > 1)
{
//多次分组预排序,分组数量每次减少,直到1组排完。
gap = gap / 3 + 1;//加1,防止跳过gap == 1
//每次排序的起点
for (int i = 0; i < gap; i++)
{
//单组单组的进行排序--每组间隔gap
//同直接插入排序。j < n - gap,保证最后一个待排记录不会越界。
for (int j = i; j < n - gap; j+=gap)
{
int end = j;
int x = arr[end + gap];
while (end >= i)
{
if (x < arr[end])
{
arr[end + gap] = arr[end];
end -= gap;
}
else
{
break;
}
}
//找到插入位置后,end还会减一次,所以+gap
arr[end + gap] = x;
}
}
}
//写法二(简洁):gap组数据交替插入排序
int gap = n;
while (gap > 1)
{
gap = gap / 3 + 1;
for (int i = 0; i < n - gap; i++)
{
int end = i;
int x = arr[end + gap];
while (end >= 0)
{
if (x < arr[end])
{
arr[end + gap] = arr[end];
end -= gap;
}
else
{
break;
}
}
arr[end + gap] = x;
}
}
}
动画演示如下:
希尔排序的时间复杂度分析:
gap越大,预排越快,预排后越不接近有序。(大数字会很快移动到后面);gap越小,预排越慢,预排后越接近有序。开始时gap较大:组内元素数量较少,因此即便是最坏情况时间复杂度都大约为:O(N);
同时由于分组间隔较大,大数字会很快移动到数列后面,使数列逐渐接近有序;gap逐渐变小直到1:组内元素数量增多,但由于数列逐渐接近有序,因此时间复杂度也大约为:O(N)
分组预排序的时间复杂度:
最好:N/gap*gap —> O(N)(每组大约N/gap个元素)
最坏:(1+2+3+…+N/gap)*gap; (gap越大,越接近N最坏情况越接近O(N))
希尔排序的时间复杂度:
gap = gap/2;
理想情况下,大约为N*log2 N(进行lon2 N次预排,每次复杂度接近O(N))
gap = gap/3+1;
理想情况下,大约为N*log3 N
gap由大变小,开始时由于gap很大,时间复杂度都大约为O(N)。多次预排序使得数组越来越接近有序。虽然gap变小了,每次排序的复杂度也都大约为O(N)。
注意:O(nlogn)是理想情况下的复杂度,而实际上在足够大的输入规模下,它的运行时间将超过具有时间复杂度 nlogn 的算法。多次实验得出希尔排序的时间复杂度平均大约为O(N^1.3),做到了对直接插入排序的优化。
希尔排序的特性总结:
希尔排序是对直接插入排序的优化。当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时是直接插入排序,数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。
时间复杂度:O(N^1.3) (或NlogN) ~ O(N^2)(逆序)
空间复杂度:O(1)
稳定性:不稳定,相等的关键字可能会被划分到不同的组进行预排序