目录
概述
思路
核心概念:增量d
算法过程
流程
Code
优化方案
区间增量优化
Code(pro)
复杂度
概述
我们在「数组」冒泡排序|选择排序|插入排序 / 及优化方案(C++)中讲解了插入排序。
它有这么两个特点:
①待排序元素较少时效率高。
②待排序元素较有序时效率高。
正如同快速排序时冒泡排序的究极promax进化版,希尔排序则是充分利用了这两个特点的插入排序promax进化版。
思路
战略是这样的:多次进行小数目的插入排序使得数组变得相对有序。
我们要采取一点策略:
通过多轮小型插入排序使得数组逐渐有序,然后就可以将小型插入排序变成中型插入排序。通过多轮中型插入排序使得数组几乎有序,然后就可以将小型插入排序变成整体插入排序。
通过一轮整体插入排序使得数组完全有序。
这个“小型的插入排序”的目的是使得数组逐渐有序,这意味这我们要在整个数组中挑选几个数出来,对他们进行插入排序。
这种挑选是很有讲究的:
我们挑选的数必须能均等地位于整个数组的不同位置中,这样才能使整个数组愈发有序。
我们挑选的数必须能覆盖整个数组,这样才能使整个数组整体愈发有序。
于是就有了增量的概念。
核心概念:增量d
增量d的本质就是对整个数组进行间隔分组:
我们将arr[i],arr[i+d],arr[i+2d]...分为一组,在组内进行插入排序。
完成一组后再完成下一组,直到所有组都进行了组内插入排序。之后减小增量d重新分组,重复上述过程,直到d=1,进行完整的插入排序。
通常我们初始化d=len/2,然后依次d/=2。(向下取整)
例如:
len=11;
arr[i] 7 1 8 9 5 6 4 2 3 10 0
↓d=len/2;
┌--------------------------------------------┐
d=5;
i 0 1 2 3 4 5 6 7 8 9 10
arr[i] 7 1 8 9 5 6 4 2 3 10 0
↓d↓
group0 7----d----6 0
group1 1----d----4
group2 8----d----2
group3 9----d----3
group4 5----d----10
↓insertion_sort()↓
group0 0 6 7
group1 1 4
group2 2 8
group3 3 9
group4 5 10
↓after sorted↓
arr[i] 0 1 2 3 5 6 4 8 9 10 7
└--------------------------------------------┘
↓d/=2;
┌--------------------------------------------┐
d=2;
i 0 1 2 3 4 5 6 7 8 9 10
arr[i] 0 1 2 3 5 6 4 8 9 10 7
↓d↓
group0 0-d-2 5 4 9 7
group1 1-d-3 6 8 10
↓insertion_sort()↓
group0 0 2 4 5 7 9
group1 1 3 6 8 10
↓after sorted↓
arr[i] 0 1 2 3 4 6 5 8 7 10 9
└--------------------------------------------┘
↓d/=2;
┌--------------------------------------------┐
d=1;
i 0 1 2 3 4 5 6 7 8 9 10
arr[i] 0 1 2 3 4 6 5 8 7 10 9
↓insertion_sort()↓
arr[i] 0 1 2 3 4 5 6 7 8 9 10
└--------------------------------------------┘
我们注意到,d的值和分组数量是相等的:
因为arr[i]与arr[i+d]为同组,而arr[i+d]与arr[i]间共有d-1组各不相同,再加上arr[i]这一组,共d组。
这一点将会在分组代码实现时利用到。
*注意*:分组图只是我们的具象化表达,希尔排序是原地算法,不会使用额外的空间储存每一组。
算法过程
流程
共有四层循环:
①最外层循环(增量减半缩小层)while (d/=2)控制增量减半
②次外层循环(按照增量分组层)for (int group = 0; group < d; group++)进行分组
③次内层循环for (int i = group+d; i < len; i += d)进行组内插入排序(根据插入排序的原理,首个元素可以跳过)
④最内层循环for ( j= i-d; j >= 0; j -= d)将组内的元素插入到组内的有序区中。
你会发现内部的两层循环就是普通插入排序的是实现,只不过普通插入排序的增量d始终为1。
Code
void shell_sort(int arr[], int len) {
int d = len;
while (d /= 2) {
for (int group = 0; group < d; group++) {
for (int i = group+d; i < len; i += d) {
int temp = arr[i], j = i - d;
for (; j >= 0; j -= d) {
if (temp < arr[j])arr[j + d] = arr[j];
else break;
}
arr[j + d] = temp;
}
}
}
}
优化方案
区间增量优化
Knuth大神提出了另一种增量策略:d=d/3+1。(+1是为了使得d==2时下次取到d==1)
你会意识到上一种分组的增量减半缩小层是log₂N级别的,而这种则是log₃N级别的。
但是这种优化不一定是最理想的,其实与上一种分组各有胜负:
因为这只是优化了增量减半缩小层,而每层内部进行了更多的比较。
Code(pro)
void SLsort(int arr[], int len) {
int d = len;
while (d = d/3+1) {
for (int group = 0; group < d; group++) {
for (int i = group + d; i < len; i += d) {
int temp = arr[i], j = i - d;
for (; j >= 0; j -= d) {
if (temp < arr[j])arr[j + d] = arr[j];
else break;
}
arr[j + d] = temp;
}
}
if (d == 1)break;
}
}
*注意*: 需要加入d==1的判断语句来结束最外层循环。
复杂度
时间复杂度:O(n¹·³)(或:O(nlog²n))
空间复杂度:O(1)
事实上,希尔排序的时间复杂度不是nlogn,它的证明极其困难,略去不表。
百万数量级抗压测试
int main()
{ int nums = 5000000;
int* arr1 = new int[nums];
int* arr2 = new int[nums];
for (int i = 0; i < nums; i++) {
int x = mt()%1000;
arr1[i] =arr2[i]= x;
}
DWORD tick1 = GetTickCount64();
shell_sort(arr1, nums);//show(arr, nums);
DWORD tick2 = GetTickCount64();
cout <<"Shell's strategy(ms):" << tick2 - tick1 << endl;
DWORD tick3 = GetTickCount64();
SLsort(arr2, nums);//show(arr, nums);
DWORD tick4 = GetTickCount64();
cout <<"Knuth's strategy(ms):" << tick4 - tick3 << endl;
delete[] arr1;
delete[] arr2;
return 0;
}