🔑🔑博客主页:阿客不是客
🍓🍓系列专栏:渐入佳境之数据结构与算法
欢迎来到泊舟小课堂
😘博客制作不易欢迎各位👍点赞+⭐收藏+➕关注
一、插入排序
步骤:
- 从第一个元素开始,该元素可以认为已经被排序
- 取下一个元素tem,从已排序的元素序列从后往前扫描
- 如果该元素大于tem,则将该元素移到下一位
- 重复步骤3,直到找到已排序元素中小于等于tem的元素
- tem插入到该元素的后面,如果已排序所有元素都大于tem,则将tem插入到下标为0的位置
- 重复步骤2~5
动态展示过程如下:
思路:
- 在待排序的元素中,假设前n-1个元素已有序,现将第n个元素插入到前面已经排好的序列中,使得前n个元素有序。按照此法对所有元素进行插入,直到整个序列有序。
- 但我们并不能确定待排元素中究竟哪一部分是有序的,所以我们一开始只能认为第一个元素是有序的,依次将其后面的元素插入到这个有序序列中来,直到整个序列有序为止。
代码实现如下:
void InsertSort(int* a, int n)
{
for (int i = 0; i < n - 1; i++)
{
int end = i;
//数组在[0, end]是有序的
while (end >= 0)
{
if (a[end + 1] < a[end])//升序
{
Swap(&a[end], &a[end + 1]);
end--;
}
else
break;
}
}
}
时间复杂度:最坏情况下为O(N*N),此时待排序列为逆序,或者说接近逆序
最好情况下为O(N),此时待排序列为升序,或者说接近升序。
空间复杂度:O(1)
二、希尔排序
步骤:
- 先选定一个小于N的整数gap作为分组数量,然后将所有距离为gap的元素分在同一组,并对每一组的元素进行直接插入排序。然后再取一个比第一增量小的整数作为第二增量,重复上述操作…一般我们选择每次分组数量为上次的1/3。
- 当分组的数量(gap)减到1时,就相当于整个序列被分到一组,进行一次直接插入排序,排序完成。
动态展示过程如下:
分解战术如下(颜色相同为一组):
思路:希尔排序,先将待排序列进行预排序,使待排序列接近有序,然后再对该序列进行一次插入排序,此时插入排序的时间复杂度为O(N),
代码实现如下:
void ShellSort(int* a, int n)
{
int gap = n;
while (gap > 1)
{
gap = gap / 3 + 1;//最后一次为1(大于1时为预排序,等于1为插入排序)
for (int i = 0; i < n - gap; i++)//插入排序变式(分成gap组,每组插入排序)
{
int end = i;
while (end >= 0)
{
if (a[end + gap] < a[end])//升序
{
Swap(&a[end], &a[end + gap]);
end -= gap;
}
else
break;
}
}
}
}
时间复杂度平均:O(N^1.3)
空间复杂度:O(1)
三、选择排序
思路:
每次从待排序列中选出一个最小值,然后放在序列的起始位置,直到全部待排数据排完即可。
实际上,我们可以一趟选出两个值,一个最大值一个最小值,然后将其放在序列开头和末尾,这样可以使选择排序的效率快一倍。
动态展示过程如下:
代码实现如下:
void SelectSort(int* a, int n)
{
int begin = 0, end = n - 1;
while (begin < end)
{
int min = begin, max = end;
for (int i = begin; i < end; i++)
{
if (a[i] < a[min])
min = i;
if (a[i] > a[max])
max = i;
}
if (min == end)
{
Swap(&a[begin], &a[min]);
Swap(&a[end], &a[max]);
}
else
{
Swap(&a[end], &a[max]);
Swap(&a[begin], &a[min]);
}
begin++, end--;
}
}
时间复杂度:最坏情况:O(N^2)
最好情况:O(N^2)
空间复杂度:O(1)
四、堆排序
在前面的堆与二叉树章节讲过,在此就不再赘述。
void AdjustDown(int* a, int n, int root)
{
int child = root * 2 + 1;
while (child < n)
{
if (child + 1 < n && a[child] < a[child + 1])//建大堆
{
child++;
}
if (a[root] < a[child])//建大堆
{
Swap(&a[child], &a[root]);
root = child;
child = root * 2 + 1;
}
else
{
break;
}
}
}
void HeapSort(int* a, int n)
{
for (int i = ((n - 1) - 1) / 2; i >= 0; i--)
{
AdjustDown(a, n, i);
}
for (int i = 1; i < n; i++)
{
Swap(&a[0], &a[n - i]);
AdjustDown(a, n - i, 0);
}
}
五、冒泡排序
void BubbleSort(int* a, int n)
{
for (int i = 0; i < n; i++)
{
int flag = 0;
for (int j = 1; j < n - i; j++)
{
if (a[j - 1] > a[j])
{
Swap(&a[j], &a[j - 1]);
flag = 1;
}
}
if (flag == 0)
break;
}
}
六、快速排序
快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序元素序列中的任一元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。
将区间按照基准值划分为左右两半部分的常见方式有:
6.1 hoare版本
- 思路:
- 选出一个key,一般是最左边或是最右边的。
- 定义一个begin和一个end,begin从左向右走,end从右向左走。(需要注意的是:若选择最左边的数据作为key,则需要end先走;若选择最右边的数据作为key,则需要bengin先走)。
- 在走的过程中,若end遇到小于key的数,则停下,begin开始走,直到begin遇到一个大于key的数时,将begin和right的内容交换,end再次开始走,如此进行下去,直到begin和end最终相遇,此时将相遇点的内容与key交换即可。(选取最左边的值作为key)
- 此时key的左边都是小于key的数,key的右边都是大于key的数
- 将key的左序列和右序列再次进行这种单趟排序,如此反复操作下去,直到左右序列只有一个数据,或是左右序列不存在时,便停止操作,此时此部分已有序。
单趟动图展示如下:
【补】快速排序的优化:
法1:三数取中法选基准值key(三数取中)
法2:递归到小的子区间时,可以考虑使用插入排序(小区间优化)
三数取中代码:
int GetMid(int* a, int left, int right) { int midi = (left + right) / 2; if (a[left] < a[midi]) { if (a[midi] < a[right]) return midi; else if (a[left] < a[right])//midi最大,二人取大为中 return right; else return left; } else //a[left] > a[midi] { if (a[midi] > a[right]) return midi; else if (a[left] < a[right])//midi最小,二人取小为中 return left; else return right; } }
小区间优化代码:
void InsertSort(int* a, int n) { for (int i = 0; i < n - 1; i++) { int end = i; //数组在[0, end]是有序的 while (end >= 0) { if (a[end + 1] < a[end])//升序 { Swap(&a[end], &a[end + 1]); end--; } else break; } } }
【ps】左边作key,right先走,相遇位置的值一定比基准值小,或相遇位置就是key的位置
Q:为什么相遇位置的值一定比基准值小,或者相遇位置就是key?
A:第一种情况:R找到小,但L找大没找到,这时L会遇到R;第二种情况:R找小没找到,直接遇到L,此时要么是一个比key小的位置,要么直接到key。类似地,若右端作key,则让L先走,相遇位置值就比key大。
代码示例如下:
int PartSort1(int* a, int left, int right)
{
//三数取中
int midi = GetMid(a, left, right);
Swap(&a[midi], &a[left]);
int begin = left, end = right;
int key = left;
while (begin < end)
{
while (begin < end && a[end] >= a[key])
end--;
while (begin < end && a[begin] <= a[key])
begin++;
Swap(&a[begin], &a[end]);
}
Swap(&a[key], &a[begin]);
return begin;
}
6.2 挖坑法
挖坑法是后人基于Hoare版本实现的改进版。
拿走key的值,留下一个坑位。right下标指针找小,找到后将值填到该坑位上,并留下一个新坑位;left下标指针找大,找到后将值填到新坑位上,且再留下一个坑,以此往复。
直到left与right相遇,就将key的值填到 left == right 的坑位。
代码示例如下:
int PartSort2(int* a, int left, int right)
{
//三数取中
int midi = GetMid(a, left, right);
Swap(&a[midi], &a[left]);
int begin = left, end = right;
int key = a[left];
int flag = left;
while (begin < end)
{
while (begin < end && a[end] >= key)
end--;
a[flag] = a[end];
flag = end;
while (begin < end && a[begin] <= key)
begin++;
a[flag] = a[begin];
flag = begin;
}
a[begin] = key;
return begin;
}
6.3 前后指针法
对于前指针prev(左)、后指针cur(右)、基准值key(数组头部),若cur找到比key小的值,则++prev,cur与prev位置的值交换;若cur找到比key大的值,则++cur。相当于把比key大的值翻转到右边(大的值往右边运),比key小的值翻转到左边(把小的值往左边运)。
【ps】prev要么紧跟cur(即prev的下一个位置就是cur/prev紧跟在比key大的值后面),要么跟cur中间间隔着一段由比key大的值组成的区间。
代码示例如下:
int PartSort3(int* a, int left, int right)
{
int prve = left, cur = left + 1;
int key = a[left];
while (cur <= right)
{
if (prve < cur && a[cur] <= key)
{
prve++;
Swap(&a[prve], &a[cur]);
}
cur++;
}
Swap(&a[left], &a[prve]);
return prve;
}
void QuickSort(int* a, int left, int right)
{
if (left >= right)
return;
if (right - left + 1 < 10)
{
//小区间优化
InsertSort(a + left, right - left + 1);
}
else
{
//int key = PartSort1(a, left, right);
//int key = PartSort2(a, left, right);
int key = PartSort3(a, left, right);
QuickSort(a, key + 1, right);
QuickSort(a, left, key - 1);
}
}
6.4 非递归实现
用栈实现(关于栈的完整代码和更多解释,详见 探索数据结构:栈的实现方法)。
先将所有数据组成的区间端点端点值入栈,然后,每次从栈里取一段区间的端点值(首次是所有数据组成的区间)进行单趟的排序;单趟排序中,被划分的子区间分别入栈(因为栈的特点是后进先出,所以右先入左后入才能使序列跟入栈前保持一致);直到划分的子区间只有一个值或子区间不存在就不再入栈。
代码实现:
int PartSort(int* a, int left, int right)
{
int midi = GetMid(a, left, right);
if (midi != left)
Swap(&a[midi], &a[left]);
int prev = left, cur = left + 1;
int keyi = left;
while (cur <= right)
{
if (a[cur] < a[keyi] && ++prev != cur)
{
Swap(&a[prev], &a[cur]);
}
cur++;
}
Swap(&a[prev], &a[keyi]);
keyi = prev;
return keyi;
}
void QuickSortNonR(int* a, int left, int right)
{
ST st;
StackInit(&st);
//先入右值(尾部的值),再入左值(头部的值)
StackPush(&st, right);
StackPush(&st, left);
while (!StackEmpty(&st))
{
//先出左值,再出右值
int begin = StackTop(&st);
StackPop(&st);
int end = StackTop(&st);
StackPop(&st);
//进行单趟的排序,且记录排序后的基准值下标
int keyi = PartSort(a, begin, end);
//分出区间:[begin,keyi-1] keyi [keyi+1, end]
//并分别入栈
if (keyi + 1 < end) //先入右区间
{
StackPush(&st, end); //先入右值
StackPush(&st, keyi + 1); //再入左值
}
if (begin < keyi - 1) //再入左区间
{
StackPush(&st, keyi - 1); //先入右值
StackPush(&st, begin); //再入左值
}
}
StackDestroy(&st);
}
七、归并排序
7.1 递归实现
归并排序算法有两个基本的操作,一个是分,也就是把原数组划分成两个子数组的过程。另一个是治,它将两个有序数组合并成一个更大的有序数组。
- 将待排序的线性表不断地切分成若干个子表,直到每个子表只包含一个元素,这时,可以认为只包含一个元素的子表是有序表。
- 将子表两两合并,每合并一次,就会产生一个新的且更长的有序表,重复这一步骤,直到最后只剩下一个子表,这个子表就是排好序的线性表。
可以看到这种结构很像一棵完全二叉树,本文的归并排序我们采用递归去实现(也可采用迭代的方式去实现)。
动画展示:
代码实现:
void _MergeSort(int* arr, int left, int right, int* temp)
{
//分解:
//分割数组只有一个元素时停止递归
if (left >= right)
{
return;
}
int mid = (left + right) / 2;
_MergeSort(arr, left, mid, temp); //分割并排序数组左半边
_MergeSort(arr, mid + 1, right, temp); //分割并排序数组右半边
//合并:
int begin1 = left, end1 = mid; //数组1的左右区间
int begin2 = mid + 1, end2 = right; //数组2的左右区间
int i = begin1;
//排序两个有序数组
while (begin1 <= end1 && begin2 <= end2)
{
if (arr[begin1] <= arr[begin2])
{
temp[i] = arr[begin1];
begin1++;
}
else
{
temp[i] = arr[begin2];
begin2++;
}
i++;
}
while (begin1 <= end1)
{
temp[i] = arr[begin1];
begin1++;
i++;
}
while (begin2 <= end2)
{
temp[i] = arr[begin2];
begin2++;
i++;
}
//拷贝临时数组的内容到原数组(可以调用memcpy函数)
//memcpy(arr+left, temp+left, (right-left+1)*sizeof(int));
for (i = left; i <= right; i++)
{
arr[i] = temp[i];
}
}
void MergeSort(int* arr, int size)
{
int* temp = (int*)malloc(size * sizeof(int));
if (temp == NULL)
{
perror("malloc fail\n");
return;
}
_MergeSort(arr, 0, size - 1, temp); //归并排序的过程
free(temp);
temp = NULL;
}
7.2 非递归实现
7.2.1 思路实现
通过循环实现。将从同一组中分出的两个数据进行比较,按大小(升序)合并为一个有序区间。
将待排序的序列不断二分,直至二分的结果为单个数据,接着,将从同一组中分出的两个数据进行比较,按大小顺序一一归并为一个有序(升序)区间;归并后,重新排序,再对有序区间进行二二归并(每个有序区间有两个数据),然后是四四归并(每个有序区间有四个数据)......以此类推,直至待排序的序列整体有序。
而对于两个有序区间的归并,同样要开辟一个新的临时数组来存排好序的数据,最后,将排好序的序列整体拷贝回原数组。
7.2.2 数组边界问题
在归并排序的非递归实现中,我们要遍历数组,将两个长度为gap的数组排序合并,但是gap总是2的幂次方,这就导致数组长度不一定是 gap*2 的倍数,这就导致两个数组在遍历到数组边界时会导致越界问题。所以我们要对数组的边界问题进行处理
1. 第一个数组越界
黄色和蓝色数组是需要合并的两个数组,第一个数组指的是黄色数组,第二个数组指的是蓝色数组
此时遍历到数组末尾时,第一个数组只有一个元素,但是需要合并的数组长度是2,所以第一个数组访问时会造成越界(第二个数组自然也越界)
2. 第二个数组全部越界
此时遍历到数组末尾时,第一个数组的长度刚好到原数组的末尾,第二个数组不存在,访问第二个数组是会越界
3. 第二个数组部分越界
此时第一个数组在数组内,第二个数组只有一部分在数组内,第二个数组存在但是长度没有gap
,访问第二个数组时会越界
解决方法 :
我们来解决这些数组越界问题的方法是调整数组区间范围:
- 第一个数组越界时,第二个数组不存在,所以不用合并,第一个数组本身就是有序数组
- 第二个数组完全越界时,第二个数组依然不存在,所以不用合并
- 第三个数部分组越界时,第二个数组存在但是不完整,此时我们将第二个数组的结束位置调整为原数组末尾位置即可,让第一个数组和第二个数组合并。
代码示例:
void MergeSortNonR(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(int) * n);
if (tmp == NULL)
{
perror("malloc fail\n");
return;
}
//(单趟)一一归并
int gap = 1;//每组归并的数据个数
while (gap < n)
{
for (int i = 0; i < n; i += 2 * gap)
{
// [begin1,end1][begin2, end2]
int begin1 = i, end1 = i + gap - 1;
int begin2 = i + gap, end2 = i + 2 * gap - 1;
//修正边界
//归并一部分,拷贝一部分
if (end1 >= n || begin2 >= n)
{
break;//第一个区间或第二个区间越界就不拷贝
}
if (end2 >= n)
{
end2 = n - 1;//第二个区间越界就修正区间边界end2
}
//依次比较两个区间相同下标位置的值,并按序放入临时数组
int j = i;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[j] = a[begin1];
j++, begin1++;
}
else
{
tmp[j] = a[begin2];
j++, begin2++;
}
}
//没走完的区间继续归并
while (begin1 <= end1)
{
tmp[j] = a[begin1];
j++, begin1++;
}
while (begin2 <= end2)
{
tmp[j] = a[begin2];
j++, begin2++;
}
//归并一部分,拷贝一部分
memcpy(a + i, tmp + i, sizeof(int) * (end2 - i + 1));
}
//一一归并 => 二二归并 => 四四归并 => ...
gap *= 2;
}
free(tmp);
}
八、计数排序
计数排序的作用是,按照大小顺序排列每个数据,并保留每个数据重复出现的次数。它又称为鸽巢原理,是对哈希直接定址法的变形应用。实现它的基本步骤为:1. 统计相同元素出现次数;2. 根据统计的结果将序列回收到原来的序列中。
详解算法:
先假设 20 个数列为:{9, 3, 5, 4, 9, 1, 2, 7, 8,1,3, 6, 5, 3, 4, 0, 10, 9, 7, 9}。
让我们先遍历这个无序的随机数组,找出最大值为 10 和最小值为 0。这样我们对应的计数范围将是 0 ~ 10。然后每一个整数按照其值对号入座,对应数组下标的元素进行加1操作。
比如第一个整数是 9,那么数组下标为 9 的元素加 1,如下图所示。
第二个整数是 3,那么数组下标为 3 的元素加 1,如下图所示。
继续遍历数列并修改数组......。最终,数列遍历完毕时,数组的状态如下图。
数组中的每一个值,代表了数列中对应整数的出现次数。
有了这个统计结果,排序就很简单了,直接遍历数组,输出数组元素的下标值,元素的值是几,就输出几次。比如统计结果中的 1 为 2,就是数列中有 2 个 1 的意思。这样我们就得到最终排序好的结果。
0, 1, 1, 2, 3, 3, 3, 4, 4, 5, 5, 6, 7, 7, 8, 9, 9, 9, 9, 10
动画展示:
贴别说明:
虽然计数排序看上去很强大,但是它存在两大局限性:
1.当数列最大最小值差距过大时,并不适用于计数排序
比如给定 20 个随机整数,范围在 0 到 1 亿之间,此时如果使用计数排序的话,就需要创建长度为 1 亿的数组,不但严重浪费了空间,而且时间复杂度也随之升高。
2.当数列元素不是整数时,并不适用于计数排序
如果数列中的元素都是小数,比如 3.1415,或是 0.00000001 这样子,则无法创建对应的统计数组,这样显然无法进行计数排序。
正是由于这两大局限性,才使得计数排序不像快速排序、归并排序那样被人们广泛适用。
代码示例:
void CountSort(int* a, int n)
{
int max = a[0], min = a[0];
for (int i = 1; i < n; i++)
{
//找最大
if (a[i] > max)
{
max = a[i];
}
//找最小
if (a[i] < min)
{
min = a[i];
}
}
//算范围
int range = max - min + 1;
//开计数数组
int* countA = (int*)malloc(sizeof(int) * range);
if (countA == NULL)
{
perror("malloc fail");
return;
}
//初始化计数数组
memset(countA, 0, sizeof(int) * range);
//计数
for (int i = 0; i < n; i++)
{
countA[a[i] - min]++; //通过相对位置映射计数(这是一种哈希的思想)
}
//排序,并覆盖原数组
int j = 0;
for (int i = 0; i < range; i++)
{
//遍历计数数组
while (countA[i]--)
{
//用数据数量的有序序列对应的数据,覆盖原数组
a[j++] = i + min; //countA[i]记录了某一数据出现的次数,countA[i]出现几次,就往原数组中写几个对应的值
//i + min相当于还原出原数据
}
}
free(countA);
}