##时间复杂度O(nlogn)
目录
##时间复杂度O(nlogn)
##递归实现归并排序
##原理
##图例
##代码实现
##非递归实现归并排序
##释
#代码实现
##递归实现归并排序
##原理
是一种基于分治策略的基础排序算法。
1.划分阶段:通过不断递归地将数组从中点处分开,将长数组的排序问题转化成段数组的排序问题。
2.合并阶段:当子数组的长度为1时终止划分,开始合并,持续不断地将左右两个较短的有序数组合并为一个较长的有序数组,直到结束。
##图例
##代码实现
1.向下递归,对半分割
2.递归返回条件:递归到最小,1个就是有序【控制的是范围,归并的是区间】
3.递归到最深处,最小时,就递归回去,开始分割按对半分割出的范围,将已有子序列合并,在tmp里面进行合并
4.再将tmp里形成的有序序列,拷贝回原数组【因下一次递归回去上一层的归并过程中,会将数据在tmp中进行归并,会将tmp中的数据覆盖,因此要及时,拷】
//python代码示例 def Merge(a, start, mid, end) : tmp = [] #创建一个临时列表,用来存储合并的值 #两段起点的开始 l = start r = mid + 1 #当两段都没到达末尾,则继续循环,将其添加到tmp while l <= mid and r <= end : if a[l] <= a[r] : tmp.append(a[l]) l += 1 else : tmp.append(a[r]) r += 1 #此时肯定只剩下,单一的一个值,即将剩余元素塞入到tmp中 tmp.extend(a[l:mid+1]) tmp.extend(a[r:end+1]) #将合并完成的元素,赋值到a原数组中 for i in range(start,end+1): a[i] = tmp[i - start] print(start,end,tmp) def MergeSort(a,start,end) : #利用递归来实现归并排序,将大的问题分解成小的子问题 if start == end : #当递归到数组只有一个元素时,直接返回 return mid = (start + end) // 2 #计算出mid,找到递归点 MergeSort(a,start,mid) #左递归 MergeSort(a,mid+1,end) #右递归 Merge(a,start,mid,end) #左递归,左合并,右递归,右合并,类似于树的后序遍历 a = [7,3,2,6] MergeSort(a,0,3)
//c++代码实现示例 #include<iostream> #include<vector> using namespace std; //c++代码实现示例 void merge(vector<int> &a, int left, int mid, int right) { int i = left ; int j = mid + 1 ; int k = left ; vector<int> tmp(right - mid + 1) ; while ( i <= mid && j <= right ) { if ( a[i] <= a[j] ) { tmp[k++] = a[i++] ; } else { tmp[k++] = a[j++] ; } } while ( i <= mid ) { tmp[k++] = a[i++] ; } while ( j <= right ) { tmp[k++] = a[j++] ; } for (int m = left ; m <= right ; m++) { a[m] = tmp[m - left] ; } cout << left << right << " " ; for (int n = 0 ; n < tmp.size() ; ++n) { cout << tmp[n] << " " ; } } void mergeSort(vector<int> &a, int left, int right) { if (left >= right) { return ; } int mid = (left + right) / 2 ; mergeSort(a,left,mid) ; mergeSort(a,mid+1,right) ; merge(a,left,mid,right) ; } int main() { // vector<int> arr = {1,2,3,4,5}; // vector<int> arr; arr.push_back(7); arr.push_back(3); arr.push_back(2); arr.push_back(6); // arr.push_back(5); mergeSort(arr,0,3) ; return 0 ; }
void _MergerSort(DataType* a ,DataType* tmp, int begin,int end) { //递归返回条件,不正常的范围,或只剩下一个数 if (begin >= end) { return ; } int mid = (begin + end) / 2 ; //递归过程 _MergeSort(a,tmp,begin,mid) ; _MergeSort(a,tmp,mid+1,end) ; //合并过程 //归并到tmp数组中,再拷贝回去 int begin1 = begin ; int end1 = mid ; int begin2 = mid + 1 ; int end2 = end ; //指向tmp,=begin是 根据要进行比较插入的数组的位置 找到其对应在tmp中所对应的位置,则不会覆盖前面已经排好序的数据 int index = begin ; while (begin1 <= end1 && begin2 <= end2) { if (a[begin1] < a[begin2]) { tmp[index++] = a[begin++] ; } else { tmp[index++] = a[begin2++] ; } } //剩下还没有插入进去的 while (begin1 <= end1) { tmp[index++] = a[begin1++]; } while (begin2 <= end2) { tmp[index++] = a[begin2++] ; } //拷贝回去原数组a中 memcpy(a+begin,tmp+begin,sizeof(DataType)*(end-begin+1)) ; } void MergeSort(DataType* a, int n) { DataType* tmp = (DataType*)malloc(sizeof(DataType)*n) ; if (tmp == NULL) { perror("malloc fail") ; return ; } _MergeSort(a,tmp,0,n-1) ; free(tmp) ; }
对于链表,归并排序相较于其他排序算法具有显著优势,可以将链表排序任务的空间复杂度优化至 𝑂(1) 。
- 划分阶段:可以使用“迭代”替代“递归”来实现链表划分工作,从而省去递归使用的栈帧空间。
- 合并阶段:在链表中,节点增删操作仅需改变引用(指针)即可实现,因此合并阶段(将两个短有序链表合并为一个长有序链表)无须创建额外链表。
##非递归实现归并排序
##释
归并排序时二分的思想=>logN层=>递归不会太深、且现在编译器优化后,递归、非递归的性能差距没有特别大了=>所以可以不用考虑非递归。
递归的缺点:递归消耗栈帧,递归的层数太深,容易爆栈。
【栈的空间比较小,在x86(32位)环境下,只有8M。(对比同一环境下的堆,则有2G+)。因为平时函数调用开不了多少个栈帧。理论上递归深度>1w 可能就会爆 ,但实际上5k左右就爆掉了】,这时就需要改非递归了。
非递归改写方法:
1.改变循环
2.利用数据结构栈(本质是通过malloc在堆上开辟的存储空间,内存空间需要足够大)
3.递归逆着求-实际上也差不多也是递归思想(如斐波那契数列逆着来求也是可行的)
#代码实现
- 开辟新的数组(临时存放)用于归并排序过程
- int gap=1;gap*=2【gap控制归并的范围:11归并,22归并,44归并】
- for (int i = 0; i < n; i += 2 * gap) { 【i 控制进行比较轮到的组号,控制进行归并的组号】
- 归并完一轮,将归并好的有序数组拷贝回原数组memcpy 。
- 进入新的一轮归并,直至gap>n则归并完成
☆注意的两个情况
6. if (begin2 >= n) { break; } 第二组不存在,这一组不用归并了
7. if (end2 > n) { end2 = n - 1; } 第二组右边界越界问题,修正一下
void MergerSortNonR(DataType* a, int n) { DataType* tmp = (DataType*)malloc(sizeof(DataType) * n); //开辟新的数组(临时存放)用于归并排序过程 if (tmp == NULL) { perror("malloc fail") ; return ; } int gap = 1 ; while (gap < n) { for (int i = 0 ; i < n ; i += 2 * gap) { // // 1 , 1 归并 // // 2 , 2 归并 // //4 , 4 归并 // //[begin1,end1][begin2,end2]归并 int begin1 = i ; int end1 = i + gap - 1 ; int begin2 = i + gap ; int end2 = i + 2 * gap - 1 ; // //如果第二组不存在,这一组不用归并了 if (begin2 >= n) { break; } //第二组右边界越界问题,修正一下 if (end2 > n) { end2 = n - 1; } // // //当beigin2 超过 n 的时候,直接break掉就OK了 // //但end2 超过 n 的时候,需要修改边界问题 n - 1 // int index = i ; while (begin1 <= end1 && begin2 <= end2) { if (a[begin1] < a[begin2]) { tmp[index++] = a[begin1++] ; } else { tmp[index++] = a[begin2++] ; } } while (begin1 <= end1) { tmp[index++] = a[begin1++] ; } while (begin2 <= end2) { tmp[index++] = a[begin2++]; } // //为什么这里不能是,2 * gap呢,不一定是2*gap的数都拷贝过去,memcpy(a+i,tmp+i,sizeof(DataType)*(end2 - beigin1 + 1)) 错误 // // memcpy(a+i,tmp+i,sizeof(DataType)*(end2 - begin1 + 1)) ; 因为begin1++会发生改变的,因此不可以,错误 memcpy(a+i,tmp+i,sizeof(DataType)*(end2 - i + 1)) ; // // } printf("\n"); // for (int k = 0 ; tmp.size() ; k ++) // { // printf("%d",tmp[k]) ; // } gap = gap * 2 ; } free(tmp); } }
def MergeSort(a, n) : tmp = [0] * (n+1) gap = 1 while (gap < n) : z = gap * 2 for i in range(0,n,z) : begin1 = i end1 = i + gap - 1 begin2 = i + gap end2 = i + 2 * gap - 1 if begin2 > n : break if end2 > n : end2 = n - 1 index = i while begin1 <= end1 and begin2 <= end2 : if a[begin1] < a[begin2] : tmp[index] = a[begin1] index += 1 begin1 += 1 else : tmp[index] = a[begin2] index += 1 begin2 += 1 while begin1 <= end1 : tmp[index] = a[begin1] index += 1 begin1 += 1 while begin2 <= end2 : tmp[index] = a[begin2] index += 1 begin2 += 1 for j in range(i,end2 + 1) : a[j] = tmp[j - i] print() # print(tmp) gap = gap * 2