一文搞定十大排序算法

news2024/11/23 19:10:25

文章目录

  • 概述
  • 冒泡排序 (Bubble Sort)
    • 算法步骤
    • 图解算法
    • 代码实现
    • 算法分析
  • 选择排序 (Selection Sort)
    • 算法步骤
    • 算法图解
    • 代码实现
    • 算法分析
  • 插入排序(Insertion Sort)
    • 算法步骤
    • 图解算法
    • 代码实现
    • 算法分析
  • 希尔排序 (Shell Sort)
    • 算法步骤
    • 图解算法
    • 代码实现
    • 算法分析
  • 归并排序 (Merge Sort)
    • 算法步骤
    • 图解算法
    • 代码实现
    • 算法分析
  • 快速排序 (Quick Sort)
    • 算法步骤
    • 图解算法
    • 代码实现
    • 算法分析
  • 堆排序 (Heap Sort)
    • 算法步骤
    • 图解算法
    • 代码实现
    • 算法分析
  • 计数排序 (Counting Sort)
    • 算法步骤
    • 图解算法
    • 代码实现
    • 算法分析
  • 桶排序 (Bucket Sort)
    • 算法步骤
    • 图解算法
    • 代码实现
    • 算法分析
  • 基数排序 (Radix Sort)
    • 算法步骤
    • 图解算法
    • 代码实现
    • 算法分析
  • 总结

在基础的算法中,我们比较常见的功能包含两个:排序、查找。在本文中我们将介绍十大常见的排序算法,并对其原理、过程进行分析。

概述

排序算法可以分为:

  • 内部排序:数据记录在内存中进行排序。
  • 外部排序 :因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。

常见的内部排序算法有:插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等,本文只涉及内部排序算法。

十种常见排序算法可以分类两大类别:

  • 比较类排序

  • 非比较类排序在这里插入图片描述

  • 比较类排序:通过比较来决定元素间的相对次序,由于其时间复杂度不能突破 O(nlogn),因此也称为非线性时间比较类排序。在冒泡排序之类的排序中,问题规模为 n,又因为需要比较 n 次,所以平均时间复杂度为 O(n²)。在归并排序、快速排序之类的排序中,问题规模通过分治法消减为 logn 次,所以时间复杂度平均 O(nlogn)。比较类排序的优势是,适用于各种规模的数据,也不在乎数据的分布,都能进行排序。可以说,比较排序适用于一切需要排序的情况

  • 非比较排序:不通过比较来决定元素间的相对次序,而是通过确定每个元素之前,应该有多少个元素来排序。由于它可以突破基于比较排序的时间下界,以线性时间运行,因此称为线性时间非比较类排序。 非比较排序只要确定每个元素之前的已有的元素个数即可,所有一次遍历即可解决。算法时间复杂度 O(n)。非比较排序时间复杂度低,但由于非比较排序需要占用空间来确定唯一位置。所以对数据规模和数据分布有一定的要求

冒泡排序 (Bubble Sort)

冒泡排序是一种简单的排序算法。它重复地遍历要排序的数列,一次比较两个元素,如果顺序错误就把它们交换过来。遍历的最终结果是会把最大的数冒泡地沉到最底下,最小的数会像鱼泡一样被冒泡地推到最上面来。

算法步骤

  • 比较相邻的元素。如果第一个比第二个大,就交换它们两个;
  • 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;
  • 针对所有的元素重复以上的步骤,除了最后一个;
  • 重复步骤 1~3,直到排序完成。

图解算法

在这里插入图片描述

代码实现

实现一:快慢指针

    public static void BubbleSort(int[] nums) {
        //建立快指针
        int fast = 1;
        //建立慢指针
        int slow = 0;
        //逐渐移动快慢指针进行比较
        //这里i维护的是一个完成排序区的长度
        for (int i = 0;i < nums.length;i++) {
            //如果快指针没有触碰到完成排序区的边界则继续
            while (fast < nums.length - i) {
                //如果慢指针指向的元素更大就交换两元素
                if (nums[slow] > nums[fast]) {
                    int temp = nums[slow];
                    nums[slow] = nums[fast];
                    nums[fast] = temp;
                }
                //无论是否交换快慢指针都要前进
                fast++;
                slow++;
            }
            //重置快慢指针
            slow = 0;
            fast = 1;
        }
    }

实现二:

/**
 * 冒泡排序
 * @param arr
 * @return arr
 */
public static int[] bubbleSort(int[] arr) {
    for (int i = 1; i < arr.length; i++) {
        // Set a flag, if true, that means the loop has not been swapped,
        // that is, the sequence has been ordered, the sorting has been completed.
        boolean flag = true;
        for (int j = 0; j < arr.length - i; j++) {
            if (arr[j] > arr[j + 1]) {
                int tmp = arr[j];
                arr[j] = arr[j + 1];
                arr[j + 1] = tmp;
       // Change flag
                flag = false;
            }
        }
        if (flag) {
            break;
        }
    }
    return arr;
}

算法分析

  • 稳定性:稳定
  • 时间复杂度:最佳:O(n) ,最差:O(n2), 平均:O(n2)
  • 空间复杂度:O(1)
  • 排序方式:In-place

选择排序 (Selection Sort)

选择排序是一种简单直观的排序算法,无论什么数据进去都是 O(n²) 的时间复杂度。所以用到它的时候,数据规模越小越好。唯一的好处可能就是不占用额外的内存空间了吧。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。

算法步骤

  1. 找到数组中最小的元素,和第一个元素交换位置。
  2. 在剩余的元素中找到最小的元素,和第二个元素交换位置。
  3. 重复步骤2,直到找到数组的最后一个元素。

算法图解

在这里插入图片描述

代码实现

/**
 * 选择排序
 * @param arr
 * @return arr
 */
public static int[] selectionSort(int[] arr) {
    for (int i = 0; i < arr.length - 1; i++) {
        int minIndex = i;
        for (int j = i + 1; j < arr.length; j++) {
            if (arr[j] < arr[minIndex]) {
                minIndex = j;
            }
        }
        if (minIndex != i) {
            int tmp = arr[i];
            arr[i] = arr[minIndex];
            arr[minIndex] = tmp;
        }
    }
    return arr;
}

算法分析

  • 稳定性:不稳定
  • 时间复杂度:最佳:O(n2) ,最差:O(n2), 平均:O(n2)
  • 空间复杂度:O(1)
  • 排序方式:In-place

插入排序(Insertion Sort)

插入排序是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用 in-place 排序(即只需用到 O(1) 的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。

插入排序的代码实现虽然没有冒泡排序和选择排序那么简单粗暴,但它的原理应该是最容易理解的了,因为只要打过扑克牌的人都应该能够秒懂。插入排序是一种最简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

插入排序和冒泡排序一样,也有一种优化算法,叫做拆半插入。

算法步骤

  1. 从第一个元素开始,该元素可以认为已经被排序;
  2. 取出下一个元素,在已经排序的元素序列中从后向前扫描;
  3. 如果该元素(已排序)大于新元素,将该元素移到下一位置;
  4. 重复步骤 3,直到找到已排序的元素小于或者等于新元素的位置;
  5. 将新元素插入到该位置后;
  6. 重复步骤 2~5

图解算法

在这里插入图片描述

代码实现

    /**
     * 插入排序
     * @param nums
     */
    public static void InsertionSort(int[] nums) {
        //维护排序区,指向待比较元素,从索引为 1 的位置开始
        for (int i = 1;i < nums.length;i++) {
            //待插入的值
            int compare = nums[i];
            //反向遍历排序区
            int j;
            for ( j = i - 1;j >= 0;j--) {
                if (compare > nums[j]) break;
                //如果大于插入值就往后移一位
                nums[j + 1] = nums[j];
            }
            //插入
            nums[j + 1] = compare;
        }
    }

算法分析

  • 稳定性:稳定
  • 时间复杂度:最佳:O(n) ,最差:O(n2), 平均:O(n2)
  • 空间复杂度:O(1)
  • 排序方式:In-place

希尔排序 (Shell Sort)

希尔排序是希尔 (Donald Shell) 于 1959 年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为递减增量排序算法,同时该算法是冲破 O(n²) 的第一批算法之一。

希尔排序的基本思想是:先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,待整个序列中的记录 “基本有序” 时,再对全体记录进行依次直接插入排序。

算法步骤

我们来看下希尔排序的基本步骤,在此我们选择增量 gap=length/2,缩小增量继续以 gap = gap/2 的方式,这种增量选择我们可以用一个序列来表示,{n/2, (n/2)/2, ..., 1},称为增量序列。希尔排序的增量序列的选择与证明是个数学难题,我们选择的这个增量序列是比较常用的,也是希尔建议的增量,称为希尔增量,但其实这个增量序列不是最优的。此处我们做示例使用希尔增量。

先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:

  1. 选择一个增量序列 {t1, t2, …, tk},其中 (ti>tj, i<j, tk=1)
  2. 按增量序列个数 k,对序列进行 k 趟排序;
  3. 每趟排序,根据对应的增量 t,将待排序列分割成若干长度为 m 的子序列,分别对各子表进行直接插入排序。仅增量因子为 1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。

图解算法

在这里插入图片描述

代码实现

   /**
     * 希尔排序
     * @param nums
     */
    public static void ShellSort(int[] nums) {
        int gap = nums.length / 2;
        while (gap > 0) {
            //维护排序区,指向待比较元素
            for (int i = gap;i < nums.length;i++) {
                //待插入的值
                int compare = nums[i];
                //反向遍历排序区
                int j;
                for ( j = i - gap;j >= 0;j-= gap) {
                    if (compare > nums[j]) break;
                    //如果大于插入值就往后移一位
                    nums[j + gap] = nums[j];
                }
                //插入
                nums[j + gap] = compare;
            }
			//改变希尔增量
            gap /= 2;

        }
    }

算法分析

  • 稳定性:不稳定
  • 时间复杂度:最佳:O(nlogn), 最差:O(n2) 平均:O(nlogn)
  • 空间复杂度:O(1)

归并排序 (Merge Sort)

归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法 (Divide and Conquer) 的一个非常典型的应用。归并排序是一种稳定的排序方法。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为 2 - 路归并。

Tips:什么是分治法?
分治法是一种很重要的算法设计技巧。它的基本思想是:将一个复杂的问题分解成两个或更多相同或相关的子问题,直到变成基本问题可以直接求解,最后将子问题的解汇总为原问题的解。
分治法通常包含三个步骤:

  1. 分解:将原问题分解为若干个子问题。
  2. 解决:递归地解决各个子问题。如果子问题还可以分解,则继续分解,否则直接解决子问题。
  3. 合并:将各个子问题的解合并为原问题的解。

分治法的优点是可以大大减少时间复杂度和空间复杂度。但是分治法也存在一定的缺点,例如在分解和合并阶段会有一定的额外开销,并不一定所有问题都可以很好地分解等。
典型的应用分治法的算法有:归并排序快速排序、线段树、阶乘实现等。

和选择排序一样,归并排序的性能不受输入数据的影响,但表现比选择排序好的多,因为始终都是 O(nlogn) 的时间复杂度。代价是需要额外的内存空间。

算法步骤

归并排序算法是一个递归过程,边界条件为当输入序列仅有一个元素时,直接返回,具体过程如下:

  1. 如果输入内只有一个元素,则直接返回,否则将长度为 n 的输入序列分成两个长度为 n/2 的子序列;
  2. 分别对这两个子序列进行归并排序,使子序列变为有序状态;
  3. 设定两个指针,分别指向两个已经排序子序列的起始位置;
  4. 比较两个指针所指向的元素,选择相对小的元素放入到合并空间(用于存放排序结果),并移动指针到下一位置;
  5. 重复步骤 3 ~4 直到某一指针达到序列尾;
  6. 将另一序列剩下的所有元素直接复制到合并序列尾。

图解算法

在这里插入图片描述

如果没有看懂这个过程可以参考下面的文章:
十大经典排序算法-归并排序算法详解

代码实现

    /**
     * 归并排序
     * @param nums
     */
    public static int[] MergeSort(int[] nums) {
        //分割点
        int division = nums.length / 2;

        if (division < 1) return nums;

        //左数组
        int[] left = MergeSort(Arrays.copyOfRange(nums, 0, division));
        //右数组
        int[] right = MergeSort(Arrays.copyOfRange(nums, division, nums.length));
        //合并
        return merge(left,right);
    }

    public static int[] merge(int[] left,int[] right){
        //创建一个大数组容量为两数组长度之和
        int[] box = new int[left.length + right.length];
        //设置left数组的头指针
        int leftPointer = 0;
        //设置right数组的头指针
        int rightPointer = 0;
        //设置box的排序指针
        int boxPointer = 0;
        
        while (boxPointer < box.length) {
            //左数组已经全部填充完了的情况
            if (leftPointer >= left.length) {
                while (rightPointer < right.length) {
                    box[boxPointer++] = right[rightPointer++];
                }
                break;
            }
            //右数组已经全部填充完了的情况
            if (rightPointer >= right.length) {
                while (leftPointer < left.length) {
                    box[boxPointer++] = left[leftPointer++];
                }
                break;
            }
            //left指针更大的情况
            if (left[leftPointer] <= right[rightPointer]) {
                box[boxPointer++] = left[leftPointer++];
            }else {
                //right指针更大的情况
                box[boxPointer++] = right[rightPointer++];
            }
        }
        return box;
    }

算法分析

  • 稳定性:稳定
  • 时间复杂度:最佳:O(nlogn), 最差:O(nlogn), 平均:O(nlogn)
  • 空间复杂度:O(n)

快速排序 (Quick Sort)

快速排序用到了分治思想,同样的还有归并排序。乍看起来快速排序和归并排序非常相似,都是将问题变小,先排序子串,最后合并。不同的是快速排序在划分子问题的时候经过多一步处理,将划分的两组数据划分为一大一小,这样在最后合并的时候就不必像归并排序那样再进行比较。但也正因为如此,划分的不定性使得快速排序的时间复杂度并不稳定。

快速排序的基本思想:通过一趟排序将待排序列分隔成独立的两部分,其中一部分记录的元素均比另一部分的元素小,则可分别对这两部分子序列继续进行排序,以达到整个序列有序。

算法步骤

快速排序使用分治法open in new window(Divide and conquer)策略来把一个序列分为较小和较大的 2 个子序列,然后递回地排序两个子序列。具体算法描述如下:

  1. 从序列中随机挑出一个元素,做为 “基准”(pivot);
  2. 重新排列序列,将所有比基准值小的元素摆放在基准前面,所有比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个操作结束之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
  3. 递归地把小于基准值元素的子序列和大于基准值元素的子序列进行快速排序。

图解算法

在这里插入图片描述

代码实现

    /**
     * 快速排序
     * @param nums
     */
    public static void quickSort(int[] nums,int left,int right) {

        if (left >= right) return;
        //记录一下左右边界
        int l = left;int r = right;
        //确定基准元素
        int standard = nums[left];
        //左右交换标志 0:left比较 1:right比较
        int exchange = 1;
        while (left != right) {
            if (exchange++ % 2 == 1) {
                if (nums[right] < standard) nums[left++] = nums[right];
                else {
                    right--;
                    exchange++;
                }
            }else {
                if (nums[left] > standard) nums[right--] = nums[left];
                else {
                    left++;
                    exchange++;
                }
            }
        }
        nums[left] = standard;
        quickSort(nums,l,left -1);
        quickSort(nums,left + 1,r);
    }

算法分析

  • 稳定性:不稳定
  • 时间复杂度:最佳:O(nlogn), 最差:O(nlogn),平均:O(nlogn)
  • 空间复杂度:O(nlogn)

堆排序 (Heap Sort)

堆排序是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似完全二叉树的结构,并同时满足堆的性质:即子结点的值总是小于(或者大于)它的父节点。

算法步骤

  1. 将初始待排序列 (R1, R2, ……, Rn) 构建成大顶堆,此堆为初始的无序区;
  2. 将堆顶元素 R[1] 与最后一个元素 R[n] 交换,此时得到新的无序区 (R1, R2, ……, Rn-1) 和新的有序区 (Rn), 且满足 R[1, 2, ……, n-1]<=R[n]
  3. 由于交换后新的堆顶 R[1] 可能违反堆的性质,因此需要对当前无序区 (R1, R2, ……, Rn-1) 调整为新堆,然后再次将 R [1] 与无序区最后一个元素交换,得到新的无序区(R1, R2, ……, Rn-2) 和新的有序区 (Rn-1, Rn)。不断重复此过程直到有序区的元素个数为 n-1,则整个排序过程完成。

图解算法

在这里插入图片描述

代码实现

// Global variable that records the length of an array;
static int heapLen;

/**
 * Swap the two elements of an array
 * @param arr
 * @param i
 * @param j
 */
private static void swap(int[] arr, int i, int j) {
    int tmp = arr[i];
    arr[i] = arr[j];
    arr[j] = tmp;
}

/**
 * Build Max Heap
 * @param arr
 */
private static void buildMaxHeap(int[] arr) {
    for (int i = arr.length / 2 - 1; i >= 0; i--) {
        heapify(arr, i);
    }
}

/**
 * Adjust it to the maximum heap
 * @param arr
 * @param i
 */
private static void heapify(int[] arr, int i) {
    int left = 2 * i + 1;
    int right = 2 * i + 2;
    int largest = i;
    if (right < heapLen && arr[right] > arr[largest]) {
        largest = right;
    }
    if (left < heapLen && arr[left] > arr[largest]) {
        largest = left;
    }
    if (largest != i) {
        swap(arr, largest, i);
        heapify(arr, largest);
    }
}

/**
 * Heap Sort
 * @param arr
 * @return
 */
public static int[] heapSort(int[] arr) {
    // index at the end of the heap
    heapLen = arr.length;
    // build MaxHeap
    buildMaxHeap(arr);
    for (int i = arr.length - 1; i > 0; i--) {
        // Move the top of the heap to the tail of the heap in turn
        swap(arr, 0, i);
        heapLen -= 1;
        heapify(arr, 0);
    }
    return arr;
}

算法分析

  • 稳定性:不稳定
  • 时间复杂度:最佳:O(nlogn), 最差:O(nlogn), 平均:O(nlogn)
  • 空间复杂度:O(1)

计数排序 (Counting Sort)

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。

计数排序 (Counting sort) 是一种稳定的排序算法。计数排序使用一个额外的数组 C,其中第 i 个元素是待排序数组 A 中值等于 i 的元素的个数。然后根据数组 C 来将 A 中的元素排到正确的位置。它只能对整数进行排序。

算法步骤

方法一:

  1. 找出数组中的最大值max和最小值min。
  2. 生成一个长度为max-min+1的计数组nums,初值全为0。
  3. 遍历原数组,当遇到nums[i]时,nums[nums[i]-min]的值加1。
  4. 遍历计数组nums,当nums[i]不为0时,从原数组中取出nums[i]个i+min放到原数组中。

注意:

标准的计数排序算法无法直接对负数进行排序。这是因为它依赖于找出数组的最大值和最小值来确定计数数组的大小,而对负数进行排序的话,最大值和最小值可能会超出计数数组的索引范围。

但是可以通过一些改进,使得计数排序也能对负数进行排序,另外我们方法一中,我们在新建的计数数组中记录序列中每个元素的数量,如果序列有相同的元素,则在输出时,无法保证元素原来的排序,是一种不稳定的排序算法,可通过优化,将其改为稳定排序算法:

以序列83、80、88、90、88、86为例,首先填充计数数组
在这里插入图片描述

将计数数组从第二个元素开始,每个元素都加上前面所有元素的和,此时,计数数组的值表示的是元素在序列中的排序
在这里插入图片描述

接下来我们创建输出数组,长度与待排序序列一致,从后往前遍历待排序序列

首先,遍历最后一个元素86,我们在计数数组中找到86对应的值为3,则在输出数组的第3位(下标为2)填入86,计数数组86对应的值减1,既当前的86排序是3,下次遇到86则排序是2
在这里插入图片描述

接着,遍历下一个元素88,在计数数组中找到88对应的值为5,在输出数组的第5位(下标为4)填入88,计数数组88对应的值减1
在这里插入图片描述

然后,遍历下一个元素90,在计数数组中找到90对应的值为6,在输出数组的第6位(下标为5)填入90,计数数组90对应的值减1
在这里插入图片描述

继续遍历下一个元素88,在计数数组中找到88对应的值为4,在输出数组的第4位(下标为3)填入88,计数数组88对应的值减1
在这里插入图片描述

以此类推,将所有元素遍历完,填入输出数组

在这里插入图片描述

原序列第3位、第5位均为88,从上面的步骤我们可以看到,在第二步,第5位的88填入输出数组的第5位,在第四步,第3位的88填入输出数组的第4位,没有改变原序列相同元素的顺序

我们总结一下,方法二:

  1. 找出数组中的最大值 max、最小值 min;
  2. 创建一个新数组 C,其长度是 max-min+1,其元素默认值都为 0;
  3. 遍历原数组 A 中的元素 A[i],以 A[i]-min 作为 C 数组的索引,以 A[i] 的值在 A 中元素出现次数作为 C[A[i]-min] 的值;
  4. 对 C 数组变形,新元素的值是该元素与前一个元素值的和,即当 i>1C[i] = C[i] + C[i-1]
  5. 创建结果数组 R,长度和原始数组一样。
  6. 从后向前遍历原始数组 A 中的元素 A[i],使用 A[i] 减去最小值 min 作为索引,在计数数组 C 中找到对应的值 C[A[i]-min]C[A[i]-min]-1 就是 A[i] 在结果数组 R 中的位置,做完上述这些操作,将 count[A[i]-min] 减小 1。

图解算法

在这里插入图片描述

代码实现

方法一代码:

    /**
     * 计数排序
     * @param nums
     */
    public static void countingSort(int[] nums){
        //首先找到最值
        int maxValue = nums[0];
        int minValue = nums[0];
        for (int i = 0; i < nums.length; i++) {
            if (nums[i] > maxValue) {
                maxValue = nums[i];
            } else if (nums[i] < minValue) {
                minValue = nums[i];
            }
        }
        //创建计数数组
        int[] countNums = new int[maxValue - minValue + 1];
        //开始计数
        for (int num : nums) countNums[num - minValue]++;
        //重新填充原数组
        //填充指针
        int insert = 0;
        for (int i = 0; i < countNums.length; i++) {
            for (int j = countNums[i];j > 0;j--) nums[insert++] = i + minValue;
        }
    }

方法二代码:

/**
 * Gets the maximum and minimum values in the array
 *
 * @param arr
 * @return
 */
private static int[] getMinAndMax(int[] arr) {
    int maxValue = arr[0];
    int minValue = arr[0];
    for (int i = 0; i < arr.length; i++) {
        if (arr[i] > maxValue) {
            maxValue = arr[i];
        } else if (arr[i] < minValue) {
            minValue = arr[i];
        }
    }
    return new int[] { minValue, maxValue };
}

/**
 * Counting Sort
 *
 * @param arr
 * @return
 */
public static int[] countingSort(int[] arr) {
    if (arr.length < 2) {
        return arr;
    }
    int[] extremum = getMinAndMax(arr);
    int minValue = extremum[0];
    int maxValue = extremum[1];
    int[] countArr = new int[maxValue - minValue + 1];
    int[] result = new int[arr.length];

    for (int i = 0; i < arr.length; i++) {
        countArr[arr[i] - minValue] += 1;
    }
    for (int i = 1; i < countArr.length; i++) {
        countArr[i] += countArr[i - 1];
    }
    for (int i = arr.length - 1; i >= 0; i--) {
        int idx = countArr[arr[i] - minValue] - 1;
        result[idx] = arr[i];
        countArr[arr[i] - minValue] -= 1;
    }
    return result;
}

算法分析

当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 O(n+k)。计数排序不是比较排序,排序的速度快于任何比较排序算法。由于用来计数的数组 C 的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上 1),这使得计数排序对于数据范围很大的数组,需要大量额外内存空间。

  • 稳定性:稳定
  • 时间复杂度:最佳:O(n+k) 最差:O(n+k) 平均:O(n+k)
  • 空间复杂度:O(k)

桶排序 (Bucket Sort)

桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。为了使桶排序更加高效,我们需要做到这两点:

  • 在额外空间充足的情况下,尽量增大桶的数量
  • 使用的映射函数能够将输入的 N 个数据均匀的分配到 K 个桶中

桶排序的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行。

算法步骤

  1. 设置一个 BucketSize,作为每个桶所能放置多少个不同数值;
  2. 遍历输入数据,并且把数据依次映射到对应的桶里去;
  3. 对每个非空的桶进行排序,可以使用其它排序方法,也可以递归使用桶排序;
  4. 从非空桶里把排好序的数据拼接起来。

图解算法

在这里插入图片描述

代码实现

/**
 * Gets the maximum and minimum values in the array
 * @param arr
 * @return
 */
private static int[] getMinAndMax(List<Integer> arr) {
    int maxValue = arr.get(0);
    int minValue = arr.get(0);
    for (int i : arr) {
        if (i > maxValue) {
            maxValue = i;
        } else if (i < minValue) {
            minValue = i;
        }
    }
    return new int[] { minValue, maxValue };
}

/**
 * Bucket Sort
 * @param arr
 * @return
 */
public static List<Integer> bucketSort(List<Integer> arr, int bucket_size) {
    if (arr.size() < 2 || bucket_size == 0) {
        return arr;
    }
    int[] extremum = getMinAndMax(arr);
    int minValue = extremum[0];
    int maxValue = extremum[1];
    int bucket_cnt = (maxValue - minValue) / bucket_size + 1;
    List<List<Integer>> buckets = new ArrayList<>();
    for (int i = 0; i < bucket_cnt; i++) {
        buckets.add(new ArrayList<Integer>());
    }
    for (int element : arr) {
        int idx = (element - minValue) / bucket_size;
        buckets.get(idx).add(element);
    }
    for (int i = 0; i < buckets.size(); i++) {
        if (buckets.get(i).size() > 1) {
            buckets.set(i, sort(buckets.get(i), bucket_size / 2));
        }
    }
    ArrayList<Integer> result = new ArrayList<>();
    for (List<Integer> bucket : buckets) {
        for (int element : bucket) {
            result.add(element);
        }
    }
    return result;
}

算法分析

  • 稳定性:稳定
  • 时间复杂度:最佳:O(n+k) 最差:O(n²) 平均:O(n+k)
  • 空间复杂度:O(k)

基数排序 (Radix Sort)

基数排序也是非比较的排序算法,对元素中的每一位数字进行排序,从最低位开始排序,复杂度为 O(n×k)n 为数组长度,k 为数组中元素的最大的位数;

基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以是稳定的。

必须使用稳定的计数排序算法,否则在同一位上出现相同元素时,则前一轮的排序就没有意义了

算法步骤

  1. 取得数组中的最大数,并取得位数,即为迭代次数 N(例如:数组中最大数值为 1000,则 N=4);
  2. A 为原始数组,从最低位开始取每个位组成 radix 数组;
  3. 对 radix 进行计数排序(利用计数排序适用于小范围数的特点);
  4. 将 radix 依次赋值给原数组;
  5. 重复 2~4 步骤 N 次

图解算法

在这里插入图片描述

代码实现

/**
 * Radix Sort
 *
 * @param arr
 * @return
 */
public static int[] radixSort(int[] arr) {
    if (arr.length < 2) {
        return arr;
    }
    int N = 1;
    int maxValue = arr[0];
    for (int element : arr) {
        if (element > maxValue) {
            maxValue = element;
        }
    }
    while (maxValue / 10 != 0) {
        maxValue = maxValue / 10;
        N += 1;
    }
    for (int i = 0; i < N; i++) {
        List<List<Integer>> radix = new ArrayList<>();
        for (int k = 0; k < 10; k++) {
            radix.add(new ArrayList<Integer>());
        }
        for (int element : arr) {
            int idx = (element / (int) Math.pow(10, i)) % 10;
            radix.get(idx).add(element);
        }
        int idx = 0;
        for (List<Integer> l : radix) {
            for (int n : l) {
                arr[idx++] = n;
            }
        }
    }
    return arr;
}

算法分析

  • 稳定性:稳定
  • 时间复杂度:最佳:O(n×k) 最差:O(n×k) 平均:O(n×k)
  • 空间复杂度:O(n+k)

总结

在这里插入图片描述

这些排序算法的使用场景如下:

  1. 数据量小,要求稳定:插入排序,冒泡排序
  2. 数据量中等,要求最快速度:快速排序
  3. 数据量大,要求稳定:归并排序,计数排序,桶排序
  4. 浮点数排序:插入排序,归并排序,堆排序
  5. 针对特定数据分布:计数排序,桶排序,基数排序

所以具体使用哪种排序算法,需要根据数据量的大小,稳定性的要求,数据的分布特点以及其他要素来综合判断选用。一般来说,对小数据量使用简单排序,大数据量使用时间复杂度低的稳定排序,特殊数据使用对应分布的排序。

对于百万以上级别的数据,推荐使用时间复杂度为O(nlogn)的排序,如快速排序,堆排序和归并排序。如果数据分布较集中的话,可以考虑线性时间的计数排序和桶排序。

基数排序 vs 计数排序 vs 桶排序

这三种排序算法都利用了桶的概念,但对桶的使用方法上有明显差异:

  • 基数排序:根据键值的每位数字来分配桶
  • 计数排序:每个桶只存储单一键值
  • 桶排序:每个桶存储一定范围的数值

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/553273.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

多维时序 | MATLAB实现GA-LSTM遗传算法优化长短期记忆网络的多变量时间序列预测

多维时序 | MATLAB实现GA-LSTM遗传算法优化长短期记忆网络的多变量时间序列预测 目录 多维时序 | MATLAB实现GA-LSTM遗传算法优化长短期记忆网络的多变量时间序列预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 MATLAB实现GA-LSTM遗传算法优化长短期记忆网络的数据多…

系统集成实验模拟总公司和分公司之间通信(涉及mpls vxn,链路聚合,nat,vlan划分,单臂路由,dhcp....)

目录 一 需求描述 二 需求分析 三 实验拓扑 四 实验配置 4.1 总公司 4.1.1 vlan间通信 4.1.2 dhcp自动分配ip 配置地址池 接口开启dhcp 4.1.3 链路聚合 4.1.4 ospf实现内网通信 4.2 分公司 4.2.1 单臂路由 4.2.2 dhcp自动获取ip 4.2.3 ospf实现内网通信 4.3 mp…

判断传入数据是否为列表、数组、数据框等数据结构pd.api.types.is_list_like()

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 判断传入数据是否为 列表、数组、数据框等数据结构 pd.api.types.is_list_like() 选择题 下列说法错误的是? import pandas as pd import numpy as np print("【执行】pd.api.ty…

基于html+css的图展示85

准备项目 项目开发工具 Visual Studio Code 1.44.2 版本: 1.44.2 提交: ff915844119ce9485abfe8aa9076ec76b5300ddd 日期: 2020-04-16T16:36:23.138Z Electron: 7.1.11 Chrome: 78.0.3904.130 Node.js: 12.8.1 V8: 7.8.279.23-electron.0 OS: Windows_NT x64 10.0.19044 项目…

深度学习之使用Keras构建分类问题的MLP神经网络——用于糖尿病预测

大家好&#xff0c;我是带我去滑雪&#xff01; Keras 是一个用于构建和训练深度学习模型的高级 API&#xff0c;它基于 Python编写&#xff0c;并能够运行于 TensorFlow, CNTK, 或者 Theano 等深度学习框架之上。Keras简化了深度神经网络的构建流程&#xff0c;让用户能够更加…

云计算基础——云计算主流解决方案

原数据&#xff1a;描述数据的数据&#xff0c;不可分割。 7.1 Google云计算技术 7.1.1 GCP Google 将这些技术组合在一起&#xff0c;运用这些从自身业务需求出发&#xff0c;逐步发展起来的一系列云计算技术和工具搭建起了其面向商业的云计算解决方案Google Cloud Platform (…

【数据湖架构】Azure Data Lake数据湖指南

数据湖漫游指南 文件大小和文件数文件格式分区方案使用查询加速我如何管理对我的数据的访问&#xff1f;我选择什么数据格式&#xff1f;如何管理我的数据湖成本&#xff1f;如何监控我的数据湖&#xff1f;ADLS Gen2 何时是您数据湖的正确选择&#xff1f;设计数据湖的关键考虑…

Vue.observable的理解

一、Observable 是什么 Observable 翻译过来我们可以理解成可观察的 先来看其在Vue中的定义 Vue.observable&#xff0c;让一个对象变成响应式数据。Vue 内部会用它来处理 data 函数返回的对象 返回的对象可以直接用于渲染函数和计算属性内&#xff0c;并且会在发生变更时触发…

PDF.js实现按需分片加载pdf文件-包含前后端开发源码和详细开发教程

PDF.js实现按需加载pdf文件 说明前言前端项目分片加载的效果前端项目结构前端核心代码项目运行与访问 后端项目项目结构核心代码实现注意事项 项目源码 说明 本文主要是介绍pdf.js的前后端项目的实现&#xff0c;包含可直接运行的源码。由于本人偏向于后端开发&#xff0c;因此…

Redis设计逻辑及生产部署问题整理

数据结构 redis数据结构包括&#xff1a;简单动态字符串SDS、链表、字典、跳跃表、整数组合、压缩列表。 SDS&#xff1a;在增加/减少字符串时不会频繁进行内存充分配&#xff0c;采用了空间预分配和惰性空间释放两种优化策略。 链表&#xff1a;链表节点使用void*保存节点值&a…

Stable Diffusion Web-UI 安装指南

Stable DIffusion 是 Stability.AI 开源的 text-to-image 模型&#xff0c;目前类似产品有 Midjourney 以及 OpenAI 的 DELL-2 &#xff1b;从AI绘画效果上来说&#xff0c;Midjourney 目前公认是最好的&#xff1b;但从模型的可玩性和发展潜力来看&#xff0c;个人观点来看&am…

【009】C++数据类型之转义字符和类型转换

C数据类型之转义字符和类型转换 引言一、转义字符1.1、概念1.2、八进制转义1.3、十六进制转义 二、类型转换2.1、自动类型转换原则2.2、强制类型转换 三、C新特性中类型转换的扩展3.1、隐式类型转换3.2、显式类型转换 总结 引言 &#x1f4a1; 作者简介&#xff1a;专注于C/C高…

Packet Tracer – 配置单臂路由器 VLAN 间路由

Packet Tracer – 配置单臂路由器 VLAN 间路由 地址分配表 设备 接口 IPv4 地址 子网掩码 默认网关 R1 G0/0.10 172.17.10.1 255.255.255.0 不适用 G0/0.30 172.17.30.1 255.255.255.0 不适用 PC1 NIC 172.17.10.10 255.255.255.0 172.17.10.1 PC2 NIC 1…

游乐园里,一边带小孩,一边写代码,分享一些有趣好玩儿的嵌入式软硬件资讯...

作者&#xff1a;晓宇&#xff0c;排版&#xff1a;晓宇 微信公众号&#xff1a;芯片之家&#xff08;ID&#xff1a;chiphome-dy&#xff09; 01 边带小孩边写代码 以前觉得&#xff0c;自己下班后都还有大把时间&#xff0c;下班了回到家还能再干个两三个小时&#xff0c;学…

定义运营系统架构

介绍 供应商提供的信息系统随着新功能和实施策略不断发展。可用选项的复杂性和多样性使许多公司难以充分讨论和比较可能满足或不满足其要求的替代方案。 供应商通常会推广由公司或个人工具箱中的产品或解决方案支持的架构。如果公司对其运营系统的架构没有清晰的愿景&#xf…

第九章:C语言的简单结构体

作为一个人有什么关于人的属性呢&#xff1f;简单的梳理一下&#xff0c;人的属性有自己的名字&#xff0c;年龄&#xff0c;身高&#xff0c;体重...。当然关于人的属性还有很多&#xff0c;当我们C语言来描述一下人的属性&#xff0c;就需要定义多个变量&#xff0c;那我们这…

21天学会C++:Day4----函数重载

CSDN的uu们&#xff0c;大家好。这里是C入门的第四讲。 座右铭&#xff1a;前路坎坷&#xff0c;披荆斩棘&#xff0c;扶摇直上。 博客主页&#xff1a; 姬如祎 收录专栏&#xff1a;C专题 目录 1. 知识引入 2. 函数重载的知识点 2. 为什么C语言不支持函数重载而C支持呢&…

springboot贫困生勤工助学评定管理系统

本系统尝试使用springboot在网上架构一个动态的贫困生管理系统&#xff0c;以使每一用户在家就能通过系统来进行贫困生管理。 Spring Boot 是 Spring 家族中的一个全新的框架&#xff0c;它用来简化Spring应用程序的创建和开发过程。也可以说 Spring Boot 能简化我们之前采用S…

数据结构学习记录——图应用实例-拯救007(问题描述、解题思路、伪代码解读、C语言算法实现)

目录 问题描述 解题思路 伪代码 总体算法 DFS算法 伪代码解读 总体算法 DFS算法 具体实现&#xff08;C语言&#xff09; 问题描述 在老电影“007之生死关头”&#xff08;Live and Let Die&#xff09;中有一个情节&#xff0c;007被毒贩抓到一个鳄鱼池中心的小岛…

Matlab - Plot in plot(图中画图)

Matlab - Plot in plot&#xff08;图中画图&#xff09; 这是在MATLAB中创建一个嵌入式图形的示例&#xff0c;可以在另一个图形中显示。 与MATLAB中的“axes”函数相关。 Coding % Create data t linspace(0,2*pi); t(1) eps; y sin(t);% Place axes at (0.1,0.1) with w…