【数据结构与算法】常见排序算法(Java实现)

301 阅读13分钟

简介

排序算法可分为:

  • 内部排序:数据记录在内存中进行排序。
  • 外部排序:因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。

常见的内部排序算法有:插入排序希尔排序选择排序冒泡排序归并排序快速排序堆排序基数排序等,本文只讲解内部排序算法。用一张图概括:

image-20230807102433373.png

提示

以下所有的排序实现都基于以下接口定义。

package sort;

public interface Sort {
    /**
     * 升序排序
     *
     * @param arr 需要排序数组
     * @return 排序后的数组
     */
    int[] sort(int[] arr);
}

算法分类

十种常见排序算法可以分类两大类别:比较类排序非比较类排序

sort2.png

冒泡排序(Bubble Sort)

冒泡排序是一种简单的排序算法。它重复地遍历要排序的序列,依次比较两个元素,如果它们的顺序错误就把它们交换过来。遍历序列的工作是重复地进行直到没有再需要交换为止,此时说明该序列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢 “浮” 到数列的顶端。

算法步骤

  1. 比较相邻的元素。如果第一个比第二个大,就交换它们两个;
  2. 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;
  3. 针对所有的元素重复以上的步骤,除了最后一个;
  4. 重复步骤 1~3,直到排序完成。

bubble_sort.gif

代码实现

package sort.impl;

import sort.Sort;

/**
 * 冒泡排序
 *
 * @author WanJie
 * @since 2023-03-19 20:45
 */
public class BubbleSort implements Sort {
    @Override
    public int[] sort(int[] arr) {
        // 默认交换标识
        boolean flag = true;

        // 排序所有元素
        for (int i = 0; i < arr.length - 1; i++) {
            // 前 i 个已经排序完成
            for (int j = 0; j < arr.length - 1 - i; j++) {
                // 升序排序,前一个大于后一个
                if (arr[j] > arr[j + 1]) {
                    // 交换
                    int tmp = arr[j];
                    arr[j] = arr[j + 1];
                    arr[j + 1] = tmp;
                    // 一趟排序下来,没有发生任何交换操作,则表明已经有序。
                    flag = false;
                }
            }

            if (flag) {
                break;
            }
        }
        return arr;
    }
}

此处做了一个小优化,加入了flag标识,目的是将算法的最佳时间复杂度优化为O(n),当原序列有序的情况下,减少比较次数。

选择排序(Select Sort)

  1. 选择排序是一种简单直观的排序算法,无论什么数据进去都是 O(n²) 的时间复杂度。所以用到它的时候,数据规模越小越好。唯一的好处可能就是不占用额外的内存空间了吧。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。

算法步骤

  1. 首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置
  2. 再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。
  3. 重复第 2 步,直到所有元素均排序完毕。

selection_sort.gif

代码实现

package sort.impl;

import sort.Sort;

/**
 * 选择排序
 *
 * @author WanJie
 * @since 2023-03-19 21:03
 */
public class SelectSort implements Sort {
    @Override
    public int[] sort(int[] arr) {
        for (int i = 0; i < arr.length - 1; i++) {
            // 最先元素
            int minIndex = i;
            // 寻找最小元素位置
            for (int j = i + 1; j < arr.length; j++) {
                if (arr[j] < arr[minIndex]) {
                    minIndex = j;
                }
            }

            if (minIndex != i) {
                // 交换最小元素
                int tmp = arr[minIndex];
                arr[minIndex] = arr[i];
                arr[i] = tmp;
            }
        }

        return arr;
    }
}

插入排序(Insertion Sort)

通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

算法步骤

  1. 从第一个元素开始,该元素可以认为已经被排序;
  2. 取出下一个元素,在已经排序的元素序列中从后向前扫描;
  3. 如果该元素(已排序)大于新元素,将该元素移到下一位置;
  4. 重复步骤 3,直到找到已排序的元素小于或者等于新元素的位置;
  5. 将新元素插入到该位置后;
  6. 重复步骤 2~5。

insertion_sort.gif

代码实现

package sort.impl;

import sort.Sort;

/**
 * 插入排序
 *
 * @author WanJie
 * @since 2023-03-19 21:10
 */
public class InsertionSort implements Sort {

    @Override
    public int[] sort(int[] arr) {
        // 开始时,第 0 个元素排序完毕。
        for (int i = 1; i < arr.length; i++) {
            // preIndex:已排序序列的最后一个元素位置。
            int preIndex = i - 1;
            // current:当前参与排序的元素位置
            int current = arr[i];

            // 升序比较
            while (preIndex >= 0 && arr[preIndex] > current) {
                // 元素依次后移
                arr[preIndex + 1] = arr[preIndex];
                preIndex -= 1;
            }

            // 插入元素
            arr[preIndex + 1] = current;
        }
        return arr;
    }

}

希尔排序(Shell Sort)

它是简单插入排序经过改进之后的一个更高效的版本,也称为递减增量排序算法,同时该算法是冲破 O(n²) 的第一批算法之一。

希尔排序的基本思想是:先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,待整个序列中的记录 “基本有序” 时,再对全体记录进行依次直接插入排序。

算法步骤

我们来看下希尔排序的基本步骤,在此我们选择增量 gap=length/2,缩小增量继续以 gap = gap/2 的方式,这种增量选择我们可以用一个序列来表示,{n/2, (n/2)/2, ..., 1},称为增量序列。希尔排序的增量序列的选择与证明是个数学难题,我们选择的这个增量序列是比较常用的,也是希尔建议的增量,称为希尔增量,但其实这个增量序列不是最优的。此处我们做示例使用希尔增量。

先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:

  • 选择一个增量序列 {t1, t2, …, tk},其中 (ti>tj, i<j, tk=1)
  • 按增量序列个数 k,对序列进行 k 趟直接插入排序;
  • 每趟排序,根据对应的增量 t,将待排序列分割成若干长度为 m 的子序列,分别对各子表进行直接插入排序。仅增量因子为 1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。

shell_sort.png

代码实现

package sort.impl;

import sort.Sort;

/**
 * 希尔排序
 *
 * @author WanJie
 * @since 2023-03-19 21:20
 */
public class ShellSort implements Sort {
    @Override
    public int[] sort(int[] arr) {
        int length = arr.length;
        // 增量
        int gap = length / 2;

        // 增量至少为 1,也就是最后一次插入排序
        while (gap >= 1) {
            // 以下就是一个直接插入排序的过程,只不过直接插入的增量默认为1;
            // 这里增量依次减少,直到1为止。
            for (int i = gap; i < length; i++) {
                int preIndex = i - gap;
                int current = arr[i];

                while (preIndex >= 0 && arr[preIndex] > current) {
                    arr[preIndex + gap] = arr[preIndex];
                    preIndex -= gap;
                }
                arr[preIndex + gap] = current;
            }

            gap /= 2;
        }
        return arr;
    }
}

归并排序(Merge Sort)

并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法 (Divide and Conquer) 的一个非常典型的应用。归并排序是一种稳定的排序方法。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为 2 - 路归并。

算法步骤

归并排序算法是一个递归过程,边界条件为当输入序列仅有一个元素时,直接返回,具体过程如下:

  1. 如果输入内只有一个元素,则直接返回,否则将长度为 n 的输入序列分成两个长度为 n/2 的子序列;
  2. 分别对这两个子序列进行归并排序,使子序列变为有序状态;
  3. 设定两个指针,分别指向两个已经排序子序列的起始位置;
  4. 比较两个指针所指向的元素,选择相对小的元素放入到合并空间(用于存放排序结果),并移动指针到下一位置;
  5. 重复步骤 3 ~4 直到某一指针达到序列尾;
  6. 将另一序列剩下的所有元素直接复制到合并序列尾。

merge_sort.gif

代码实现

package sort.impl;

import sort.Sort;

import java.util.Arrays;

/**
 * 归并排序
 *
 * @author WanJie
 * @since 2023-03-19 21:41
 */
public class MergeSort implements Sort {
    @Override
    public int[] sort(int[] arr) {
        if (arr.length < 2) {
            return arr;
        }

        int middle = arr.length / 2;
        int[] left = Arrays.copyOfRange(arr, 0, middle);
        int[] right = Arrays.copyOfRange(arr, middle, arr.length);

        return merge(sort(left), sort(right));
    }

    private static int[] merge(int[] left, int[] right) {
        int[] sorted = new int[left.length + right.length];
        int index = 0;

        while (left.length > 0 && right.length > 0) {
            if (left[0] <= right[0]) {
                sorted[index++] = left[0];
                left = Arrays.copyOfRange(left, 1, left.length);
            } else {
                sorted[index++] = right[0];
                right = Arrays.copyOfRange(right, 1, right.length);
            }
        }

        while (left.length > 0) {
            sorted[index++] = left[0];
            left = Arrays.copyOfRange(left, 1, left.length);
        }

        while (right.length > 0) {
            sorted[index++] = right[0];
            right = Arrays.copyOfRange(right, 1, right.length);
        }

        return sorted;
    }
}

快速排序(Quick Sort)

快速排序的基本思想:通过一趟排序将待排序列分隔成独立的两部分,其中一部分记录的元素均比另一部分的元素小,则可分别对这两部分子序列继续进行排序,以达到整个序列有序。

算法步骤

快速排序使用分治法(Divide and conquer)策略来把一个序列分为较小和较大的 2 个子序列,然后递回地排序两个子序列。具体算法描述如下:

  1. 从序列中随机挑出一个元素,做为 “基准”(pivot);
  2. 重新排列序列,将所有比基准值小的元素摆放在基准前面,所有比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个操作结束之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
  3. 递归地把小于基准值元素的子序列和大于基准值元素的子序列进行快速排序。

random_quick_sort.gif

代码实现

package sort.impl;

/**
 * @author WanJie
 * @since 2023-08-07 12:09
 */
public class QuickSort2 {

    public void sort(int[] arr, int low, int high) {
        if (low < high) {
            int position = partition(arr, low, high);
            sort(arr, low, position - 1);
            sort(arr, position + 1, high);
        }
    }

    private int partition(int[] arr, int low, int high) {
        int pivot = arr[high];
        int pointer = low;
        for (int i = low; i < high; i++) {
            if (arr[i] <= pivot) {
                int temp = arr[i];
                arr[i] = arr[pointer];
                arr[pointer] = temp;
                ++pointer;
            }
        }
        int temp = arr[pointer];
        arr[pointer] = arr[high];
        arr[high] = temp;
        return pointer;
    }
}

堆排序(Heap Sort)

堆排序是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似完全二叉树的结构,并同时满足堆的性质:即子结点的值总是小于(或者大于)它的父节点

算法步骤

  1. 将初始待排序列 (R1, R2, ……, Rn) 构建成大顶堆,此堆为初始的无序区;
  2. 将堆顶元素 R[1] 与最后一个元素 R[n] 交换,此时得到新的无序区 (R1, R2, ……, Rn-1) 和新的有序区 (Rn), 且满足 R[1, 2, ……, n-1]<=R[n]
  3. 由于交换后新的堆顶 R[1] 可能违反堆的性质,因此需要对当前无序区 (R1, R2, ……, Rn-1) 调整为新堆,然后再次将 R [1] 与无序区最后一个元素交换,得到新的无序区 (R1, R2, ……, Rn-2) 和新的有序区 (Rn-1, Rn)。不断重复此过程直到有序区的元素个数为 n-1,则整个排序过程完成。

heap_sort.gif

代码实现

package sort.impl;

import sort.Sort;

/**
 * @author WanJie
 * @since 2023-03-28 17:10
 */
public class HeapSort implements Sort {
    @Override
    public int[] sort(int[] arr) {
        int n = arr.length;
        // 构造堆
        // n - 1:最后一个节点,(n - 1) - 1 / 2 == n / 2 - 1:最后一个非叶子节点
        for (int i = n / 2 - 1; i >= 0; i--) {
            heapify(arr, n, i);
        }

        // 排序
        for (int i = n - 1; i > 0; i--) {
            // 将堆顶元素添加到数组尾部
            swap(arr, i, 0);
            // i = n - 1,即断开最后交换的堆顶元素,依次获取堆顶(最大值)最终得到升序序列
            heapify(arr, i, 0);
        }

        return arr;
    }

    /**
     * 堆化
     *
     * @param tree 待堆化的二叉树
     * @param n    二叉树的节点数
     * @param i    堆顶
     */
    private void heapify(int[] tree, int n, int i) {
        // 完全二叉树
        // 下标为 i 的节点的父节点下标为:(i-1) / 2 [整除法]
        // 下标为 i 的节点的左子节点的下标为:i * 2 + 1
        // 下标为 i 的节点的右子节点的下标为:i * 2 + 2

        int largest = i;
        int lson = i * 2 + 1;
        int rson = i * 2 + 2;
        if (lson < n && tree[largest] < tree[lson]) {
            largest = lson;
        }

        if (rson < n && tree[largest] < tree[rson]) {
            largest = rson;
        }

        // 堆顶交换
        if (largest != i) {
            swap(tree, i, largest);
            heapify(tree, n, largest);
        }

    }

    private void swap(int[] tree, int i, int j) {
        int t = tree[i];
        tree[i] = tree[j];
        tree[j] = t;
    }
}

计数排序(Counting Sort)

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数

计数排序 (Counting sort) 是一种稳定的排序算法。计数排序使用一个额外的数组 C,其中第 i 个元素是待排序数组 A 中值等于 i 的元素的个数。然后根据数组 C 来将 A 中的元素排到正确的位置。**它只能对整数进行排序。

算法步骤

  1. 找到数组中的最大值和最小值。
  2. 创建计数数组,并初始化为0。
  3. 计算每个元素的出现次数。
  4. 根据计数数组重新构建排序后的数组。

counting_sort.gif

代码实现

package sort.impl;

/**
 * 计数排序
 *
 * @author WanJie
 * @since 2023-08-07 12:58
 */

import sort.Sort;

import java.util.Arrays;

public class CountingSort implements Sort {
    @Override
    public int[] sort(int[] arr) {
        int n = arr.length;

        // 找到数组中的最大值和最小值
        int min = arr[0];
        int max = arr[0];
        for (int i = 1; i < n; i++) {
            if (arr[i] < min) {
                min = arr[i];
            }
            if (arr[i] > max) {
                max = arr[i];
            }
        }

        // 创建计数数组,并初始化为0
        int range = max - min + 1;
        int[] count = new int[range];
        Arrays.fill(count, 0);

        // 计算每个元素的出现次数
        for (int i = 0; i < n; i++) {
            count[arr[i] - min]++;
        }

        // 根据计数数组重新构建排序后的数组
        int index = 0;
        for (int i = 0; i < range; i++) {
            while (count[i] > 0) {
                arr[index++] = i + min;
                count[i]--;
            }
        }
        return arr;
    }
}

桶排序(Bucket Sort)

桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。为了使桶排序更加高效,我们需要做到这两点:

  1. 在额外空间充足的情况下,尽量增大桶的数量
  2. 使用的映射函数能够将输入的 N 个数据均匀的分配到 K 个桶中

桶排序的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行。

算法步骤

  1. 设置一个 BucketSize,作为每个桶所能放置多少个不同数值;

  2. 遍历输入数据,并且把数据依次映射到对应的桶里去;

  3. 对每个非空的桶进行排序,可以使用其它排序方法,也可以递归使用桶排序;

  4. 从非空桶里把排好序的数据拼接起来。

bucket_sort.gif

代码实现

/**
 * Gets the maximum and minimum values in the array
 * @param arr
 * @return
 */
private static int[] getMinAndMax(List<Integer> arr) {
    int maxValue = arr.get(0);
    int minValue = arr.get(0);
    for (int i : arr) {
        if (i > maxValue) {
            maxValue = i;
        } else if (i < minValue) {
            minValue = i;
        }
    }
    return new int[] { minValue, maxValue };
}

/**
 * Bucket Sort
 * @param arr
 * @return
 */
public static List<Integer> bucketSort(List<Integer> arr, int bucket_size) {
    if (arr.size() < 2 || bucket_size == 0) {
        return arr;
    }
    int[] extremum = getMinAndMax(arr);
    int minValue = extremum[0];
    int maxValue = extremum[1];
    int bucket_cnt = (maxValue - minValue) / bucket_size + 1;
    List<List<Integer>> buckets = new ArrayList<>();
    for (int i = 0; i < bucket_cnt; i++) {
        buckets.add(new ArrayList<Integer>());
    }
    for (int element : arr) {
        int idx = (element - minValue) / bucket_size;
        buckets.get(idx).add(element);
    }
    for (int i = 0; i < buckets.size(); i++) {
        if (buckets.get(i).size() > 1) {
            buckets.set(i, sort(buckets.get(i), bucket_size / 2));
        }
    }
    ArrayList<Integer> result = new ArrayList<>();
    for (List<Integer> bucket : buckets) {
        for (int element : bucket) {
            result.add(element);
        }
    }
    return result;
}

基数排序 (Radix Sort)

基数排序也是非比较的排序算法,对元素中的每一位数字进行排序,从最低位开始排序,复杂度为 O(n×k)n 为数组长度,k 为数组中元素的最大的位数;

基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以是稳定的。

算法步骤

  1. 取得数组中的最大数,并取得位数,即为迭代次数 N(例如:数组中最大数值为 1000,则 N=4);
  2. A 为原始数组,从最低位开始取每个位组成 radix 数组;
  3. radix 进行计数排序(利用计数排序适用于小范围数的特点);
  4. radix 依次赋值给原数组;
  5. 重复 2~4 步骤 N

radix_sort.gif

代码实现

/**
 * Radix Sort
 *
 * @param arr
 * @return
 */
public static int[] radixSort(int[] arr) {
    if (arr.length < 2) {
        return arr;
    }
    int N = 1;
    int maxValue = arr[0];
    for (int element : arr) {
        if (element > maxValue) {
            maxValue = element;
        }
    }
    while (maxValue / 10 != 0) {
        maxValue = maxValue / 10;
        N += 1;
    }
    for (int i = 0; i < N; i++) {
        List<List<Integer>> radix = new ArrayList<>();
        for (int k = 0; k < 10; k++) {
            radix.add(new ArrayList<Integer>());
        }
        for (int element : arr) {
            int idx = (element / (int) Math.pow(10, i)) % 10;
            radix.get(idx).add(element);
        }
        int idx = 0;
        for (List<Integer> l : radix) {
            for (int n : l) {
                arr[idx++] = n;
            }
        }
    }
    return arr;
}

参考