堆排序基础

142 阅读3分钟

堆排序

堆排序是一种利用堆这种数据结构设计的排序算法。堆是一个近似完全二叉树的结构,满足子节点的键值或索引总是小于(或者大于)它的父节点。堆排序的基本思想是利用大顶堆(或小顶堆)的特性,使得每次从无序序列中选择最大(或最小)元素变得简单。

具体步骤:

  1. 将待排序的序列构造成一个最大堆(或最小堆),此时序列的最大(或最小)值为根节点。
  2. 依次将根节点与待排序序列的最后一个元素交换,并从堆中删除该元素。
  3. 再维护从根节点到该元素的前一个节点为最大堆(或最小堆),如此往复,最终得到一个递增(或递减)序列。
// 堆排序代码示例
public class HeapSort {

    // 交换数组中的两个元素
    public static void swap(int[] arr, int i, int j) {
        int temp = arr[i];
        arr[i] = arr[j];
        arr[j] = temp;
    }

    // 调整堆,使其满足最大堆的性质
    public static void heapify(int[] arr, int n, int i) {
        // i为当前节点的索引,n为堆的大小
        int largest = i; // 假设当前节点为最大值
        int left = 2 * i + 1; // 左孩子的索引
        int right = 2 * i + 2; // 右孩子的索引

        // 如果左孩子存在且大于当前节点,更新最大值的索引
        if (left < n && arr[left] > arr[largest]) {
            largest = left;
        }

        // 如果右孩子存在且大于当前节点,更新最大值的索引
        if (right < n && arr[right] > arr[largest]) {
            largest = right;
        }

        // 如果最大值不是当前节点,交换它们,并递归地调整被交换的子树
        if (largest != i) {
            swap(arr, i, largest);
            heapify(arr, n, largest);
        }
    }

    // 堆排序主函数
    public static void heapSort(int[] arr) {
        int n = arr.length; // 数组的长度

        // 从最后一个非叶子节点开始,自下而上地构建最大堆
        for (int i = n / 2 - 1; i >= 0; i--) {
            heapify(arr, n, i);
        }

        // 从堆中依次取出最大元素,并放到数组的末尾
        for (int i = n - 1; i > 0; i--) {
            swap(arr, 0, i); // 将堆顶元素与当前最后一个元素交换
            heapify(arr, i, 0); // 将剩余的元素重新调整为最大堆
        }
    }

    // 测试代码
    public static void main(String[] args) {
        int[] arr = {12, 11, 13, 5, 6, 7}; // 待排序的数组
        System.out.println("原始数组:");
        for (int num : arr) {
            System.out.print(num + " ");
        }
        System.out.println();

        heapSort(arr); // 堆排序

        System.out.println("排序后的数组:");
        for (int num : arr) {
            System.out.print(num + " ");
        }
    }
}

堆排序其实也是一种选择排序,是一种树形选择排序。只不过直接选择排序中,为了从R[1…n]中选择最大记录,需比较n-1次,然后从R[1…n-2]中选择最大记录需比较n-2次。

事实上这n-2次比较中有很多已经在前面的n-1次比较中已经做过,而树形选择排序恰好利用树形的特点保存了部分前面的比较结果,因此可以减少比较次数。对于n个关键字序列,最坏情况下每个节点需比较log2(n)次,因此其最坏情况下时间复杂度为nlogn。堆排序为不稳定排序,不适合记录较少的排序。