深入理解五种经典排序算法 | 青训营 X 豆包MarsCode AI 刷题

30 阅读5分钟

深入理解五种经典排序算法

在计算机科学中,排序算法是一个极为重要的概念,影响着程序的效率和性能。今天,我们将探讨五种经典的排序算法:基数排序、计数排序、快速排序、归并排序和堆排序,并分享一些实战中的个人分析。

基数排序

基数排序是一种非比较型排序算法,适用于按关键字排序。它通过将数据拆分为多个关键字,然后逐个关键字进行排序。

代码示例:

#include <iostream>
#include <vector>
#include <algorithm>

void countingSortForRadix(std::vector<int>& arr, int exp) {
    std::vector<int> output(arr.size());
    int count[10] = {0};
    
    for (int i = 0; i < arr.size(); i++)
        count[(arr[i] / exp) % 10]++;
    
    for (int i = 1; i < 10; i++)
        count[i] += count[i - 1];
    
    for (int i = arr.size() - 1; i >= 0; i--) {
        output[count[(arr[i] / exp) % 10] - 1] = arr[i];
        count[(arr[i] / exp) % 10]--;
    }
    
    for (int i = 0; i < arr.size(); i++)
        arr[i] = output[i];
}

void radixSort(std::vector<int>& arr) {
    int maxVal = *std::max_element(arr.begin(), arr.end());

    for (int exp = 1; maxVal / exp > 0; exp *= 10)
        countingSortForRadix(arr, exp);
}

个人分析: 基数排序在处理大规模整数数据集合时特别高效,尤其是当数据的范围较大而数字长度相对固定时。基数排序可以显著提高效率。然而,数据输入格式需要满足一定条件,如为正整数,这样才能更好地发挥其优势。

计数排序

计数排序是一种高效的非比较排序算法,适用于数据范围有限的情况。

代码示例:

#include <iostream>
#include <vector>

void countingSort(std::vector<int>& arr) {
    int maxVal = *std::max_element(arr.begin(), arr.end());
    int minVal = *std::min_element(arr.begin(), arr.end());
    int range = maxVal - minVal + 1;
    
    std::vector<int> count(range), output(arr.size());
    
    for (int num : arr)
        count[num - minVal]++;
    
    for (int i = 1; i < range; i++)
        count[i] += count[i - 1];
    
    for (int i = arr.size() - 1; i >= 0; i--) {
        output[count[arr[i] - minVal] - 1] = arr[i];
        count[arr[i] - minVal]--;
    }
    
    for (int i = 0; i < arr.size(); i++)
        arr[i] = output[i];
}

个人分析: 在处理已知数据范围且范围不大的问题时,计数排序非常高效。例如,当元素值的范围小而数量大时,计数排序能充分发挥其时间优势。但需注意,当数据范围过大或数据分布非常稀疏时,可能会导致大量内存消耗。

快速排序

快速排序是一种基于分治的排序算法,通过选择一个基准点将数组分割成两部分递归排序。

代码示例:

#include <iostream>
#include <vector>

int partition(std::vector<int>& arr, int low, int high) {
    int pivot = arr[high];
    int i = low - 1;

    for (int j = low; j <= high - 1; j++) {
        if (arr[j] < pivot) {
            i++;
            std::swap(arr[i], arr[j]);
        }
    }
    std::swap(arr[i + 1], arr[high]);
    return i + 1;
}

void quickSort(std::vector<int>& arr, int low, int high) {
    if (low < high) {
        int pi = partition(arr, low, high);

        quickSort(arr, low, pi - 1);
        quickSort(arr, pi + 1, high);
    }
}

个人分析: 快速排序在实践中往往是首选,特别是在处理大规模无序数据时。其平均时间复杂度为 (O(n \log n)),且能在原地排序。然而,选择基准点非常关键,避免最坏情况(如已排序数组下的 (O(n^2)))可通过随机选择或三数取中法来实现。

归并排序

归并排序使用分治策略,将数组递归地划分排序并合并。

代码示例:

#include <iostream>
#include <vector>

void merge(std::vector<int>& arr, int left, int mid, int right) {
    int n1 = mid - left + 1;
    int n2 = right - mid;

    std::vector<int> L(n1), R(n2);

    for (int i = 0; i < n1; i++)
        L[i] = arr[left + i];
    for (int i = 0; i < n2; i++)
        R[i] = arr[mid + 1 + i];

    int i = 0, j = 0, k = left;
    while (i < n1 && j < n2) {
        arr[k++] = (L[i] <= R[j]) ? L[i++] : R[j++];
    }

    while (i < n1) arr[k++] = L[i++];
    while (j < n2) arr[k++] = R[j++];
}

void mergeSort(std::vector<int>& arr, int left, int right) {
    if (left < right) {
        int mid = left + (right - left) / 2;

        mergeSort(arr, left, mid);
        mergeSort(arr, mid + 1, right);
        merge(arr, left, mid, right);
    }
}

个人分析: 归并排序在数据量大且需要稳定排序时表现出色。其稳定性和 (O(n \log n)) 时间复杂度使其成为处理需要保持元素原始顺序的任务的理想选择。尽管需要额外内存,实际应用中往往可以通过优化来减少内存占用。

堆排序

堆排序利用堆这种数据结构进行排序,通过构建最大堆或最小堆进行排序。

代码示例:

#include <iostream>
#include <vector>

void heapify(std::vector<int>& arr, int n, int i) {
    int largest = i;
    int left = 2 * i + 1;
    int right = 2 * i + 2;

    if (left < n && arr[left] > arr[largest])
        largest = left;

    if (right < n && arr[right] > arr[largest])
        largest = right;

    if (largest != i) {
        std::swap(arr[i], arr[largest]);
        heapify(arr, n, largest);
    }
}

void heapSort(std::vector<int>& arr) {
    int n = arr.size();

    for (int i = n / 2 - 1; i >= 0; i--)
        heapify(arr, n, i);

    for (int i = n - 1; i > 0; i--) {
        std::swap(arr[0], arr[i]);
        heapify(arr, i, 0);
    }
}

个人分析: 堆排序的非递归特性和 (O(n \log n)) 时间复杂度在某些特定场合非常有用。它不需要额外空间,使其在内存受限环境中成为不错的选择。然而,因其在现代处理器缓存利用率不佳,导致其常数因子较大,在实际应用中可能不如快速排序高效。

总结

这五种排序算法各有优劣,适用于不同的场景。通过理解每种算法的原理和适用条件,我们可以在实际应用中灵活选择合适的算法。例如,当处理大规模固定长度整数时,基数排序可能是最佳选择;而在需要稳定性和最坏情况下性能保证时,归并排序可能更为合适。快速排序则是大多数情况下的通用选择。了解这些排序算法的细节,不仅可以提高程序的性能,还可以帮助我们更好地理解算法设计的艺术。