数据结构与算法(上) | 青训营笔记

85 阅读3分钟

这是我参与「第三届青训营 -后端场」笔记创作活动的第4篇笔记。
本笔记总结了张云浩老师的「数据结构与算法」的课程内容(经典排序算法部分)。

1. 经典排序算法

插入排序 | 快速排序 | 堆排序

1.1 Insertion Sort 插入排序

image.png

原理:将元素不断插入已经排序好的array中

以上图为例:

  • 起始只有一个元素 5 ,其本身是一个有序序列

  • 后续元素插入有序序列中,即不断交换,直到找到第一个比其小的元素

    Time complexity(时间复杂度)

    BestAvgWorst
    O(n)O(n^2)O(n^2)

    缺点:平均和最坏情况的时间复杂度高达O(n^2)
    优点:最好情况时间复杂度为O(n)

代码(来自 pdqsort/sort.go at master · zhangyunhao116/pdqsort (github.com) 的实现):

// insertionSort sorts v[begin:end) using insertion sort.
func insertionSort[T ordered](v []T) {
	for cur := 1; cur < len(v); cur++ {
		for j := cur; j > 0 && v[j] < v[j-1]; j-- {
			v[j], v[j-1] = v[j-1], v[j]
		}
	}
}

1.2 Quick Sort 快速排序

image.png
可以在 visualising data structures and algorithms through animation - VisuAlgo 找到快排过程的可视化

原理:分治思想,不断分割序列直到序列整体有序

  • 选定一个 pivot(轴点)

  • 使用 pivot 分割序列,分成元素比 pivot 大 和元素比 pivot 小两个序列

    Time complexity(时间复杂度)

    BestAvgWorst
    O(n*logn)O(n*logn)O(n^2)

    缺点:最坏情况的时间复杂度高达O(n^2)
    优点:平均情况的时间复杂度为O(n*logn)

代码:

func partition(arr []int, low, high int) ([]int, int) {
	pivot := arr[high]
	i := low
	for j := low; j < high; j++ {
		if arr[j] < pivot {
			arr[i], arr[j] = arr[j], arr[i]
			i++
		}
	}
	arr[i], arr[high] = arr[high], arr[i]
	return arr, i
}

func quickSort(arr []int, low, high int) []int {
	if low < high {
		var p int
		arr, p = partition(arr, low, high)
		arr = quickSort(arr, low, p-1)
		arr = quickSort(arr, p+1, high)
	}
	return arr
}

1.3 Heap Sort 堆排序

image.png

利用堆的性质形成的排序算法

  • 构造一个大顶堆

  • 将根节点(最大元素)交换到最后一个位置,调整整个堆,如此反复

    Time complexity(时间复杂度)

    BestAvgWorst
    O(n*logn)O(n*logn)O(n*logn)

    缺点:最好情况的时间复杂度高达O(n*logn)
    优点:最坏情况的时间复杂度为O(n*logn)

代码(来自 pdqsort/sort.go at master · zhangyunhao116/pdqsort (github.com) 的实现):

// siftDown implements the heap property on v[lo:hi].
func siftDown[T ordered](v []T, node int) {
	for {
		child := 2*node + 1
		if child >= len(v) {
			break
		}
		if child+1 < len(v) && v[child] < v[child+1] {
			child++
		}
		if v[node] >= v[child] {
			return
		}
		v[node], v[child] = v[child], v[node]
		node = child
	}
}

func heapSort[T ordered](v []T) {
	// Build heap with greatest element at top.
	for i := (len(v) - 1) / 2; i >= 0; i-- {
		siftDown(v, i)
	}

	// Pop elements into end of v.
	for i := len(v) - 1; i >= 1; i-- {
		v[0], v[i] = v[i], v[0]
		siftDown(v[:i], 0)
	}
}

经典算法理论印象

BestAvgWorst
InsertionSortO(n)O(n^2)O(n^2)
QuickSortO(n*logn)O(n*logn)O(n^2)
HeapSortO(n*logn)O(n*logn)O(n*logn)
  • 插入排序平均和最坏情况时间复杂度都是O(n^2),性能不好
  • 快速排序整体性能处于中间层次
  • 堆排序性能稳定,“众生平等”

实际场景 benchmark

根据序列元素排列情况划分:

  • 完全随机的情况 (random)
  • 有序/逆序的情况 (sorted/reverse)
  • 元素重复度较高的情况 (mod8) 在此基础上,还需要根据序列长度来进行划分 (16/128/1024)

Benchmark-random

image.png

  • 插入排序在短序列中速度最快
  • 快速排序在其他情况中速度最快
  • 堆排序速度与最快算法差距不大

Benchmark-sorted

image.png

  • 插入排序在序列已经有序的情况下速度最快

实际场景 benchmark 结论

  • 所有短序列和元素有序情况下,插入排序性能最好
  • 在大部分的情况下,快速排序有较好的综合性能
  • 几乎在任何情况下,堆排序的表现都比较稳定

以交通工具为例:

插入排序 ————————> 单车
快速排序 ————————> 汽车
堆排序 —————————> 地铁

我们在市内出行的时候,常常会选择多种交通工具来到达目的地,排序算法是否也可以如此呢?

BestAvgWorst
InsertionSortO(n)O(n^2)O(n^2)
QuickSortO(n*logn)O(n*logn)O(n^2)
HeapSortO(n*logn)O(n*logn)O(n*logn)
???O(n)O(n*logn)O(n*logn)

我们如何结合已有的经典排序算法,打造一个性能更好的混合排序算法呢?
这些问题的答案,将再下一部分揭晓。

下篇链接:数据结构与算法(下) | 青训营笔记 - 掘金 (juejin.cn)