怎么实现O(n)级别的排序算法?

401 阅读5分钟

桶排序

核心思想是将要排序的数据分到几个有序的桶里,每个桶里的数据再单独进行排序。桶内排完序之后,再把每个桶里的数据按照顺序依次取出,组成的序列就是有序的了。

如果要排序的数据有 n 个,我们把它们均匀地划分到 m 个桶内,每个桶里就有 k=n/m 个元素。每个桶内部使用快速排序,时间复杂度为 O(k * logk)。m 个桶排序的时间复杂度就是 O(m * k * logk),因为 k=n/m,所以整个桶排序的时间复杂度就是 O(n*log(n/m))。当桶的个数 m 接近数据个数 n 时,log(n/m) 就是一个非常小的常量,这个时候桶排序的时间复杂度接近 O(n)。

使用的要求:

首先,要排序的数据需要很容易就能划分成 m 个桶,并且,桶与桶之间有着天然的大小顺序。这样每个桶内的数据都排序完之后,桶与桶之间的数据不需要再进行排序。其次,数据在各个桶之间的分布是比较均匀的。如果数据经过桶的划分之后,有些桶里的数据非常多,有些非常少,很不平均,那桶内数据排序的时间复杂度就不是常量级了。在极端情况下,如果数据都被划分到一个桶里,那就退化为 O(nlogn) 的排序算法了。

适合使用:

桶排序比较适合用在外部排序中。所谓的外部排序就是数据存储在外部磁盘中,数据量比较大,内存有限,无法将数据全部加载到内存中。

计数排序

计数排序其实是桶排序的一种特殊情况。当要排序的 n 个数据,所处的范围并不大的时候,比如最大值是 k,我们就可以把数据划分成 k 个桶。每个桶内的数据值都是相同的,省掉了桶内排序的时间。

考生的满分是 900 分,最小是 0 分,这个数据的范围很小,所以我们可以分成 901 个桶,对应分数从 0 分到 900 分。根据考生的成绩,我们将这 50 万考生划分到这 901 个桶里。桶内的数据都是分数相同的考生,所以并不需要再进行排序。我们只需要依次扫描每个桶,将桶内的考生依次输出到一个数组中,就实现了 50 万考生的排序。因为只涉及扫描遍历操作,所以时间复杂度是 O(n)。

总结:

计数排序只能用在数据范围不大的场景中,如果数据范围 k 比要排序的数据 n 大很多,就不适合用计数排序了。而且,计数排序只能给非负整数排序,如果要排序的数据是其他类型的,要将其在不改变相对大小的情况下,转化为非负整数。

下面是用go实现的桶排序的算法,计数和桶排序应该是差不多的。

//我在这里实现的是最简单的计数排序,应该是不稳定的
func jisort(arr []int)[]int {
	var res []int //这里需要注意一下,如果使用的是make([]int,len(arr))的话
	//那么结果就会多一些0,因为这样直接写的话,初始化就把位置上的值默认为了0
	t :=make([]int,len(arr))
	for _,val :=range arr {
		t[val]++
	}
	for index,v := range t {
		for ; v > 0 ; v-- {
			res = append(res,index)
		}
	}
	return res

}

下面是第二种:

//上面是一个最简单的实践的方法,但是很方便我们去理解,它是不稳定,下面我们实现稳定的计数排序,并且下面的基数排序也会用到这个点
func jiSort(arr []int) []int {

	// 数组长度
	length := len(arr)

	// 统计长度 0~9
	bitCounts := make([]int, 10)
  num:=0
	for i := 0; i < length; i++ {
		num =arr[i]

		bitCounts[num]++
	}

	// 叠加(目的是增加稳定性)
	// 原来是0~9,现在变成描述0~9的累加数量,这样就可以很方便的知道最终的坐标
	for j := 1; j < len(bitCounts); j++ {
		bitCounts[j] += bitCounts[j-1]
	}

	// 临时数组
	res := make([]int, length)

	// 将原来的数组倒序遍历一遍
	for i := length - 1; i >= 0; i-- {

	
		num = arr[i]

		res[bitCounts[num]-1] = arr[i]

		// 统计余数相等的个数,进行递减
		bitCounts[num]--
	}

	return res
}


基数排序

基数排序是一种非比较型整数排序算法,其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。由于整数也可以表达字符串(比如名字或日期)和特定格式的浮点数,所以基数排序也不是只能使用于整数。

基数排序对数据的要求 基数排序对要排序的数据是有要求的,需要可以分割出独立的“位”来比较,而且位之间有递进的关系,如果 a 数据的高位比 b 数据大,那剩下的低位就不用比较了。除此之外,每一位的数据范围不能太大,要可以用线性排序算法来排序,否则,基数排序的时间复杂度就无法做到 O(n) 了。

func RadixSort(arr []int) []int {

	// 最大值,确定数量级
	max, _ := selectSort.SelectSortMax(arr)

	// 按照数量级分段
	for bit := 1; max/bit > 0; bit *= 10 {

		// 每次处理一个级别的排序
		arr = bitSort(arr, bit)
	}

	return arr
}

// 按照位数排序
func bitSort(arr []int, bit int) []int {

	// 数组长度
	length := len(arr)

	// 统计长度 0~9
	bitCounts := make([]int, 10)

	for i := 0; i < length; i++ {

		// 余数
		num := (arr[i] / bit) % 10

		// 统计余数相等的个数,进行递增
		bitCounts[num]++
	}

	// 叠加(目的是增加稳定性)
	// 原来是0~9,现在变成描述0~9的累加数量,这样就可以很方便的知道最终的坐标
	for j := 1; j < len(bitCounts); j++ {
		bitCounts[j] += bitCounts[j-1]
	}

	// 临时数组
	res := make([]int, length)

	// 将原来的数组倒序遍历一遍
	for i := length - 1; i >= 0; i-- {

		// 余数
		num := (arr[i] / bit) % 10

		res[bitCounts[num]-1] = arr[i]

		// 统计余数相等的个数,进行递减
		bitCounts[num]--
	}

	return res
}