插入排序

156 阅读4分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

前言: 排序的概念

排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。 稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。image-20220501212330686 内部排序:数据元素全部放在内存中的排序。 外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。

image-20220502101741551

==常见排序算法的实现(全都以升序为例)==

1. 插入排序

1.1 基本思想:

直接插入排序是一种简单的插入排序法,其是基本思想

把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。

实际中我们玩扑克牌时,就用了插入排序的思想,在排序自己手中的扑克牌时经常会这样排。

1.2 1️⃣直接插入排序:

当插入第i(i>=1)个元素时,前面的array[0],array[1],…,array[i-1]已经排好序,此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较,找到插入位置即将array[i]插入,原来位置上的元素顺序后移

img

void InsertSort(int* a, int n)
{
	for (int i = 0; i < n - 1; i++)
	{
		int end = i;
		//单趟排序
		int tmp = a[end + 1];
		while (end >= 0)
		{
			if (a[end] > tmp)
			{
				a[end + 1] = a[end];//移开,腾位置
				end--;
			}
			else
				break;
		}
		a[end + 1] = tmp;
	}
}

直接插入排序的特性总结:

1️⃣元素集合越接近有序,直接插入排序算法的时间效率越高

2️⃣时间复杂度:O(N2N^2)

3️⃣空间复杂度:O(1)

4️⃣ 稳定性:稳定

1.3 2️⃣希尔排序( 缩小增量排序)

希尔排序法又称缩小增量法。希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成多个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取不同的gap,重复上述分组和排序的工作。 gap>1时在做预排序,当到达gap=1时相当于做直接插入排序,所有记录在统一组内排好序

640?wx_fmt=gif

void ShellSort(int* a, int n)
{
	int gap = n;
	while (gap > 1)
	{
        //gap > 1        预排序
        //最后一次gap = 1 直接插入排序
		gap = gap / 3 + 1;
		for (int i = 0; i < n - gap; i++)
		{
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
				if (a[end] > tmp)
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
				{
					break;
				}
			}
			a[end + gap] = tmp;
		}
	}
}

希尔排序的特性总结: 1️⃣希尔排序是对直接插入排序的优化。 2️⃣ 当gap > 1时都是预排序,目的是让数组更快接近于有序(跳的快)。

​ 当gap == 1时(相当于直接插入排序),数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。 3️⃣希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都不固定:

举个🌰:Knuth在所著的《计算机程序设计技巧》第三卷中,利用大量的实验统计资料得出,当n很大时,关键码平均比较次数和对象平均移动次数大概在范围n1.25n^{1.25}1.6n1.251.6*n^{1.25}范围内,这是利用直接插入排序作为子序列排序方法的情况下得到的。

因为咱们的gap是按照Knuth提出的方式取值的,而且Knuth进行了大量的试验统计,我们暂时就按照:O(n1.25n^{1.25}​)到 O(1.6n1.251.6*n^{1.25}​)来算。

4️⃣稳定性:不稳定(相同的数据可能被分到不同的gap组)