搞不懂排序算法？看这篇就欧了数据结构入门学习（全是干货）——排序算法（上） 1 简单排序（冒泡排序、插入排序） 1.1

数据结构入门学习（全是干货）——排序算法（上）

1 简单排序（冒泡排序、插入排序）

1.1 概述

简单排序包括冒泡排序和插入排序，它们是基础的排序算法，具有易于理解和实现的特点，适合对小规模数据进行排序。


void X_Sort(ElementType A[],int N)//sort就是排序的意思，X是排序算法的名称
    //统一默认输入的参数有两个(一个是待排的元素放在一个数组里，数据类型为ElementType任意类型。另外一个是正整数N，表示的是我们要排的元素到底有多少个，默认讨论整数(从小到达)的排序)
    1.N是正整数
    2.只讨论基于比较的排序(>=< 有定义)
    3.只讨论内部排序(假设我们内存空间足够大，所有数据可以一次性导入内存空间里，然后所有的排序是在内存里面一次性完成的)
    //外部排序(假设我有的内存空间有2GB，但是要求我们对10TB的数据进行排序，这个时候内部排序就不行了)
    4.稳定性：任意两个相等的数据，排序先后的相对位置不发生改变
    5.没有一种排序是任何情况下都表现最好

1.2 冒泡排序

冒泡排序的特点：

冒泡排序适合于单向链表和数组等数据结构。其对链表的适应性较好，其他排序算法实现起来相对困难。
冒泡排序是稳定的排序算法。相同元素的相对位置在排序后仍然保持不变。


void Bubble_Sort(ElementType A[],int N)
{
    for(i = 0; i < P;P--){
        flag = 0;//表示还没有执行果任何一次交换
        for(i = 0;i < P;i++ ){//一趟冒泡
        	if(A[i] > A[i+1] ){
            	Swap(A[i],A[i+1]);
                flag = 1;//要交换的时候标识变为1
        	}
    }
        if( flag == 0 ) break;//全程无交换
    }
}

最好情况：顺序T = O(N)	全程无交换
最坏情况：逆序T = O(N²)

冒泡排序的例子：

给定初始序列 {34, 8, 64, 51, 32, 21}，冒泡排序完成排序的过程中需要 9次元素交换。

1.3 插入排序


void Insertion_Sort( ElementType A[],int N )
{
    for( P = 1;P < N; P++ ){
        Tmp = A[P];//摸下一张牌，Tmp为临时存放的位置
        for( i = P; i > 0 && A[i - 1] > Tmp;i--)//旧牌大
            A[i] = A[i - 1];//移除空位
        A[i] = Tmp;//新牌落位
    }
}
//最好情况：顺序T = O(N)
//最坏情况：逆序T = O(N²)

插入排序的特点：

插入排序算法简洁，代码相对较短，容易实现。
与冒泡排序相比，插入排序在交换元素时，减少了额外的操作，因为插入排序并不依赖于相邻元素的两两交换，而是将元素插入合适的位置。
插入排序也是稳定的排序算法。

插入排序的例子：

同样给定序列 {34, 8, 64, 51, 32, 21}，插入排序需要 9次元素移动 完成排序。

对于一组10个元素的非递减有序序列，使用插入排序将其转换为非递增序列，最多可能会进行 45次比较 和 44次移动。

1.4 时间复杂度下界

冒泡排序和插入排序的时间复杂度均为 O(N²) 在最坏和平均情况下，它们的效率与逆序对的数量密切相关。

逆序对的分析

序列 {34, 8, 64, 51, 32, 21} 中有 9个逆序对，逆序对的数量等于排序过程中的交换次数。

为了提高算法效率，关键在于一次性消除多个逆序对，或者通过交换不相邻的元素来加速排序。

2 希尔排序

希尔排序是一种改进的插入排序算法，通过引入增量序列，使得每次可以跨较大的间隔进行排序，从而加速排序过程。

到最后使用1-间隔的排序来保证序列有序(彻底的插入排序)。但此时这个序列已经基本有序了，大多数的逆序对已经在前面两趟5-间隔和3-间隔里面被消除掉了

重要性质：3-间隔有序的序列还保持了前面5-间隔有序的这个性质(没有把上一步的结果变坏)

希尔增量序列

原始希尔排序


void Shell_Sort( ElementType A[],int N )
{
    for(D = M/2; D > 0; D /= 2 ){//希尔增量序列
        for( P = D; P < N; P++ ){//插入排序，D是距离(第0张牌在我手里，下一张牌从第D张牌开始摸)
            Tmp = A[P];
            for( i = P; i >= D && A[i - D] > Tmp;i -= D )
                A[i] = A[i - D];
            A[i] = Tmp;
        }
    }
}

最坏情况：

O是一个上界(可能达不到)

增长速度跟N²一样快

坏例子

增量元素不互质，则小增量可能根本不起作用

更多的增量序列

用Sedgewick增量序列
void ShellSort( ElementType A[], int N )
{ /* 希尔排序 - 用Sedgewick增量序列 */
     int Si, D, P, i;
     ElementType Tmp;
     /* 这里只列出一小部分增量 */
     int Sedgewick[] = {929, 505, 209, 109, 41, 19, 5, 1, 0};
     
     for ( Si=0; Sedgewick[Si]>=N; Si++ ) 
         ; /* 初始的增量Sedgewick[Si]不能超过待排序列长度 */

     for ( D=Sedgewick[Si]; D>0; D=Sedgewick[++Si] )
         for ( P=D; P<N; P++ ) { /* 插入排序*/
             Tmp = A[P];
             for ( i=P; i>=D && A[i-D]>Tmp; i-=D )
                 A[i] = A[i-D];
             A[i] = Tmp;
         }
}

希尔排序的特点：

通过多次使用递减的增量序列进行排序，逐步消除逆序对，最终使用 1-间隔的排序来保证序列完全有序。
增量选择不当可能导致最坏情况时间复杂度与 O(N²) 一样。

3 堆排序

大顶堆：每个节点的值都大于或者等于它的左右子节点的值。

堆排序的基本思想是：
1、将带排序的序列构造成一个大顶堆，根据大顶堆的性质，当前堆的根节点（堆顶）就是序列中最大的元素；
2、将堆顶元素和最后一个元素交换，然后将剩下的节点重新构造成一个大顶堆；
3、重复步骤2，如此反复，从第一次构建大顶堆开始，每一次构建，我们都能获得一个序列的最大值，然后把它放到大顶堆的尾部。最后，就得到一个有序的序列了。

3.1 选择排序的基础

堆排序是一种基于堆的选择排序算法。最小堆的根节点存储的是最小元素，最大堆的根节点则存储最大元素。

void Selection_Sort( ElementType A[],int N )
{
    for( i = 0;i < N; i++ ){
        MinPosition = ScanForMin( A,i,N-1);
        //从A[i]到A[N-1]中找最小元，并将其位置赋给MinPosition
    Swap(A[i],A[MinPosition]);//这两个元素通常情况下不是挨着的，可能跳了很远的距离做一个交换，一下子就消除掉很多逆序对
        //将未排序部分的最小元换到有序部分的最后位置
        //最坏情况就是每次都必须换一下，最多需要换N-1次
    }
}
//想要得到更快的算法取决于这个ScanForMin( A,i,N-1)，也就是如何快速找到最小元

最小堆的特点就是他的根结点一定存的是最小元

3.2 堆排序的实现

堆排序通过构建最大堆（或最小堆）逐步将根节点与末尾元素交换，并调整堆的结构，完成排序。对于下标为 i 的元素，其左孩子下标为 2i+1，右孩子下标为 2i+2。

算法一：

void Heap_Sort(ElementType A[],int N)
{
    BuildHeap(A);//O(N)
    for( i = 0;i < N;i++ )
        TmpA[i] = DeleteMin(A);//把根结点弹出来，依次存到这个临时数组里面。O(logN)
    for( i = 0;i < N;i++ )//O(N)
        A[i] = TmpA[i];//将TmpA里面所有的元素导回A里面
}
//缺点：需要额外O(N)空间，并且复制元素需要时间

算法二：

void Heap_Sort(ElementType A[],int N )
{
    for(i = N/2;i >= 0;i-- ){//BuildHeap，i对应的是根节点所在的位置，N对应的是当前这个堆里一共有多少个元素
        PercDown(A,i,N);
    for( i = N-1;i > 0;i--){//堆循环
        Swap(&A[0],&A[i]);//DeleteMax，A[0]根节点里面存的是最大的元素，i是当前最后一个元素的下标，把根节点换到当前这个堆的最后一个元素的位置上去
        PercDown(A,0,i);//调整的时候是以0为根节点，i是当前这个最大堆的元素个数
    }
    }
}

算法2的动态变化：

堆排序
void Swap( ElementType *a, ElementType *b )
{
     ElementType t = *a; *a = *b; *b = t;
}
 
void PercDown( ElementType A[], int p, int N )
{ 
  /* 将N个元素的数组中以A[p]为根的子堆调整为最大堆 */
    int Parent, Child;
    ElementType X;

    X = A[p]; /* 取出根结点存放的值 */
    for( Parent=p; (Parent*2+1)<N; Parent=Child ) {
        Child = Parent * 2 + 1;
        if( (Child!=N-1) && (A[Child]<A[Child+1]) )
            Child++;  /* Child指向左右子结点的较大者 */
        if( X >= A[Child] ) break; /* 找到了合适位置 */
        else  /* 下滤X */
            A[Parent] = A[Child];
    }
    A[Parent] = X;
}

void HeapSort( ElementType A[], int N ) 
{ /* 堆排序 */
     int i;
      
     for ( i=N/2-1; i>=0; i-- )/* 建立最大堆 */
         PercDown( A, i, N );
     
     for ( i=N-1; i>0; i-- ) {
         /* 删除最大堆顶 */
         Swap( &A[0], &A[i] ); /* 见代码7.1 */
         PercDown( A, 0, i );
     }

4 归并排序

4.1 有序子列的归并

归并排序利用“分而治之”的思想，将序列分割为若干子序列，然后通过合并有序子列完成排序。

需要3个指针(这个指针不一定是C语言里面说的那个语法上的指针)

指针：本质上他存的是位置

假设我们讨论的是数组(那位置由下标决定，那图中的指针就可以是整数，整数存的是这个元素的下标)

上方图中红色跟绿色的指针指向的位置进行比大小，小的填入下方的空位置中，红绿色其他一方填入数值后指针就往后挪一位，然后继续红绿色指针所指位置对比大小，直到下方空位置填满

如果两个子列一共有N个元素，则归并的时间复杂度是？T(N) = O(N)

//L = 左边起始位置,R = 右边起始位置,RightEnd = 右边终点位置
void Merge(ElementType A[],ElementType TmpA[],int L,int R,int RightEnd)//Merge就是归并的意思
{//参数意思从左到右分别是：原始的待排的序列，临时存放的数组，归并左边的起始位置(也就是上图的Aptr)，归并右边的起始位置(也就是上图的Bptr)，右边终点的位置

    LeftEnd = R - 1;//左边终点位置，假设左右两列挨着
    Tmp = L;//存放结果的数组的初始位置，相当于上图的Cptr
    NumElements = RightEnd - L + 1;//元素的总个数
    //上方是准备工作，下方开始归并
    while( L <= LeftEnd && R <= RightEnd ){//一直走到左右两边其中一方不满足之后跳出(意味着其中一个子序列已经空了，没有元素了，另一方剩下的元素直接全部导入后面就可以了)
        if(A[L] <= A[R] ) TmpA[Tmp++] = A[L++];//左边小，将Aptr放入
        else			  TmpA[Tmp++] = A[R++];//右边小，将Bptr放入
    }
    while( L <= LeftEnd )//直接复制左边剩下的
        TmpA[Tmp++] = A[L++];
    while( R <= RightEnd)//直接复制右边剩下的
        TmpA[Tmp++] = A[R++];//TmpA只是临时存放的地方，还需要导回去
    for( i = 0;i < NumElements;i++,RightEnd-- )//从后面开始才能知道终点的位置具体是哪个，因为RightEnd具体多少是不固定的
        A[RightEnd] = TmpA[RightEnd];
}

归并的时间复杂度为 O(N)，因为每次都需要将 N 个元素进行比较并合并。

4.2 递归归并排序

递归实现归并排序需要申请额外的空间用于存放临时数据，并通过递归方式将序列逐步分割到最小子序列，再进行归并。

先把整个一分为二，然后递归的去考虑问题，递归的去把左边排好序，再递归的把右边排好序。这样得到两个有序的子序列，而且肩并肩的放在一起，最后调用我们归并的算法，把他们归并到一个完整的数组里

void MSort(ElementType A[],ElementType TmpA[],int L,int RightEnd )
{//上述参数：原始待排的数组，临时的数组，L指待排序列开头的位置，RightEnd则是待排序列结尾的位置
    int Center;//中间的位置
    if( L < RightEnd ){
        Center = (L + RightEnd ) / 2;
        MSort( A,TmpA,L,Center );//左边的递归排序
        MSort( A,TmpA,Center+1，RightEnd );//右边的递归
        Merge( A,TmpA,L,Center+1,RightEnd );//归并，传入的参数分别是原始数组A,临时数组TmpA，左边的起始点，右边的起始点吗，右边的终点。结果存在原来这个数组A里面
    }
}
//T(N) = T(N/2)+T(N/2)+O(N) => T(N) = O(NlogN)
NlogN：没有最坏时间复杂度也没有最好时间复杂度，更没有平均时间复杂度，任何情况下都是NlogN，非常稳定

统一函数接口

void Merge_sort( ElementType A[],int N )//参数：原始的数组A,元素的个数N
{
    ElementType *TmpA;
    TmpA = malloc(N * sizeof( ElementType ));//TmpA空间在这里临时申请
    if( TmpA != NULL ){//检查申请的空间是否还有位置
        MSort(A,TmpA,0,N-1);//TmpA在这里只是一个递归的调用，真正用到TmpA的地方是在Merge(核心的那个归并函数里)
        free( TmpA );//把临时空间给释放掉 
    }
    else Error("空间不足")
}

如果只在Merge中声明临时数组TmpA
1.void Merge( ElementType A[],int L,int R,int RightEnd )
2.void MSort( ElementType A[],int L,int RightEnd)

白色砖块一样的东西是申请的空间，要不停的申请空间再释放掉，这样做实际上是不合算的(太麻烦了，申请一个释放掉在申请下一个不停循环) 最合算的做法：一开始就声明一个数组，每次只把数组的指针传进去，只在这个数组的某一段上面做操作，就不需要重复的malloc跟free

4.3 非递归归并排序

非递归的归并排序使用迭代的方法实现，通过逐步扩大已排序的子序列的长度，完成排序。该方法的空间复杂度为 O(N)。

只需要开一个临时数组就够了，没有必要每次合并都开一个
第一次我们把A给归并到临时数组里面
第二次把临时数组里面的东西归并回A里面去，然后再把A导到临时数组里，再把临时数组导回到A
最后一步运气好的话就是A，运气不好的话这最后一步可能是那个临时数组他不是A(需要再加一步导回到A里面去)

上图的深度为logN

非递归算法的额外空间复杂度是？O(N)

void Merge_pass( ElementType A[],ElementType TmpA[],int N,int length)//length = 当前有序子列长度(一开始为1，之后每次加倍)
{//参数：原始数组，临时数组，N为待排序列长度
    for(i = 0; i < N-2*length;i += 2*length )//i += 2*length就是跳过两段然后去找下一对。最后尾巴可能是单个的所以先把前面成对的那一部分处理完，终止条件就是处理到倒数第二对(这个处理完了再看尾巴)
        Merge1( A, TempA, i, i+length, i+2*length-1 );//不做Merge最后一步导入A中，在这里意味着把A中的元素归并到TmpA里面去，最好有序的内容是放在TmpA里面
    if( i+length < N )//归并最后两个子列，最后如果加上一段以后还是小于N的，那就说明我最后是不止一个子列，是有两个子列的
        //如果这个if条件不成立意味着当前i这个位置加上一个length之后他就跳到N外面去了，也就意味着我最后只剩下一个子列
        Merge1(A,TmpA,i,i+length,N-1);
    else//最后剩下一个子列
        for(j = i;i < N;j++ ) TmpA[j] = A[j]; 
}

原始统一接口

void Merge_sort( ElementType A[],int N )
{
    int length = 1//初始化子序列长度
    ElementType *TmpA;
    TmpA = malloc( N* sizeof(ElementType));
    if( TmpA != NULL ){
        while( length < N ){
            Merge_pass(A,TmpA,N,length);
            length *= 2;
            Merge_pass(TmpA,A,N,length);//传进来的length长度是2。前面这个TmpA是初始状态，后面A是归并以后的状态
            length *= 2;//这里length再次double(翻倍)变成了4
            //最后跳出while循环，结果都是存在A里面的，哪怕最后一步执行到Merge_pass(A,TmpA,N,length);就已经有序了，也会多执行一步Merge_pass，将TmpA原封不动的导到A里面然后自然跳出
        }
        free(TmpA);
    }
    else Error("空间不足");
}

//优点：稳定
//缺点：需要一个额外的空间，并且需要在数组跟数组之间来回来去的复制 导这个元素。所以实际运用中基本上不做内排序(在外排序的时候是非常有用的)

归并排序的优缺点：

优点：稳定，适合外部排序。
缺点：需要额外的 O(N) 空间。