数据结构和算法--平衡二叉树

525 阅读12分钟

定义

平衡⼆叉树

平衡⼆叉树(Self-Balancing Binary Search Tree或Height-Balanced Binary Search Tree),是⼀ 种二叉排序树.其中每一个结点的左子树和右子树的高度差⾄多等于1

为啥要引入平衡二叉树呢?

对于一个数组,生成了二叉排序树,如果插入的序列越接近有序,生成的二叉搜索树就越像一个链表。如图

为了避免二叉搜索树变成“链表”,我们引入了平衡二叉树,即让树的结构看起来尽量“均匀”,左右子树的节点数尽量一样多。

两位俄罗斯数学家 G.M.Adelson - Velskii 和 E.M.Landis 共同发明的一种解决平衡二叉树的算法. 也称为AVL树

⾼度平衡: 意思是说,要么它是一颗空树,要么它的左子树和右子树都是平衡二叉树.且左子树和右子树的深度之差的绝对值不超过1;

平衡因子: 我们将二叉树上结点的左子树深度减去右子树深度的值称为平衡因子BF(Balance Factor)

下面都是平衡二叉树

最小不平衡⼆叉树

距离插入点最近的,且平衡因子的绝对值大于一的节点为根的子树,我们称为最小不平衡子树

基本思想

平衡二叉树构建的基本思想:

  • 就是在构建⼆叉排序树的过程中,每当插⼊一个结点时,先检查是否因插入⽽破坏了了树的平衡性.
  • 若是,则找到最⼩不不平衡⼦树.在保持二叉排序树特性的前提下,调整最小不平衡子树中各结点之间的链接关系.进行相应的旋转, 使之成为新的平衡子树.

构建过程

我们先将数组a[10] = {3,2,1,4,5,6,7,10,9,8}构建成二叉排序树,然后再将二叉排序树,转换成二叉平衡树

第一步:插入3、2、1的过程

当插入3的时候我们发现左子树出现了不平衡树,并且平衡因子BF是正数,并且绝对值大于1,所以需要对结点3右旋,让2成为根结点,成为了图二

第二步:插入4

依然是平衡树,继续插入

第三步:再插入5

我们发现在3结点处又出现了最小不平衡树,因为是BF是负的,所以我们需要对3结点开始的子树进行左旋,因为4只有右子树,所以只需让4代替3的位置,然后3成为4的左子树就行了,变成了图5

第四步:插入6

在2结点的右子树处出现了最小不平衡树,所以我们需要在2结点处进行左旋,让4成为根结点,因为4有左右子树,所以我们需要重新排序,根据二叉排序树规则,变成了图7

第五步:插入7

我们发现5结点的右子树出现了最小不平衡树,并且BF是负的,所以进行左旋,成为图9

第六步:插入10

依然是平衡树

第七步:插入9

在7结点的右子树出现了最小不平衡树,但是因为10结点的BF是正的,7结点的BF是负的,如果直接对7结点进行左旋,会变成图12,但是图12不是二叉排序树,所以需要先对10结点进行右旋,让10结点处的BF为负的,统一符号后,如图13,再对7结点进行左旋,然后成为图14,

右旋后成为图13,再左旋成为图14

第八步:插入8

发现了6结点的右子树出现了最小不平衡树,依然是6结点处出现了最小不平衡树,切6结点BF为-2,9结点处BF为1,需要先对9结点进行右旋,统一符号后,如图16,然后再对6结点进行左旋得到图17

这个时候,我们就完成了对数组创建二叉平衡树的创建

左旋和右旋

左旋

我们分析一下左旋的过程

  • p作为左旋的根节点
  • R的左子树成为P的右子树
  • P成为了R的左子树
  • R替换了P,成为二叉排序树新的根结点

右旋

  • P作为右旋的根结点
  • L的右子树成为了P的左子树
  • P成为了L的右子树
  • L替换了P,成为二叉排序树新的根结点

总结:

  • 当结点A的BF为正且大于或者等于2,且子树的BF也为正的时候,需要右旋
  • 当结点A的BF为负且小于或者等于-2,且子树的BF也为负的时候,需要左旋
  • 当结点A的BF为正且大于或者等于2,且子树的BF为负的时候,先对子树进行左旋,将子树的BF变为正,然后再对结点A右旋
  • 当结点A的BF为负且小于或者等于-2,且子树的BF为正的时候,先对子树进行右旋,将子树的BF变成负的,然后再对结点A左旋
  • 左旋:对结点A左旋,就是将A的右子树B放到A的位置,然后A成为B的左子树,假如B有左子树C,那么就将C变为A的右子树
  • 右旋:对结点A右旋,就是将A的左子树B放到A的位置,然后A变成B的右子树,假如B有右子树C,那么就将C变为A的左子树

代码

#define OK 1
#define ERROR 0
#define TRUE 1
#define FALSE 0
#define MAXSIZE 100
typedef int Status;

//二叉树的二叉链表结点结构定义
//结点结构
typedef struct BiTNode{
    //结点数据
    int data;
    //结点的平衡因子
    int bf;
    //结点左右孩子指针
    struct BiTNode *lchild,*rchild;
    
}BiTNode,*BiTree;

//1.右旋
/*
 对以p为根的二叉排序树作右旋处理;
 处理之后p指向新的树根结点,即旋转处理之前的左子树的根结点;
 */
void R_Rotate(BiTree *p){
    BiTree L;
    //① L是p的左子树;
     L = (*p)->lchild;
    //② L的右子树作为p的左子树
    (*p)->lchild =  L->rchild;
    //③ 将p作为L的右子树
     L->rchild = (*p);
    //④ 将L替换原有p的根结点位置
    *p =  L;
    
}

/*
 2.左旋
 对以P为根的二叉排序树作左旋处理
 处理之后P指向新的树根结点,即旋转处理之前的右子树的根结点
 */

void L_Rotate(BiTree *p){
    BiTree R;
    //① R是p的右子树
    R = (*p)->rchild;
    //② R的左子树作为R的右子树
    (*p)->rchild = R->lchild;
    //③ 将p作为R的左子树;
    R->lchild = (*p);
    //④ 将R替换原有p的根结点的位置
    *p = R;
}

#define LH +1 /*  左高 */
#define EH 0  /*  等高 */
#define RH -1 /*  右高 */
/*
 3. 对指针T所指结点为根的二叉树作左平衡旋转处理,算法结束后,指针T指向平衡处理后新的根结点
 */
void LeftBalance(BiTree *T)
{
    BiTree L,Lr;
    
    //1.L指向T的左子树根结点
    L=(*T)->lchild;
    
    //2.检查T的左子树的平衡度,并作相应平衡处理,
    //因为T既然需要左旋,肯定是T的BF的值是2,所以需要判断T的左子树L的BF符号是否和T的一样
    switch(L->bf)
    {
        /*① 新结点插入在T的左孩子的左子树上,要作单右旋处理(如图1-平衡二叉树右旋解释图)
         */
        case LH:
            //L的平衡因子为LH,即为1时,表示它与根结点BF符号相同,则将它们(T,L)的BF值都改为EH(0)
            (*T)->bf=L->bf=EH;
            //对最小不平衡子树T进行右旋;
            R_Rotate(T);
            break;
            
        //② LH的平衡因子为RH(-1)时,它与跟结点的BF值符合相反.此时需要做双旋处理(2次旋转处理)
        //   新结点插入在T的左孩子的右子树上,要作 双旋处理
        case RH:
            
            //Lr指向T的左孩子的右子树根
            Lr=L->rchild;
            
            //修改T及其左孩子的平衡因子
            switch(Lr->bf)
            {
            
                case LH:
                    (*T)->bf=RH;
                    L->bf=EH;
                    break;
                    
                case EH:
                    (*T)->bf=L->bf=EH;
                    break;
                    
                case RH:
                    (*T)->bf=EH;
                    L->bf=LH;
                    break;
             }
            Lr->bf=EH;
            //对T的左子树作左旋平衡处理
            L_Rotate(&(*T)->lchild);
            //对T作右旋平衡处理
            R_Rotate(T);
    }
}

/*
 4. 右平衡树失衡处理
 对以指针T所指结点为根的二叉树作右平衡旋转处理
 本算法结束时,指针T指向新的根结点
 */
void RightBalance(BiTree *T)
{
    BiTree R,Rl;
    //1.R指向T的右子树根结点
    R=(*T)->rchild;
    
    //2. 检查T的右子树的平衡度,并作相应平衡处理
    switch(R->bf)
    {
        //① 新结点插入在T的右孩子的右子树上,要作单左旋处理
        case RH:
            (*T)->bf=R->bf=EH;
            L_Rotate(T);
            break;
        //新结点插入在T的右孩子的左子树上,要作双旋处理
        case LH:
            //Rl指向T的右孩子的左子树根
            Rl=R->lchild;
           
            //修改T及其右孩子的平衡因子
            switch(Rl->bf)
                {
                    case RH:
                        (*T)->bf=LH;
                        R->bf=EH;
                        break;
                    case EH:
                        (*T)->bf=R->bf=EH;
                        break;
                    case LH:
                        (*T)->bf=EH;
                        R->bf=RH;
                        break;
                }
            
            Rl->bf=EH;
            //对T的右子树作右旋平衡处理
            R_Rotate(&(*T)->rchild);
            //对T作左旋平衡处理
            L_Rotate(T);
    }
}

/*
 5. 平衡二叉树的插入实现
 若在平衡的二叉排序树T中不存在和e有相同关键字的结点,则插入一个数据元素为e的新结点,并返回1,否则返回0。若因插入而使二叉排序树失去平衡,则作平衡旋转处理,布尔变量taller反映T长高与否
 思路:
 1.如果T为空时,则创建一个新结点;
 2.如果T不为空,判断是否存在相同的结点.如果二叉树中存在相同结点,则不需要插入;
 3.如果新结点值e小于T的根结点值,则在T的左子树查找;
 -如果能在左子树中查找到,则不插入进去.返回False; 如果没有找到,则插入
 -插入成功taller为TRUE,说明新结点e已经插入进去; 此时需要判断T的平衡因子;
 -如果平衡因子是1,则说明左子树高于右子树,那么需要调用leftBalance进行左平衡旋转处理;
 -如果为0或者-1,则说明新插入的结点没有让整颗二叉排序树失去平衡性,只需要修改BF值即可;
 4.如果新结点值e大于T的根结点值,则在T的右子树查找;
 -如果能在右子树中查找到,则不插入进去.返回False; 如果没有找到,则插入
 -插入成功taller为TRUE,说明新结点e已经插入进去; 此时需要判断T的平衡因子;
 -如果平衡因子是-1,则说明右子树高于左子树,那么需要调用RightBalance进行右平衡旋转处理;
 -如果为0或者1,则说明新插入的结点没有让整颗二叉排序树失去平衡性,只需要修改BF值即可;
 */
Status InsertAVL(BiTree *T,int e,Status *taller)
{
    if(!*T)
    {   //1.插入新结点,树“长高”,置taller为TRUE
        //① 开辟一个新结点T;
        *T=(BiTree)malloc(sizeof(BiTNode));
        //② 对新结点T的data赋值,并且让其左右孩子指向为空,T的BF值为EH;
        (*T)->data=e;
        (*T)->lchild=(*T)->rchild=NULL;
        (*T)->bf=EH;
        //③ 新结点默认"长高"
        *taller=TRUE;
    }
    else
    {
        if (e==(*T)->data)
        {  //2.树中已存在和e有相同关键字的结点则不再插入
            *taller=FALSE;
            return FALSE;
        }
        if (e<(*T)->data)
        {
           //3.应继续在T的左子树中进行搜索
            if(!InsertAVL(&(*T)->lchild,e,taller))
                //未插入
                return FALSE;
            
            //4.已插入到T的左子树中且左子树“长高”
            if(*taller)
                //5.检查T的平衡度
                switch((*T)->bf)
            {
                case LH:
                    //原本左子树比右子树高,需要作左平衡处理
                    LeftBalance(T);
                    *taller=FALSE;
                    break;
                case EH:
                    //原本左、右子树等高,现因左子树增高而使树增高
                    (*T)->bf=LH;
                    *taller=TRUE;
                    break;
                case RH:
                    //原本右子树比左子树高,现左、右子树等高
                    (*T)->bf=EH;
                    *taller=FALSE;
                    break;
            }
        }
        else
        { //6.应继续在T的右子树中进行搜索
            //未插入
            if(!InsertAVL(&(*T)->rchild,e,taller))
                return FALSE;
            //已插入到T的右子树且右子树“长高”
            if(*taller)
                // 检查T的平衡度
                switch((*T)->bf)
            {
                //原本左子树比右子树高,现左、右子树等高
                case LH:
                    (*T)->bf=EH;
                    *taller=FALSE;
                    break;
                //原本左、右子树等高,现因右子树增高而使树增高
                case EH:
                    (*T)->bf=RH;
                    *taller=TRUE;
                    break;
                // 原本右子树比左子树高,需要作右平衡处理
                case RH:
                    RightBalance(T);
                    *taller=FALSE;
                    break;
            }
        }
    }
    return TRUE;
}

/*6.二叉排序树查找*/
Status SearchBST(BiTree T,int key,BiTree f, BiTree *p){
    
    if (!T)    /*  查找不成功 */
    {
        *p = f;
        return FALSE;
    }
    else if (key==T->data) /*  查找成功 */
    {
        *p = T;
        return TRUE;
    }
    else if (key<T->data)
        return SearchBST(T->lchild, key, T, p);  /*  在左子树中继续查找 */
    else
        return SearchBST(T->rchild, key, T, p);  /*  在右子树中继续查找 */
}


int main(int argc, const char * argv[]) {
    // insert code here...
    printf("平衡二叉树 !\n");
    int i;
    int a[10]={3,2,1,4,5,6,7,10,9,8};
    //调整数组的顺序,最终生成的平衡二叉树高度是一样的.
    //int a[10]={8,9,1,4,5,6,7,10,2,3};
    //int a[10]={9,4,1,2,7,6,5,10,3,8};
    
    BiTree T=NULL;
    Status taller;
    int sum = 0;
    for(i=0;i<10;i++)
    {
        InsertAVL(&T,a[i],&taller);
        sum += taller;
        printf("插入%d,是否增加树的高度(%d)[YES->1 / NO->0]\n",a[i],taller);
    }
    
    printf("将数组a插入到平衡二叉树后,最终形成高度为%d的平衡二叉树\n",sum);
    
    BiTree p;
    int statusValue = SearchBST(T, 10, NULL, &p);
    printf("查找%d是否成功:%d (1->YES/0->NO)\n",p->data,statusValue);
    
    return 0;
}