数据结构-树（二）5.3. 二叉树的遍历和线索二叉树 5.3.1_1 二叉树的先中后序遍历遍历：按照某种次序把所有结点

5.3. 二叉树的遍历和线索二叉树

5.3.1_1 二叉树的先中后序遍历

遍历：按照某种次序把所有结点都访问一遍
二叉树的递归特性：

①要么是个空二叉树

②要么就是由“根节点+左子树+右子树”组成的二叉树

先序遍历：根左右（NLR）

中序遍历：左根右（LNR）

后序遍历：左右根（LRN）

先序遍历（PreOrder）的操作过程如下：

若二叉树为空，则什么也不做；
若二叉树非空：

①访问根结点；

②先序遍历左子树；

③先序遍历右子树。

代码实现如下：

typedef struct BiTNode{  
    ElemType data;  
    struct BiTNode *lchild, *rchild;
}BiTNode, *BiTree;
 
// 先序遍历
void PreOrder(BiTree T){  
    if(T!=NULL){     
        visit(T);                 //访问根结点        
        PreOrder(T->lchild);      //递归遍历左子树 
        PreOrder(T->rchild);      //递归遍历右子树
    }
}

中序遍历（InOrder）的操作过程如下：

若二叉树为空，则什么也不做；
若二叉树非空：

①中序遍历左子树；

②访问根结点；

③中序遍历右子树；

代码实现如下：

typedef struct BiTNode{  
    ElemType data;  
    struct BiTNode *lchild, *rchild;
}BiTNode, *BiTree;
 
// 中序遍历
void PreOrder(BiTree T){  
    if(T!=NULL){     
        PreOrder(T->lchild);      //递归遍历左子树 
        visit(T);                 //访问根结点        
        PreOrder(T->rchild);      //递归遍历右子树
    }
}

后序遍历（InOrder）的操作过程如下：

若二叉树为空，则什么也不做；
若二叉树非空： ①后序遍历左子树；

②后序遍历右子树；

③访问根结点。

代码实现如下：

typedef struct BiTNode{  
    ElemType data;  
    struct BiTNode *lchild, *rchild;
}BiTNode, *BiTree;
 
// 后序遍历
void PreOrder(BiTree T){  
    if(T!=NULL){     
        PreOrder(T->lchild);      //递归遍历左子树 
        PreOrder(T->rchild);      //递归遍历右子树
        visit(T);                 //访问根结点        
    }
}

应用：求树的深度

int treeDepth(BiTree T){  
    if(T == NULL){  
        return 0;  
    }else{      
        int l = treeDepth(T->lchild); 
        int r = treeDepth(T->rchild); 
        //树的深度=Max(左子树深度，右子树深度)+1
        return l>r ? l+1 r+1;  
    }
}

5.3.1_2 二叉树的层次遍历

算法思想:

①初始化一个辅助队列

②根结点入队

③若队列非空，则队头结点出队，访问该结点，并将其左、右孩子插入队尾（如果有的话)

④重复③直至队列为空

代码实现：

// 二叉树结点(链式存储)
typedef struct BiTNode{  
    char data;   
    struct BiTNode *lchild, *rchild;
}BiTNode, *BiTree;
 
// 链式队列结点
typedef struct LinkNode{ 
    BiTNode *data;             //存结点的指针而不是结点本身
    struct LinkNode *next;
}LinkNode;
 
typedef struct{ 
    LinkNode *front, *rear;    //队头队尾
}LinkQueue;
 
// 层序遍历
void LevelOrder(BiTree T){  
    LinkQueue Q; 
    InitQueue(Q);              //初始化辅助队列
    BiTree p;
    EnQueue(Q, T);             //将根结点入队
    while(!IsEmpty(Q)){        //队列不空则循环
        DeQueue(Q, p);         //队头结点出队
        visit(p);              //访问出队结点
        if(p->lchild!=NULL)      
            EnQueue(Q, p->lchild);     //左孩子入队
        if(p->rchild!=NULL)    
            EnQueue(Q, p->rchild);     //右孩子入队
    }
}

5.3.1_3 由遍历序列构造二叉树

若只给出一棵二叉树的前/中/后/层序遍历序列中的一种，不能唯一确定一棵二叉树一种遍历序列可能对应多种形态

前序 + 中序遍历序列

由前序遍历可推出根节点在中序遍历中的位置，从而确定左右结点，再依此类推

后序 + 中序遍历序列

由后序遍历可推出根结点在中序遍历中的位置，从而确定左右结点在中序遍历的位置

层序 + 中序遍历序列

由层序遍历可推出根结点，再根据根节点进一步确定左右的根的位置

5.3.2_1 线索二叉树的概念

普通二叉树进行遍历时，找前驱、后继很不方便，且每次都要从根结点出发，无法从一个指定的结点开始遍历。
n 个结点的二叉树，有 n+1 个空链域，可用来记录前驱、后继的信息。指向前驱、后继的指针被称为“线索”，形成的二叉树就称为线索二叉树。
线索二叉树的存储
线索二叉树的结点在原本二叉树的基础上，新增了左右线索标志 tag。
tag == 0 时，表示指针指向孩子；tag == 1 时，表示指针是“线索”。

// 线索二叉树的结点
typedef struct ThreadNode{ 
    ElemType data;   
    struct ThreadNode *lchild, *rchild; 
    int ltag, rtag;	//左、右线索标志
}ThreadNode,*ThreadTree;

5.3.2_2 二叉树的线索化

中序线索化

//线索二叉树结点
typedef struct ThreadNode{
    ElemType data;  
    struct ThreadNode *lchild, *rchild;   
    int ltag, rtag;            //左、右线索标志
}ThreadNode, *ThreadTree;
 
// 中序遍历二叉树，一边遍历一边线索化
void InThread(ThreadTree T) {
	if (T != NULL) {
		InThread(p->lchild);    //中序遍历左子树
		visit(T);               //访问根结点
		InThread(p->rchild);    //中序遍历右子树
	}
}
 
void visit(ThreadNode *q) {
    if(q->lchild==NULL){        //左子树为空，建立前驱线索
        q->lchild=pre;          //
        q->ltag=1;              //修改ltag=1,只有变成1才表示指针是线索
    }
    if(pre!=NULL&&pre->rchild==NULL){
        pre->rchild=q;          //建立前驱结点的后继线索
        pre->rtag=1;
    }
    pre=q;
}
 
//全局变量pre，指向当前访问结点的前驱
ThreadNode *pre=NULL;           //pre没有前驱，最开始指向NULL
 
 
// 中序化线索二叉树T
void CreateInThread(ThreadTree T) {
    pre = NULL;                //pre初始化为NULL
	if (T != NULL) {           //非空二叉树才能线索化
		InThread(T, pre);      //中序化线索二叉树
		if(pre->rchild = NULL)
		    pre->rtag = 1;     //处理遍历的最后一个结点
	}
}

先序线索化

// 先序遍历二叉树T
void PreThread(ThreadTree T) {
	if (T != NULL) {           //非空二叉树才能线索化
        visit(T);              //先处理根结点
		if(T->ltag ==0)        //lchild不是前驱线索
            PreThread(T->child);
        PreThread(T->child);
  	}
}
 
 
void visit(ThreadNode *q) {
    if(q->lchild==NULL){        //左子树为空，建立前驱线索
        q->lchild=pre;          //
        q->ltag=1;              //修改ltag=1,只有变成1才表示指针是线索
    }
    if(pre!=NULL&&pre->rchild==NULL){
        pre->rchild=q;          //建立前驱结点的后继线索
        pre->rtag=1;
    }
    pre=q;
}
 
//全局变量pre，指向当前访问结点的前驱
ThreadNode *pre=NULL;           //pre没有前驱，最开始指向NULL
 
void CreateInThread(ThreadTree T) {
    pre = NULL;                //pre初始化为NULL
	if (T != NULL) {           //非空二叉树才能线索化
		PreThread(T);          //先序化线索二叉树
		if(pre->rchild = NULL)
		    pre->rtag = 1;     //处理遍历的最后一个结点
	}
}

后序线索化

// 后序遍历二叉树T
void PostThread(ThreadTree T) {
	if (T != NULL) {           //非空二叉树才能线索化
		PreThread(T->child);   //后序遍历左子树
        PreThread(T->child);   //后序遍历右子树
        visit(T);              //访问根结点
  	}
}
 
 
void visit(ThreadNode *q) {
    if(q->lchild==NULL){        //左子树为空，建立前驱线索
        q->lchild=pre;          //
        q->ltag=1;              //修改ltag=1,只有变成1才表示指针是线索
    }
    if(pre!=NULL&&pre->rchild==NULL){
        pre->rchild=q;          //建立前驱结点的后继线索
        pre->rtag=1;
    }
    pre=q;
}
 
//全局变量pre，指向当前访问结点的前驱
ThreadNode *pre=NULL;           //pre没有前驱，最开始指向NULL
 
//后续线索化二叉树T
void CreateInThread(ThreadTree T) {
    pre = NULL;                //pre初始化为NULL
	if (T != NULL) {           //非空二叉树才能线索化
		PostThread(T);          //后续线索化二叉树
		if(pre->rchild = NULL)
		    pre->rtag = 1;     //处理遍历的最后一个结点
	}
}

5.3.2_3 在线索二叉树中找前驱后继

在中序线索二叉树中找到指定结点*p 的中序后继 next

①若 p->rtag==1，则 next = p->rchild

②若 p->rtag==0，则 next = p 的右子树中最左下结点

// 找到以p为根的子树中，第一个被中序遍历的结点
ThreadNode *FirstNode(ThreadNode *p){
    // 循环找到最左下结点（不一定是叶结点）
    while(p->ltag==0)
        p=p->rchild;
    return p;
}
 
// 在中序线索二叉树中找到结点p的后继结点
ThreadNode *NextNode(ThreadNode *p){
    // 右子树中最左下的结点
    if(p->rtag==0)
        return FirstNode(p->lchild);
    else
        return p->rchild;    //rtage==1直接返回后继线索
}
 
// 对中序线索二叉树进行中序循环（利用线索实现的非递归方法） 空间复杂度O(1)
void InOrder(ThreadNode *T){
    for(ThreadNode *p=FirstNode(T); p!=NULL; p=NextNode(p))
        visit(p);
}

在中序线索二叉树中找到指定结点*p 的中序前驱 pre

①若 p->ltag==1，则 pre = p->lchild

②若 p->ltag==0

// 找到以p为根的子树中，最后一个被中序遍历的结点
ThreadNode *LastNode(ThreadNode *p){
    // 循环找到最右下结点（不一定是叶结点）
    while(p->rtag==0)
        p=p->rchild;
    return p;
}
 
// 在中序线索二叉树中找到结点p的前驱结点
ThreadNode *PreNode(ThreadNode *p){
    // 左子树中最右下的结点
    if(p->ltag==0)
        return LastNode(p->lchild);
    else
        return p->lchild;        //ltage==1直接返回前驱线索
}
 
// 对中序线索二叉树进行中序循环（非递归方法实现）
void RevOrder(ThreadNode *T){
    for(ThreadNode *p=LastNode(T); p!=NULL; p=PreNode(p))
        visit(p);
}

在先序线索二叉树中找到指定结点*p 的先序后继 next

①若 p->rtag==1，则 next = p->rchild

②若 p->rtag==0

在先序线索二叉树中找到指定结点*p 的先序前驱 pre

①若 p->ltag==1，则 next = p->lchild

②若 p->ltag==0

在后序线索二叉树中找到指定结点*p 的后序前驱 pre

①若 p->ltag==1，则 pre = p->lchild

②若 p->ltag==0

在后序线索二叉树中找到指定结点*p 的后序后继 next

①若 p->rtag==1，则 next = p->rchild

②若 p->rtag==0

5.4 树和森林

5.4.1 树的存储结构

树的存储1：双亲表示法用数组顺序存储各结点，每个结点中保存数据元素、指向双亲结点(父结点)的“指针”

#define MAX_TREE_SIZE 100
 
// 树的结点
typedef struct{
    ElemType data;
    int parent;
}PTNode;
 
// 树的类型
typedef struct{
    PTNode nodes[MAX_TREE_SIZE];
    int n;	//结点数量
}PTree;

优点：找双亲(父结点)很方便

缺点：找孩子不方便，只能从头到尾遍历整个数组

树的存储2：孩子表示法（顺序+链式存储)

#define MAX_TREE_SIZE 100
 
struct CTNode{
    int child;	//孩子结点在数组中的位置
    struct CTNode *next;	//下一个孩子
}
 
typedef struct{
    ElemType data;
    struct CTNode *firstChild;	//第一个孩子
}CTBox;
 
typedef struct{
    CTBox node[MAX_TREE_SIZE];
    int n,r;	//结点数和根的位置
}CTree;

优点:找孩子很方便

缺点:找双亲(父结点)不方便，只能遍历每个链表

树的存储3：孩子兄弟表示法树的孩子兄弟表示法与二叉树类似，采用二叉链表实现，每个结点内保存数据元素和两个指针，但两个指针的含义和二叉树结点不同

//孩子兄弟表示法结点
typedef struct CSNode{
    ElemType data;
    struct CSNode *firstchild, *nextsibling;	//第一个孩子和右兄弟结点
}CSNode, *CSTree;

5.4.2 树、森林与二叉树的转换

树到二叉树的转换

①先在二叉树中，画一个根节点。

②按“树的层序”依次处理每个结点。

处理一个结点的方法是：如果当前处理的结点在树中有孩子，就把所有孩子结点 “用右指针串成糖葫芦”，并在二叉树中把第一个孩子挂在当前结点的左指针下方

森林到二叉树的转换

①先把所有树的根结点画出来，在二叉树中用右指针串成糖葫芦。

②按“森林的层序”依次处理每个结点。

处理一个结点的方法是：如果当前处理的结点在树中有孩子，就把所有孩子结点“用右指针串成糖葫芦”，并在二叉树中把第一个孩子挂在当前结点的左指针下方

注意：森林中各棵树的根节点视为平级的兄弟关系

二叉树到树的转换

①先画出树的根节点

②从树的根节点开始，按“树的层序”恢复每个结点的孩子

如何恢复一个结点的孩子：在二叉树中，如果当前处理的结点有左孩子，就把左孩子和“一整串右指针糖葫芦” 拆下来，按顺序挂在当前结点的下方

二叉树到森林的转换

①先把二叉树的根节点和“一整串右指针糖葫芦”拆下来，作为多棵树的根节点

②按“森林的层序”恢复每个结点的孩子

如何恢复一个结点的孩子：在二叉树中，如果当前处理的结点有左孩子，就把左孩子和“一整串右指针糖葫芦” 拆下来，按顺序挂在当前结点的下方

5.4.3 树和森林的遍历

树的先根遍历。若树非空，先访问根结点，再依次对每棵子树进行先根遍历。（深度优先遍历）

void PreOrder(TreeNode *R){
    if(R!=NULL){
        visit(R);
        while(R还有下一个子树T)
            PreOrder(T);
    }
}

树的先根遍历序列与这棵树相应二叉树的先序序列相同

树的后根遍历。若树非空，先依次对每棵子树进行后根遍历，最后再访问根结点。（深度优先遍历）

树的后根遍历序列与这棵树相应二叉树的中序序列相同。

树的层次遍历（用队列实现）：（广度优先遍历）

①若树非空，则根节点入队

②若队列非空，队头元素出队并访问，同时将该元素的孩子依次入队

③重复②直到队列为空
森林的先序遍历森林。森林是m (m>0）棵互不相交的树的集合。每棵树去掉根节点后，其各个子树又组成森林。

若森林为非空，则按如下规则进行遍历:

访问森林中第一棵树的根结点。

先序遍历第一棵树中根结点的子树森林。

先序遍历除去第一棵树之后剩余的树构成的森林。

效果等同于依次对各个树进行先根遍历，等同于对二叉树的先序遍历。

森林的中序遍历

中序遍历森林中第一棵树的根结点的子树森林。

访问第一棵树的根结点。

中序遍历除去第一棵树之后剩余的树构成的森林

效果等同于依次对各个树进行后根遍历，等同于对二叉树的中序遍历。

5.5 树与二叉树的应用

5.5.1 哈夫曼树

结点的权：有某种现实含义的数值。

结点的带权路径长度：从树的根到该结点的路径长度（经过的边数）与该结点上权值的乘积。

树的带权路径长度：树中所有叶结点的带权路径长度之和（WPL，Weighted Path Length）

哈夫曼树的定义：在含有 n 个带权叶结点的二叉树中，其中带权路径长度（WPL）最小的二叉树称为哈夫曼树，也称最优二叉树
哈夫曼树的构造

给定n个权值分别为w1, w2,..., wn的结点，构造哈夫曼树的算法描述如下:

将这n个结点分别作为n棵仅含一个结点的二叉树，构成森林F.
构造一个新结点，从F中选取两棵根结点权值最小的树作为新结点的左、右子树，并且将新结点的权值置为
左、右子树上根结点的权值之和。
从F中删除刚才选出的两棵树，同时将新得到的树加入F中。
重复步骤2）和3），直至F中只剩下一棵树为止。

哈夫曼树的性质

每个初始结点最终都成为叶结点，且权值越小的结点到根结点的路径长度越大。
哈夫曼树的结点总数为 2n−1。
哈夫曼树中不存在度为 1 的结点。
哈夫曼树并不唯一，但 WPL 必然相同且为最优。

哈夫曼编码

固定长度编码――每个字符用相等长度的二进制位表示

可变长度编码――允许对不同字符用不等长的二进制位表示

若没有一个编码是另一个编码的前缀，则称这样的编码为前缀编码

有哈夫曼树得到哈夫曼编码――字符集中的每个字符作为一个叶子结点，各个字符出现的频度作为结点的权值，根据之前介绍的方法构造哈夫曼树

哈夫曼编码可用于数据压缩

5.5.2_1 并查集

逻辑结构：数据元素之间为“集合”关系

集合的两个基本操作——“并”和“查”

Find ——“查”操作：确定一个指定元素所属集合

Union ——“并”操作：将两个不想交的集合合并为一个

注：并查集（Disjoint Set）是逻辑结构——集合的一种具体实现，只进行 “并”和“查”两种基本操作 “并查集”的存储结构

“并查集”的代码实现——初始化

#define SIZE 13
int uFsets [ SIZE];    //集合元素数组
//初始化并查集
void Initial (int S[]){
    for(int i=0;i<SIZE;i++)
        s[i]=-1;
}

“并查集”的代码实现——并、查

//Find“查”操作，找x所属集合(返回x所属根结点)
int Find (int S[],int x){
    while(S[x]>=0)    //循环寻找x的根
        x=S[x] ;
    return x;         //根的s[]小于0
)
 
// union“并”操作，将两个集合合并为一个
void union(int S[],int Root1,int Root2){
    //要求Root1与Root2是不同的集合
    if(Root1==Root2)return;
    //将根Root2连接到另一根Root1下面
    S[Root2]=Root1;

Union操作的优化

优化思路：在每次Union操作构建树的时候，尽可能让树不长高

①用根节点的绝对值表示树的结点总数

②Union操作，让小树合并到大树

// Union“并”操作，小树合并到大树
void Union (int S[],int Root1,int Root2 ){
    if(Root1==Root2 ) return;
    if(S[Root2]>S[Root1]) { //Root2结点数更少
        S[Root1]+=S[Root2]; //累加结点总数
        S[Root2]=Root1;     //小树合并到大树
    }else{
        S[Root2]+=S[Root1]; //累加结点总数
        S[Root1]=Root2;     //小树合并到大树
    }
}

5.5.2_2 并查集的进一步优化

拓展：Find操作的优化(压缩路径)

先找到根结点，再将查找路径上所有结点都挂到根结点下

//Find“查"操作优化，先找到根节点，再进行“压缩路径”
int Find(int S[],int x){
    int root = x;
    while(S[root]>=0)  root=S[root]; //循环找到根
    while(x! =root){   //压缩路径
        int t=S[x];    //t指向x的父节点
        S[x]=root;     //x直接挂到根节点下
        x=t;
    }
return root;           //返回根节点编号
}