【数据结构】二叉树的概念与介绍 | 堆的概念与性质

253 阅读7分钟

​一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第7天,点击查看活动详情。​

前言:

在上一章中我们正式开启了对数据结构中树的讲解,介绍了树的基础。本章我们将学习二叉树的概念,介绍满二叉树和完全二叉树的定义,并对二叉树的基本性质进行一个简单的介绍。本章附带课后练习。

0x00 概念

📚 定义:二叉树既然叫二叉树,顾名思义即度最大为2的树称为二叉树。 它的度可以为 1 也可以为 0,但是度最大为 2 。

📜 一颗二叉树是节点的一个有限集合,该集合:

① 由一个根节点加上两颗被称为左子树右子树的二叉树组成

② 或者为空

🔺 观察上图我们可以得出如下结论:

① 二叉树不存在度大于 2 的节点,换言之二叉树最多也只能有两个孩子。

② 二叉树的子树有左右之分,分别为左孩子右孩子。次序不可颠倒,因此二叉树是有序树。

📌 注意:对于任意的二叉树都是由以下几种情况复合而成的:

0x01 满二叉树

📚 定义:一个二叉树,如果每一层的节点数都达到了最大值(均为2),则这个二叉树就可以被称作为 "满二叉树" 。

📜 换言之,如果一个二叉树的层数为 h​,且节点总数是 2^h - 1​ ,则他就是一个满二叉树。

🔺 计算公式:

① 已知层数求总数:N = 2^h-1

② 已知总数求层数: h = log_2(N+1)

❓ 十亿个节点,满二叉树是多少层?

💡 2^3^0​ ≈ 10亿多

0x02 完全二叉树

📚 定义:对于深度为 K​ 的,有 n​ 个结点的二叉树,当且仅当其每一个结点都与深度为 K​ 的满二叉树中编号从 1 至 n​ 的结点一一对应时称之为完全二叉树。

📜 前 h - 1​ 层是满的,最后一层不满,但是最后一层从左到右是连续的。

完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。所以,满二叉树是一种特殊的完全二叉树(每一层节点均为2)。

📚 常识:

① 完全二叉树中,度为 1 的最多只有 1 个。

② 高度为 h​ 的完全二叉树节点范围是 [ 2^{h-1} - 1 + 1, 2^{h} - 1 ]

0x03 二叉树的性质

📚 四点规则:

① 若规定根节点的层数为 1 ,则一颗非空二叉树的第 i​ 层上最多有 2^{(i-1)}​ 个节点。

② 若规定根节点的层数为 1 ,则深度为 K​ 的二叉树最大节点数是 2^h-1​ .

③ 对任何一颗二叉树,如果度为 0 其叶子结点个数为 n_0​ ,度为 2 的分支节点个数为 n_2​ ,则有 n_0 = n_2 + 1​ 。换言之,度为 0 的永远比度为 2 的多一个叶子结点。

④ 若规定根节点的层数为 1 , 具有 n​ 个节点的满二叉树的深度 K = log_2 (n+1)​ (log是以2为底,n+1的对数)。

📚 对于有 n​ 个节点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从 0 开始编号,则对于序号为 parent​ 的节点有:

​(非完全二叉树,也可以用数组存放,但会浪费很多空间)

假设 parent​ 是父节点在数组中的下标,此公式仅适用于完全二叉树:

① 求左孩子: leftChild = parent * 2 + 1

② 求右孩子:rightChild = parent*2+2

③ 求父亲(假设不关注是左孩子还是右孩子):

parent = \frac{child-1}{2}

④ 判断是否有左孩子: 2*parent+1\geq n

⑤ 判断是否由右孩子: 2*parent+2 \geq n

💭

PS:

二叉树不一定要标准,比如这个其实也是二叉树:

课后练习:

1. 某二叉树共有 399 个结点,其中有 199 个度为 2 的结点,则该二叉树中的叶子结点数为( )

A. 不存在这样的二叉树

B. 200

C. 198

D. 199

2. 在具有 2n 个结点的完全二叉树中,叶子结点个数为( )

A. n

B. n+1

C. n-1

D. n/2

3. 一棵完全二叉树的节点数位为531个,那么这棵树的高度为( )

A. 11

B. 10

C. 8

D. 12

5. 一个具有767个节点的完全二叉树,其叶子节点个数为()

A. 383

B. 384

C. 385

D. 386

二、堆的概念与性质

0x00 堆的概念

**【百度百科】**​堆(Heap)是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵完全二叉树的数组对象。

📚 若有一个关键码的集合 K= \left { k_0,k_1,k_2,...,k_{n-1} \right }​ , 堆分为大堆小堆。将其所有元素按完全二叉树的顺序存储在一个数组中:

① 如满足 K_i \leq K_{2*i+1}​ 且 K_i \leq K_{2*i+2}i = 0, 1,2...​ 则称为小堆。

② 如满足 K_i \geq K_{2*i+1}​ 且 K_i \geqslant K_{2*i+2}i = 0, 1,2...​ ,则称为大堆。

我们将根节点最大的堆称作最大堆(即大根堆),根节点最小的堆称作最小堆(即小根堆)。

🔺 综上所述:

① 大堆:树中任何一棵树及子树中,父亲的值都大于等于孩子 ( parent \geqslant child​ )

② 小堆:树中任何一颗树及子树中,父亲的值都小于等于孩子 ( parent \leqslant child​ )

0x01 堆的性质

① 堆总是一棵完全二叉树。

② 堆中的某个节点的值总是不大于或不小于其父节点的值。

0x02 堆的作用

① 堆排序

② 解决 TopK​ 问题,在 N​ 个数中找出最大的前 k​ 个或找出最小的 k​ 个

……

三、堆的定义

所有的数组都可以表示成完全二叉树,但是它不一定是堆。大堆:树中所有父亲都大于等于孩子小堆:树中所有父亲都小于等于孩子。下面我们将要实现的是大堆。

0x00 数组堆

typedef int HPDataType;

typedef struct Heap {
    HPDataType* array;  //指向动态开辟的数组
    int size;           //有效数据的个数
    int capacity;       //容量空间的大小
} HP;

0x01 接口函数

📚 这是需要实现几个接口函数:

/* 堆的初始化 */
void HeapInit(HP* php);

/* 堆的销毁 */
void HeapDestroy(HP* php);

/* 堆的打印 */
void HeapPrint(HP* php);

/* 判断堆是否为空 */
bool HeapIfEmpty(HP* hp);

/* 堆的插入 */
void HeapPush(HP* php, HPDataType x);
    /* 检查容量 */
    void HeapCheckCapacity(HP* php);
        /* 交换函数 */
        void Swap(HPDataType* px, HPDataType* py);
    /* 大根堆上调 */ 
    void BigAdjustUp(int* arr, int child);
    /* 小根堆上调 */ 
    void SmallAdjustUp(int* arr, int child);

/* 堆的删除 */
void HeapPop(HP* php);
    /* 小根堆下调*/ 
    void SmallAdjustDown(int* arr, int n, int parent);
    /* 大根堆下调 */
    void BigAdjustDown(int* arr, int n, int parent);

/* 返回堆顶数据*/
HPDataType HeapTop(HP* php);

/* 统计堆的个数 */
int HeapSize(HP* php);

本章完。