Holle 二叉树| 8月更文挑战

213 阅读6分钟

image.png

一、树

1.树的常用概念

根节点、叶子节点、父节点、子节点、兄弟节点,还有节点的高度、深度以及层数,树的高度。

2.概念解释

  • 节点:树中的每个元素称为节点
  • 父子关系:相邻两节点的连线,称为父子关系
  • 根节点:没有父节点的节点
  • 叶子节点:没有子节点的节点
  • 父节点:指向子节点的节点
  • 子节点:被父节点指向的节点
  • 兄弟节点:具有相同父节点的多个节点称为兄弟节点关系
  • 节点的高度:节点到叶子节点的最长路径所包含的边数
  • 节点的深度:根节点到节点的路径所包含的边数
  • 节点的层数:节点的深度+1(根节点的层数是1)
  • 树的高度:等于根节点的高度 图1 图2

二、二叉树

1.概念

1.什么是二叉树? 每个节点最多只有2个子节点的树,这两个节点分别是左子节点和右子节点。 2.什么是满二叉树? 有一种二叉树,除了叶子节点外,每个节点都有左右两个子节点,这种二叉树叫做满二叉树。 3.什么是完全二叉树? 有一种二叉树,叶子节点都在最底下两层,最后一层叶子节都靠左排列,并且除了最后一层,其他层的节点个数都要达到最大,这种二叉树叫做完全二叉树。 3

2.完全二叉树的存储

  1. 链式存储 图4 每个节点由3个字段,其中一个存储数据,另外两个是指向左右子节点的指针。我们只要拎住根节点,就可以通过左右子节点的指针,把整棵树都串起来。这种存储方式比较常用,大部分二叉树代码都是通过这种方式实现的。
  2. 顺序存储 图5 用数组来存储,对于完全二叉树,如果节点X存储在数组中的下标为i,那么它的左子节点的存储下标为2i,右子节点的下标为2i+1,反过来,下标i/2位置存储的就是该节点的父节点。注意,根节点存储在下标为1的位置。完全二叉树用数组来存储时最省内存的方式。
  3. 二叉树的遍历 6 前序遍历:对于树中的任意节点来说,先打印这个节点,然后再打印它的左子树,最后打印它的右子树。 中序遍历:对于树中的任意节点来说,先打印它的左子树,然后再打印它的本身,最后打印它的右子树。 后序遍历:对于树中的任意节点来说,先打印它的左子树,然后再打印它的右子树,最后打印它本身。
前序遍历的递推公式:
preOrder(r) = print r->preOrder(r->left)->preOrder(r->right)
中序遍历的递推公式:
inOrder(r) = inOrder(r->left)->print r->inOrder(r->right)
后序遍历的递推公式:
postOrder(r) = postOrder(r->left)->postOrder(r->right)->print r
时间复杂度:3种遍历方式中,每个节点最多会被访问2次,所以时间复杂度是O(n)。

递归代码实现:

void preOrder(Node* root) {
  if (root == null) return;
  print root // 此处为伪代码,表示打印 root 节点
  preOrder(root->left);
  preOrder(root->right);
}

void inOrder(Node* root) {
  if (root == null) return;
  inOrder(root->left);
  print root // 此处为伪代码,表示打印 root 节点
  inOrder(root->right);
}

void postOrder(Node* root) {
  if (root == null) return;
  postOrder(root->left);
  postOrder(root->right);
  print root // 此处为伪代码,表示打印 root 节点
}

三、思考

1.给定一组数据,比如1,3,5,6,9,10.你来算算,可以构建出多少种不同的二叉树?

  • 答: 是卡特兰数,是C[n,2n] / (n+1)种形状,c是组合数,节点的不同又是一个全排列,一共就是n!*C[n,2n] / (n+1)个二叉树。可以通过数学归纳法推导得出。

2.我们讲了三种二叉树的遍历方式,前、中、后序。实际上,还有另一种遍历方式,也就是按层遍历,你知道如何实现吗?

  • 答:层次遍历需要借助队列这样一个辅助数据结构。(其实也可以不用,这样就要自己手动去处理节点的关系,代码不太好理解,好处就是空间复杂度是o(1)。不过用队列比较好理解,缺点就是空间复杂度是o(n))。根节点先入队列,然后队列不空,取出对头元素,如果左孩子存在就入列队,否则什么也不做,右孩子同理。直到队列为空,则表示树层次遍历结束。树的层次遍历,其实也是一个广度优先的遍历算法。

四、二叉查找树

二叉查找树:在树中的每一个节点,其左子树的每个节点值都小于这个节点,其右子树中的每个节点值都大于这个节点值。

二叉查找树基本操作

1.查找:每次和节点比较,小则再从左子树找,大则从右子树找。

图一

public class BinarySearchTree {
  private Node tree;

  public Node find(int data) {
    Node p = tree;
    while (p != null) {
      if (data < p.data) p = p.left;
      else if (data > p.data) p = p.right;
      else return p;
    }
    return null;
  }

  public static class Node {
    private int data;
    private Node left;
    private Node right;

    public Node(int data) {
      this.data = data;
    }
  }
}

2.插入:同查找类似,直到左子树或者右子树为空则插入。

图二

public void insert(int data) {
  if (tree == null) {
    tree = new Node(data);
    return;
  }

  Node p = tree;
  while (p != null) {
    if (data > p.data) {
      if (p.right == null) {
        p.right = new Node(data);
        return;
      }
      p = p.right;
    } else { // data < p.data
      if (p.left == null) {
        p.left = new Node(data);
        return;
      }
      p = p.left;
    }
  }
}

3.删除:分三种情况。

  • 如果要删除的节点没有子节点,则将指向该节点的指针置为null即可。
  • 如果要删除的节点只有一个子节点,只需要将指向要删除节点的指针指向其子节点即可。
  • 如果要删除的节点有两个子节点,那么需要找到其右子树上的最小节点来替换要删除的这个节点。

图三

public void delete(int data) {
  Node p = tree; // p 指向要删除的节点,初始化指向根节点
  Node pp = null; // pp 记录的是 p 的父节点
  while (p != null && p.data != data) {
    pp = p;
    if (data > p.data) p = p.right;
    else p = p.left;
  }
  if (p == null) return; // 没有找到

  // 要删除的节点有两个子节点
  if (p.left != null && p.right != null) { // 查找右子树中最小节点
    Node minP = p.right;
    Node minPP = p; // minPP 表示 minP 的父节点
    while (minP.left != null) {
      minPP = minP;
      minP = minP.left;
    }
    p.data = minP.data; // 将 minP 的数据替换到 p 中
    p = minP; // 下面就变成了删除 minP 了
    pp = minPP;
  }

  // 删除节点是叶子节点或者仅有一个子节点
  Node child; // p 的子节点
  if (p.left != null) child = p.left;
  else if (p.right != null) child = p.right;
  else child = null;

  if (pp == null) tree = child; // 删除的是根节点
  else if (pp.left == p) pp.left = child;
  else pp.right = child;
}

注:其实删除有个取巧的操作:即把要删除的节点标记为已删除。只是删的多了会比较占内存。

二叉查找树其他操作:快速查找最大最小节点、前驱结点、后继节点。中序遍历可快速输出有序序列,实践复杂度O(n)。

效率:极度不平衡的二叉查找树(退化成链表)层数为n,时间复杂度O(n),完全二叉树复杂度O(logn),因为层数小于等于logn。所以我们尽可能构建左右子树都比较平衡的二叉树。

五、思考:

如何通过编程,求出一颗给定二叉树的确切高度。

确定二叉树高度有两种思路:

  • 第一种是深度优先思想的递归,分别求左右子树的高度。当前节点的高度就是左右子树中较大的那个+1;
  • 第二种可以采用层次遍历的方式,每一层记录都记录下当前队列的长度,这个是队尾,每一层队头从0开始。然后每遍历一个元素,队头下标+1。直到队头下标等于队尾下标。这个时候表示当前层遍历完成。每一层刚开始遍历的时候,树的高度+1。最后队列为空,就能得到树的高度。

image.png