B树

156 阅读4分钟

红黑树(Red Black Tree)

  • 红黑树也是一种自平衡的二叉搜索树
  • 也可称为平衡二叉B树 红黑树必须满足以下五条性质:
  1. 节点是Red或者Black
  2. 根节点是Black
  3. 叶子节点(外部节点、空节点)都是Black
  4. Red节点的子节点都是Black
  • Red节点的Parent都是Black
  • 从根节点到叶子节点的所有路径上不可能有2个连续的Red节点
  1. 从任意节点到叶子节点的所有路径都包含相同数目的Black节点

截屏2021-11-13 上午12.11.25.png

B树

  • B树是一种平衡的多路搜索树,多用于文件系统、数据库的实现
  • 一个节点可以存储超过两个元素,可以有超过两个子节点
  • 有二叉搜索树的一些性质
  • 平衡,每个节点的子树高度一致
  • 树的高度较矮

截屏2021-11-13 上午12.18.37.png

截屏2021-11-13 上午12.19.02.png

m阶B树的性质(m>=2)

假设一个节点存储的元素个数为x

  • 根节点: 1 <= x <= m-1
  • 非根节点: ceil(m/2) - 1 <= x <= m-1 (ceil为向上取整) 若有子节点,子节点个数 y = x + 1
  • 根节点: 2 <= y <= m
  • 非根节点: ceil(m/2) <= y <= m 比如m=5, 3 <= y <= 5, 因此可称为(3,5)树
  • 数据库实现一般使用 200 - 300阶 B树

截屏2021-11-13 上午12.31.38.png

B树与二叉搜索树对比

  • B树和二叉搜索树在逻辑上是等价的
  • 多代节点合并可得到一个超级节点
  • 2代合并的节点,最多拥有4个子节点(至少是4阶B树)
  • 3代合并的节点,最多拥有8个子节点(至少是8阶B树)
  • n代合并的节点,最多拥有2^n个子节点(至少是2^n阶B树) m阶B树,最多需要log2(m)代合并

截屏2021-11-13 上午12.41.42.png

B树的搜索

与二叉搜索树的搜索类似:

  1. 先在节点内部从小到大开始搜索元素
  2. 如果命中,搜索结束
  3. 如果未命中,再去对应子节点中搜索元素,重复步骤1

B树的添加

新添加的元素必定是添加到叶子节点 添加前:

截屏2021-11-13 上午12.47.30.png

添加55:

截屏2021-11-13 上午12.47.42.png

添加95:

截屏2021-11-13 上午12.50.15.png

假设这是一棵4阶B树,如果再添加98会导致右下角叶子节点的元素个数超过限制,此种现象称作上溢(overflow)

上溢问题的解决

此处假设是5阶B树

  • 上溢节点的元素个数一定为m
  • 假设上溢节点最中间的元素位置为k,将k位置元素与父节点合并
  • 将[0, k-1]和[k+1, m-1]位置的元素分裂为2个子节点,且这两个分裂的子节点的元素个数必然不会低于最低限制ceil(m/2)-1
  • 一次分裂完毕后可能会导致父节点也产生上溢,同样参照此方法即可
  • 最极端情况下可能会导致一直分裂到根节点

具体可见下图:

截屏2021-11-13 上午1.05.26.png

整体添加过程举例如下:

截屏2021-11-13 上午1.07.09.png

B树的删除

删除叶子节点

假如删除的元素在叶子节点中,直接删除即可 删除前: 截屏2021-11-13 上午1.12.49.png 删除30: 截屏2021-11-13 上午1.12.57.png

删除非叶子节点

假如要删除的元素在非叶子节点中,则:

  1. 先找到前驱或后继元素,覆盖所需删除元素的值
  2. 再把前驱或者后继元素删掉 非叶子节点的前驱或者后继元素一定在叶子节点中,所以本质也是删除叶子节点的元素 真正删除的元素都是在叶子节点中

这里删除60,使用了60的前驱节点55,也可以使用后继节点70 截屏2021-11-13 上午1.17.59.png

添加会导致上溢的发生,同样删除也会导致下溢的发生

下溢的解决

  • 下溢节点的元素数量必然为ceil(m/2)-2
  • 如果下溢节点临近的兄弟节点中元素数量不低于ceil(m/2),可以从中借一个元素
  • 将父节点的元素b插入到下溢节点的0位置(最小位置)
  • 用兄弟节点的最大元素a替代b 这种操作等价于旋转

截屏2021-11-13 上午1.26.59.png

  • 如果下溢节点临近的兄弟节点中元素数量只有ceil(m/2) - 1
  • 将父节点的元素b挪下来与左右子节点进行合并
  • 合并后元素个数为ceil(m/2) + ceil(m/2) - 2 不超过 m - 1 这个操作同样可能会导致父节点发生下溢,依然按照此方法解决,此现象可能会向上传播

截屏2021-11-13 上午1.44.58.png

4阶B树

4阶B树的性质:

  • 所有节点所能储存的元素个数x:1 <= x <= 3
  • 所有非叶子节点的子节点个数y: 2 <= y <= 4

添加从1添加到22,再从1删除到22过程可参考:www.cs.usfca.edu/~galles/vis…