数据结构与算法(十)-红黑树(RedBlackTree)

1,455 阅读10分钟

红黑树(RedBlackTree)

一、红黑树的介绍

红黑树(Red–black tree)是一种自平衡二叉查找树,是在计算机科学中用到的一种数据结构,典型用途是实现关联数组。它在1972年由鲁道夫·贝尔发明,被称为"对称二叉B树",它现代的名字源于Leo J. Guibas和罗伯特·塞奇威克1978年写的一篇论文。

红黑树的结构复杂,但它的操作有着良好的最坏情况运行时间,并且在实践中高效:它可以在{\displaystyle {\text{O}}(\log n)}时间内完成查找、插入和删除,这里的n是树中元素的数目

----来自维基百科

二、红黑树的五条规则

红黑树除了符合二叉搜索树的基本规则外,还添加了以下特性:

  • 规则1:节点是红色或黑色的
  • 规则2:根节点是黑色的
  • 规则3:每个叶子节点都是黑色的空节点(NIL节点)
  • 规则4:每个红色节点的两个子节点都是黑色的(从每个叶子到根的所有路径上不可能有两个连续的红色节点)
  • 规则5:从任一节点到其每个叶子节点的所有路径都包含相同数目的黑色节点

image-20200303121529068

红黑树的相对平衡

前面5条规则的约束确保了以下红黑树的关键特性:

  • 根到叶子节点最长路径,不会超过最短路径两倍
  • 结果就是这棵树基本是平衡的
  • 虽然没有做到绝对的平衡,但是可以保证在最坏的情况下,该树依然是高效的

为什么可以做到最长路径不超过最短路径的两倍呢?

  • 性质4决定了路径上不能有两个相连的红色节点
  • 所以,最长路径一定是红色节点和黑色节点交替而成的
  • 由于根节点和叶子节点都是黑色的,最短路径可能都是黑色节点,并且最长路径中一定是黑色节点多于红色节点
  • 性质5决定了所有路径上都有相同数目的黑色节点
  • 这就表明了没有路径能多于其他任何路径两倍长

三、红黑树的三种变化

插入一个新节点时,有可能树不再平衡,可以通过三种方式的变换使树保持平衡:

  • 变色
  • 左旋转
  • 右旋转

3.1 变色

为了重新符合红黑树的规则,需要把红色节点变为黑色,或者把黑色节点变为红色

插入的新节点通常都是红色节点

  • 当插入的节点为红色的时候,大多数情况不违反红黑树的任何规则
  • 插入黑色节点,必然会导致一条路径上多了一个黑色节点,这是很难调整的
  • 红色节点虽然可能导致红红相连的情况,但是这种情况可以通过颜色调换和旋转来调整

3.2 左旋转

以节点X为根逆时针旋转二叉搜索树,使得父节点原来的位置被自己的右子节点替代,左子节点的位置被父节点替代

image-20200303132706061

旋转过程详解:

如上图所示,左旋转之后:

  • 节点X取代了节点a原来的位置
  • 节点Y取代了节点X原来的位置
  • 节点X的左子树 a 仍然是节点X的左子树(这里X的左子树只有一个节点,有多个节点时同样适用,以下同理)
  • 节点Y的右子树 c 仍然是节点Y的右子树
  • 节点Y的左子树 b 向左平移成为了节点X的右子树

除此之外,二叉搜索树左旋转之后仍为二叉搜索树:

image-20200303132617108

3.3 右旋转

以节点X为根顺时针旋转二叉搜索树,使得父节点原来的位置被自己的左子节点替代,右子节点的位置被父节点替代

image-20200303132529476

旋转过程详解:

如上图所示,右旋转之后:

  • 节点X取代了节点a原来的位置
  • 节点Y取代了节点X原来的位置
  • 节点X的右子树 a 仍然是节点X的右子树(这里X的右子树虽然只有一个节点,但是多个节点时同样适用,以下同理)
  • 节点Y的左子树 b 仍然是节点Y的左子树
  • 节点Y的右子树 c 向右平移成为了节点X左子树

除此之外,二叉搜索树右旋转之后仍为二叉搜索树:

image-20200303132501369

四、红黑树的插入操作

首先需要明确,在保证满足红黑树5条规则的情况下,新插入的节点必然是红色节点

为了方便说明,规定以下四个节点:新插入节点为N(Node),N的父节点为P(Parent),P的兄弟节点为U(Uncle),U的父节点为G(Grandpa),如下图所示:

image-20200303120344016

情况1

当插入的新节点N位于树的根上时,没有父节点。

这种情况下,只需要将红色节点变为黑色节点即可满足规则2 。

image-20200303132357511

情况2

新节点N的父节点P为黑色节点,此时不需要任何变化。此时既满足规则4也满足规则5。

尽管新节点是红色的,但是新节点N有两个黑色节点NIL,所以通向它的路径上黑色节点的个数依然相等,因此满足规则5 。

image-20200303132304098

情况3

节点P为红色,节点U也为红色,此时节点G必为黑色,即父红 叔红 祖黑。在这种情况下需要:

  • 先将父节点P变为黑色
  • 再将叔叔节点U变为黑色
  • 最后将祖父节点G变为红色

即变为父黑叔黑祖红,如下图所示:

image-20200303132148128

可能出现的问题:

  • N的 祖父节点G父节点 也可能是 红色,这就违反了规则4,此时可以通过递归调整节点颜色
  • 当递归调整到根节点时就需要旋转了,如下图节点A和节点B所示,具体情况后面会介绍

image-20200303132050765

情况4

节点P是红色节点,节点U是黑色节点,并且节点N为节点P的左子节点,此时节点G一定是黑色节点,即父红叔黑祖黑

在这种情况下需要:

  • 先变色:将父节点P变为黑色,将祖父节点G变为红色,即父黑祖红
  • 后旋转:以祖父节点G为根进行右旋转

image-20200303131956298

情况5

节点P是红色节点,节点U是黑色节点,并且节点N为节点P的右子节点,此时节点G一定是黑色节点,即父红叔黑祖黑

在这种情况下需要:

  • 先以**节点P为根进行左旋转,**旋转后如图b所示
  • 随后将红色节点P和黑色节点B看成一个整体的红色节点N1,将新插入的红色节点N 看成 红色节点P1 如图c所示。此时整体就转换为了情况4。

image-20200303140225631

然后可以按照情况4进行处理:

  • 先变色:将N1节点的父节点P1变为黑色,将祖父节点G变为红色
  • 后旋转:以祖父节点G为根进行右旋转,旋转后如图 e 所示
  • 最后将节点N1和P1变换回来,完成节点N的插入,如图 f 所示

image-20200303131736316

五、实际插入案例

在二叉树中依次插入节点:10,9,8,7,6,5,4,3,2,1 。

如果直接采用普通的二叉搜索树,节点全部插入后是这样的:

image-20200303161149709

是一个严重的不平衡树,相当于一个链表,不能体现出二叉搜索树的高效率。而按照红黑树的五条规则插入节点就能最大程度保证搜索二叉树是一棵平衡树

以下为在红黑树中实际插入10,9,9....1过程的详解,为了方便解释省略了部分红黑树的叶子节点(NIL)

插入10

符合情况1

  • 插入节点10
  • 将节点10的颜色变为黑色

image-20200303161257010

插入9

符合情况2

  • 不需要任何变化

image-20200303161919072

插入8

我们快速判断属于情况3还是情况4的方法:

从新插入的节点N出发,按图示箭头经过的四个节点,若为红红黑红 三个红色节点则为情况3,若为**红红黑黑 **两个红色节点则为情况4

image-20200303162613413

经过判断,我们插入8时符合情况4,所以需要以下操作:

  • 父节点9变成黑,祖父节点10变为红
  • 以祖父节点为根进行右旋转

image-20200303163803388

插入7

符合情况3

  • 父节点8和叔节点10变为黑,祖父节点9变为红
  • 此时会出现问题:不符合规则2,即根节点不为黑,此时可以把以9为根节点的二叉搜索树当作一个整体作为一个新插入的节点N,而此时又符合情况1,只需要把9变回黑色即可

image-20200303165135028

插入6

符合情况4

  • 父节点7变为黑,祖父节点8变为红
  • 以祖父节点8为根进行右旋转

image-20200306170016958

插入5

符合情况3

  • 父节点6和叔节点8变为黑,祖父节点7变为红

image-20200303170150314

插入4

符合情况4

  • 父节点5变为黑,祖父节点6变为红
  • 以祖父节点6为根进行右旋转

image-20200303171028009

插入3

第一次变换:符合情况3

  • 父节点4和叔节点6变为黑,祖父节点5变为红

变换之后发现5和7为相连的两个红色节点,于是把以5为根的整个子树看成一个新插入的节点N1,再进行第二次变换。

image-20200303171755035

第二次变换:符合情况4

  • 父节点7变为黑,祖父节点9变为红
  • 以祖父节点9为根进行右旋转

image-20200303172800302

最后复原N1得到变换后的红黑树:

image-20200303173158141

插入2

符合情况4

  • 父节点3变为黑,祖父节点4变为红
  • 以祖父节点4为根进行右旋转

image-20200303174011409

插入1

第一次变换:符合情况3

  • 父节点2和叔节点4变为黑,祖父节点3变为红

变换之后发现3和5为相连的两个红色节点,于是把以3为根的整个子树看成一个新插入的节点N1,再进行第二次变换

image-20200303180603741

第二次变换:符合情况3

  • 父节点5和叔节点9变为黑祖父节点7变为红

变换之后发现根节点7为红色不符合规则2,所以把以7为根节点的红黑树看成一个新插入的节点N2,再进行第三次变换

第三次变换:符合情况1

  • 直接将根节点7变为黑色即可

image-20200303181133397

由此,完成了1~10节点的插入,虽然没有遇到情况5,不过情况5经过左旋转的操作便可转换为情况4,原理一样。如下图所示,将这棵红黑树的叶子节点NIL补全之后,经检验满足红黑树的五条规则,并且基本属于平衡树,效率较高。

image-20200303182326442