为什么要使用红黑树
二叉查找树的缺陷例子 假设初始的二叉查找树只有三个结点,根结点值为9,左孩子值为8,右孩子值为12:
接下来我们依次插入如下五个结点:7,6,5,4,3。依照二叉查找树的特性,结果会变成什么样呢?
这样的二叉树虽然符合二叉查找树的特性,但是查找的性能大打折扣,几乎变成了线性查找
为了解决二叉查找树多次插入新节点导致的不平衡,红黑树便孕育而生。
红黑树介绍
红黑树是一种自平衡的二叉查找树。除了符合二叉查找树的基本特性外,还符合以下特性
- 1、节点是红色或者黑色
- 2、根节点是黑色
- 3、每个叶子节点都是黑色的空节点(NIL)
- 4、每个红色结点的两个子结点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色结点)
- 5、从任一结点到其每个叶子的所有路径都包含相同数目的黑色结点。
红黑树相关概念
变色
1、原红黑树插入值为14的新结点:
由于父结点15是黑色结点,因此这种情况并不会破坏红黑树的规则,无需做任何调整。
2、向原红黑树插入值为21的新结点:
由于父结点22是红色结点,因此这种情况打破了红黑树的规则4(每个红色结点的两个子结点都是黑色),必须进行调整,使之重新符合红黑树的规则。
为了重新符合红黑树的规则,尝试把红色结点变为黑色,或者把黑色结点变为红色。
下图所表示的是红黑树的一部分(子树),新插入的结点Y是红色结点,它的父亲结点X也是红色的,不符合规则4,因此我们可以把结点X从红色变成黑色:
但是,仅仅把一个结点变色,会导致相关路径凭空多出一个黑色结点,这样就打破了规则5。因此,我们需要对其他结点做进一步的调整。
旋转
左旋转:
逆时针旋转红黑树的两个结点,使得父结点被自己的右孩子取代,而自己成为自己的左孩子。说起来很怪异,大家看下图:
图中,身为右孩子的Y取代了X的位置,而X变成了自己的左孩子。此为左旋转。
右旋转:
顺时针旋转红黑树的两个结点,使得父结点被自己的左孩子取代,而自己成为自己的右孩子。大家看下图:
红黑树的应用
红黑树往往出现由于树的深度过大而造成磁盘IO读写过于频繁,进而导致效率低下的情况在数据较小,可以完全放到内存中时,红黑树的时间复杂度比B树低。
如linux中进程的调度用的是红黑树
IO多路复用epoll的实现采用红黑树组织管理sockfd,以支持快速的增删改查
ngnix中,用红黑树管理timer,因为红黑树是有序的,可以很快的得到距离当前最小的定时器.
红黑树和B树应用场景有何不同?
两者都是有序数据结构,可用作数据容器。红黑树多用在内部排序,即全放在内存中的,微软STL的map和set的内部实现就是红黑树。B树多用在内存里放不下,大部分数据存储在外存上时。因为B树层数少,因此可以确保每次操作,读取磁盘的次数尽可能的少。 在数据较小,可以完全放到内存中时,红黑树的时间复杂度比B树低。反之,数据量较大,外存中占主要部分时,B树因其读磁盘次数少,而具有更快的速度。