跳表

201 阅读2分钟

redis为什么选择跳表来实现有序集合呢?为什么不用红黑树?

如何理解跳表?

  • 对于一个单链表存储的数据是有序的,但是如果我们想在其中查找某个数据,也只能从头到尾遍历链表。 这样查找效率会很低,时间复杂度也很高,是O(n)
  • 那么怎么提高查找效率呢?建立索引

跳表是不是很浪费内存?

  • 比起单纯的单链表,跳表需要存储多级索引,肯定要消耗更多的存储共建。那到底需要消耗多少额外的存储空间呢?
  • 我们来分析跳表的空间复杂度O(n)

解答题目

  • Redis中的有序集合是通过跳表来实现的,严格来讲,其实还用到了散列表。Redis中有序集合支持的核心操作主要有下面几个:
    • 插入一个数据
    • 删除一个数据
    • 查找一个数据
    • 按照区间查找数据(比如查找值在[100,356]之间的数据)
    • 迭代输出有序序列
  • 其中,插入、删除、查找以及迭代输出有序序列这几个操作,红黑树也可以完成,时间复杂度跟跳表一样的。但是,按照区间查找这个操作,红黑树的效率没有跳表高
  • 对于按照区间查找数据这个操作,跳表可以做到O(logn)的时间复杂度定位区间的起点,然后在原始链表中顺序往后 遍历就可以了。这样做非常高效
  • 当然,Redis之所以用跳表来实现有序集合,还有其他原因,比如,跳表更容易代码实现。虽然跳表代码也不简单,但比起红黑树来说还是好懂、好写多了,而简单就意味着可读性好,不容易出错。还有,跳表更加灵活,它可以通过改变索引构建策略,有效平衡执行效率和内存消耗。
  • 不过,跳表也不能完全替代红黑树。因为红黑树比跳表出现但更早,很多编程语言的map类型都是通过红黑树来实现的。我们做业务开发的时候,直接拿来用就可以了,不用费劲的实现一个红黑树,但是跳表并没有一个现成的实现,所以在开发中,如果你想要实现跳表,必须自己实现。