有了如此高效的散列表,为什么还需要二叉树?

有了如此高效的散列表,为什么还需要二叉树?

散列表的插入、删除、查找操作的时间复杂度可以做到常量级的O(1),非常高效。而二叉树在比较平衡的情况下, 插入、删除、查找操作时间复杂度才是O(logn),相对散列表有什么优势呢?

  • 散列表中的数据是无序存储的,如果要输出有序的数据,需要先进行排序。而对于BST来说,我们只需要中序遍历,就可以在O(n)的时间复杂度内,输出有序的数据序列
  • 散列表扩容耗时很多,而且当遇到散裂冲突时,性能不稳定,尽管BST的性能不稳定,但在工程中,我们最常用的BST性能非常稳定在O(logn)
  • 笼统地来说,尽管散列表的查找等操作的时间复杂度是常量级的,但因为哈希冲突的存在,这个常量不一定比 logn 小,所以实际的查找速度可能不一定比 O(logn) 快。加上哈希函数的耗时,也不一定就比平衡二叉查找树的效率高。
  • 散列表的构造比二叉查找树要复杂,需要考虑的东西很多。比如散列函数的设计、冲突解决办法、扩容、缩容等。平衡二叉查找树只需要考虑平衡性这一个问题,而且这个问题的解决方案比较成熟、固定。
  • 为了避免过多的散列冲突,散列表装载因子不能太大,特别是基于开放寻址法解决冲突的散列表,不然会浪费一定的存储空间。

综合,BST在某些方面还是优于散列表的,所以两者的存在并不冲突

分类:
后端
标签: