数据结构之为什么使用多路查找树

2022-06-12 239 阅读2分钟

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第16天，点击查看活动详情

为什么使用多路查找树

在前面专题中讲的BST、AVL、RBT都是典型的二叉查找树结构，其查找的时间复杂度与树高相关，都是在内存中进行的。那么降低树高自然对查找效率是有所帮助的。

另外还有一个比较实际的问题：就是大量数据存储中，实现查询这样一个实际背景下，平衡二叉树由于树深度过大而造成磁盘IO读写过于频繁，进而导致效率低下。那么如何减少树的深度（当然不能减少查询数据量），一个基本的想法就是：

每个节点存储多个元素（但元素数量不能无限多，否则查找就退化成了节点内部的线性查找了）。
摒弃二叉树结构，采用多叉树（由于节点内元素数量不能无限多，自然子树的数量也就不会无限多了）。

二叉树存在的问题

二叉树需要加载到内存的，如果二叉树的节点少，没有什么问题，但是如果二叉树的节点很多(比如1亿)，就存在如下问题:

问题1：在构建二叉树时，需要多次进行I/O操作(海量数据存在数据库或文件中)，节点海量，构建二叉树时，速度有影响.
问题2：节点海量，也会造成二叉树的高度很大，会降低操作速度.

解决上述问题 ---> 多叉树

多路查找树

1、在二叉树中，每个节点有数据项，最多有两个子节点。如果允许每个节点可以有更多的数据项和更多的子节点，就是多叉树（multiway tree）
2、后面我们讲解的"2-3树"，"2-3-4树"就是多叉树，多叉树通过重新组织节点，减少树的高度，能对二叉树进行优化。
3、举例说明(下面2-3树就是一颗多叉树)