阿里面试B+树,完美回答通过了

243 阅读4分钟

前言

一个朋友面试阿里。面试过程中面试官问了B+树,回答时大叔面试官一直点头,最后点头过于频繁被警察叔叔带走了,今天详细讲一讲B+树。\

\

平衡二叉树

平衡二叉树(Balanced Binary Tree)又被称为AVL树(有别于AVL算法),且具有以下性质:它是一 棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。这个方案很好的解决了二叉查找树退化成链表的问题,把插入,查找,删除的时间复杂度最好情况和最坏情况都维持在O(logN)。但是频繁旋转会使插入和删除牺牲掉O(logN)左右的时间,不过相对二叉查找树来说,时间上稳定了很多。

\

\

B树(B-树)

B树和平衡二叉树稍有不同的是B树属于多叉树又名平衡多路查找树(查找路径不只两个),数据库索引技术里大量使用者B树和B+树的数据结构  

\

m阶B树特点

第一、非叶节点最多有m棵子树;
第二、根节点最少有两个子树,非根、非叶节点最少有m/2棵子树;
第三、非叶子结点中保存的关键字个数,等于该节点子树个数-1,就是说一个节点如果有3棵子树,那么其中必定包含2个关键字;
第四、非叶子节点中的关键字大小有序,如图中左面的节点中37、51两个元素就是有序的;
第五、节点中每个关键字的左子树中的关键字都小于该关键字,右子树中的关键字都大于该关键字。如图中关键字51的左子树有42、49,都小于51,右子树的节点有59,大于51;
第六、所有叶节点都在同一层。

\

\

优点

\


\

\

B树相对于B+树的优点是,如果经常访问的数据离根节点很近,而B树的非叶子节点存储关键字数据的地址,所以这种数据检索的时候会要比B+树快。\

\

\

B+树

   

\

\

m阶B+树定义

  • 1、每个节点最多可以有 m 个元素;
  • 2、除了根节点外,每个节点最少有 (m/2) 个元素;
  • 3、如果根节点不是叶节点,那么它最少有 2 个孩子节点;
  • 4、所有的叶子节点都在同一层;
  • 5、一个有 k 个孩子节点的非叶子节点有 (k-1) 个元素,按升序排列;
  • 6、某个元素的左子树中的元素都比它小,右子树的元素都大于或等于它;
  • 7、非叶子节点只存放关键字和指向下一个孩子节点的索引,记录只存放在叶子节点中;
  • 8、相邻的叶子节点之间用指针相连。 

\

优点

\


\

B+树的层级更少: 相较于B树B+每个非叶子节点存储的关键字数更多,树的层级更少所以查询数据更快;

\

B+树查询速度更稳定: B+所有关键字数据地址都存在叶子节点上,所以每次查找的次数都相同所以查询速度要比B树更稳定;

\

B+树天然具备排序功能: B+树所有的叶子节点数据构成了一个有序链表,在查询大小区间的数据时候更方便,数据紧密性很高,缓存的命中率也会比B树高。

\

B+树全节点遍历更快: B+树遍历整棵树只需要遍历所有的叶子节点即可,而不需要像B树一样需要对每一层进行遍历,这有利于数据库做全表扫描。

\

\

\

适应场景

\

通常用于数据库和操作系统的文件系统中。

\

结点的分裂


\

\

将已满结点进行分裂,将已满节点后M/2节点生成一个新节点,将新节点的第一个元素指向父节点。\

\

父节点出现已满,将父节点继续分裂。

\

一直分裂,如果根节点已满,则需要分类根节点,此时树的高度增加。

\

\

优点

\


\

能够保持数据稳定有序,其插入与修改拥有较稳定的对数时间复杂度

\

\

总结

\


\

B+树在面试中几乎被问烂了。 除了本文提到的平衡二叉树、B树和B+树外,B+树的应用场景还有很高的话题性,比如MySQL和一些文件系统中使用的是B+树结构。