Mysql页结构——Page Directory和Page Header

350 阅读3分钟

Page Directory(页目录)和 Page Header(页面头部)

Page Directory(页目录)

现在有一个问题,我们要在一个页中查找指定的一条记录。除了从顺序查找还有更高效率的方法么?

Page Directory提供了解决方案:二分查找法。

InnoDB 会将一个页中的所有记录划分成若干个组,每组4-8个记录。将每个组最后一个记录相对于第一个记录的地址偏移量(可以定位到真实数据记录)提取出来存放在页中一个叫做Page Directory的数组中,数组中的元素就是这些地址偏移量,也称为槽(slot)。所以Page Directory就是由槽组成的。

所以在一个页中根据主键查找记录是很快的,步骤为两步:

  1. 二分法确定该记录所在的槽,并找到该槽所在分组中主键值最小的那条记录。
  2. 通过记录的 next_record 属性遍历该槽所在的组中的各个记录

Page Header(页面头部)

为了能得到一个数据页中存储的记录的状态信息,比如本页中已经存储了多少条记录,第一条记录的地址是什么,页目录中存储了多少个槽等等,特意在页中定义了一个叫Page Header的部分,这个部分占用固定的56个字节,专门存储各种状态信息。

各字段如下:

名称占用空间大小描述
PAGE_N_DIR_SLOTS2字节页目录中的槽数量
PAGE_HEAP_TOP2字节还未使用的空间最小地址,该地址之后就是 Free Space
PAGE_N_HEAP2字节本页中的记录的数量(包括最大最小和标记为删除的记录)
PAGE_FREE2字节指向可重用空间的地址
PAGE_GARBAGE2字节已删除记录占用的字节数
PAGE_LAST_INSERT2字节最后插入记录的位置
PAGE_DIRECTION2字节最后插入的方向
PAGE_N_DIRECTION2字节一个方向连续插入的记录数量
PAGE_N_RECS2字节该页中记录的数量(不包括最大最小和标记为删除的记录)
PAGE_MAX_TRX_ID2字节修改当前页的最大事务ID,该值仅在二级索引中定义
PAGE_LEVEL2字节当前页在索引树(B+树)中的层级
PAGE_INDEX_ID8字节索引ID,表示当前页属于哪个索引
PAGE_BTR_SEG_LEAF10字节B+树叶子段的头部信息,仅在B+树的Root页定义
PAGE_BTR_SEG_TOP10字节B+树叶子段的头部信息,仅在B+树的Root页定义

假如新插入的一条记录的主键值比上一条记录的主键值大,我们说这条记录的插入方向是右边,反之则是左边。用来表示最后一条记录插入方向的状态就是PAGE_DIRECTION。

假设连续几次插入新记录的方向都是一致的,InnoDB会把沿着同一个方向插入记录的条数记下来,这个条数就用PAGE_N_DIRECTION这个状态表示。当然,如果最后一条记录的插入方向改变了的话,这个状态的值会被清零重新统计。