Innodb 的数据存储与索引构建对InnoDB存储逻辑进行分析，了解 innodb 怎么存储数据？怎么逐步提升检索效率

原文链接：关于Mysql数据存储，你了解多少？

Innodb 数据怎么存储？

Innodb 的存储结构：

Segment:
extent:
page: 磁盘和内存交换的基本单位，默认 16KB
row:

Row

记录在磁盘的存放方式也被称为「行格式」或者记录格式。行格式主要包含以下几种：

compact
redundant
dynamic
compressed

1. compact

compact 的存储结构如下：

变长字段长度列表：存储变长数据类型真实存储的字节长度
null 值列表：统一管理所有可以为 null 的列，分别用 0/1 代表对应列是否为空
- 目的：节省 NULL 的存储空间
记录头信息：包含记录的状态、记录数、记录类型等信息

2. redundant

与 compact 相比，缺少了「变长字段列表」以及「NULL值列表」，增加了所有真实数据的偏移地址

3. dynamic

和 compact 基本相同，对于溢出页的处理会有一些差异。

溢出页：存储空间较大的列，单页无法存储，需要将部分数据存在其他页中

compact 中溢出页会先存储 768字节的数据，20个字节存储剩余数据存储页的地址。dynamic 会直接存储20字节的溢出页地址，不再额外记录一部分的数据。

4. compressed

在 dynamic 的基础上增加了压缩处理，能存储更多大长度类型的数据，但是性能并不友好。

B+索引怎么提升检索效率？

回顾一下，innodb 数据页之间通过双向链表相连，页内数据按照「主键」排序组成单向链表，每个数据页也会维护一个「页目录」通过二分提升效率。

问题：

刚才聊的都是在单页中查找，那么如何找到数据所在的页？
页目录是针对主键的，那么查询条件不是主键怎么办？

怎么构建索引？

预设：下一个页的主键必须大于上一个页中的主键。

假设一个数据页最多有3条数据，且当前数据页中已经达到了 3 条记录的上限，新增一条记录之后会新申请一个页，但是可能会破坏页之间主键大小的预设，如下图：此时，就需要重新移动记录，把记录4移动到页2，把记录3移动到页1，这个过程就是「页分裂」但是实际存储时，页之间的编号并不连续，因此需要新增一个目录来记录页的位置和数据范围。如下图，目录1记录了页1的页号和最小值，目录2记录了页23的页号和最小值。我们查找数据时：