MySQL 学习笔记（二）：索引原理与 B+ Tree核心设计思想：以空间换时间索引本质上是一种排好序的数据结构。它的

索引本质上是一种排好序的数据结构。它的存在是为了减少磁盘 IO 次数，让你从几千万行数据中“定位”而不是“扫描”。

一、核心组件：B+ Tree（最强导航仪）

虽然索引可以用 Hash、二叉树等实现，但 InnoDB 选择了 B+ Tree。

数据结构特点：
1. 非叶子节点：只存索引（Key），不存数据，这样一页能塞下更多路径，树会很“矮”。
2. 叶子节点：存所有数据，并且叶子之间有双向链表。
3. 高度低：千万级的数据，树的高度通常只有 3-4 层，意味着只需 3-4 次磁盘 IO。

这是最容易混淆的地方，我们用“身份证”来做对比。

任何技术都有两面性，索引也不是越多越好。

通过对比，你就能明白 MySQL 设计者的良苦用心：

对比二叉树：二叉树每个节点只能有两个子节点。当数据量达到千万级时，树的高度会变得非常夸张（可能达到几十层）。树越高，磁盘 IO 次数越多，查询就会慢得像蜗牛。
对比 Hash 索引：Hash 表利用哈希算法定位，找单个值极快（ $O(1)$ ）。但它致命的缺点是不支持范围查询（比如查 id > 100）和排序。因为经过 Hash 计算后，数据的原始顺序已经全部打乱了。
对比 B 树 (B-Tree) ：
- 痛点 1：空间利用率低。B 树的每个节点（包括根和中间节点）都会存储整行数据。这导致一个 16KB 的页能存的索引数量变少，树会比 B+ 树更高，增加 IO 次数。
- 痛点 2：范围查询低效。B 树没有叶子节点之间的链表，做范围查询时需要不断地在树的层级间“回溯”遍历，性能不稳定。
最终选择 B+ Tree：
- 更矮胖：中间节点只存索引不存数据，一页能存更多指针，千万级数据仅需 3~4 层。
- 更高效：叶子节点不仅存了全量数据，还用双向链表串联了起来。找范围时，只需定位起点，横向一拉，数据全出。

即使建了索引，如果 SQL 写得不好，服务层的优化器也会放弃索引。

“索引不是越多越好，而是越准越好。”