MySQL(1.2)：InnoDB 核心组件与运行流程从 Buffer Pool 与页管理切入，讲 Free/LRU/F

1.2 InnoDB 核心组件与运行流程

作为 MySQL 默认的存储引擎，InnoDB 是一个复杂的体系。其核心组件大致可以分为“内存”和“后台线程”两大部分，并由 Checkpoint 及 Master Thread 机制统领其运转。

InnoDB 是基于磁盘的数据库管理系统，但是磁盘 I/O 速度极慢。为了弥补 CPU 与磁盘之间的速度鸿沟，InnoDB 引入了庞大的内存区域——缓冲池 (Buffer Pool)。

InnoDB 将数据按 页 (Page) 的方式进行管理，通常一页大小为 16KB。页是磁盘管理的最小单位，也是内存交换的最小单位。与其一条记录一条记录搬运，不如直接搬运 16KB 的整夜进内存。

缓冲池中不仅有数据页，还包括索引页、undo 页、插入缓冲页、锁信息等。

为了高效管理缓冲池的有限空间，InnoDB 用了三个关键链表：

Free List (空闲链表)：记录哪些页是空的。当需要从磁盘读新页时，优先来这里找空位。若没空位，只能去 LRU List 踢人。
LRU List (冷热链表)：记录正在使用的页。普通的 LRU（最近最少使用）算法有致命弱点：一次全表扫描会把真正的热点数据全部踢出内存（缓存污染）。
- Midpoint 优化：InnoDB 将 LRU 切分为热区（New Sublist）和冷区（Old Sublist，通常占 3/8）。
- 从磁盘新读入的页，首先放在 Midpoint（冷区头部）。如果它在冷区度过了观察期（如 1 秒）且再次被访问，才会晋升到热区头部。这有效防止了全表扫描造成的缓存冲刷。

3. Flush List (脏页链表)：记录被修改过但还未写入磁盘的页。这些页同时存在于 LRU 中，但由专门的后台线程依据 Flush List 决定何时落盘。

内存里的变化，最终需要人去默默搬运到磁盘上，这就依赖于后台线程。

修改的数据虽然在内存里很快，但要是遇到断电，内存数据就没了。Checkpoint 的主要作用就是决定“何时将什么脏页刷回磁盘”。

缩短恢复时间：崩溃重启时，只需重放最近一次 Checkpoint 之后的 redo log。而在它之前的所有修改，数据页都已经安稳躺在磁盘里了。
内存告急时急救：如 Free List 空了，不得不从 LRU 里踢走脏页，这时必须触发 Checkpoint 进行小规模刷脏。
重做日志告急时急救：Redo Log 是循环覆盖写的。如果写满一圈发现旧日志对应的数据还在内存没落盘，就必须马上触发 Checkpoint 刷脏，否则系统将陷入停滞。

注：LSN（Log Sequence Number）是 redo log 的递增序号。当记录 "checkpoint 在 LSN = X" 时，意味着小于等于 X 对应的脏页均已落盘。

Master Thread 本质上是一个“大循环调度器”。它通过每秒与每 10 秒的时钟中断，执行不同强度的日常维护逻辑。如果在检测到数据库完全空闲时，还会进入“后台强化清理模式”。

它的核心使命可以概括为维持平衡：