LSM 浅析「levelDB 基础机构」这是我参与8月更文挑战的第8天，活动详情查看：8月更文挑战就地更新 → B+T

这是我参与8月更文挑战的第8天，活动详情查看：8月更文挑战

LSM 从设计上具有很好的顺序写的高性能特性，成为 写入密集 的数据库系统基础。

LSM问题

顺序写入的问题：

如何解决这几个问题，成为 LSM 设计的精髓所在。

合并多个 key 的操作记录，只留下最后一个

新的问题：每次合并都需要遍历磁盘文件，类似与 STW ，会影响用户写入。

⇒ 那就将文件分段，多个文件做一个 key 的去重合并 → 多路归并算法

多路归并 ⇒ 就需要合并的多个组本身内部是排序好的 而且放在磁盘中进行 merge，IO 成本比较大 → 那就直接在内存中就排序好，落盘即可

⇒ 那么在内存中数据的组织形式 → skiplist

skiplist ⇒ 读取写入的复杂度均衡，主要是代码好写

总结一下：

如何减少读放大：

major compaction 上层的 sstable 在达到阈值之后，不断向下层 merge。类似多路归并