LSMT 存储引擎浅析 | 青训营笔记这是我参与「第四届青训营」笔记创作活动的第3天 LSMT和存储引擎介绍历史 L

这是我参与「第四届青训营」笔记创作活动的第3天

通过Append-only Write ＋择机Compact来维护结构的索引树

以单机数据库MySQL为例，大致可以分为:

计算层主要负责SQL解析/查询优化/计划执行。数据库著名的 ACID特性，在MySQL中全部强依赖于存储引擎。 ACID是什么/存储引擎哪些组件保障了这些特性?

RocksDB的数据由3部分组成，MemTable/lmmemTable / SST。持有这三部分数据并且提供快照功能的组件叫做 SuperVersion
MemTable和SST的释放依赖于引用计数。对于读取来说，只要拿着SuperVersion，从MemTable 一级一级向下，就能查到记录。拿着SuperVersion不释放，等于是拿到了快照
如果所有读者都给SuperVersion 的计数加1，读完后再减1，那么这个原子引用计数器就会成为热点。CPU 在多核之间同步缓存是有开销的，核越多开销越大
为了让读操作更好的scale，RocksDB做了一个优化是Thread Local SuperVersionCache
没有Thread Local 缓存时，读取操作要频繁Acquire和 Release SuperVersion——CPU 缓存不友好
有Thread Local 缓存，读取只需要检查一下SuperVersion并标记 Thread.ocal 缓存正在使用即可 ——CPU 缓存友好

Compact在 LSMT中是将Key区间有重叠或无效数据较多的SST进行合并，以此来加速读取或者回收空间。Compact策略可以分为两大类，Level和Tier。下图是 Level策略
Level策略直接来自于LeveIDB，也是RocksDB 的默认策略。每一个层不允许有SST的Key区间重合