这是我参与「第五届青训营」笔记创作活动的第17天

一：RDBMS简介

1：事务 ACID

事务(Transaction)：是由一组SQL语句组成的一个程序执行单元(Unit)，它需要满足ACID特性。
ACID：
- 原子性(Atomicity):事务是一个不可再分割的工作单元，事务中的操作要么都发生，要么都不发生
- 一致性(Consistency):数据库事务不能破坏关系数据的完整性以及业务逻辑上的一致性
- 隔离性(图solation):多个事务并发访问时，事务之间是隔离的，一个事务不应该影响其它事务运行效果
- 持久性(Durability):在事务完成以后，该事务所对数据库所作的更改便持久的保存在数据库之中，并不会被回滚
要满足高并发、高可靠的要求

2：DBMS数据模型

（1）网状模型

网状数据库所基于的网状数据模型建立的数据之间的联系，能反映现实世界中信息的关联，是许多空间对象的自然表达形式。
1964年，世界上第一个数据库系统——集成数据存储(Integrated Data Storage , lDS)诞生于通用电气公司。IDS是世界上第一个网状数据库，奠定了数据库发展的基础，在当时得到了广泛的应用。在1970s网状数据库系统十分流行，在数据库系统产品中占据主导地位。

（2）层次模型

1968年，世界上第一个层次数据库——信息管理系统( Information Management System ， IMS ）诞生于IBM公司，这也是世界上第一个大型商用的数据库系统。层次数据模型，即使用树形结构来描述实体及其之间关系的数据模型。

（3）关系模型

1970年，IBM的研究员E.F.Codd博士发表了一篇名为"A Relational Model of Data for Data Banks"的论文，提出了关系模型的概念，奠定了关系模型的理论基础。1979年Oracle首次将关系型数据库商业化，后续DB2, SAP Sysbase ASE, and Informix等知名数据库产品也纷纷面世。

3：SQL语言

1974年IBM的Ray Boyce和Don Chamberlin将Codd关系数据库的12条准则的数学定义以简单的关键字语法表现出来，里程碑式地提出了SQL(Structured Query Language)语言。

语法风格接近自然语言;
高度非过程化;
面向集合的操作方式
语言简洁，易学易用。

二：RDBMS关键技术

1：一条SQL的生命历程

2：SQL引擎

（1）parser

解析器(Parser)一般分为词法分析(Lexical analysis )、语法分析( Syntax analysis )、语义分析(Semantic analyzer )等步骤。

（2）optimizer

优化器作用：

基于规则的优化(RBO Rule Base Optimizer)
- 条件化简
  - a = 5 and b > a → a = 5 and b > 5
  - a > 5 and a < b and b = 1 √ → FALSE
- 表连接优化
  - 总是小表先进行连接
- Scan优化
  - 唯一索引
  - 普通索引
  - 全表扫描

数据库索引：是数据库管理系统中辅助数据结构，以协助快速查询、更新数据库表中数据。目前数据库中最常用的索引是通过B+树实现的。

基于代价的优化(CBO Cost Base Optimizer)
- 一个查询有多种执行方案，CBO会选择其中代价最低的方案去真正的执行。

（3）executor

火山模型：
- 每个Operator调用Next操作，访问下层Operator，获得下层perator返回的一行数据，经过计算之后，将这行数据返回给上层。
- 优点∶
  - 每个算子独立抽象实现，相互之间没有耦合，逻辑结构简单
- 缺点∶
  - 每计算一条数据有多次函数调用开销，导致CPU效率不高。
向量化：
- 每个Operator每次操作计算的不再是一行数据，而是一批数据(Batch N行数据)，计算完成后向上层算子返回一个Batch,
- 优点:
  - 函数调用次数降低为1/N;
  - CPU cache命中率更高;
  - 可以利用CPU提供的SIMD(Single Instruction Multi Data)机制。
编译执行：
- 将所有的操作封装到一个函数里面，函数调用的代价也能大幅度降低.
- 用户SQL千变万化怎么办?难道要穷举用户的所有SQL，给每一个SQL都预先写好一个执行函数吗?
  - LLVM动态编译执行技术

3：存储引擎

（1）InnoDB

In-Memory:
- Buffer Pool
- Change Buffer
- Adaptive Hash Index
- Log Buffer
On-Disk:
- System Tablespace(ibdata1)
- General Tablespaces(xxx.ibd)
- Undo Tablespaces(xoxx.ibu)
- Temporary Tablespaces(xxx.ibt)
- Redo Log(ib_logfileN)