拉勾教育学习-笔记分享のMySQL"渡劫" IMySQL 是世界市场占比最高的两种数据库之一，除了需要付费的MySQL企

【文章内容输出来源：拉勾教育Java高薪训练营】
--- 所有脑图均本人制作，未经允许请勿滥用 ---
MySQL作为当下核心的关系型数据库管理工具，除了多思考多实战，别无他法

傲不可长，欲不可纵，乐不可极，志不可满

一、必备基础

Oracle 和 MySQL 是世界市场占比最高的两种数据库
Oracle => 垄断，有钱的大企业采用，互联网企业之外使用第一
MySQL => 互联网项目最常使用

MySQL软件下载及安装（建议5.7+）
常用MySQL工具：
- Window : MySQL WorkBench, Navicat, SQLyog,HeidiSQL,MySQL Front
- Linux：MySQL WorkBeanch, Navicat
- Mac：Navicat、Sequel Pro
DDL \ DML \ DQL \ TCL
约束：主键、外键、非空、唯一
索引、事务

除了需要付费的MySQL企业版、多样化的MySQL社区版，还有一条非常流行的开源分支版本：Percona Server，它由MySQL公司的技术支持公司Percona推出；此外，还有一个有趣的分支是MariaDB，由MySQL创始人Monty按原本思路重新写的一套新数据库。

二、MySQL 应用架构演变

part 1 - V1.0 单机单库

所有的信息都存入唯一一个 MySQL Instance 中

part 2 - V2.0 主从架构

为 V1.0 的 Instance 挂在从库来解决读取的压力，在主库宕机时，从库切换保障高可用；
主库 ==> 抵抗写压力
从库 ==> 分摊读压力

part 3 - V3.0 分库分表

核心操作：水平拆分
垂直拆分 ==> 每一个 Instance 均拥有全部数据
水平拆分 ==> 每一个 Instance 只拥有1/n的数据

此时，数据如何路由成为了关键问题。（手段：范围拆分、List拆分、Hash拆分）
此外，如何保持数据的一致性也是个难点

part 4 - V4.0 云数据库

各大IT公司都把云数据库作为节约成本的突破点：如何让MySQL成为一个saas(Software as a Service)

三、MySQL 架构原理

part 1 - 体系架构

MySQL Server 自顶向下：网络连接层 -> 服务层 -> 存储引擎层 -> 系统文件层

「网络连接层」

客户端连接器 (Client Connectors)：提供与MySQL服务器建立的支持。

「服务层」

作为MySQL Server 的核心，主要包括以下六个部分：

连接池（Connection Pool）:负责存储和管理客户端与数据库的连接，一个线程负责一个连接；
系统管理和控制工具（Management Service & Utilities）:备份恢复、安全管理、集群管理...
SQL接口（SQL Interface）:用于接收客来自客户端的各种SQL命令，并且返回结果；（DML\DDL\存储过程\视图\触发器...）
解析器（Parser）:将请求的SQL解析生成一个 "解析树"，然后根据一些MySQL规则检查解析数是否合法；
查询优化器（Optimizer）:当 "解析树" 合法后，将它们转化成执行计划，并与存储引擎交互；
缓存（Cache & Buffer）:由众多小缓存（表缓存、记录缓存、权限缓存...）组成，供命中的查询命令直接使用.

「存储引擎层」

负责MySQL中数据的存储和提取，与底层文件交互。
MySQL 的存储引擎是插件式的，查询执行引擎 通过接口与 存储引擎 进行通信。
目前常见的存储引擎：MyISAM / InnoDB

「系统文件层」

该层负责将数据库的数据和日志存储在文件系统之上，并完成与存储引擎的交互，是 文件的物理存储层。
主要包括：

日志文件：
- 错误日志（Error log）：默认开启
```
show variables like '%log_error%'
```
- 通用查询日志（General query log）：记录一般查询语句
```
show variables like '%general%'
```
- 二进制文件（Binary log）：记录了数据库的更改操作、语句发生时间、执行时长...
  但它不记录 select/show 等不修改数据库的SQL。主要用于 数据库恢复/主从恢复
```
show variables like '%log_bin%'; //是否开启
show variables like '%binlog%'; //参数查看
show binary logs;//查看日志文件
```
- 慢查询日志（Slow query log）：记录所有时间超时的查询SQL（默认10s）
```
show variables like '%slow_query%'; //是否开启
show variables like '%long_query_time%'; //时长
```
配置文件：用于存放MySQL所有的配置信息文件，如：my.cnf、my.ini...
数据文件：
- db.opt 文件：记录这个库的默认使用的字符集和校验规则。
- frm 文件：存储与表相关的元数据（meta）信息，包括表结构的定义信息等，每一张表都会有一个frm 文件。
- MYD 文件：MyISAM 存储引擎专用，存放 MyISAM 表的数据（data)，每一张表都会有一个.MYD 文件。
- MYI 文件：MyISAM 存储引擎专用，存放 MyISAM 表的索引相关信息，每一张 MyISAM 表对应一个 .MYI 文件。
- ibd文件和 IBDATA 文件：存放 InnoDB 的数据文件（包括索引）。InnoDB 存储引擎有两种表空间方式：独享表空间和共享表空间。独享表空间使用 .ibd 文件来存放数据，且每一张InnoDB 表对应一个 .ibd 文件。共享表空间使用 .ibdata 文件，所有表共同使用一个（或多个，自行配置）.ibdata 文件。
- ibdata1 文件：系统表空间数据文件，存储表元数据、Undo日志等。
- ib_logfile0、ib_logfile1 文件：Redo log 日志文件。
pid文件：是mysqld应用程序在 Unix/Linux 环境下的一个进程文件，存放着自己的进程id；
socket文件：也是 Unix/Linux 环境下才有的，让用户可以不通过TCP/IP而是直接使用 Unix Socket 来连接 MySQL.

part 2 - 运行机制

建立连接（Connectors&Connection Pool），通过客户端/服务器通信协议与MySQL建立连接。MySQL 客户端与服务端的通信方式是 “ 半双工 ”。对于每一个 MySQL 的连接，时刻都有一个线程状态来标识这个连接正在做什么。
- 通讯机制：
  - 全双工：能同时发送和接收数据，例如平时打电话。
  - 半双工：指的某一时刻，要么发送数据，要么接收数据，不能同时。例如早期对讲机
  - 单工：只能发送数据或只能接收数据。例如单行道
- 线程状态：show processlist; //查看用户正在运行的线程信息，root用户能查看所有线程，其他用户只能看自己的
  - id：线程ID，可以使用kill xx；
  - user：启动这个线程的用户
  - Host：发送请求的客户端的IP和端口号
  - db：当前命令在哪个库执行
  - Command：该线程正在执行的操作命令
    -> Create DB：正在创建库操作
    -> Drop DB：正在删除库操作
    -> Execute：正在执行一个PreparedStatement
    -> Close Stmt：正在关闭一个PreparedStatement
    -> Query：正在执行一个语句
    -> Sleep：正在等待客户端发送语句
    -> Quit：正在退出
    -> Shutdown：正在关闭服务器
  - Time：表示该线程处于当前状态的时间，单位是秒
  - State：线程状态
    -> Updating：正在搜索匹配记录，进行修改
    -> Sleeping：正在等待客户端发送新请求
    -> Starting：正在执行请求处理
    -> Checking table：正在检查数据表
    -> Closing table : 正在将表中数据刷新到磁盘中
    -> Locked：被其他查询锁住了记录
    -> Sending Data：正在处理Select查询，同时将结果发送给客户端
  - Info：一般记录线程执行的语句，默认显示前100个字符。想查看完整的使用show full processlist;
查询缓存（Cache&Buffer）: 这是MySQL的一个可优化查询的地方，如果开启了查询缓存且在查询缓存过程中查询到完全相同的SQL语句，则将查询结果直接返回给客户端；如果没有开启查询缓存或者没有查询到完全相同的 SQL 语句则会由解析器进行语法语义解析，并生成“解析树”。
- 缓存Select查询的结果和SQL语句
- 执行Select查询时，先查询缓存，判断是否存在可用的记录集，要求是否完全相同（包括参数值），这样才会匹配缓存数据命中。
- 即使开启查询缓存，以下SQL也不能缓存
  - 查询语句使用SQL_NO_CACHE
  - 查询的结果大于query_cache_limit设置
  - 查询中有一些不确定的参数，比如now()
- show variables like '%query_cache%'; //查看查询缓存是否启用，空间大小，限制等
- show status like 'Qcache%'; //查看更详细的缓存参数，可用缓存空间，缓存块，缓存多少等
解析器（Parser）将客户端发送的SQL进行语法解析，生成"解析树"。 预处理器根据一些MySQL规则进一步检查“解析树”是否合法，例如这里将检查数据表和数据列是否存在，还会解析名字和别名，看看它们是否有歧义，最后生成新的“解析树”。
查询优化器（Optimizer）根据“解析树”生成最优的执行计划。MySQL使用很多优化策略生成最优的执行计划，可以分为两类：静态优化（编译时优化）、动态优化（运行时优化）。
- 等价变换策略
  - 5=5 and a>5 改成 a > 5
  - a < b and a=5 改成b>5 and a=5
  - 基于联合索引，调整条件位置等
- 优化count、min、max等函数
  - InnoDB引擎min函数只需要找索引最左边
  - InnoDB引擎max函数只需要找索引最右边
  - MyISAM引擎count(*)，不需要计算，直接返回
- 提前终止查询
  - 使用了limit查询，获取limit所需的数据，就不在继续遍历后面数据
- in的优化
- MySQL对in查询，会先进行排序，再采用二分法查找数据。比如where id in (2,1,3)，变成 in (1,2,3)
查询执行引擎执行 SQL 语句，此时查询执行引擎会根据 SQL 语句中表的存储引擎类型，以及对应的API接口与底层存储引擎缓存或者物理文件的交互，得到查询结果并返回给客户端。若开启用查询缓存，这时会将SQL 语句和结果完整地保存到查询缓存（Cache&Buffer）中，以后若有相同的 SQL 语句执行则直接返回结果。
- 如果开启了查询缓存，先将查询结果做缓存操作
- 返回结果过多，采用增量模式返回

part 3 - MySQL 存储引擎

「InnoDB 和 MyISAM 对比」

事务&外键方面：
- InnoDB 均支持 √ ，安全性 + 完整性，适用大量 insert + update 语句
- MyISAM 均不支持 × ，高速存储 + 检索，适用大量 select 语句
锁机制：
- InnoDB 支持行级锁，锁定指定记录；（基于索引实现）
- MyISAM 支持表级锁，锁定整张表.
索引结构：
- InnoDB 使用聚集索引（聚簇索引），索引和记录一起存储；
- MyISAM 使用非聚集索引，索引和记录分开.
并发处理能力：
- InnoDB 读写阻塞与隔离级别有关，可以采用多版本并发控制（MVCC）来支持高并发；
- MyISAM 因为使用表锁，会导致写操作并发率低——>写阻塞；（读不影响）
存储文件：
- InnoDB 对应：.frm表结构文件 + .ibd数据文件；（表最大支持64TB）
- MyISAM 对应：.frm表结构文件 + MYD表数据文件 + .MYI索引文件；（默认限制256TB）

【总结】：

InnoDB ==> 需事务支持，行级锁高效适应高并发，数据一致性要求很高，硬件设备内存较大，可以利用InnoDB较好的缓存能力来提高内存利用率，减少磁盘IO；

MyISAM ==> 无需事务支持，并发低，数据一致性要求低，操作以读为主。

扩展资料：

「InnoDB存储结构」

官方的InnoDB引擎架构图：

-------内存结构-------

Buffer Pool:缓冲池（BP），以Page页为单位，默认16K。底层采用链表数据结构管理Page。
每次访问记录和索引时会在Page页中缓存，减少了磁盘IO操作。
- Page管理机制：
  - free page：空闲page --> free list
  - clean page：使用过的page（数据未被修改）--> lru list
  - dirty page：脏页，数据和磁盘中不一致 --> lru list + flush list
- 改进型LRU算法：
  - 普通LRU：末尾淘汰法，头部加入新数据，尾部淘汰旧数据
  - 改性LRU：分 new + old 两部分，从midpoint加入新数据，如果数据很快被访问，那么page就会向new列表头部移动，如果数据没有被访问，会逐步向old尾部移动
- Buffer Pool配置参数：
  - 查看page页大小
```
show variables like '%innodb_page_size%';
```
  - 查看lru list 中 old列表参数
```
show variables like '%innodb_old%';
```
  - 查看Buffer Pool 中参数
```
show variables like '%innodb_buffer%';
```
Change Buffer：写缓冲区（CB）。在进行DML操作时，如果BP没有其相应的Page数据，并不会立刻将磁盘页加载到缓冲池，而是在CB记录缓冲变更，等未来数据被读取时，再将数据合并恢复到BP中
- 默认占Buffer Pool 25% 的空间，最大允许50%（调整参数==>innodb_change_buffer_max_size）
- 当更新一条记录时，该记录在BufferPool存在，直接在BufferPool修改，一次内存操作。
- 当更新一条记录时，BP中未命中，则直接在CB中进行一次内存操作，当下次查询记录时，会先进性磁盘读取，然后再从CB中读取信息合并，最终载入BP中
Adaptive Hash Index：自适应哈希索引。用于优化对BP数据的查询。
（InnoDB存储引擎会自动根据访问的频率和模式来为某些页建立哈希索引）
Log Buffer：日志缓冲区。用于保存要写入磁盘log文件（Redo/Undo）的数据。
日志缓冲区满时会自动将其刷新到磁盘，当遇到BLOB或多行更新的大事务操作时，增加日志缓冲区可以节省磁盘I/O

【补充说明】

free list: 空闲缓冲

flush list: 需要刷新到磁盘的缓冲区，内部按照修改时间排序。

lru list: 正在使用的缓冲区，以midpoint为基点

建议将innodb_buffer_pool_size设置为总内存大小的 60%-80%

innodb_flush_log_at_trx_commit参数控制日志刷新行为，默认为1

-------磁盘结构-------

Tablespaces: 表空间。用于存储表结构和数据。分以下类型：
- 系统表空间：包含InnoDB数据字典，Doublewrite Buffer，Change Buffer，Undo Logs的存储区域。
  系统表空间是一个共享的表空间因为它是被多个表共享的。
  该空间的数据文件通过参数innodb_data_file_path控制。默认值==> ibdata1:12M:autoextend (文件名为ibdata1 / 12MB / 自动扩展)。
- 独立表空间：当innodb_file_per_table选项开启时，表将被创建于表空间中。否则，innodb将被创建于系统表空间中。
  每个表文件表空间由一个.ibd 数据文件代表，该文件默认被创建于数据库目录中。
  表空间的表文件支持动态（dynamic）和压缩（commpressed）行格式。
- 通用表空间：通过 create tablespace 语法创建的共享表空间。可以创建于mysql数据目录外的其他表空间，其可以容纳多张表，且其支持所有的行格式
```
CREATE TABLESPACE ts1 ADD DATAFILE ts1.ibd Engine=InnoDB; // 创建 表空间ts1
CREATE TABLE t1 (c1 INT PRIMARY KEY) TABLESPACE ts1; // 将表添加到 ts1 中
```
- 撤销表空间：由一个或多个包含Undo日志文件组成。在MySQL 5.7版本之前Undo占用的是System Tablespace共享区，从5.7开始将Undo从System Tablespace分离了出来。
  由innodb_undo_tablespaces配置选项控制，默认为0。
  - 0 -> 使用系统表空间ibdata1
  - 大于0 -> 使用undo表空间undo_001、undo_002...
- 临时表空间：
  - session temporary tablespaces: 用户创建的临时表和磁盘内部的临时表
  - global temporary tablespace: 用户临时表的回滚段（rollback segments ）
InnoDB Data Dictionary: 数据字典。由内部系统表组成，用于查找表、索引、表字段等元数据。
Doublewrite Buffer: 双写缓冲区。（位于系统表空间）
在BufferPage的page页刷新到磁盘真正的位置前，会先将数据存在Doublewrite 缓冲区。如果在page页写入过程中出现操作系统、存储子系统或mysqld进程崩溃，InnoDB可以在崩溃恢复期间从Doublewrite 缓冲区中找到页面的一个好备份。
- Tip A: 在大多数情况下，默认情况下启用双写缓冲区，要禁用Doublewrite 缓冲区，可以将innodb_doublewrite设置为0。
- Tip B: 使用 Doublewrite 缓冲区时建议将 innodb_flush_method 设置为 O_DIRECT。
Redo Log: 重做日志。基于磁盘，用于在奔溃恢复期间修正不完整事务写入的数据。
MySQL以循环方式写入重做日志文件，记录InnoDB中所有对Buffer Pool修改的日志。
当出现实例故障（像断电），导致数据未能更新到数据文件，则数据库重启时须redo，重新把数据更新到数据文件。读写事务在执行的过程中，都会不断的产生redo log。
默认情况下，重做日志在磁盘上由两个名为 ib_logfile0 和 ib_logfile1 的文件物理表示。
Undo Log: 撤销日志。事务开始之前保存的被修改数据的备份，用于例外情况时回滚事务。
属于逻辑日志，根据每行记录进行记录。撤消日志存在于系统表空间、撤消表空间和临时表空间中。

【补充说明】

MySQL的innodb_flush_method这个参数控制着innodb数据文件及redo log的打开、刷写模式:

fdatasync(默认): 先写入操作系统缓存，然后再调用fsync()函数去异步刷数据文件与redo log的缓存信息

O_DIRECT:数据文件写入操作会通知操作系统不要缓存数据，也不要用预读，直接从Innodb Buffer写到磁盘文件

-------大版本更新重点-------

MySQL 5.7 版本
- 将 Undo日志表空间从共享表空间 ibdata 文件中分离出来，可以在安装 MySQL 时由用户自行指定文件大小和数量。
- 增加了 temporary 临时表空间，里面存储着临时表或临时查询结果集的数据。
- Buffer Pool 大小可以动态修改，无需重启数据库实例。
MySQL 8.0 版本
- 将InnoDB表的数据字典和Undo都从共享表空间ibdata中彻底分离出来了，以前需要ibdata中数据字典与独立表空间ibd文件中数据字典一致才行，8.0版本就不需要了。
- temporary 临时表空间也可以配置多个物理文件，而且均为 InnoDB 存储引擎并能创建索引，这样加快了处理的速度。
- 用户可以像 Oracle 数据库那样设置一些表空间，每个表空间对应多个物理文件，每个表空间可以给多个表使用，但一个表只能存储在一个表空间中。
- 将Doublewrite Buffer从共享表空间ibdata中也分离出来了。

「InnoDB线程模式」

IO Thread ：在InnoDB中使用了大量的 AIO（Async IO）来做读写处理，这样可以极大提高数据库的性能。在InnoDB1.0版本之前共有4个IO Thread，分别是write，read，insert buffer和log thread，后来版本将read thread和write thread分别增大到了4个，一共有10个了。
- read thread ：负责读取操作，将数据从磁盘加载到缓存page页。4个
- write thread：负责写操作，将缓存脏页刷新到磁盘。4个
- log thread：负责将日志缓冲区内容刷新到磁盘。1个
- insert buffer thread ：负责将写缓冲内容刷新到磁盘。1个
Purge Thread ：事务提交之后，其使用的undo日志将不再需要，因此需要Purge Thread回收已经分配的undo页。
```
show variables like '%innodb_purge_threads%';
```
Page Cleaner Thread : 将脏数据刷新到磁盘，脏数据刷盘后相应的redo log也就可以覆盖，即可以同步数据，又能达到redo log循环使用的目的。会调用 write thread 线程处理。
```
show variables like '%innodb_page_cleaners%';
```
Master Thread : InnoDB的主线程，负责调度其他各线程，优先级最高。作用是将缓冲池中的数据异步刷新到磁盘，保证数据的一致性。包含：脏页的刷新（page cleaner thread）、undo页回收（purge thread）、redo日志刷新（log thread）、合并写缓冲等。内部有两个主处理，分别是每隔1秒和10秒处理。
- 每1秒的操作：
  - 刷新日志缓冲区，刷到磁盘
  - 合并写缓冲区数据，根据IO读写压力来决定是否操作
  - 刷新脏页数据到磁盘，根据脏页比例达到75%才操作（innodb_max_dirty_pages_pct，innodb_io_capacity）
- 每10秒的操作：
  - 刷新脏页数据到磁盘
  - 合并写缓冲区数据
  - 刷新日志缓冲区
  - 删除无用的undo页

「InnoDB数据文件」

-------InnoDB文件存储结构-------

Tablesapce: 表空间
用于存储多个ibd数据文件，用于存储表的记录和索引。一个文件包含多个段。
Segment: 段
用于管理多个Extent，分为数据段（Leaf node segment）、索引段（Non-leaf node segment）、回滚段（Rollback segment）。一个表至少会有两个segment，一个管理数据，一个管理索引。每多创建一个索引，会多两个segment。
Extent: 区
一个区固定包含64个连续的页，大小为1M。当表空间不足，需要分配新的页资源，不会一页一页分，直接分配一个区。
Page: 页
用于存储多个Row行记录，大小为16K。包含很多种页类型，比如数据页，undo页，系统页，事务数据页，大的BLOB对象页。
Row: 行
包含了记录的字段值，事务ID（Trx id）、滚动指针（Roll pointer）、字段指针（Field pointers）等信息。

空间 -> 段 -> 区 -> 页 -> 行

Page是文件最基本的单位，无论何种类型的page，都是由page header，page trailer 和page body组成

-------InnoDB文件存储格式-------

通过 select * from information_schema.innodb_sys_tables; 查看指定表的文件格式。

-------File文件格式（File-Format）-------

在早期的InnoDB版本中，文件格式只有一种，随着InnoDB引擎的发展，出现了新文件格式，用于支持新的功能。目前InnoDB只支持两种文件格式：Antelope 和 Barracuda。

Antelope: 先前未命名的，最原始的InnoDB文件格式，它支持两种行格式：COMPACT 和 REDUNDANT，MySQL 5.6及其以前版本默认格式为Antelope。
Barracuda: 新的文件格式。它支持InnoDB的所有行格式，包括新的行格式：COMPRESSED 和 DYNAMIC。

通过 innodb_file_format 配置参数可以设置InnoDB文件格式 (之前默认值为Antelope，5.7版本开始改为Barracuda)

-------Row行格式（Row_format）-------

表的行格式决定了它的行是如何物理存储的，这反过来又会影响查询和DML操作的性能。

如果在单个page页中容纳更多行
==> 查询和索引查找可以更快地工作
====> 缓冲池中所需的内存更少
=======> 写入更新时所需的I/O更少。

InnoDB存储引擎支持四种行格式:

REDUNDANT 行格式: 使用REDUNDANT行格式，表会将变长列值的前768字节存储在B树节点的索引记录中，其余的存储在溢出页上。对于大于等于786字节的固定长度字段InnoDB会转换为变长字段，以便能够在页外存储。
COMPACT 行格式: 与REDUNDANT行格式相比，COMPACT行格式减少了约20%的行存储空间，但代价是增加了某些操作的CPU使用量。如果系统负载是受缓存命中率和磁盘速度限制，那么COMPACT格式可能更快。如果系统负载受到CPU速度的限制，那么COMPACT格式可能会慢一些。
DYNAMIC 行格式: 使用DYNAMIC行格式，InnoDB会将表中长可变长度的列值完全存储在页外，而索引记录只包含指向溢出页的20字节指针。大于或等于768字节的固定长度字段编码为可变长度字段。DYNAMIC行格式支持大索引前缀，最多可以为 3072字节，可通过innodb_large_prefix 参数控制。
COMPRESSED 行格式: COMPRESSED行格式提供与DYNAMIC行格式相同的存储特性和功能，但增加了对表和索引数据压缩的支持。

DYNAMIC和COMPRESSED新格式引入的功能有：数据压缩、增强型长列数据的页外存储和大索引前缀

每个表的数据分成若干页来存储，每个页中采用 B树结构 存储

如果某些字段信息过长，无法存储在B树节点中，这时候会被单独分配空间，此时被称为溢出页，该字段被称为页外列

「Undo Log」

数据库事务开始之前，会将要修改的记录存放到 Undo 日志里，当事务回滚时或者数据库崩溃时，可以利用 Undo 日志，撤销未提交事务对数据库产生的影响
事务在提交时，并不会立刻删除undolog，innodb会将该事务对应的undo log放入到删除列表中，后面会通过后台线程purge thread进行回收处理。
Undo Log属于逻辑日志，记录一个变化过程。例如执行一个delete，undolog会记录一个insert；执行一个update，undolog会记录一个相反的update。
undo log采用段的方式管理和记录。在innodb数据文件中包含一种rollbacksegment回滚段，内部包含1024个undo log segment。可以通过show variables like '%innodb_undo%'; 来控制Undo log存储

【Undo Log 的作用】

实现事务原子性：
Undo Log 是为了实现事务的原子性而出现的产物。事务处理过程中，如果出现了错误或者用户执行了 ROLLBACK 语句，MySQL 可以利用 Undo Log 中的备份将数据恢复到事务开始之前的状态。
实现多版本并发控制 (MVCC)：
Undo Log 在 MySQL InnoDB 存储引擎中用来实现多版本并发控制。事务未提交之前，Undo Log保存了未提交之前的版本数据，Undo Log 中的数据可作为数据旧版本快照供其他并发事务进行快照读

事务A手动开启事务，执行更新操作，首先会把更新命中的数据备份到 Undo Buffer 中。
事务B手动开启事务，执行查询操作，会读取 Undo 日志数据返回，进行快照读

「Redo Log & Binlog」

-------Redo Log-------

Redo：顾名思义就是重做。以恢复操作为目的，在数据库发生意外时重现操作。
Redo Log：指事务中修改的任何数据，将最新的数据备份存储的位置（Redo Log），被称为重做日志。
Redo Log 的生成和释放：随着事务操作的执行，就会生成Redo Log，在事务提交时会将产生Redo Log写入Log Buffer，并不是随着事务的提交就立刻写入磁盘文件。等事务操作的脏页写入到磁盘之后，Redo Log 的使命也就完成了，Redo Log占用的空间就可以重用（被覆盖写入）。

工作原理

Redo Log 是为了实现事务的持久性而出现的产物。
防止在发生故障的时间点，尚有脏页未写入表的 IBD 文件中，在重启 MySQL 服务的时候，根据 Redo Log 进行重做，从而达到事务的未入磁盘数据进行持久化这一特性。

写入机制

以顺序循环的方式写入文件，写满时则回溯到第一个文件，进行覆盖写

write pos 是当前记录的位置，一边写一边后移，写到最后一个文件末尾后就回到 0 号文件开头；

checkpoint 是当前要擦除的位置，也是往后推移并且循环的，擦除记录前要把记录更新到数据文件；

write pos 和 checkpoint 之间还空着的部分，可以用来记录新的操作。如果 write pos 追上 checkpoint，表示写满，这时候不能再执行新的更新，得停下来先擦掉一些记录，把 checkpoint推进一下。

相关配置参数

每个InnoDB存储引擎至少有1个重做日志文件组（group），每个文件组至少有2个重做日志文件，默认为ib_logfile0和ib_logfile1。
可以通过 show variables like '%innodb_log%'; 控制 Redo Log。
Redo Buffer 持久化到 Redo Log 的策略，可通过 Innodb_flush_log_at_trx_commit 设置
- 0：每秒提交 Redo buffer ->OS cache -> flush cache to disk，可能丢失一秒内的事务数据。
  由后台Master线程每隔 1秒执行一次操作。
- 1（默认值）：每次事务提交执行 Redo Buffer -> OS cache -> flush cache to disk，最安全，性能最差的方式。
- 2（建议）：每次事务提交执行 Redo Buffer -> OS cache，然后由后台Master线程再每隔1秒执行OS cache -> flush cache to disk 的操作。

-------Binlog-------

Redo Log 是属于InnoDB引擎所特有的日志，而MySQL Server也有自己的日志，即 Binary log（二进制日志），简称Binlog。

Binlog是记录所有数据库表结构变更以及表数据修改的二进制日志，不会记录 SELECT 和 SHOW 这类操作。
Binlog日志是以事件形式记录，还包含语句所执行的消耗时间。

【两个最重要的使用场景】

主从复制：在主库中开启Binlog功能，这样主库就可以把Binlog传递给从库，从库拿到Binlog后实现数据恢复达到主从数据一致性。
数据恢复：通过mysqlbinlog工具来恢复数据。

Binlog文件名默认为“主机名_binlog-序列号”格式，例如oak_binlog-000001，也可以在配置文件中指定名称。

【文件记录模式】

ROW（row-based replication, RBR）：日志中会记录每一行数据被修改的情况，然后在slave端对相同的数据进行修改。
- 优点：能清楚记录每一个行数据的修改细节，能完全实现主从数据同步和数据的恢复。
- 缺点：批量操作，会产生大量的日志，尤其是alter table会让日志暴涨。
STATMENT（statement-based replication, SBR）：每一条被修改数据的SQL都会记录到master的Binlog中，slave在复制的时候SQL进程会解析成和原来master端执行过的相同的SQL再次执行。简称SQL语句复制。
- 优点：日志量小，减少磁盘IO，提升存储和恢复速度
- 缺点：在某些情况下会导致主从数据不一致，比如last_insert_id()、now()等函数。
MIXED（mixed-based replication, MBR）：以上两种模式的混合使用，一般会使用 STATEMENT模式保存binlog，对于STATEMENT模式无法复制的操作使用ROW模式保存binlog，MySQL会根据执行的SQL语句选择写入模式。

【文件结构】

MySQL的binlog文件中记录的是对数据库的各种修改操作，用来表示修改操作的数据结构是Log event。
不同的修改操作对应的不同的 Log event。比较常用的log event有：Query event、Row event、Xid event等。
binlog文件的内容就是各种 Log event的集合。

【写入机制】

根据记录模式和操作触发event事件生成log event（事件触发执行机制）
将事务执行过程中产生log event写入缓冲区，每个事务线程都有一个缓冲区 Log Event 保存在一个 binlog_cache_mngr 数据结构中。在该结构中有两个缓冲区:
- stmt_cache，用于存放不支持事务的信息；
- trx_cache，用于存放支持事务的信息。
事务在提交阶段会将产生的 log event 写入到外部 binlog文件中。
不同事务以串行方式将 log event 写入 binlog文件中，所以一个事务包含的 log event信息在binlog文件中是连续的，中间不会插入其他事务的 log event。

【文件操作】

Binlog 状态查看：

show variables like 'log_bin';

开启 Binlog 功能：需要修改my.cnf或my.ini配置文件，在[mysqld]下面增加log_bin=mysql_bin_log，重启MySQL服务

mysql> set global log_bin=mysqllogbin; 
ERROR 1238 (HY000): Variable 'log_bin' is a read only variable

#log-bin=ON 
#log-bin-basename=mysqlbinlog 
binlog-format=ROW 
log-bin=mysqlbinlog

使用 show binlog events 命令：

show binary logs; //等价于show master logs; 
show master status; 
show binlog events; 
show binlog events in 'mysqlbinlog.000001';

使用mysqlbinlog 命令：

mysqlbinlog "文件名" 
mysqlbinlog "文件名" > "test.sql"

使用 binlog 恢复数据：mysqldump：定期全部备份数据库数据。mysqlbinlog可以做增量备份和恢复操作。

//按指定时间恢复 
mysqlbinlog --start-datetime="2020-04-25 18:00:00" --stop- 
datetime="2020-04-26 00:00:00" mysqlbinlog.000002 | mysql -uroot -p1234 
//按事件位置号恢复 
mysqlbinlog --start-position=154 --stop-position=957 
mysqlbinlog.000002 | mysql -uroot -p1234

删除 Binlog文件：可以通过设置expire_logs_days参数来启动自动清理功能。默认值为0表示没启用。设置为1 表示超出1天binlog文件会自动删除掉

purge binary logs to 'mysqlbinlog.000001'; //删除指定文件 
purge binary logs before '2020-04-28 00:00:00'; //删除指定时间之前的文件 
reset master; //清除所有文件

-------Redo Log 和 Binlog 区别-------

Redo Log 是属于InnoDB引擎功能，Binlog 是属于MySQL Server自带功能，并且是以二进制文件记录。
Redo Log 属于物理日志，记录该数据页更新状态内容，Binlog 是逻辑日志，记录更新过程。
Redo Log 日志是循环写，日志空间大小是固定，Binlog 是追加写入，写完一个写下一个，不会覆盖使用。
Redo Log 作为服务器异常宕机后事务数据自动恢复使用，Binlog 可以作为主从复制和数据恢复使用。Binlog 没有自动crash-safe能力。