MySQL事务面试必知必会

147 阅读7分钟

概述

事务可由一条非常简单的 SOL语句组成,也可以由一组复杂的 SOL语句组成。事务是访问并更新数据库中各种数据项的一个程序执行单元。在事务中的操作,要么都做修改,要么都不做,这就是事务的目的,也是事务模型区别与文件系统的重要特征之一。

事务的特性

这里,具体介绍事务的 ACID 四大特性,并给出相关概念。

ACID特性的定义

  1. 原子性(Atomicity):事务开始后所有操作,要么全部做完,要么全部不做,不可能停滞在中间环节。事务执行过程中出错,会回滚到事务开始前的状态,所有的操作就像没有发生一样。也就是说事务是一个不可分割的整体,就像化学中学过的原子,是物质构成的基本单位。

  2. 一致性(Consistency):事务开始前和结束后,数据库的完整性约束没有被破坏。包括一致性读和一致性写。比如A向B转账,不可能A扣了钱,B却没收到。

  3. 隔离性(Isolation):同一时间,只允许一个事务请求同一数据,不同的事务之间彼此没有任何干扰。比如A正在从一张银行卡中取钱,在A取钱的过程结束前,B不能向这张卡转账。

  4. 持久性(Durability):事务完成后,事务对数据库的所有更新将被保存到数据库,不能回滚。

ACID特性的目的

  • 为数据库提供了一个从失败中恢复到正常状态的方法,同时提供了数据库在异常状态下仍保持一致性的方法

  • 为多个应用程序在并发访问数据库时,可以在这些应用程序之间提供一个隔离的方法,以防止彼此之间的操作相互干扰

成功的情况下

  • 能够将数据从一种状态变为另一种状态,并且能够持久化

异常情况下

  • 能将数据恢复到正常状态

  • 要能够保持一致性,包含数据的一致性和约束的一致性

并发的情况下

  • 并发的操作之间不会产生影响

并发事务可能带来的问题

  1. 脏读:事务A读取了事务B更新的数据,然后B回滚操作,那么A读取到的数据是脏数据

  2. 不可重复读:事务 A 多次读取同一数据,事务 B 在事务A多次读取的过程中,对数据作了更新并提交,导致事务A多次读取同一数据时,结果 不一致。

  3. 幻读:系统管理员A将数据库中所有学生的成绩从具体分数改为ABCDE等级,但是系统管理员B就在这个时候插入了一条具体分数的记录,当系统管理员A改结束后发现还有一条记录没有改过来,就好像发生了幻觉一样,这就叫幻读。

不可重复读和幻读的区别

很多人容易搞混不可重复读和幻读,确实这两者有些相似。但不可重复读重点在于update和delete,而幻读的重点在于insert

如果使用锁机制来实现这两种隔离级别,在可重复读中,该sql第一次读取到数据后,就将这些数据加锁,其它事务无法修改这些数据,就可以实现可重复 读了。但这种方法却无法锁住insert的数据,所以当事务A先前读取了数据,或者修改了全部数据,事务B还是可以insert数据提交,这时事务A就会 发现莫名其妙多了一条之前没有的数据,这就是幻读,不能通过行锁来避免。需要Serializable隔离级别 ,读用读锁,写用写锁,读锁和写锁互斥,这么做可以有效的避免幻读、不可重复读、脏读等问题,但会极大的降低数据库的并发能力。

MySQL事务隔离级别

不同隔离级别解决的问题:

事务隔离级别脏读不可重复读幻读
读未提交 (Read-Uncommitted)未解决未解决未解决
读已提交(Read-Committed)解决未解决未解决
可重复度(Repeatable-Read)解决解决未解决
串行化(Serializable)解决解决解决

隔离级别越低,事务请求的锁越少或者保持锁的时间就越短。这也就是大多数数据库的隔离级别是READ COMMITTED的原因,MySQL的默认隔离级别就是Repeatable-Read。

MySQL8.0事务隔离级别为:REPEATABLE-READ

image.png

MySQL事务的实现原理

事务隔离性由来实现。原子性、一致性、持久性通过数据库的 redo logundo log来完成。redo log 称为重做日志,用来保证事务的原子性和持久性。undo log 用来保证事务的一致性。

有的DBA或许会认为 undo 是 redo 的逆过程,其实不然。redo 和 undo 的作用都可以视为是一种恢复操作,redo 恢复提交事务修改的页操作,而undo 回滚行记录到某个特定版本。因此两者记录的内容不同,redo 通常是物理日志,记录的是页的物理修改操

作。undo 是逻辑日志,根据每行记录进行记录。

MVCC机制

在事务隔离级别READ COMMITTED和 REPEATABLE READ(InnoDB存储引擎的默认事务隔离级别)下,InnoDB存储引擎使用非锁定的一致性读。然而,对于快照数据的定义却不相同。在 READ COMMITTED事务隔离级别下,对于快照数据,非一致性读总是读取被锁定行的最新一份快照数据。而在 REPEATABLE READ事务隔离级别下,对于快照数据,非一致性读总是读取事务开始时的行数据版本。Innodb实现事务的隔离性采用的是MVCC机制,它会在事务中执行查询操作的时候生成一个一致性视图(READ-VIEW),通过比对版本号和回滚指针(数据表中会包含着两个隐藏列)来找到最新一份快照数据。MVCC机制原理可以参考。什么是MySQL的MVCC机制?

redo log

重做日志用来实现事务的持久性,即事务 ACID中的 D。其由两部分组成∶一是内存中的重做日志缓冲(redo log buffer),其是易失的;二是重做日志文件(redo log file),其是持久的。

redo log 用来保证事务的持久性。redo log基本上都是顺序写的,在数据库运行时不需要对 redo log 的文件进行读取操作。为了确保每次日志都写入重做日志文件,在每次将重做日志缓冲写入重做日志文件后,InnoDB存储引擎都需要调用一次 fsync 操作。

undo log

redo log记录了事务的行为,可以很好地通过其对页进行"重做"操作。但是事务有时还需要进行回滚操作,这时就需要 undo。因此在对数据库进行修改时,InnoDB存储引擎不但会产生redo,还会产生一定量的 undo。这样如果用户执行的事务或语句由干某种原因失败了,又或者用户用一条 ROLLBACK语句请求回滚,就可以利用这些 undo 信息将数据回滚到修改之前的样子。redo 存放在重做日志文件中,与 redo 不同,undo 存放在数据库内部的一个特殊段(segment)中,这个段称为 undo 段(undo segment)。undo 段位于共享表空间内。

undo log 用来帮助事务回滚及 MVCC的功能。undo log 是需要进行随机读写的。

总结

对上面的知识点写了一个小结。

image.png

【参考】

【1】《MySQL技术内幕InnoDB存储引擎》