简述Mysql InnoDB的MVCC机制

164 阅读5分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第22天,点击查看活动详情

什么是MVCC

MVCC是Multi-Version Concurrency Control的缩写,也就是多版本并发控制。在Mysql InnoDB中用来处理读写冲突,实现非阻塞并发读,以达到更好的数据库并发性能。

当前读和快照读

说到MVCC,就不得不提当前读和快照读。

  • 当前读

    当前读,顾名思义就是读取当前的最新数据。比如select for updateselect lock in share modeupdateinsertdelete等都属于当前读,因为这些操作都会对数据进行加锁,避免其他并发事务不能修改当前记录,以保证读取到的是最新数据。

  • 快照读

    快照读就是读取某一时刻的记录,读取这样的数据是不需要加锁的。比如select操作就是快照读,这样处理可以有效提升数据库的并发读写能力。快照读的实现就是基于MVCC。

也就是说,当前读和快照读的区别就在于:当前读是加锁的,是悲观锁的实现;快照读是不加锁的,基于MVCC实现;

MVCC解决了什么问题

  • 数据库读写并发能力

    在并发读写数据时,可以做到在读写操作不用相互阻塞,提升数据库并发读写性能;因为select操作是快照读,updateinsertdelete操作是当前读,两者不会相互阻塞;

  • 解决脏读、不可重复读、幻读等问题

    MVCC与Read View结合可以解决脏读、不可重复读、幻读事务隔离问题;

MVCC是怎么实现的

MVCC设计出来的目的就是为了解决读写冲突,它的实现主要依赖于4个隐式字段、undolog、Read View;

  • 隐式字段

    数据库在每一行数据记录外额外增加了3个隐式字段:

    DB_ROW_IDDB_TRX_IDDB_ROLL_PTRDELETED_BIT
    隐藏主键事务ID回滚指针记录被更新或者被删除标记

    1.隐藏主键:隐含的自增ID,如果数据表没有设置主键,InnoDB会自动以DB_ROW_ID生成一个聚簇索引;

    2.事务ID:记录创建这条记录/或者最后一次修改这条记录的事务ID;

    3.回滚指针:记录这条记录的上一个版本;

    4.记录被更新或者被删除标记:修改操作是给当前记录打上DELETED_BIT=true的标记,另外再创建一条新记录;删除操作是给当前记录打上DELETED_BIT=true的标记;都不是真正地把数据删掉;

  • undo日志

    除了查询操作不会记录undo log外,其他的updateinsertdelete操作都会记录对应的undo log;

    1.比如有一个user表已经插入一条新记录,name=zouwei,age=28,隐藏主键为1: image-20221019191320343.png 2.现在再来一个事务1针对该记录的name做出修改,改名为Z

    • 在事务1修改该记录时,数据库先给该记录加上排他锁;
    • 然后再把当前记录拷贝一份到undo log中,DELETED_BIT设置为true;
    • 拷贝完毕后,修改改记录name=Z,并把DB_TRX_ID设置为1,DB_ROLL_PTR指向undlog中的副本,也就是当前记录的上一个版本;
    • 事务提交,释放排他锁; image-20221019192603660.png

    3.再来一个事务2修改该记录的age=30

    • 在事务2修改该记录时,同样先给该记录加上排他锁;
    • 然后再把当前记录拷贝一份到undo log中,DELETED_BIT设置为true;
    • 拷贝完毕后,修改改记录age=30,并把DB_TRX_ID设置为2,DB_ROLL_PTR指向undlog中的副本,也就是当前记录的上一个版本;
    • 事务提交,释放排他锁; image-20221019193052654.png

    也就是说,不同事务针对同一记录做修改,undo log会产生该记录的版本链条,链首是该记录的最新旧数据,链尾是该记录的最早旧数据;

  • Read View

    Read View就是在事务中,执行快照读操作时,生成的读视图;在该事务执行快照读的那一刻,会生成数据库当前的一个快照,记录并维护了当前活跃的事务ID(事务ID被分配时是递增的);

    Read View的作用就是用来判断在执行快照读时,当前事务在undo log链中,哪些旧数据是可以被看见的;Read View可见性算法大致如下:

    Read View中包含大概三个全局属性:

    1.trx_list:未提交事务ID列表;

    2.up_limit_id:trx_list中的最小事务ID;

    3.low_limit_id:创建视图那一刻,下一个系统尚未分配的事务ID;

    • 在undo log中,DB_TRX_ID小于up_limit_id的记录都是可见的;
    • 如果DB_TRX_ID大于low_limit_id,那么说明该记录时在创建Read View后写进来的,那肯定是不可见的;
    • 那么还要检测DB_TRX_ID是否在trx_list中,如果不在,那么说明事务已经提交,那么该记录可见,否则说明该事务还未提交,不可见;

Read View在RR隔离级别和RC隔离级别的区别

  • 在RR隔离级别下,事务对某条记录的第一次快照读会创建一个Read View,此后再调用快照读的时候,使用的还是同一个Read View;所以当前事务只要在其他事务提交之前使用过快照读,那么即使其他事务已经提交了,因为使用的是同一个Read View,所以依然还是看不见提交的数据;

  • 在RC隔离级别下,每一次快照读都会重新生成一个新的Read View,所以我们就可以在RC隔离级别下看到其他事务提交的数据;