MVCC机制,你是否了解?

46 阅读3分钟

一、什么是MVCC?

全称Multi-Version Concurrency Control,即多版本并发控制。

对于写-写、读-写、写-读这三类并发场景,利用加锁的方案可以确保线程安全,但加锁会导致部分事务串行化,因此效率会下降。写-写场景必须要加锁才能保障安全,对于读-写、写-读这两类并发场景,mysql推出了mvcc机制,通过快照读,做到在发生读-写请求冲突时不用加锁。

二、版本链

在每次更新该记录后,都会将旧值放到一条undo日志中。随着更新次数的增多,所有的版本都会被roll_pointer属性连接成一条链表,这个链表就称之为版本链。

聚簇索引记录中都包含下面两个必要的隐藏列:

trx_id一个事务每次对某条聚簇索引记录进行改动时(即:insert、delete、update),都会把该事务的事务id赋值给trx_id隐藏列。

roll_pointer每次对某条聚簇索引记录进行改动时,都会把旧的版本写入到undo日志中。这个隐藏列就相当于一个指针,可以通过它找到该记录修改前的信息。 版本链示意图:

image.png

三、ReadView

也叫一致性视图,用来判断版本链中的哪个版本是当前事务可见的。ReadView包含4个比较重要的内容:

m_ids:在生成ReadView时,当前系统中活跃的读写事务的事务id列表。

min_trx_id:在生成ReadView时,当前系统中活跃的读写事务中最小的事务id;也就是m_ids中的最小值。

max_trx_id:在生成ReadView时,系统应该分配给下一个事务的事务id值。

creator_trx_id:生成该ReadView的事务的事务id。

注:只有在对表中的记录进行改动时(即:insert、delete、update)才会为事务分配唯一的事务id,否则一个事务的事务id值都默认为0。

如何通过ReadView来判断记录的某个版本是否可见?

1、如果trx_id == creator_trx_id,则表明当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问。

2、如果trx_id <min_trx_id,则表明生成该版本的事务在当前事务生成ReadView之前已经提交了,所以该版本可以被当前事务访问。

3、如果trx_id >=max_trx_id,则表明生成该版本的事务在当前事务生成ReadView之后才开启,所以该版本不可以被当前事务访问。

4、如果trx_id in m_ids,说明创建ReadView时生成该版本的事务还是活跃的,该版本不可以被访问。

5、如果trx_id not in m_ids,说明创建ReadView时生成该版本的事务已经被提交,该版本可以被访问。

如果某个版本的数据对当前事务不可见,那就顺着版本链找到下一个版本的数据,并继续执行上面的步骤来判断记录的可见性,以此类推,直到版本链中的最后一个版本。

四、MVCC如何实现RC和RR的隔离级别

1、RC的隔离级别下,每个快照读都会生成并获取最新的readview。

2、RR的隔离级别下,只有在同一个事务的第一个快照读才会创建readview,之后的每次快照读都使用的同一个readview,所以每次的查询结果都是一样的。