简单聊聊MVCC

36 阅读2分钟

前言:本文章仅仅是从一个点来讲MVCC,比较粗浅,并不能代表这就是全部的MVCC。网上还有许多其他详细的MVCC介绍文章,可以结合起来阅读。

一、MVCC如何实现

数据库中有两个隐含的列,一个是DB_TRX_ID(事务id),另一个是DB_ROLL_PTR(回滚指针)。事务ID是一个自增id,他表示事务创建时候的顺序;回滚指针指向前一个事务版本的数据

像这样,如果事务10执行失败了,可以回滚到事务7。那么为什么10前面不是9呢?因为9可能操作的不是ID为1的数据。

那么,是否所有的事务都需要像这样记录在视图链上呢?不是的,如果一直记录,必然会有占满磁盘的时候。如果一条链上的最后一个事务已经提交了,那么这条链就可以删除。

那么在RR(可重复度)隔离级别下,哪些数据可以看得到,哪些看不到呢?

例如,当前事务id为cur_id,

事务id > cur_id的事务操作的数据全部都看不到,因为这些事务是在当前事务之后才出现的

事务id = cur_id的事务操作的数据全都可以看到,因为这本来就是当前事务处理的数据

事务id < cur_id的事务操作的数据:

已经提交的,可以看到

没有提交的,不能看到

面对不能看到的数据,我们就根据视图链往下找,直到找到能够看到的数据。会不会存在找不到的情况呢?不会,因为视图链最下面的一条数据一定是已经提交的数据。

MySQL为了优化性能,还将最小活跃事务id到当前id中的活跃id放在了一个集合中,便于判断。

二、MVCC是否可以解决幻读

这也是争议比较大的话题,欢迎讨论。

一句话说结论:MVCC可以在一定程度上避免幻读

一句话解释:说一个MVCC下的幻读情况。比如说事务9正在执行过程中,select一下,之后,事务7提交了一个insert,这个commit对于事务9来说是可见的,然后事务9又select一下。那么这两次select的行数肯定是不一样的,这样就发生了幻读。