mvcc并发事务管理控制到底是个什么东东如何基于undo log +Read View 实现的mvcc 事务版本控制

mvcc 事务版本控制

1.多个事务共同操作一条数据可能产生的问题

多个事务同时对一条数据进行crud 操作可能遇到的问题呢这里其实可能会遇到 脏写丶脏读、不可重复读、幻读的情况

1.脏写

脏写就是假设现在有两条事务此时 a事务将值更新为a的值 a会生成一条 undo log b更新为b的值 b也生成一条undo log 在这个时候 a的线程这个时候回滚了

在a更新之前这个值是空的这个时候 a突然回滚了此时 a根据undo log 将那条值改成了 null ，a就将 b的值一并回滚成了null 此时事务b查询时这个值就变成了null 这个就是脏写

2.脏读

接下来继续脏读的问题还是同样两个事务此时 a事务更新了某行数据但是事务未提交此时事务b来读取读取到了事务 a的值这个时候事务b还在很high的操作数据此时a事务突然回滚了事务这个时候b事务再去读取a修改的值发现竟然是空这个就是脏读

总结: 无论是脏读还是脏写都是某个事务去去读取或者是修改了另外一个还没提交的事务更新或者是修改的数据,因为事务还没提交,他随时可能反悔，就会导致你的数据没了或者是之前查到的数据没了这就是脏读或者是脏写

3.不可重复读

我们假设现在有一个事务A开启了并且这个时候事务b 去更新数据在事务b没提交之前事务A是读取不到事务b的数据的这样就可以避免脏读和脏写问提但是我们这个时候 a事务开启了这个时候a事务多次对一条数据进行读取但是这个时候事务b更改后提交了事务这个时候事务a读取的值就发生了变化因为事务b提交了事务这个时候a就读取不到前面的值了如果a是想在这个事务期间读取到的是还没变化的值这个时候就读取不到了，这个问题就叫不可重复读

4.幻读

幻读到底是个什么东西幻读就是假设一个事务a 开启了这个时候他查询 select * from xx where id>1 这个时候查询出来了 10条数据但是这个时候事务b开了这个时候事务b 网数据库插入了两条数据这个时候事务a再去查询发现 woc 我是不是出现了幻觉刚刚都还是10条数据这个时候突然出现了 12条数据这个情况就是幻读

这些问题都是并发事务问题，所以数据库设计了事务隔离机制，mvcc多版本隔离机制，锁机制

2.数据库的隔离机制

1.sql标准的4种隔离机制

read uncommitted（读未提交），read committed（读已提交），repeatable read（可重复读），serializable（串行化）不同的隔离级别可以解决不同的问题

隔离级别	脏写	脏读	幻读	幻读
read uncommitted	false	true	true	true
read committed	false	false	true	true
repeatable read	false	false	false	true
serializable	false	false	false	false

这个是标准的事务隔离级别一般是不会用串行化的因为串行化就不允许事务串行了但是Mysql的隔离级别 RR级别已经可以避免幻读了为什么sql可以做到RR级就可以防止幻读这个是主要是依托 mysql 的mvcc机制 有了这个机制才能将 RR级别事务隔离解决幻读的问题

3.mvcc机制前奏 undo log版本链

简单来说呢，我们每条数据其实都有两个隐藏字段，一个是trx_id，一个是roll_pointer，这个trx_id就是最近一次更新这条数据的事务id，roll_pointer就是指向你了你更新这个事务之前生成的undo log，关于undo log之前都讲过了，这里不用多说了。

举个例子

假设现在有一个事务a id=50 ，插入了一条数据此时隐藏的字段指向的 undo log 是空的插入的值是a rool_pointer 指向的是一个空的 undolog 所以之前是没有值的。

此时如果友来了一个事务b 这个时候他把值改成了b 这个时候会生成一个新的 undo log 记录之前的值，然后会让roll_pointer指向实际回滚的这个值 !

此时又来了一个事务c 这个时候事务c 就会指向刚刚修改的事务b形成一个版本链条

这就是这个多个事务串行更新一行数据的时候，txr_id和roll_pinter两个隐藏字段的概念，包括undo log串联起来的多版本链条的概念！

4.ReadView ReadView 到底是个什么东东

ReadView，简单来说，就是你执行一个事务的时候，就给你生成一个ReadView，里面比较关键的东西有4个

1.一个是m_ids，这个就是说此时有哪些事务在MySQL里执行还没提交的；

2.一个是 min_txr_id 这个就是m_ids里最小的值

3.一个是max_txr_id 这个了就是下个要生成的事务id 就是最大id

4.一个是 creator_txr_id 这个就是你当前事务的id

1.假设原来数据库有一行数据很早之前就插入过了事务id是32 这个是他的初始值这个时候事务 a（id=45 ）一个是事务b（id =59）去修改他的值

这个时候a去查询这个数据现在事务a 会开启一个 ReadView 里面包含了事务id 45 和 60两个 id 这个时候事务a 去查询这行数据去走一个判断判断这行数据的事务id txr_id 是否小于ReadView 中的最小id 这个时候一查询发现 txr_id =32 小于ReadView中的id 说明这个数据是在事务开启前提交的所以此时查询的数据就是id为32的这条数据

如果此时事务b来修改了这个值并且提交这个时候事务a 查询的时候值变成了事务 b的id59 这个时候发现是大于min_txr_id 最小值和小于max_txr_id 最大值的说明是差不多时间开启的这个时候就去m_ids 去看一下是不是存在然后发现事务id59存在于 m_ids 里面这个时候就去查之前的undo log 然后查询到之前的值

如果此时事务a自己更新了这个值让事务id 变成了45同事保存事务b的快照当a开来查询的时候发现事务id为45 这个时候是可以读取的因为是自己修改的值

此时在事务a执行的过程中突然开启了事务c 这个事务的id为78 然后他更新了那个值为c 然后提交了事务

说明 a事务开启后有一个事务更新了事务是自己看不到的此时就会顺着undo log多版本链条往下找，自然先找到值A自己之前修改的过的那个版本，因为那个trx_id=45跟自己的ReadView里的creator_trx_id是一样的，所以此时直接读取自己之前修改的那个版本，如下图。

ReadView 他能够保证在你只能读到事务开启你事务开启前别的事务提交的值时候开启后的值你是读不到的或者是你开启后比你晚开启的值你也是读不到的

5.RC级别是如何根据readView 实现的

首先假设我们的数据库里有一行数据，是事务id=50的一个事务之前就插入进去的，然后现在呢，活跃着两个事务，一个是事务A（id=60），一个是事务B（id=70），此时如下图所示。

然后事务b 进行了update 操作然后数据的事务id变成70 生成一条undo log 有roll_pointer指向

这个时候事务a来查询发现这条数据的事务id是70 也就是说，属于ReadView的事务id范围之间，说明是他生成ReadView之前就有这个活跃的事务，是这个事务修改了这条数据的值，但是此时这个事务B还没提交，所以ReadView的m_ids活跃事务列表里，是有[60, 70]两个id的，所以此时根据ReadView的机制，此时事务A是无法查到事务B修改的值B的。

然后这个时候事务b提交了这个时候事务a再来查询事务a会生成一个新的ReadView 由于事务 b提交了这个时候事务 b 不在m_ids里面这个时候事务a读取到的值就是事务b id=70的值了

这就是 Rc +readView 的实现

6.RR级别是如何根据readView 实现的