欢迎大家关注 github.com/hsfxuebao ，希望对大家有所帮助，要是觉得可以的话麻烦给点一下Star哈

1. 概述

1.1 如何理解缓存双写一致性？

如果redis中有数据，需要和数据库中的值相同
如果redis中无数据，数据库中的值必须是最新值

1.2 缓存的分类

只读缓存
读写缓存
- 同步直写策略：写缓存时也同步写数据，缓存和数据库中的数据一致
- 对于读写缓存来说，要想保证缓存和数据库中的数据一致，就要采用同步直写策略

2. 数据库和缓存一致性更新策略

给缓存设置过期时间，是保证最终一致性的解决方案。

我们可以对存入缓存的数据设置过期时间，所有的 写操作以数据库为准 ，对缓存操作只是尽最大努力即可。也就是说如果数据库写成功，缓存更新失败，那么只要到达过期时间，则后面的读请求自然会从数据库中读取新值然后回填缓存，达到一致性， 切记以mysql的数据库写入库为准 。

上述方案是调研后的主流+成熟的做法，但是考虑到各个公司业务系统的差距，不是100%绝对正确，不保证绝对适配全部情况。 总之，我们必须达到最终一致性。

2.1 先更新数据库，再更新缓存

这套方案，大家是普遍反对的。为什么呢？有如下两点原因。

原因一（线程安全角度） 同时有请求A和请求B进行更新操作，那么会出现

（1）线程A更新了数据库
（2）线程B更新了数据库
（3）线程B更新了缓存
（4）线程A更新了缓存

这就出现请求A更新缓存应该比请求B更新缓存早才对，但是因为网络等原因，B却比A更早更新了缓存。这就导致了脏数据，因此不考虑。

原因二（业务场景角度） 有如下两点：

（1）如果你是一个写数据库场景比较多，而读数据场景比较少的业务需求，采用这种方案就会导致，数据压根还没读到，缓存就被频繁的更新，浪费性能。
（2）如果你写入数据库的值，并不是直接写入缓存的，而是要经过一系列复杂的计算再写入缓存。那么，每次写入数据库后，都再次计算写入缓存的值，无疑是浪费性能的。显然，删除缓存更为适合。

接下来讨论的就是争议最大的，先删缓存，再更新数据库。还是先更新数据库，再删缓存的问题。

2.2 先删除缓存，再更新数据库

该方案会导致不一致的原因是。同时有一个请求A进行更新操作，另一个请求B进行查询操作。那么会出现如下情形:

请求A进行写操作，删除缓存后，工作正在进行中......A还么有彻底更新完
请求B开工，查询redis发现缓存不存在
请求B继续，去数据库查询得到了myslq中的旧值
请求B将旧值写入redis缓存
请求A将新值写入mysql数据库这种情况就会导致数据库和缓存不一致的情况，如下： |时间|线程A|线程B|出现的问题| |--|--|--|--| |t1|请求A进行写操作，删除缓存后，工作正在进行中......||| |t2| |（1）缓存中读取不到，立刻读mysql，由于A还没有对mysql更新完，读到的是旧值。(2)还把从mysql读取的旧值，写回了redis|(1) A还更新完mysql，导致B读到了旧值(2)线程B遵守回写机制，把旧值写回redis，导致其它请求读取的还是旧值，A白干了。| |t3|更新mysql数据库的值，over||redis是被B写回的旧值，mysql是被A更新的新值。出现了，数据不一致问题。|

总结：如果数据库更新失败，导致B线程请求再次访问缓存时，发现redis里面没数据，缓存缺失，再去读取mysql时，从数据库中读取到旧值

那么，如何解决呢？采用延时双删策略 伪代码如下:

public void write(String key,Object data){
        // 先淘汰缓存
        redis.delKey(key);
        // 再写数据库（这两步和原来一样）
        db.updateData(data);
        // 休眠1秒，再次淘汰缓存 这么做，可以将1秒内所造成的缓存脏数据，再次删除。
        Thread.sleep(1000);
        redis.delKey(key);
}

延迟双删问题：

这个1秒怎么确定的，具体该休眠多久呢？ 针对上面的情形，需要自己评估自己的项目的读数据业务逻辑的耗时。然后写数据的休眠时间则在读数据业务逻辑的耗时基础上，加几百ms即可。这么做的目的，就是确保读请求结束，写请求可以删除读请求造成的缓存脏数据。
如果你用了mysql的读写分离架构怎么办？ 在这种情况下，造成数据不一致的原因如下，还是两个请求，一个请求A进行更新操作，另一个请求B进行查询操作。

1. 请求A进行写操作，删除缓存
1. 请求A将数据写入数据库了，
1. 请求B查询缓存发现，缓存没有值
1. 请求B去从库查询，这时，还没有完成主从同步，因此查询到的是旧值
1. 请求B将旧值写入缓存
1. 数据库完成主从同步，从库变为新值上述情形，就是数据不一致的原因。还是使用双删延时策略。

只是，睡眠时间修改为在主从同步的延时时间基础上，加几百ms。

采用这种同步淘汰策略，吞吐量降低怎么办？ 那就将第二次删除作为异步的。自己起一个线程，异步删除。这样，写的请求就不用沉睡一段时间后了，再返回。这么做，加大吞吐量。
第二次删除,如果删除失败怎么办？

这是个非常好的问题，因为第二次删除失败，就会出现如下情形。还是有两个请求，一个请求A进行更新操作，另一个请求B进行查询操作，为了方便，假设是单库：

1. 请求A进行写操作，删除缓存
1. 请求B查询发现缓存不存在
1. 请求B去数据库查询得到旧值
1. 请求B将旧值写入缓存
1. 请求A将新值写入数据库
1. 请求A试图去删除请求B写入对缓存值，结果失败了。

ok,这也就是说。如果第二次删除缓存失败，会再次出现缓存和数据库不一致的问题。 如何解决呢？ 具体解决方案，且看对第(3)种更新策略的解析。

2.3 先更新数据库，再删除缓存

时间	线程A	线程B	出现的问题
t1	删除数据库中的值
t2		缓存中立刻命中，此时B读取的是缓存旧值。	A还没有来得及删除缓存的值，导致B缓存命中读到旧值。
t3	更新缓存的数据，over

总结：假如缓存删除失败或者来不及，导致请求再次访问redis时缓存命中， 读取到的是缓存旧值。

2.3.1 理论依据

老外提出了一个缓存更新套路，名为《Cache-Aside pattern》。其中就指出

失效：应用程序先从cache取数据，没有得到，则从数据库中取数据，成功后，放到缓存中。
命中：应用程序从cache中取数据，取到后返回。
更新：先把数据存到数据库中，成功后，再让缓存失效。

另外，知名社交网站facebook也在论文《Scaling Memcache at Facebook》中提出，他们用的也是先更新数据库，再删缓存的策略。

这种情况不存在并发问题么？

不是的。假设这会有两个请求，一个请求A做查询操作，一个请求B做更新操作，那么会有如下情形产生

（1）缓存刚好失效

（2）请求A查询数据库，得一个旧值

（3）请求B将新值写入数据库

（4）请求B删除缓存

（5）请求A将查到的旧值写入缓存 ok，如果发生上述情况，确实是会发生脏数据。

然而，发生这种情况的概率又有多少呢？

发生上述情况有一个先天性条件，就是步骤（3）的写数据库操作比步骤（2）的读数据库操作耗时更短，才有可能使得步骤（4）先于步骤（5）。

可是，大家想想，数据库的读操作的速度远快于写操作的（不然做读写分离干嘛，做读写分离的意义就是因为读操作比较快，耗资源少），因此步骤（3）耗时比步骤（2）更短，这一情形很难出现。假设，有人非要抬杠，有强迫症，一定要解决怎么办？

如何解决上述并发问题？

首先，给缓存设有效时间是一种方案。其次，采用策略（2）里给出的异步延时删除策略，保证读请求完成以后，再进行删除操作。

还有其他造成不一致的原因么？

有的，这也是缓存更新策略（2）和缓存更新策略（3）都存在的一个问题，如果删缓存失败了怎么办，那不是会有不一致的情况出现么。比如一个写数据请求，然后写入数据库了，删缓存失败了，这会就出现不一致的情况了。这也是缓存更新策略（2）里留下的最后一个疑问。

如何解决？ 提供一个保障的重试机制即可，这里给出两套方案。

方案一：如下图所示：

流程如下所示

更新数据库数据；
缓存因为种种问题删除失败
将需要删除的key发送至消息队列
自己消费消息，获得需要删除的key
继续重试删除操作，直到成功然而，该方案有一个缺点，对业务线代码造成大量的侵入。

于是有了方案二，在方案二中，启动一个订阅程序去订阅数据库的binlog，获得需要操作的数据。在应用程序中，另起一段程序，获得这个订阅程序传来的信息，进行删除缓存操作。

方案二：

流程如下所示：

更新数据库数据
数据库会将操作信息写入binlog日志当中
订阅程序提取出所需要的数据以及key
另起一段非业务代码，获得该信息
尝试删除缓存操作，发现删除失败
将这些信息发送至消息队列
重新从消息队列中获得该数据，重试操作。

备注说明： 上述的订阅binlog程序在mysql中有现成的中间件叫canal，可以完成订阅binlog日志的功能。至于oracle中，目前不知道有没有现成中间件可以使用。另外，重试机制，采用的是消息队列的方式。如果对一致性要求不是很高，直接在程序中另起一个线程，每隔一段时间去重试即可，这些大家可以灵活自由发挥，只是提供一个思路。Redis与MySQL数据双写一致性工程落地案例

3. Redis与Mysql强一致性方案

思路：数据库dbVersion和缓存cacheVersion进行比较

方案一： 查询2次DB，查询一次缓存,步骤如下：

查询缓存（包括cacheVersion）
查询数据库（只查询版本，索引性能较高）
查询数据库（查询需要的数据，性能相对较低）
返回数据

方案二：查询1次缓存，查询1次DB，步骤如下：

查询缓存（包括cacheVersion）
查询数据库（包括版本和数据，性能相对较低）

以上两种方案仅供大家参考，需要根据实际情况选择合适的方案就好。

参考文档：
Redis与MySQL数据双写一致性工程落地案例
 Redis与Mysql双写一致性方案解析
 主从DB与cache一致性
 缓存更新的套路

Redis6系列11-Redis和MySql双写一致性问题探讨