【Redis】缓存更新策略与数据库一致性

208 阅读5分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第17天,点击查看活动详情

先操作缓存还是操作数据库

若先修改缓存再更新数据库,在高并发的情况下,会造成数据大量的迭代增加服务器的压力,同时,部分数据并不大量调用,造成资源的浪费。 所以,合理的方案是先更新数据库再更新缓存

主动更新策略

1. read/write through 缓存代理

采用分布式缓存组件,应用程序只和缓存交互,不再和数据库交互,而是由缓存和数据库交互,相当于更新数据库的操作由缓存自己代理了。 写策略的步骤: 当有数据更新的时候,先查询要写入的数据在缓存中是否已经存在:

  • 如果缓存中数据已经存在,则更新缓存中的数据,并且由缓存组件同步更新到数据库中,最后告知应用程序更新完成。
  • 如果缓存中数据不存在,直接更新数据库,然后返回; 读策略的步骤: 先查询缓存中数据是否存在,如果存在则直接返回,如果不存在,则由缓存组件负责从数据库查询数据,并将结果写入到缓存组件,最后缓存组件将数据返回。

2. Write Back(写回)策略

Write Back(写回)策略在更新数据的时候,只更新缓存,同时将缓存数据设置为脏的,然后立马返回,不更新数据库。而我们的缓存会异步地批量更新数据库。 特别适合写多的场景 问题显而易见 数据不是强一致性,可能会丢失数据

3. Cache Aside(旁路缓存)策略

写策略的步骤:

  • 先更新数据库中的数据,再删除缓存中的数据。 读策略的步骤:
  • 如果读取的数据命中了缓存,则直接返回数据;
  • 如果读取的数据没有命中缓存,则从数据库中读取数据,然后将数据写入到缓存,并且返回给用户。 因此适合读多写少的情况

操作缓存和数据库时有三个问题需要考虑:

删除缓存还是更新缓存?

  • 更新缓存:每次更新数据库都更新缓存,无效写操作较多
  • 删除缓存:更新数据库时让缓存失效,查询时再更新缓存

如何保证缓存与数据库的操作的同时成功或失败?

  • 单体系统,将缓存与数据库操作放在一个事务
  • 分布式系统,利用TCC等分布式事务方案

先删除缓存的缺点

正常情况下 出现错误的情况 正常情况下 出现错误的情况 可以看到,先操作数据库再删除缓存出现数据不一致的可能性还存在 需要满足以下条件:

  • 两个线程并发执行
  • 线程1执行时恰好缓存失效
  • 线程1查完数据库进行写缓存的微秒时刻线程2更新数据库,删缓存 在这微小时刻进行数据库的写入(耗时长)可能性不大,所以选择先操作数据库,再删除缓存

总结

缓存更新策略的最佳实践方案:

  • 低一致性需求:使用Redis自带的内存淘汰机制
  • 高一致性需求:主动更新,并以超时剔除作为兜底方案

读操作:

  • 缓存命中则直接返回
  • 缓存未命中则查询数据库,并写入缓存,设定超时时间

写操作:

  • 先写数据库,然后再删除缓存
  • 要确保数据库与缓存操作的原子性 即给缓存添加超时剔除和主动更新的策略,可以解决大部分的数据一致性问题

其他问题

1. 缓存穿透

客户端请求的数据在缓存中和数据库中都不存在,这样缓存永远不会生效,这些请求都会打到数据库。 给服务器带来很大的压力

解决方案

1.1 缓存空对象 优点:实现简单,维护方便 缺点: 额外的内存消耗,可能造成短期的不一致

1.2 布隆过滤 优点:内存占用较少,没有多余key 缺点:实现复杂,存在误判可能

2.缓存雪崩

缓存雪崩是指在同一时段大量的缓存key同时失效或者Redis服务宕机,导致大量请求到达数据库,带来巨大压力。 解决方案

  1. 给不同的Key的TTL添加随机值
  2. 利用Redis集群提高服务的可用性
  3. 给缓存业务添加降级限流策略
  4. 给业务添加多级缓存

3.缓存击穿

缓存击穿问题也叫热点Key问题,就是一个被高并发访问并且缓存重建业务较复杂的key突然失效了,无数的请求访问会在瞬间给数据库带来巨大的冲击。

解决方案

  1. 互斥锁
  2. 逻辑过期(增加一个字段,也要用互斥的原理调用一个线程去数据库获取数据)