Redis缓存常见问题解决

125 阅读4分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 2 月更文挑战」的第 30 天,点击查看活动详情

缓存雪崩

概念

缓存雪崩:缓存雪崩指的是在缓存中的大量数据同时过期或失效,导致缓存失效的情况。这时候,所有的请求都会打到数据库上,导致数据库负载瞬间增大,甚至会压垮数据库。为了避免缓存雪崩,可以在缓存的过期时间上加上随机值,或者使用一些缓存高可用的方案,如Redis Cluster和Redis Sentinel。

解决方案

  • 构建多级缓存架构: nginx 缓存 + redis 缓存 +其他缓存(ehcache 等),程序设计较为复杂
  • 使用锁或队列: 用加锁或者队列的方式来保证不会有大量的线程对数据库一次性进行读写,从而避免失效时大量的并发请求落到底层存储系统上。效率低,不适用高并发情况
  • 设置过期标志更新缓存: 记录缓存数据是否过期(设置提前量),如果过期会触发通知另外的线程在后台去更新实际 key 的缓存
  • 将缓存失效时间分散开: 比如我们可以在原有的失效时间基础上增加一个随机值,比如 1-5 分钟随机,这样每一个缓存的过期时间的重复率就会降低,就很难引发集体失效的事件

缓存穿透

概念

缓存穿透:缓存穿透是指恶意请求一个不存在于缓存中的数据,导致请求打到了数据库上,而且这个数据在数据库中也不存在,这会导致缓存无效,大量请求打到数据库上,导致数据库压力过大。为了避免缓存穿透,可以使用布隆过滤器等技术,将查询结果为空的数据也缓存起来,或者使用Nginx等反向代理服务器拦截恶意请求。

解决方案

  • 一个一定不存在的数据,由于缓存是不命中时被动写的,并且出于容错考虑,如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义

  • 对空值缓存: 如果一个查询返回的数据为空(不管是数据是否不存在),我们仍然把这个空结果(null)进行缓存,这样可以缓解数据库的访问压力,然后设置空结果的过期时间会很短,最长不超过五分钟。(只能作为简单的应急方案)

  • 设置可访问的名单(白名单): 使用 bitmaps 类型定义一个可以访问的名单,名单 id 作为 bitmaps 的偏移量,每次访问和 bitmap 里面的 id 进行比较,如果访问 id 不在 bitmaps 里面,进行拦截,不允许访问。

  • 布隆过滤器: 将所有可能存在的数据哈希到一个足够大的 bitmaps 中,一个一定不存在的数据会被这个bitmaps 拦截掉,从而避免了对底层存储系统的查询压力

  • 进行实时监控: 当发现 Redis 的命中率开始急速降低,需要排查访问对象和访问的数据,和运维人员配合,可以设置黑名单限制服务

缓存击穿

概念

缓存击穿:缓存击穿指的是一个热点key在缓存中失效的同时,有大量请求过来查询该热点数据,这时候请求都会打到数据库上,导致数据库负载过大,甚至压垮数据库。为了避免缓存击穿,可以将热点数据的过期时间设置为永久有效,或者使用互斥锁机制,即只有一个线程去请求数据库,其他线程等待这个线程的结果,并使用其结果进行缓存。此外,还可以使用异步加载、预加载等技术来减少对数据库的压力。

解决方案

key 可能会在某些时间点被超高并发地访问,是一种非常“热点”的数据。这个时候,需要考虑一个问题:缓存被“击穿”的问题。

  • 预先设置热门数据: 在 redis 高峰访问之前,把一些热门数据提前存入到redis 里面,加大这些热门数据 key 的时长
  • 实时调整: 现场监控哪些数据热门,实时调整 key 的过期时长
  • 使用锁:(1)就是在缓存失效的时候(判断拿出来的值为空),不是立即去 load DB;(2) 先使用缓存工具的某些带成功操作返回值的操作(比如 Redis 的 SETNX)去 set 一个 mutex key;(3) 当操作返回成功时,再进行 load db 的操作,并回设缓存,最后删除 mutex key;(4) 当操作返回失败,证明有线程在 load db,当前线程睡眠一段时间再重试整个 get 缓存的方法