持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第8天,点击查看活动详情
Redis 应用问题解决
缓存穿透
缓存无数据,数据库也无数据
问题描述
key 对应的数据在数据源并不存在,每次针对此 key 的请求从缓存获取不到,请求都会压到数据源(数据库),从而可能压垮数据源。
例子
比如用一个不存在的用户获取用户信息,不论缓存还是数据库都没有,若黑客利用此漏洞进行攻击可能压垮数据库。
缓存穿透发生的条件
- 应用服务器压力变大
- redis 命中率降低
- 一直查询数据库,使得数据库压力太大而压垮
其实 redis 在这个过程中一直平稳运行,崩溃的是我们的数据库(如 MySQL)。
缓存穿透发生的原因:黑客或者其他非正常用户频繁进行很多非正常的 url 访问,使得 redis 查询不到数据库。
解决方案
- 对空值缓存:如果一个查询返回的数据为空(不管是数据是否不存在),我们仍然把这个空结果(null)进行缓存,设置空结果的过期时间会很短,最长不超过五分钟,最好控制在以秒为单位。
- 设置黑名单:使用 bitmaps 类型或者其他技术定义一个黑名单,名单 id 作为 bitmaps 的偏移量,每次访问和 bitmap 里面的 id 进行比较,如果访问 id 在 bitmaps 里面,进行拦截,不允许访问。
- 采用布隆过滤器:布隆过滤器(Bloom Filter)是 1970 年由布隆提出的。它实际上是一个很长的二进制向量 (位图) 和一系列随机映射函数(哈希函数)。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难。
- 进行实时监控:当发现 Redis 的命中率开始急速降低,需要排查访问对象和访问的数据,和运维人员配合,可以设置黑名单限制服务。
布隆过滤器的原理
- 先初始化一个大的二进制数组。
- 预先将数据库的ID数据,查找出来,对这个数组进行初始化,我们可以将数据进行hash,对数组的进行标记。
- 得到比如 010101000000,如果一个不存在的数据,提取的数据对应的bit 值为0 ,那么表示数据不存在.
- 当然也有可能出现误判的情况,比如提取到的位数全部唯一,这种情况几率会很小。
RBloomFilter<String> filter=client.getBloomFilter("bloom");
filter.tryInit(1000000L,0.01);
filter.add("1001");
filter.add("1002");
System.err.println(filter.contains("1001"));
System.err.println(filter.contains("1004"));
缓存击穿
缓存无数据,数据库有数据,key比较集中(比如热点key)
问题描述
key 对应的数据存在,但在 redis 中过期,此时若有大量并发请求过来,这些请求发现缓存过期一般都会从后端数据库加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端数据库压垮。
缓存击穿的现象:
- 数据库访问压力瞬时增加,数据库崩溃
- redis 里面没有出现大量 key 过期
- redis 正常运行
缓存击穿发生的原因
redis 某个 key 过期了,大量访问使用这个 key(热门 key)
解决方案
key 可能会在某些时间点被超高并发地访问,是一种非常 “热点” 的数据。
- 预先设置热门数据:在 redis 高峰访问之前,把一些热门数据提前存入到 redis 里面,加大这些热门数据 key 的时长。
- 实时调整:现场监控哪些数据热门,实时调整 key 的过期时长。
- 设置随机过期时间,让过期时间在一个范围,而不是统一在某个时间点过期.
- 使用锁
- 就是在缓存失效的时候(判断拿出来的值为空),不是立即去 load db。
- 先使用缓存工具的某些带成功操作返回值的操作(比如 Redis 的 SETNX)去 set 一个 mutex key。
- 当操作返回成功时,再进行 load db 的操作,并回设缓存,最后删除 mutex key;
- 当操作返回失败,证明有线程在 load db,当前线程睡眠一段时间再重试整个 get 缓存的方法。
缓存雪崩
缓存无数据,数据库有数据,key比较分散(比如项目初始化数据,设置过期时间每天23:59:59)
问题描述
key 对应的数据存在,但在 redis 中过期,此时若有大量并发请求过来,这些请求发现缓存过期一般都会从后端数据库加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端数据库压垮。
解决方案
- 构建多级缓存架构:nginx 缓存 + redis 缓存 + 其他缓存(ehcache 等)。
- 使用锁或队列:用加锁或者队列的方式来保证不会有大量的线程对数据库一次性进行读写,从而避免失效时大量的并发请求落到底层存储系统上,该方法不适用高并发情况。
- 设置过期标志更新缓存:记录缓存数据是否过期(设置提前量),如果过期会触发通知另外的线程在后台去更新实际 key 的缓存。
- 将缓存失效时间分散开:比如可以在原有的失效时间基础上增加一个随机值,比如 1-5 分钟随机,这样每一个缓存的过期时间的重复率就会降低,就很难引发集体失效的事件。