Redis是什么

问题出现

rehash：rehash操作是将ht[0]中的数据，全部迁移到ht[1]中。数据量小的场景下，直接将数据从ht[0]拷贝到ht[1]速度是较快的。数据量大的场景，例如存有上百万的KV时，迁移过程将会明显阻塞用户请求。
渐进式rehash：为避免出现这种情况，使用了rehash方案。基本原理就是，每次用户访问时都会迁移少量数据。将整个迁移过程，平摊到所有的访问用户请求过程中。

定义：
- String类型：value的字节数大于10KB
- Hash/Set/Zset/list等复杂数据结构类型：元素个数大于5000各或总value字节数大于10MB
危害：
- 读取成本高
- 容易导致慢查询（过期、删除）
- 主从复制异常，服务阻塞，无法正常响应请求
- 业务侧使用大Key时，请求Redis超时报错
消除方法：
- 拆分：将大Key拆分为小Key。例如一个String拆分成多个String
- 压缩：将value压缩后写入redis，读取时解压后再使用。压缩算法可以是gzip/snappy/lz4等。通常情况下，一个压缩算法压缩率高，则解压耗时就长。需要对实际数据进行测试后，选择一个合适的算法。如果存储的是JSON字符串，可以考虑使用MessagePack进行序列化。
- 集合类结构hash、list、set：
  - （1）拆分：可以用hash取余、位掩码的方式决定放在哪个key中
  - （2）区分冷热：如榜单列表场景使用zset，只缓存前10页数据，后续数据走db

定义：用户访问一个Key的QPS特别高，导致Server实例出现CPU负载突增或不均的情况。热Key没有明确的标准，QPS超过500就有可能被识别为热Key。
解决方法：
- 设置Localcache：在访问redis前，在业务服务侧设置Localcache，降低访问redis的QPS。LocalCache中缓存过期或未命中，则从Redis中将数据更新到Localcache。Java的Guava、Golang的Bigcache就是这类Localcache
- 拆分：将key:value这一个热Key复制写入多份，例如key1:value，key2:value，访问的时候访问多个key，但value是同一个，以此将QPS分散到不同实例上，降低负载。代价是，更新时需要更新多个key，存在数据短暂不一致的风险
- 使用redis代理的热Key承载能力：字节的Redis访问代理就具备热Key承载能力，本质上是结合了“热Key发现”、“LocalCache”两个功能

容易导致redis慢查询的操作：

定义：热点数据查询绕过缓存，直接查询数据库
危害：
- 查询一个一定不存在的数据：如果是系统bug或者人为攻击，容易导致db响应慢甚至宕机
- 缓存过期时：高并发场景下，一个热key过期或者同一时间有大量key集中过期时，会有大量请求落到db上，导致查询变慢，容易影响db性能和稳定，甚至出现db无法响应新的查询
解决办法：
- 缓存空值：下次再查缓存时直接反空值
- 布隆过滤器：通过bloom filter算法来存储合法key，由于该算法超高的压缩率，极小空间就可存储大量key值

定义：大量缓存同时过期
解决办法：
- 缓存空值：将缓存失效时间分散开，比如再原有的失效时间基础上增加一个随机值。热点数据过期时间尽量设置得长一些，冷门数据过期时间相对短一些
- 使用缓存集群，避免单机宕机造成的缓存雪崩