Redis是什么

为什么需要Redis

数据流增长，读写数据压力的不断增加。
将经常被访问到的数据存到内存中，从内存中读数据比从磁盘中读要快。

Redis基本工作原理

数据从内存中读写。
数据保存到磁盘上防止重启后数据丢失。
- 增量数据保存到AOF文件。
- 全量数据RDB文件。
单线程处理所有操作命令

Redis应用案例

连续签到

用户每日有一次签到的机会，如果断签，连续签到计数将归0。

连续签到的定义：每天必须在23:59:59前签到。

key：uid
value：count
expireAt：后天的0点

消息通知

例如当文章更新时，将更新后的文章推到ES，用户可用能搜索到最新的文章数据。

用list做为消息队列。

计数

一个用户有多项计数需求，可以使用Hash结构存储。

排行榜

积分变化时，排名实时更新。可以使用ZSet。

限流

要求1秒内放行的请求数为N，超过N则禁止访问。

key: xxxx_1671356046

对这个key调用incr，超过限制N则禁止访问，1671356046是当前时间戳。

生成一个带时间戳的key，每次相同的请求都对先获取这个key的值，如果超过N则拒绝访问，否则放行，且对这个key做incr操作。

分布式锁

并发场景，要求一次只能有一个线程执行。执行完成后，其他等待中的线程才能执行。

可以使用redis的setnx实现，利用了两个特性：

Redis是单线程执行命令。
setnx只有未设置才能执行成功。

注意：死锁，Redis在集群的情况可能会出现问题。

Redis使用注意事项

大key

大key的定义：

String类型：value的字节数大于10KB。
Hash/Set/ZSet/List等复杂数据结构类型：元素个数大于5000个或总value字节数大于10MB。

大key的危害：

读取成本高。
容易导致慢查询（过期、删除）。
主从复杂异常，服务阻塞，无法正常响应请求。

业务侧使用大key的表现

请求Redis超时报错。

消除大key的方法

拆分：

将大key拆分为小key。例如一个String拆分成多个String。

压缩：

将value压缩后写入redis，读取时解压后再使用。压缩算法可以是gzip，snappy，lz4等。通常情况下，一个压缩算法压缩率高，则解压耗时就长。就需要对实际数据进行测试后，选择一个合适的算法。如果存储的是JSON字符串，可以考虑使用MessagePack进行序列化。

hash、list、set、zset：

拆分：将key拆分为多个key，然后可以用hash取余、位掩码的方式决定放哪个key中。
区分冷热：如榜单场景使用ZSet，只缓存前10页数据，后续数据都db。

热key

用户访问一个key的QPS特别高。导致Server实例出现CPU负载突增或者不均的情况。热key没有明确的标准，QPS超过500就有可能被识别为热key。

解决

设置LocalCache：

在访问Redis前，在业务服务侧设置LocalCache，降低访问Redis的QPS。LocalCache中缓存过期或未命中再去Redis中将数据更新到LocalCache。Java的Guava、Golang的BigCache就是这类LocalCache。

拆分：

将key：value这一个热key复制写入多份，例如key1：value，key2：value。访问的时访问多个key，但value是同一个，以此将QPS分散到不同实例上，降低负载。问题在于更新时需要更新多个key，存在数据短暂不一致的风险。

使用Redis代理的热key承载能力：

字节的Redis访问代理就具备热key承载能力。本质是结合了“热key发现”、“LocalCache”两个功能。

慢查询场景

容易导致redis慢查询的操作

批量操作一次性传入过多的key/value，如mset、hmset、sadd、zadd等O(n)操作，建议单批次不要超过100，超过100后性能下降明显。
ZSet大部分命令都是O(log(n))，当大小超过5k时，简单的zadd、zrem也可能导致慢查询。
操作的单个value过大，超过10KB。也就是避免使用大Key。
对大key的delete、expire操作也可能导致慢查询，Redis4.0之前不支持异步删除unlink，大key删除会导致阻塞Redis。

缓存穿透

缓存穿透:热点数据查询绕过缓存，直接查询数据库。

缓存穿透的危害

查询一个一定不存在的数据，通常不会缓存不存在的数据，这类查询请求都会直接打到db，如果有系统bug或人为攻击那么容易导致db响应慢甚至宕机。
高并发场景下，一个热key如果过期，会有大量请求同时击穿至db，容易影响db性能和稳定。在高并发场景下，同一时间有大量key集中过期时，也会导致大量请求落到上，导致查询变慢，甚至出现db无法响应新的查询。

避免：

缓存空值：如不存在的userID。这个id在缓存和数据库中都不存在。则可以缓存一个空值，下次再查缓存直接反空值。
布隆过滤器：通过bloom filter算法来存储合法key，得益于该算法超高的压缩率，只需要占用极小的空间就能存储大量key值。

缓存雪崩

缓存雪崩:大量缓存同时过期

避免：

将缓存失效时间分散开，比如在原有的失效时间基础上增加一个随机值，例如不同key过期时间可以设置为10分1秒过期，10分23秒过期，10分8秒过期。单位秒部分就是随机时间，这样过期时间就分散了。对于热点数据，过期时间尽量设置得长一些，冷门的数据可以相对设置过期时间短一些。
使用缓存集群，避免单机宕机造成的缓存雪崩。

总结

Redis是一个开源的高性能内存数据存储系统，它可以用作数据库、缓存和消息中间件。它支持多种数据结构，如字符串、哈希、列表、集合、有序集合等，并且数据存储在内存中，因此访问速度非常快。同时，Redis也可以将数据持久化到磁盘，以防止数据丢失。

需要使用Redis的主要原因包括：

快速访问： 将常用的数据存储在内存中，从而实现更快速的数据访问，比传统基于磁盘的数据库更快。
缓存： 作为缓存层，可以减轻后端数据库的负担，提高读取性能，减少数据库的访问次数。
高并发支持： Redis是单线程处理命令的，这保证了数据的原子性，适合高并发的读写操作。
数据结构支持： Redis提供多种数据结构，可以灵活地应对不同的业务需求。
持久化： Redis支持将数据持久化到磁盘，以便在重启后恢复数据，确保数据的可靠性。
消息中间件： Redis的发布订阅功能使其可以用作消息中间件，用于实现实时消息传递等功能。

关于Redis的基本工作原理：

数据存储在内存中，从内存中读取数据速度比从磁盘中读取快。
为了防止数据重启后丢失，Redis支持将数据持久化到磁盘，包括增量数据保存到AOF（Append-Only File）文件和全量数据保存到RDB（Redis Database）文件。
Redis使用单线程处理所有操作命令，确保了操作的原子性。
Redis可以应用于多种场景，如连续签到、消息通知、计数、排行榜、限流、分布式锁等。

在应用案例中，连续签到可以通过记录用户的签到次数并设置过期时间来实现，消息通知可以利用Redis的List结构来实现消息队列，计数可以使用Hash结构存储，排行榜可以使用ZSet来处理积分变化，限流可以通过设置特定的键来控制访问频率，分布式锁可以使用Redis的setnx命令来实现。

然而，需要注意一些问题，比如避免大key、热key、慢查询、缓存穿透和缓存雪崩等。这些问题可能会影响Redis的性能和稳定性。针对这些问题，可以采取不同的策略，如数据拆分、使用压缩、设置本地缓存、使用布隆过滤器等。

Redis - 大厂程序员是怎么用的 | 青训营