这是我参与「第五届青训营」伴学笔记创作活动的第 17 天

一、本堂课重点内容

Redis是什么
Redis应用案例
Redis使用注意事项

二、详细知识点介绍

Redis是什么

为什么需要Redis

数据从单表，演进出了分库分表
MySQL从单机演进除了集群
- 数据量增长
- 读写数据压力的不断增加

数据分冷热
- 热数据：经常被访问到的数据
将热数据存储到内存中

Redis基本工作原理

数据从内存中读写
数据保存到硬盘上防止重启数据丢失
- 增量数据保存到AOF文件

- 全量数据保存到RDB文件

- 单线程处理所有操作命令

Redis应用案例

连续签到

掘金每日连续签到

用户每日有一次签到的机会，如果断签，连续签到计数将归0.

连续签到的定义：每天必须在23:59:59之前签到，如果在次日0:00:00之后签到，将视为断签。

解决方案

对于这种需求，我们可以使用Redis的 incr和 expire命令来实现，为每个用户设置一个key，key的value为连续签到的天数，签到时，将用户的value通过 incr命令加1，然后通过 expire设置签到后的当天0点+48小时后过期，这样就可以保证用户的连续签到天数。

用到的Redis数据结构

在上述场景中，我们用到了Redis的 String数据结构，String数据结构（sds）是Redis最基本的数据结构。

可以存储字符串、数字、二进制数据
通常和 expire命令一起使用
场景
- 存储计数
- Session

消息通知

用list作为消息队列。

当文章更新时，将更新后的文章推送到ES，用户就能搜索到最新的文章数据。

解决方案

使用Redis的 lpush和 rpop命令来实现，当文章更新时，将文章通过 lpush命令推送到Redis的list中，当用户访问时，通过 brpop命令从list中取出文章，然后将文章推送到ES。

用到的Redis数据结构

在上述场景中，我们用到了Redis的 List数据结构，List数据结构（Quicklist）是Redis的链表结构，是一个双向链表+listpack的结构，链表中的每个节点都包含了一个entry，也就是listpack，其中包含的就是数据，如下图所示

计数

当一个用户有多项计数的需求时，可以通过hash结构存储。

解决方案

使用Redis的 hincrby命令来实现，当用户访问时，将用户的计数通过 hincrby命令加1。同时通过 hget命令获取用户的计数。但由于一个用户有多项计数，而查找和增加时，每次都需要连接到Redis，所以可以通过管道，pipeline，将多个命令一次性发送到Redis，减少连接次数。

用到的Redis数据结构

在上述场景中，我们用到了Redis的 Hash数据结构，Hash数据结构（dict）是Redis的字典结构，是一个哈希表（dictht）+链表（dictEntry）的结构（拉链法解决冲突）。如下图所示

区分

rehash

扩容时，将旧的哈希表中的数据迁移到新的哈希表中，这个过程叫做rehash，也就是将ht[0]中的数据全部迁移到ht[1]中，然后将ht[0]指向ht[1]指向的哈希表，ht[1]指向空。在数据量小的情况下，直接拷贝是较快的，不过，数据量一大，就会导致阻塞用户请求。
渐进式rehash

为了避免出现上述这种情况，使用了rehash方案。基本原理就是，每次用户访问时都会迁移少量数据。将整个迁移过程平摊到所有访问的用户上，这样就不会出现阻塞用户请求的情况。当用户访问时，将其访问的迁移到ht[1]。

String与Hash的区别

String每次都会新建一个key
Hash每次新建一个key里的field

排行榜

当用户积分变化，排名要实时的变更。

解决方案

使用Redis的 zadd、zrevrange、zincrby命令来实现，当用户积分变化时，将用户的积分通过 zadd命令加入到Redis的有序集合中，当用户访问时，通过 zrevrange命令获取排名前10的用户，通过 zincrby命令增加用户的积分。

用到的Redis数据结构

在上述场景中，我们用到了Redis的 Sorted Set数据结构，Sorted Set数据结构（zskiplist）是Redis的跳表结构，是一个跳表（skiplist）+字典（dict）的结构。如下图所示

其中skiplist是一个多层的链表结构，每一层都是一个有序的链表，通过高层的链表向右和下层遍历，可以快速的找到目标节点。其在zset中用于排序，而dict用于存储节点数据。

限流

当用户访问频率过高时，需要限制用户的访问。

要求1秒内放行的请求为N，超过N则禁止访问。

解决方案

设置key与当前时间的时间戳相关（最小粒度为秒），当用户访问时，该时间戳对应的key就通过 incr命令加1，然后判断其返回值（加完1后的值）是否大于N，如果大于N，则禁止访问，否则放行。而下一秒，就会生成一个新的key，这样就可以实现每秒放行N个请求。

分布式锁

当多个用户同时访问时，需要保证只有一个用户可以访问。并发场景，要求一次只能有一个协程执行。执行完成后，其他等待中的协程才能执行。如图，上为抢锁情况，下为预期结果。

解决方案

使用Redis的 setnx命令来实现，当用户访问时，通过 setnx命令设置一个key，如果设置成功，则表示抢到锁，否则表示没有抢到锁。

原理

Redis是单线程执行命令的
setnx表示如果key不存在，则设置key，如果key存在，则不设置key

Redis使用注意事项

大Key

定义

数据类型	大Key标准
String类型	value的字节数大于10KB即为大key
Hash/Set/Zset/list等复杂数据结构类型	元素个数大于5000个或总value字节数大于10MB即为大key

危害

读取成本高
容易导致慢查询（过期、删除）
主从复制异常，服务阻塞无法正常响应请求

业务侧使用大key的表现

请求Redis超时报错

消除方法

String类型

拆分

将大key拆分成小key。例如一个String拆分成多个String

	Key	Value
拆分前	article:70011	abcdefghigklmnopqrst
拆分后	article:70011	[3][70011]abcdefg
	article:70011_2	[70011]higklmn
	article:70011_3	[70011]opqrst

其中拆分后的key很好理解，而value中第一个[3]表示一共拆分成了三部分。

压缩

将value压缩后写入redis，读取时解压后再使用。压缩算法可以是gzip、snappy、lz4等。通常情况下，一个压缩算法压缩率高、则解压耗时就越长。需要对实际数据进行测试后，选择一个合适的压缩算法。

如果存储的是JSON字符串，可以考虑使用MessagePack进行序列化（可以将数字压缩到能表示的最小字节数）。

集合类结构hash、list、set、zset

拆分

可以用hash取余、位掩码的方式决定放在哪个key中
区分冷热

如榜单列表场景使用zset，只缓存前10页数据，后续数据走db

热Key

定义

用户访问一个Key的QPS特别高，导致Server实例出现CPU负载突增或者不均的情况。

热Key没有明确的标准，QPS超过500就有可能被识别为热Key。

解决方法

设置Localcache

在访问Redis前，在业务服务侧设置Localcache，降低访问的Redis的QPS。Localcache中缓存过期或未命中，则从Redis中将数据更新到Localcache，Java的Guava、Golang的Bigcache就是这类Localcache。

拆分

将key:value这一个热Key复制写入多份，例如key1:value, key2:value，访问的时候访问多个key，但value是同一个，以此将qps分散到不同实例上，降低负载。代价是，更新时需要更新多个key，存在数据短暂不一致的风险。

使用Redis代理的热Key承载能力

字节跳动的Redis访问代理就具备热Key承载能力，本质上是结合了“热Key发现”、“Localcache”两个功能。

慢查询场景

容易导致慢查询的操作

批量操作一次性传入过多的key/value，如mset/hmset/sadd/zadd等O(N)操作，建议单批次不要超过100，超过100之后性能下降明显。
zset大部分命令都是O(logN)，当大小超过5k以上时，简单的zadd/zrem也可能导致慢查询。
操作单个value过大，超过10KB，也就是要避免使用大Key
对大key的delete/expire操作也可能导致慢查询，Redis4.0之前不支持异步删除unlink，大key删除会阻塞Redis。

缓存穿透 & 缓存雪崩

定义

缓存穿越

热点数据查询绕过缓存，直接查询数据库

缓存雪崩

大量缓存同时过期，导致大量请求落到db上

危害

查询一个一定不存在的数据时

通常不会缓存不存在的数据，这类查询请求都会直接打到db，如果有系统bug或人为攻击，那么容易导致db响应慢甚至宕机
缓存过期时

在高并发场景下，一个热key如果过期，会有大量请求同时击穿至db，容易影响db性能和稳定。

同一时间有大量key集中过期，也会导致大量请求落到db上，导致查询变慢，甚至出现db无法响应新的查询。

如何减少缓存穿透

缓存空值

如一个不存在的ID。这个ID在缓存和数据库中都不存在，则可以缓存一个空值，下次再查缓存直接返回空值。
布隆过滤器

通过bloom filter算法来存储合法key，得益于该算法超高的压缩率，只需要占用极小的空间就能存储大量key。

如何减少缓存雪崩

缓存空值

将缓存失效时间分散开，比如在原有的失效时间基础上增加一个随机值，例如不同key过期时间，可以设置为10分1秒过期、10分23秒过期、10分8秒过期。单位秒部分就是随机时间，这样过期时间就分散了。

对于热点数据，过期时间尽量设置长一些，冷门的数据可以设置过期时间短一些。
使用缓存集群，避免单机宕机造成的缓存雪崩

三、实践练习例子

本节课程并没有给出用于实践练习的例子，不过在之前的Redis应用案例中，我们已经实践过了Redis的一些应用场景。

四、课后个人总结

本次课程主要讲解了使用Redis的原因，以及Redis的一些应用场景，包括缓存、计数器、排行榜、延时队列、分布式锁等，同时也讲解了Redis的一些常见问题，包括热Key、慢查询、缓存穿透、缓存雪崩等。

Redis ｜ 青训营笔记

一、本堂课重点内容

二、详细知识点介绍

Redis是什么

为什么需要Redis

Redis基本工作原理

Redis应用案例

连续签到

解决方案

用到的Redis数据结构

消息通知

解决方案

用到的Redis数据结构

计数

解决方案

用到的Redis数据结构

排行榜

解决方案

用到的Redis数据结构

限流

解决方案

分布式锁

解决方案

Redis使用注意事项

大Key

定义

危害

消除方法

热Key

定义

解决方法

慢查询场景

容易导致慢查询的操作

缓存穿透 & 缓存雪崩

定义

危害

如何减少缓存穿透

如何减少缓存雪崩

三、实践练习例子

四、课后个人总结

Redis ｜青训营笔记