你真的懂Redis的5种基本数据结构吗?这些知识点或许你还需要看看(图文并茂,浅显易懂,建议收藏)

33 阅读17分钟
  • string(字符串)

  • list(列表)

  • hash(字典)

  • set(集合)

  • zset(有序集合)

其中list、set、hash、zset这四种数据结构是容器型数据结构,它们共享下面两条通用规则:

  • create if not exists:容器不存在则创建

  • drop if no elements:如果容器中没有元素,则立即删除容器,释放内存

本文将详细讲述的是Redis的5种基础数据结构。

二、string(字符串)


1、string(字符串)相关介绍

1.1 string(字符串)的内部结构

string(字符串)是Redis最简单也是使用最广泛的数据结构,它的内部是一个字符数组。如图所示:

string(字符串).png

Redis中string(字符串)是动态字符串,允许修改;它在结构上的实现类似于Java中的ArrayList(默认构造一个大小为10的初始数组),这是冗余分配内存的思想,也称为预分配;这种思想可以减少扩容带来的性能消耗。

string(字符串)预置空间.png

1.2 string(字符串)的扩容

当string(字符串)的大小达到扩容阈值时,将会对string(字符串)进行扩容,string(字符串)的扩容主要有以下几个点:

  1. 长度小于1MB,扩容后为原先的两倍; length = length * 2

  2. 长度大于1MB,扩容后增加1MB; length = length + 1MB

  3. 字符串的长度最大值为 512MB

2、string(字符串)的指令

2.1 单个键值对增删改查操作

set -> key 不存在则新增,存在则修改

set key value

get -> 查询,返回对应key的value,不存在返回(nil)

get key

del -> 删除指定的key(key可以是多个)

del key [key …]

示例:

1127.0.0.1:6379> set name liziba

2OK

3127.0.0.1:6379> get name

4"liziba"

5127.0.0.1:6379> set name liziba001

6OK

7127.0.0.1:6379> get name

8"liziba001"

9127.0.0.1:6379> del name

10(integer) 1

11127.0.0.1:6379> get name

12(nil)

2.2 批量键值对

批量键值读取和写入最大的优势在于节省网络传输开销

mset -> 批量插入

mset key value [key value …]

mget -> 批量获取

mget key [key …]

示例:

1127.0.0.1:6379> mset name1 liziba1 name2 liziba2 name3 liziba3

2OK

3127.0.0.1:6379> mget name1 name2 name3

41) "liziba1"

52) "liziba2"

63) "liziba3"

2.3 过期set命令

过期set是通过设置一个缓存key的过期时间,使得缓存到期后自动删除从而失效的机制。

方式一:

expire key seconds

示例:

1127.0.0.1:6379> set name liziba

2OK

3127.0.0.1:6379> get name

4"liziba"

5127.0.0.1:6379> expire name 10   # 10s 后get name 返回 nil

6(integer) 1

7127.0.0.1:6379> get name

8(nil)

方式二:

setex key seconds value

示例:

1127.0.0.1:6379> setex name 10 liziba    # 10s 后get name 返回 nil

2OK

3127.0.0.1:6379> get name

4(nil)

2.4 不存在创建存在不更新

上面的set操作不存在创建,存在则更新;此时如果需要存在不更新的场景,那么可以使用如下这个指令

setnx -> 不存在创建存在不更新

setnx key value

示例:

1127.0.0.1:6379> get name

2(nil)

3127.0.0.1:6379> setnx name liziba        

4(integer) 1

5127.0.0.1:6379> get name

6"liziba"

7127.0.0.1:6379> setnx name liziba_98        # 已经存在再次设值,失败

8(integer) 0

9127.0.0.1:6379> get name

10"liziba"

2.5计数

string(字符串)也可以用来计数,前提是value是一个整数,那么可以对它进行自增的操作。自增的范围必须在signed long的区间访问内,[-9223372036854775808,9223372036854775808]

incr -> 自增1

incr key

示例:

1127.0.0.1:6379> set fans 1000

2OK

3127.0.0.1:6379> incr fans # 自增1

4(integer) 1001

incrby -> 自定义累加值

incrby key increment

1127.0.0.1:6379> set fans 1000

2OK

3127.0.0.1:6379> incr fans

4(integer) 1001

5127.0.0.1:6379> incrby fans 999

6(integer) 2000

测试value为整数的自增区间

最大值:

1127.0.0.1:6379> set fans 9223372036854775808

2OK

3127.0.0.1:6379> incr fans

4(error) ERR value is not an integer or out of range

最小值:

1127.0.0.1:6379> set money -9223372036854775808

2OK

3127.0.0.1:6379> incrby money -1

4(error) ERR increment or decrement would overflow

三、list(列表)​


1、list(列表)相关介绍

1.1 list(列表)的内部结构

Redis的列表相当于Java语言中的LinkedList,它是一个双向链表数据结构(但是这个结构设计比较巧妙,后面会介绍),支持前后顺序遍历。链表结构插入和删除操作快,时间复杂度O(1),查询慢,时间复杂度O(n)。

list结构简图.png

1.2 list(列表)的使用场景

根据Redis双向列表的特性,因此其也被用于异步队列的使用。实际开发中将需要延后处理的任务结构体序列化成字符串,放入Redis的队列中,另一个线程从这个列表中获取数据进行后续处理。其流程类似如下的图:

list用于异步队列示意图.png

2、list(列表)的指令

2.1 右进左出—队列

队列在结构上是先进先出(FIFO)的数据结构(比如排队购票的顺序),常用于消息队列类似的功能,例如消息排队、异步处理等场景。通过它可以确保元素的访问顺序。

lpush -> 从左边边添加元素

lpush key value [value …]

rpush -> 从右边添加元素

rpush key value [value …]

llen -> 获取列表的长度

llen key

lpop -> 从左边弹出元素

lpop key

1127.0.0.1:6379> rpush code java c python    # 向列表中添加元素

2(integer) 3

3127.0.0.1:6379> llen code    # 获取列表长度

4(integer) 3

5127.0.0.1:6379> lpop code # 弹出最先添加的元素

6"java"

7127.0.0.1:6379> lpop code    

8"c"

9127.0.0.1:6379> lpop code

10"python"

11127.0.0.1:6379> llen code

12(integer) 0

13127.0.0.1:6379> lpop code

14(nil)

2.2 右进右出——栈

栈在结构上是先进后出(FILO)的数据结构(比如弹夹压入子弹,子弹被射击出去的顺序就是栈),这种数据结构一般用来逆序输出。

lpush -> 从左边边添加元素

lpush key value [value …]

rpush -> 从右边添加元素

rpush key value [value …]

rpop -> 从右边弹出元素

rpop code

1127.0.0.1:6379> rpush code java c python

2(integer) 3

3127.0.0.1:6379> rpop code            # 弹出最后添加的元素

4"python"

5127.0.0.1:6379> rpop code

6"c"

7127.0.0.1:6379> rpop code

8"java"

9127.0.0.1:6379> rpop code

10(nil)

2.3 慢操作

列表(list)是个链表数据结构,它的遍历是慢操作,所以涉及到遍历的性能将会遍历区间range的增大而增大。注意list的索引运行为负数,-1代表倒数第一个,-2代表倒数第二个,其它同理。

lindex -> 遍历获取列表指定索引处的值

lindex key ind

lrange -> 获取从索引start到stop处的全部值

lrange key start stop

ltrim -> 截取索引start到stop处的全部值,其它将会被删除

ltrim key start stop

1127.0.0.1:6379> rpush code java c python

2(integer) 3

3127.0.0.1:6379> lindex code 0        # 获取索引为0的数据

4"java"

5127.0.0.1:6379> lindex code 1   # 获取索引为1的数据

6"c"

7127.0.0.1:6379> lindex code 2        # 获取索引为2的数据

8"python"

9127.0.0.1:6379> lrange code 0 -1    # 获取全部 0 到倒数第一个数据  == 获取全部数据

101) "java"

112) "c"

123) "python"

13127.0.0.1:6379> ltrim code 0 -1    # 截取并保理 0 到 -1 的数据 == 保理全部

14OK

15127.0.0.1:6379> lrange code 0 -1

161) "java"

172) "c"

183) "python"

19127.0.0.1:6379> ltrim code 1 -1    # 截取并保理 1 到 -1 的数据 == 移除了索引为0的数据 java

20OK

21127.0.0.1:6379> lrange code 0 -1

221) "c"

232) "python"

3、list(列表)深入理解

Redis底层存储list(列表)不是一个简单的LinkedList,而是quicklist ——“快速列表”。关于quicklist是什么,下面会简单介绍,具体源码我也还在学习中,后面大家一起探讨。

quicklist是多个ziplist(压缩列表)组成的双向列表;而这个ziplist(压缩列表)又是什么呢?ziplist指的是一块连续的内存存储空间,Redis底层对于list(列表)的存储,当元素个数少的时候,它会使用一块连续的内存空间来存储,这样可以减少每个元素增加prev和next指针带来的内存消耗,最重要的是可以减少内存碎片化问题。

3.1 常见的链表结构示意图

每个node节点元素,都会持有一个prev->执行前一个node节点和next->指向后一个node节点的指针(引用),这种结构虽然支持前后顺序遍历,但是也带来了不小的内存开销,如果node节点仅仅是一个int类型的值,那么可想而知,引用的内存比例将会更大。

常见链表结构.png

3.2 ziplist示意图

ziplist是一块连续的内存地址,他们之间无需持有prev和next指针,能通过地址顺序寻址访问。

ziplist内存示意图.png

3.3 quicklist示意图

quicklist是由多个ziplist组成的双向链表。

quicklist示意图.png

四、hash(字典)​


1、hash(字典)相关介绍

1.1 hash(字典)的内部结构

Redis的hash(字典)相当于Java语言中的HashMap,它是根据散列值分布的无序字典,内部的元素是通过键值对的方式存储。

hash无序字典键值对存储 (1).png

hash(字典)的实现与Java中的HashMap(JDK1.7)的结构也是一致的,它的数据结构也是数组+链表组成的二维结构,节点元素散列在数组上,如果发生hash碰撞则使用链表串联在数组节点上。

hash结构 (1).png

1.2 hash(字典)扩容

Redis中的hash(字典)存储的value只能是字符串值,此外扩容与Java中的HashMap也不同。Java中的HashMap在扩容的时候是一次性完成的,而Redis考虑到其核心存取是单线程的性能问题,为了追求高性能,因而采取了渐进式rehash策略。

渐进式rehash指的是并非一次性完成,它是多次完成的,因此需要保理旧的hash结构,所以Redis中的hash(字典)会存在新旧两个hash结构,在rehash结束后也就是旧hash的值全部搬迁到新hash之后,新的hash在功能上才会完全替代以前的hash。

hash-_rehash.png

1.3 hash(字典)的相关使用场景

hash(字典)可以用来存储对象的相关信息,一个hash(字典)代表一个对象,hash的一个key代表对象的一个属性,key的值代表属性的值。hash(字典)结构相比字符串来说,它无需将整个对象进行序列化后进行存储。这样在获取的时候可以进行部分获取。所以相比之下hash(字典)具有如下的优缺点:

  • 读取可以部分读取,节省网络流量

  • 存储消耗的高于单个字符串的存储

2 hash(字典)相关指令

2.1 hash(字典)常用指令

hset -> hash(字典)插入值,字典不存在则创建 key代表字典名称,field 相当于 key,value是key的值

hset key field value

hmset -> 批量设值

hmset key field value [field value …]

示例:

17.0.0.1:6379> hset book java "Thinking in Java"        # 字符串包含空格需要""包裹

2(integer) 1

3127.0.0.1:6379> hset book python "Python code"

4(integer) 1

5127.0.0.1:6379> hset book c "The best of c"

6(integer) 1

7127.0.0.1:6379> hmset book go "concurrency in go" mysql "high-performance MySQL" # 批量设值

8OK

hget -> 获取字典中的指定key的value

hget key field

hgetall -> 获取字典中所有的key和value,换行输出

hgetall key

示例:

1127.0.0.1:6379> hget book java

2"Thinking in Java"

3127.0.0.1:6379> hgetall book

41) "java"

52) "Thinking in Java"

63) "python"

74) "Python code"

85) "c"

96) "The best of c"

hlen -> 获取指定字典的key的个数

hlen key

举例:

1127.0.0.1:6379> hlen book

2(integer) 5

2.2 hash(字典)使用小技巧

在string(字符串)中可以使用incr和incrby对value是整数的字符串进行自加操作,在hash(字典)结构中如果单个子key是整数也可以进行自加操作。

hincrby -> 增对hash(字典)中的某个key的整数value进行自加操作

hincrby key field increment

1127.0.0.1:6379> hset liziba money 10

2(integer) 1

3127.0.0.1:6379> hincrby liziba money -1

4(integer) 9

5127.0.0.1:6379> hget liziba money

6"9"

注意如果不是整数会报错。

1127.0.0.1:6379> hset liziba money 10.1

2(integer) 1

3127.0.0.1:6379> hincrby liziba money 1

4(error) ERR hash value is not an integer

五、set(集合)


1、set(集合)相关介绍

1.1 set(集合)的内部结构

Redis的set(集合)相当于Java语言里的HashSet,它内部的键值对是无序的、唯一的。它的内部实现了一个所有value为null的特殊字典。

集合中的最后一个元素被移除之后,数据结构被自动删除,内存被回收。

set结构 (1).png

1.2 set(集合)的使用场景

set(集合)由于其特殊去重复的功能,我们可以用来存储活动中中奖的用户的ID,这样可以保证一个用户不会中奖两次。

2、set(集合)相关指令

sadd -> 添加集合成员,key值集合名称,member值集合元素,元素不能重复

sadd key member [member …]

1127.0.0.1:6379> sadd name zhangsan

2(integer) 1

3127.0.0.1:6379> sadd name zhangsan        # 不能重复,重复返回0

4(integer) 0

5127.0.0.1:6379> sadd name lisi wangwu liumazi # 支持一次添加多个元素

6(integer) 3

smembers -> 查看集合中所有的元素,注意是无序的

smembers key

1127.0.0.1:6379> smembers name    # 无序输出集合中所有的元素

21) "lisi"

32) "wangwu"

43) "liumazi"

54) "zhangsan"

sismember -> 查询集合中是否包含某个元素

sismember key member

1127.0.0.1:6379> sismember name lisi  # 包含返回1

2(integer) 1

3127.0.0.1:6379> sismember name tianqi # 不包含返回0

4(integer) 0

scard -> 获取集合的长度

scard key

1127.0.0.1:6379> scard name

2(integer) 4

spop -> 弹出元素,count指弹出元素的个数

spop key [count]

1127.0.0.1:6379> spop name            # 默认弹出一个

2"wangwu"

3127.0.0.1:6379> spop name 3    

41) "lisi"

52) "zhangsan"

63) "liumazi"

六、zset(有序集合)


1、zset(有序集合)相关介绍

1.1 zset(有序集合)的内部结构

zset(有序集合)是Redis中最常问的数据结构。它类似于Java语言中的SortedSet和HashMap的结合体,它一方面通过set来保证内部value值的唯一性,另一方面通过value的score(权重)来进行排序。这个排序的功能是通过Skip List(跳跃列表)来实现的。

zset(有序集合)的最后一个元素value被移除后,数据结构被自动删除,内存被回收。

zset的内部数据结构.png

1.2 zset(有序集合)的相关使用场景

利用zset的去重和有序的效果可以由很多使用场景,举两个例子:

  • 存储粉丝列表,value是粉丝的ID,score是关注时间戳,这样可以对粉丝关注进行排序

  • 存储学生成绩,value使学生的ID,score是学生的成绩,这样可以对学生的成绩排名

2、zset(有序集合)相关指令

1、zadd -> 向集合中添加元素,集合不存在则新建,key代表zset集合名称,score代表元素的权重,member代表元素

zadd key [NX|XX] [CH] [INCR] score member [score member …]

1127.0.0.1:6379> zadd name 10 zhangsan

2(integer) 1

3127.0.0.1:6379> zadd name 10.1 lisi

4(integer) 1

5127.0.0.1:6379> zadd name 9.9 wangwu

6(integer) 1

2、zrange -> 按照score权重从小到大排序输出集合中的元素,权重相同则按照value的字典顺序排序([lexicographical order])

超出范围的下标并不会引起错误。 比如说,当 start 的值比有序集的最大下标还要大,或是 start > stop 时, zrange 命令只是简单地返回一个空列表。 另一方面,假如 stop 参数的值比有序集的最大下标还要大,那么 Redis 将 stop 当作最大下标来处理。

可以通过使用 WITHSCORES 选项,来让成员和它的 score 值一并返回,返回列表以 value1,score1, …, valueN,scoreN 的格式表示。 客户端库可能会返回一些更复杂的数据类型,比如数组、元组等。

zrange key start stop [WITHSCORES]

1127.0.0.1:6379> zrange name 0 -1 # 获取所有元素,按照score的升序输出

21) "wangwu"

32) "zhangsan"

43) "lisi"

5127.0.0.1:6379> zrange name 0 1        # 获取第一个和第二个slot的元素

61) "wangwu"

72) "zhangsan"

8127.0.0.1:6379> zadd name 10 tianqi    # 在上面的基础上添加score为10的元素

9(integer) 1

10127.0.0.1:6379> zrange name 0 2    # key相等则按照value字典排序输出

111) "wangwu"

122) "tianqi"

133) "zhangsan"

14127.0.0.1:6379> zrange name 0 -1 WITHSCORES # WITHSCORES 输出权重

151) "wangwu"

162) "9.9000000000000004"

173) "tianqi"

184) "10"

195) "zhangsan"

206) "10"

217) "lisi"

228) "10.1"

3、zrevrange -> 按照score权重从大到小输出集合中的元素,权重相同则按照value的字典逆序排序

其中成员的位置按 score 值递减(从大到小)来排列。 具有相同 score 值的成员按字典序的逆序(reverse lexicographical order)排列。 除了成员按 score 值递减的次序排列这一点外, ZREVRANGE 命令的其他方面和 ZRANGE key start stop [WITHSCORES] 命令一样

zrevrange key start stop [WITHSCORES]

1127.0.0.1:6379> zrevrange name 0 -1 WITHSCORES

21) "lisi"

32) "10.1"

43) "zhangsan"

54) "10"

65) "tianqi"

76) "10"

87) "wangwu"

98) "9.9000000000000004"

4、zcard -> 当 key 存在且是有序集类型时,返回有序集的基数。 当 key 不存在时,返回 0

zcard key

1127.0.0.1:6379> zcard name

2(integer) 4

5、zscore -> 返回有序集 key 中,成员 member 的 score 值,如果 member 元素不是有序集 key 的成员,或 key 不存在,返回 nil

zscore key member z

1127.0.0.1:6379> zscore name zhangsan

2"10"

3127.0.0.1:6379> zscore name liziba

4(nil)

6、zrank -> 返回有序集 key 中成员 member 的排名。其中有序集成员按 score 值递增(从小到大)顺序排列。

排名以 0 为底,也就是说,score 值最小的成员排名为 0

zrank key member

1127.0.0.1:6379> zrange name 0 -1

21) "wangwu"

32) "tianqi"

43) "zhangsan"

54) "lisi"

6127.0.0.1:6379> zrank name wangwu

7(integer) 0

7、zrangebyscore -> 返回有序集 key 中,所有 score 值介于 min 和 max 之间(包括等于 min 或 max )的成员。有序集成员按 score 值递增(从小到大)次序排列。

min 和 max 可以是 -inf 和 +inf ,这样一来,你就可以在不知道有序集的最低和最高 score 值的情况下,使用 [ZRANGEBYSCORE]这类命令。

默认情况下,区间的取值使用闭区间,你也可以通过给参数前增加 ( 符号来使用可选的[开区间]小于或大于)

zrangebyscore key min max [WITHSCORES] [LIMIT offset count]

1127.0.0.1:6379> zrange name 0 -1 WITHSCORES # 输出全部元素

21) "wangwu"

32) "9.9000000000000004"

43) "tianqi"

54) "10"

65) "zhangsan"

76) "10"

87) "lisi"

由于篇幅原因,这份面试宝典已经被整理成了PDF文档,有需要Android面试宝典全套完整文档的麻烦点赞+点击GitHub即可获取资料免费领取方式!

本文在开源项目:GitHub中已收录,里面包含不同方向的自学编程路线、面试题集合/面经、及系列技术文章等,资源持续更新中...