Redis面试要点(数据结构)

763 阅读7分钟

1.Redis 有哪些数据结构

Redis 所有的数据结构都是以唯一的 key 字符串作为名称,然后通过这个唯一 key 值来获取相应的 value 数据。不同类型的数据结构的差异就在于 value 的结构不一样。下面为常用的5中数据结构。

  1. string (字符串)
    • 使用场景:
      1. 缓存用户信息: 将用户信息结构体使用 JSON 序列化成字符串,然后将序列化后的字符串塞进 Redis 来缓存。同样,取用户信息会经过一次反序列化的过程。
    • 内部情况
      1. Redis 的字符串是动态字符串,是可以修改的字符串,内部结构实现上类似于 Java 的 ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配.
      2. 字符串实际分配的空间 capacity 一般要高于实际字符串长度 len
      3. 当字符串长度小于 1M 时,扩容都是加倍现有的空间,如果超过 1M,扩容时一次只会多扩 1M 的空间
      4. 需要注意的是字符串最大长度为 512M
      5. 可以对 key 设置过期时间,到点自动删除,这个功能常用来控制缓存的失效时间
    • 常用命令
      1. 键值对(set,get,exists,del)
      2. 批量键值对(mset,mget)
      3. 过期和 set 命令扩展
        • expire name 5 # 5s 后过期
        • setex name 5 value # 5s 后过期,等价于 set+expire
        • setnx name value # 如果 name 不存在就执行 set 创建
      4. 计数(如果 value 值是一个整数,还可以对它进行自增操作。自增是有范围的,它的范围是 signed long 的最大最小值,超过了这个值,Redis 会报错。)
        • incr,incrby
  2. list (列表)
    • 使用场景
      1. Redis 的列表结构常用来做异步队列使用。将需要延后处理的任务结构体序列化成字符串塞进 Redis 的列表,另一个线程从这个列表中轮询数据进行处理
    • 内部情况
      1. Redis 的列表相当于 Java 语言里面的 LinkedList,注意它是链表而不是数组,这意味着 list 的插入和删除操作非常快,时间复杂度为 O(1),但是索引定位很慢,时间复杂度为 O(n)
      2. 当列表弹出了最后一个元素之后,该数据结构自动被删除,内存被回收
    • 常用命令
      1. 做队列(rpush,lpop)
      2. 做栈(rpush,rpop)
      3. lindex(类似于java 链表的get(int index)方法,它需要对链表进行遍历,性能随着参数index增大而变差。)
      4. ltrim (定义了两个参数start_index和end_index,在这个区间内的值,ltrim 要保留,区间之外统统砍掉)
    • 底层数据结构
      1. Redis 底层存储的还不是一个简单的 linkedlist,而是称之为快速链表 quicklist 的一个结构。
      2. ziplist将所有的元素紧挨着一起存储,分配的是一块连续的内存
      3. 首先在列表元素较少的情况下会使用一块连续的内存存储,这个结构是 ziplist,也即是压缩列表
      4. 当数据量比较多的时候才会改成 quicklist
      5. Redis 将链表和 ziplist 结合起来组成了 quicklist。也就是将多个 ziplist 使用双向指针串起来使用
  3. hash (字典)
    • 使用场景
      1. hash 结构也可以用来存储用户信息,不同于字符串一次性需要全部序列化整个对象,hash 可以对用户结构中的每个字段单独存储
      2. hash 也有缺点,hash 结构的存储消耗要高于单个字符串,到底该使用 hash 还是字符串,需要根据实际情况再三权衡。
    • 内部情况
      1. Redis 的字典相当于 Java 语言里面的 HashMap,它是无序字典,内部实现结构上同 Java 的 HashMap 也是一致的,同样的数组 + 链表二维结构。
      2. 不同的是,Redis 的字典的值只能是字符串,另外它们 rehash 的方式不一样,因为 Java 的 HashMap 在字典很大时,rehash 是个耗时的操作,需要一次性全部 rehash。Redis 为了高性能,不能堵塞服务,所以采用了渐进式 rehash 策略
      3. 渐进式 rehash 会在 rehash 的同时,保留新旧两个 hash 结构,查询时会同时查询两个 hash 结构,然后在后续的定时任务中以及 hash 操作指令中,循序渐进地将旧 hash 的内容一点点迁移到新的 hash 结构中。当搬迁完成了,就会使用新的hash结构取而代之。
      4. 当 hash 移除了最后一个元素之后,该数据结构自动被删除,内存被回收。
    • 常见操作
      1. hset,hget,hlen,hgetall,hmset
      2. hincrby,和string 中的 incr 使用基本一样。
  4. set (集合)
    • 使用场景
      1. set 结构可以用来存储活动中奖的用户 ID,因为有去重功能,可以保证同一个用户不会中奖两次。
    • 内部情况
      1. Redis 的集合相当于 Java 语言里面的 HashSet,它内部的键值对是无序的唯一的。它的内部实现相当于一个特殊的字典,字典中所有的 value 都是一个值NULL
      2. 当集合中最后一个元素移除之后,数据结构自动删除,内存被回收
    • 常用操作
      1. sadd,spop
      2. smembers #查询全部
      3. sismember #查询某个 value 是否存在,相当于 contains(o)
      4. scard #获取长度相当于 count()
  5. zset (有序集合)
    • 使用场景
      1. zset 可以用来存粉丝列表,value 值是粉丝的用户 ID,score 是关注时间。我们可以对粉丝列表按关注时间进行排序。
      2. zset 还可以用来存储学生的成绩,value 值是学生的 ID,score 是他的考试成绩。我们可以对成绩按分数进行排序就可以得到他的名次。
    • 内部情况
      1. 类似于 Java 的 SortedSet 和 HashMap 的结合体,一方面它是一个 set,保证了内部 value 的唯一性,另一方面它可以给每个 value 赋予一个 score,代表这个 value 的排序权重
      2. 它的内部实现用的是一种叫做「跳跃列表」的数据结构。
      3. zset 中最后一个 value 被移除后,数据结构自动删除,内存被回收。
    • 常用操作
      1. zadd books 9.0 "think in java"
      2. zrange books 0 -1 # 按 score 排序列出,参数区间为排名范围
      3. zrevrange books 0 -1 # 按 score 逆序列出,参数区间为排名范围
      4. zcard books # 相当于 count()
      5. zscore books "java concurrency" # 获取指定 value 的 score
      6. zrank books "java concurrency" # 排名
      7. zrangebyscore books 0 8.91 # 根据分值区间遍历 zset
      8. zrangebyscore books -inf 8.91 withscores # 根据分值区间 (-∞, 8.91] 遍历 zset,同时返回分值。inf 代表 infinite,无穷大的意思。
      9. zrem books "java concurrency" # 删除 value
    • 底层数据结构(跳跃链表):
      1. 因为 zset 要支持随机的插入和删除,所以它不好使用数组来表示
      2. 跳跃列表采取一个随机策略来决定新元素可以兼职到第几层
      3. 首先 L0 层肯定是 100% 了,L1 层只有 50% 的概率,L2 层只有 25% 的概率,L3 层只有 12.5% 的概率,一直随机到最顶层 L31 层。绝大多数元素都过不了几层,只有极少数元素可以深入到顶层。列表中的元素越多,能够深入的层次就越深,能进入到顶层的概率就会越大。

2.需要注意的事情

  1. 过期时间
    • Redis 所有的数据结构都可以设置过期时间,时间到了,Redis 会自动删除相应的对象。需要注意的是过期是以对象为单位,比如一个 hash 结构的过期是整个 hash 对象的过期,而不是其中的某个子 key。
    • 还有一个需要特别注意的地方是如果一个字符串已经设置了过期时间,然后你调用了 set 方法修改了它,它的过期时间会消失。
    • 查看过期时间的语句:ttl key