搞懂Redis(二)-4:set数据结构

119 阅读1分钟

Redis的集合相当于Java中的Hashset.内部键值无序,唯一.内部实现相当于一个特殊字典,字典的value都是null.集合set类型底层编码包括hashTable和intset. 使用整数集合intset实现set的条件:

  1. 存储数据均为整数
  2. 存储数据元素个数小于512个 如果不能同时满足,这是用dict来存储集合的数据 hashTable在上文已解释其结构

接下来我们聊聊intset

intset结构体


typedef struct intset {
    uint32_t encoding;
    // length就是数组的实际长度
    uint32_t length;
    // contents 数组是实际保存元素的地方,数组中的元素有以下两个特性:
    // 1.没有重复元素
    // 2.元素在数组中从小到大排列
    int8_t contents[];
} intset;

// encoding 的值可以是以下三个常量的其中一个
#define INTSET_ENC_INT16 (sizeof(int16_t))
#define INTSET_ENC_INT32 (sizeof(int32_t))
#define INTSET_ENC_INT64 (sizeof(int64_t))

intset的查询 intset是有序集合,查找元素的复杂度为O(logN)(采用二分法),但插入不一定为O(logN),可能涉及升级操作. 例:集合中存的是int16_t的整数,这时要插入一个int31_t,那么为了维持集合中的数据类型统一.其他所有的数据都会转成int32_t类型,涉及内存重新分配,插入的复杂度为O(N).

intset不支持降级操作