Redis 5分钟掌握数据结构 intset(五)

44 阅读2分钟

当一个集合只包含整数元素,并且这个集合的元素不多时,使用整数集合(inset)作为集合键的底层实现之一。

如果创建一个包含五个元素的集合键,并且集合中的所有元素都是整数,那么这个集合键的底层实现就会是整数集合:

 redis> SADD numbers 1 3 5 7 9
 (integer) 5 
 redis> OBJECT ENCODING numbers
 "intset"

如果集合存的非数字,会使用 hashtable 类型,而不是 intset

127.0.0.1:6379> sadd numbers dsd
(integer) 1
127.0.0.1:6379> OBJECT ENCODING numbers
"hashtable"

整数集合的实现

整数集合(intset)是 Redis 用于保存整数值的集合抽象数据结构,它可以保存类型为 int16_tint32_t 或者 int64_t 的整数值,并且保证集合中不会出现重复元素。

typedef struct intset {
    // 编码方式
    uint32_t encoding; 
    // 集合包含的元素数量
    uint32_t length; 
    // 保存元素的数组
    int8_t contents[]; 
} intset;

每当我们要将一个新元素添加到整数集合里面,并且新元素的类型比整数集合现有所有元素的类型都要长时,整数集合需要先进行升级(upgrade),然后才能将新元素添加到整数集合里面。

升级整数集合并添加新元素共分为三步进行:

  • 根据新元素的类型,扩展整数集合底层数组的空间大小,并为新元素分配空间。
  • 将底层数组现有的所有元素都转换成与新元素相同的类型,并将类型转换后的元素放置到正确的位上,而且在放置元素的过程中,需要继续维持底层数组的有序性质不变。
  • 将新元素添加到底层数组里面。

举个例子,假设现在有一个 INTSET_ENC_INT16 编码的整数集合,集合中包含三个 int16_t 类型的元素。 image.png

因为每个元素都占用 16 位空间,所以整数集合底层数组的大小为 3 * 16 = 48 位,图 6-4 展示了整数集合的三个元素在这 48 位里的位置。 image.png

现在,假设我们要将类型为 int32_t 的整数值 65535 添加到整数集合里面,因为 65535 的类型 int32_t 比整数集合当前所有元素的类型都要长,所以在将 65535 添加到整数集合之前,程序需要先对整数集合进行升级。 image.png 整数集合只支持升级操作,不支持降级操作.