Redis基础系列(一)——Redis对象与编码

227 阅读5分钟

  Redis使用对象来表示数据库中的健值对,当向Redis数据库中设置一个key-value时,数据库至少会创建两个对象,一个对象用作键值对的键(键对象),一个对象用作键值对的值(值对象)。Redis中的每个对象都由一个redisObject结构表示,该结构中和保存数据有关的三个属性分别是type属性,encoding属性和ptr属性。还有用于对象引用计数的refcount属性,记录对象空转时长的lru属性。

typedef struct redisObject {
    //类型
    unsigned type:4;

    //编码
    unsigned encoding:4;

    //指向底层实现数据结构的指针
    void *ptr;

    //引用计数
    int refcount;

    //记录对象空转时长
    unsigned lru;
}

类型

  对象的type属性记录对象的类型,Redis中共有5中对象类型:字符串对象、列表对象、哈希对象、集合对象、有序集合对象。在Redis的键值对中,键总是一个字符串对象,而值可以是5种对象类型中的任何一种。

对象类型常量type命令的输出
字符串对象REDIS_STRINGstring
列表对象REDIS_LISTlist
哈希对象REDIS_HASHhash
集合对象REDIS_SETset
有序集合对象REDIS_ZSETzset

编码

  redisObject结构中的encoding属性记录着对象的编码方式,编码的方式决定着ptr指针指向的底层实现数据结构。Redis中的对象都有两种或以上的编码方式,每一种编码都有对应数据结构。

编码常量编码所对应的底层数据结构OBJECT ENCODING 命令输出
REDIS_ENCODING_INTlong类型的整数int
REDIS_ENCODING_EMBSTRembstr编码的简单动态字符串embstr
REDIS_ENCODING_RAM简单动态字符串raw
REDIS_ENCODING_HT字典hashtable
REDIS_ENCODING_LINKEDLIST双端列表linkedlist
REDIS_ENCODING_ZIPLIST压缩表ziplist
REDIS_ENCODING_INTSET整数集合intset
REDIS_ENCODING_SKIPLIST跳跃表和字典sliplist

不同对象类型对应的编码

类型编码对象
REDIS_STRINGREDIS_ENCODING_INT使用整数值实现的字符串对象
REDIS_STRINGREDIS_ENCODING_EMBSTR使用embstr编码的简单动态字符串实现的字符串对象
REDIS_STRINGREDIS_ENCODING_RAW使用简单动态字符串实现的字符串对象
REDIS_LISTREDIS_ENCODING_ZIPLIST使用压缩列表实现的列表对象
REDIS_LISTREDIS_ENCODING_LINKEDLIST使用双端列表实现的列表对象
REDIS_HASHREDIS_ENCODING_ZIPLIST使用压缩列表实现哈希对象
REDIS_HASHREDIS_ENCODING_HT使用字典实现的哈希对象
REDIS_SETREDIS_ENCODING_INTSET使用整数集合实现的集合对象
REDIS_SETREDIS_ENCODING_HT使用字典实现的集合对象
REDIS_ZSETREDIS_ENCODING_ZIPLIST使用压缩列表实现的有序集合对象
REDIS_ZSETREDIS_ENCODING_SKIPLIST使用跳跃表和字典实现的有序集合对象

类型检查与编码检查

  Redis中操作键的命令基本上可以分为两种类型:一种命令可以对任何类型的键执行,如DEL命令、TYPE命令;另一种只针对特定的对象类型执行,如GET命令只针对String对象,如果对List对象使用则会报类型错误。

  服务器接收到一条命令时,会对其进行类型检查;还会根据其编码方式选择正确的实现代码来执行命令。类型检查根据redisObject结构的type属性进行,编码检查根据encoding属性进行。类型检查和编码检查都是实现多态命令的方式,前者是基于类型的多态,后者是基于编码的多态。

命令多态.png

内存回收与对象共享

  对象的整个生命周期可以划分为创建对象、操作对象、释放对象三个阶段。Redis底层实现使用C语言,而C语言并不具备自动内存回收功能,所以Redis在自己的对象系统中使用引用计数技术实现内存回收机制。对象的引用计数信息会存于redisObject的refcount属性中,对象的引用计数信息会随着对象的使用状态而不断变化。

  • 创建新对象时,引用计数的值会被初始化为1;
  • 当对象被一个新程序使用时,它的引用计数值会被增一;
  • 当对象不再被一个程序使用时,它的引用计数会被减一;
  • 当对象的引用计数变为0时,对象所占用的内存会被释放。

  除了用于实现引用计数回收内存之外,refcount属性还被用于REDIS_ENCODING_INT编码的字符串对象的共享。当创建一个值为整数值类型的键值对时,数据库会先检查是否存在一个值相等的字符串对象,存在则将键指向已存在的字符串对象,并将对象的refcount加一。

  Redis在初始化服务器时,会创建一万个字符串对象,包含0~9999的所有整数值,当服务器需要用到这些值时,服务器就会使用这些共享对象。

  Redis不共享包含字符串的对象,因为验证字符串是否完全相同的复杂度太高,会占用太多的CPU资源。

对象的空转时长与数据淘汰策略

  redisObject结构中的lru属性记录对象最后操作的时间,使用OBJECT IDLETIME命令可以获得指定键的空转时长。空转时长可服务于数据淘汰策略,当数据库占用的内存大于所设置的maxmemory,并且maxmomery-policy设置为volatile-lru或allkeys-lru时,将对空转时长最高的部分数据进行删除。

Redis中的淘汰策略

  • volatile-lru(least recently used):最近最少使用算法,从设置了过期时间的键key中选择空转时间最长的键值对清除掉;
  • volatile-lfu(least frequently used):最近最不经常使用算法,从设置了过期时间的键中选择某段时间之内使用频次最小的键值对清除掉;
  • volatile-ttl:从设置了过期时间的键中选择过期时间最早的键值对清除;
  • volatile-random:从设置了过期时间的键中,随机选择键进行清除;
  • allkeys-lru:最近最少使用算法,从所有的键中选择空转时间最长的键值对清除;
  • allkeys-lfu:最近最不经常使用算法,从所有的键中选择某段时间之内使用频次最少的键值对清除;
  • allkeys-random:所有的键中,随机选择键进行删除;
  • noeviction:不做任何的清理工作,在redis的内存超过限制之后,所有的写入操作都会返回错误;但是读操作都能正常的进行;