Hash 哈希
⼏乎所有的主流编程语⾔都提供了哈希(hash)类型,它们的叫法可能是哈希、字典、关联数组、映射。在 Redis 中,哈希类型是指值本⾝⼜是⼀个键值对结构,形如 key = "key",value = { {field1, value1 }, ..., {fieldN, valueN } },Redis 键值对和哈希类型⼆者的关系。
哈希类型中的映射关系通常称为 field-value,⽤于区分 Redis 整体的键值对(key-value),注意这⾥的 value 是指 field 对应的值,不是键(key)对应的值,请注意 value 在不同上下⽂的作⽤。
命令
HSET 设置 hash 中指定的字段(field)的值(value)。 语法:HSET key field value [field value ...]
命令有效版本:2.0.0 之后 时间复杂度:插⼊⼀组 field 为 O(1), 插⼊ N 组 field 为 O(N) 返回值:添加的字段的个数。
HGET 获取 hash 中指定字段的值。 语法:HGET key field
命令有效版本:2.0.0 之后 时间复杂度:O(1) 返回值:字段对应的值或者 nil。
HEXISTS 判断 hash 中是否有指定的字段。 语法:HEXISTS key field
命令有效版本:2.0.0 之后 时间复杂度:O(1) 返回值:1 表⽰存在,0 表⽰不存在。
HDEL 删除 hash 中指定的字段。 语法:HDEL key field [field ...]
命令有效版本:2.0.0 之后 时间复杂度:删除⼀个元素为 O(1). 删除 N 个元素为 O(N). 返回值:本次操作删除的字段个数。
HKEYS 获取 hash 中的所有字段。 语法:HKEYS key
命令有效版本:2.0.0 之后 时间复杂度:O(N), N 为 field 的个数. 返回值:字段列表。
HVALS 获取 hash 中的所有的值。 语法:HVALS key
命令有效版本:2.0.0 之后 时间复杂度:O(N), N 为 field 的个数. 返回值:所有的值。
HGETALL 获取 hash 中的所有字段以及对应的值。 语法:HGETALL key
命令有效版本:2.0.0 之后 时间复杂度:O(N), N 为 field 的个数. 返回值:字段和对应的值。
HMGET ⼀次获取 hash 中多个字段的值。 语法:HMGET key field [field ...]
命令有效版本:2.0.0 之后 时间复杂度:只查询⼀个元素为 O(1), 查询多个元素为 O(N), N 为查询元素个数. 返回值:字段对应的值或者 nil。
在使⽤ HGETALL 时,如果哈希元素个数⽐较多,会存在阻塞 Redis 的可能。如果开发⼈员只需要获取部分 field,可以使⽤ HMGET,如果⼀定要获取全部 field,可以尝试使⽤ HSCAN命令,该命令采⽤渐进式遍历哈希类型,HSCAN 会在后续章节介绍。
HLEN 获取 hash 中的所有字段的个数。 语法:HLEN key
命令有效版本:2.0.0 之后 时间复杂度:O(1) 返回值:字段个数。
HSETNX 在字段不存在的情况下,设置 hash 中的字段和值。 语法:HSETNX key field value
命令有效版本:2.0.0 之后 时间复杂度:O(1) 返回值:1 表⽰设置成功,0 表⽰失败。
HINCRBY 将 hash 中字段对应的数值添加指定的值。 语法:HINCRBY key field increment
命令有效版本:2.0.0 之后 时间复杂度:O(1) 返回值:该字段变化之后的值。
HINCRBYFLOAT HINCRBY 的浮点数版本。 语法:HINCRBYFLOAT key field increment
命令有效版本:2.6.0 之后 时间复杂度:O(1) 返回值:该字段变化之后的值。
内部编码
哈希的内部编码有两种: • ziplist(压缩列表):当哈希类型元素个数⼩于 hash-max-ziplist-entries 配置(默认 512 个)、同时所有值都⼩于 hash-max-ziplist-value 配置(默认 64 字节)时,Redis 会使⽤ ziplist 作为哈希的内部实现,ziplist 使⽤更加紧凑的结构实现多个元素的连续存储,所以在节省内存⽅⾯⽐hashtable 更加优秀。 • hashtable(哈希表):当哈希类型⽆法满⾜ ziplist 的条件时,Redis 会使⽤ hashtable 作为哈希的内部实现,因为此时 ziplist 的读写效率会下降,⽽ hashtable 的读写时间复杂度为 O(1)。下⾯的⽰例演⽰了哈希类型的内部编码,以及响应的变化。
缓存⽅式对⽐
截⾄⽬前为⽌,我们已经能够⽤三种⽅法缓存⽤⼾信息,下⾯给出三种⽅案的实现⽅法和优缺点分析。
1. 原⽣字符串类型 ⸺ 使⽤字符串类型,每个属性⼀个键。 优点:实现简单,针对个别属性变更也很灵活。 缺点:占⽤过多的键,内存占⽤量较⼤,同时⽤⼾信息在 Redis 中⽐较分散,缺少内聚性,所以这种 ⽅案基本没有实⽤性。
2. 序列化字符串类型,例如 JSON 格式 优点:针对总是以整体作为操作的信息⽐较合适,编程也简单。同时,如果序列化⽅案选择合适,内存的使⽤效率很⾼。 缺点:本⾝序列化和反序列需要⼀定开销,同时如果总是操作个别属性则⾮常不灵活。
3. 哈希类型 优点:简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。 缺点:需要控制哈希在 ziplist 和 hashtable 两种内部编码的转换,可能会造成内存的较⼤消耗。