Redis——渐进式Rehash

233 阅读1分钟

背景

在Redis为了加快查找和访问速度 使用了哈希表
当哈希表满了或达到阈值时就会进行扩容,将原有哈希表的数据重新分配到新哈希表中,这个过程就叫rehash
rehash需要耗费大量的时间和内存资源,为了避免了一次性rehash的开销,采用了渐进式rehash 算法。

渐进式Rehash大概实现

渐进式rehash 将哈希表分为两个哈希表。
没有rehash时: 使用一个哈希表;
进行rehash时: 用户每进行访问操作时,redis都逐渐将旧哈希表数据迁移到新哈希表;在rehash期间 两个hash表都可以访问。
结束rehash时: 旧哈希表就会被释放掉。

redis 存储结构

#dict字典的数据结构
typedef struct dict{
    dictType *type; //包含自定义的函数,这些函数使得key和value能够存储任何类型的数据
    void *privdata; //保存dictType结构中函数的 参数
    dictht ht[2]; //两张哈希表
    long rehashidx; //-1表示没有进行rehash,rehash时每迁移一个桶就+1
    int itreators;  //正在迭代的迭代器数量
}
 
#哈希表的数据结构ht[0]、ht[1]
typedef struct dictht{
    dictEntry[] table;        //存放实际数据的地址
    unsingned long size;      //哈希表table的大小,出始大小为4
    unsingned long  sizemask; //用于将hash值映射到table位置的索引,大小为(size-1)
    unsingned long  used;     //记录哈希表已有节点(键值对)的数量
}

#dictEntry 哈希表节点
typedef struct dictEntry {
    // 键
    void *key;
    // 值
    union {
        void *val;
        uint64_t u64;
        int64_t s64;
    } v;
    // 链往后继节点
    struct dictEntry *next;
} dictEntry;

dictEntry
value类型:字典,双向链表,压缩列表,跳表,整数数组,动态字符串。