Redis 内部数据结构源码阅读笔记
SDS
SDS --- Simple Dynamic String
突发奇想,想读读redis源码,就先从sds的初始化入手
// sds.h
typedef char *sds;
sds本质是一个字符指针
sdshdr是一个结构体,记录sds的一些类型信息
其中__attribute__ ((__packed__))意思是让编译器这个结构体内存不对齐
struct __attribute__ ((__packed__)) sdshdr16 {
uint16_t len; /* used */
uint16_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
sds创建实现函数如下
sds _sdsnewlen(const void *init, size_t initlen, int trymalloc) {
void *sh;
sds s;
sdsReqType根据字符串长度确定使用sdshdr5是sdshdr8还是16还是32还是64
char type = sdsReqType(initlen);
很多情况下,我们会创建一个空字符串然后用来向空字符串后面拼接字符串 这种情况下如果使用5bit的数据结构就会导致性能开销上升,所有这里做了一个小优化,直接用8bit来存
/* Empty strings are usually created in order to append. Use type 8
* since type 5 is not good at this. */
if (type == SDS_TYPE_5 && initlen == 0) type = SDS_TYPE_8;
int hdrlen = sdsHdrSize(type);
unsigned char *fp; /* flags pointer. */
size_t usable;
申请内存,大小为字符串长度+hdr的长度
assert(initlen + hdrlen + 1 > initlen); /* Catch size_t overflow */
sh = trymalloc?
s_trymalloc_usable(hdrlen+initlen+1, &usable) :
s_malloc_usable(hdrlen+initlen+1, &usable);
if (sh == NULL) return NULL;
if (init==SDS_NOINIT)
init = NULL;
else if (!init)
memset(sh, 0, hdrlen+initlen+1);
可以看到这边s并不是指向内存的头,而是内存的头+hdrlen
s = (char*)sh+hdrlen;
fp是flag point指向数据类型的指针,sdshdr声明的时候char buf []是不占
源码中所有的sdshdr的flag在最后,只占一个字节,所以(unsigned char*)s-1就是flag的位置
fp = ((unsigned char*)s)-1;
usable = usable-hdrlen-1;
if (usable > sdsTypeMaxSize(type))
usable = sdsTypeMaxSize(type);
switch(type) {
case SDS_TYPE_5: {
*fp = type | (initlen << SDS_TYPE_BITS);
break;
}
case SDS_TYPE_8: {
SDS_HDR_VAR(8,s);
sh->len = initlen;
sh->alloc = usable;
*fp = type;
break;
}
...
case SDS_TYPE_64: {
SDS_HDR_VAR(64,s);
sh->len = initlen;
sh->alloc = usable;
*fp = type;
break;
}
}
if (initlen && init)
memcpy(s, init, initlen);
s[initlen] = '\0';
return s;
}
最后将原来的字符串复制到s开始的位置,并且在最后赋值一个结束符
至此sds的初始化已经完成了
其结构如图
简单总结一下初始化过程
- 计算需要的内存
- 申请内存
- 把sds指针移动到该移动的地方
- s前面的内存强转成对应的结构体然后赋值