Redis分布式数据分区算法分布式数据库系统会根据不同的数据分区算法，将数据分散存储到不同的数据库服务器节点上，每个节点

分布式数据库系统会根据不同的数据分区算法，将数据分散存储到不同的数据库服务器节点上，每个节点管理着整个数据集合中的一个子集。图片.png 常见的数据分区规则有两大类：顺序分区与哈希分区。

1.顺序分区

顺序分区规则可以将数据按照某种顺序平均分配到不同的节点。不同的顺序方式，产生了不同的分区算法。例如，轮询分区算法、时间片轮转分区算法、数据块分区算法、业务主题分区算法等。由于这些算法都比较简单，所以这里就不展开描述了。

1.1轮询分区算法

每产生一个数据，就依次分配到不同的节点。该算法适合于数据问题不确定的场景。其分配的结果是，在数据总量非常庞大的情况下，每个节点中数据是很平均的。但生产者与数据节点间的连接要长时间保持。

1.2时间片轮转分区算法

在某人固定长度的时间片内的数据都会分配到一个节点。时间片结束，再产生的数据就会被分配到下一个节点。这些节点会被依次轮转分配数据。该算法可能会出现节点数据不平均的情况（因为每个时间片内产生的数据量可能是不同的）。但生产者与节点间的连接只需占用当前正在使用的这个就可以，其它连接使用完毕后就立即释放。

1.3数据块分区算法

在整体数据总量确定的情况下，根据各个节点的存储能力，可以将连接的某一整块数据分配到某一节点。

1.4业务主题分区算法

数据可根据不同的业务主题，分配到不同的节点。

2.哈希分区

哈希分区规则是充分利用数据的哈希值来完成分配，对数据哈希值的不同使用方式产生了不同的哈希分区算法。哈希分区算法相对较复杂，这里详细介绍几种常见的哈希分区算法。

2.1节点取模分区算法

该算法的前提是，每个节点都已分配好了一个唯一序号，对于N个节点的分布式系统，其序号范围为[0, N-1]。然后选取数据本身或可以代表数据特征的数据的一部分作为key，计算hash(key)与节点数量N的模，该计算结果即为该数据的存储节点的序号。

该算法最大的优点是简单，但其也存在较严重的不足。如果分布式系统扩容或缩容，已经存储过的数据需要根据新的节点数量N进行数据迁移，否则用户根据key是无法再找到原来的数据的。生产中扩容一般采用翻倍扩容方式，以减少扩容时数据迁移的比例。

2.2一致性哈希分区算法

一致性hash算法通过一个叫作一致性hash环的数据结构实现。这个环的起点是0，终点是 2（32次方）-1，并且起点与终点重合。环中间的整数按逆/顺时针分布，故这个环的整数分布范围是[0, 2（32次方）-1]。

图片.png

上图中存在四个对象 o1、o2、o3、o4，分别代表四个待分配的数据，红色方块是这四个数据的hash(o)在Hash环中的落点。同时，图上还存在三个节点 m0、m1、m2，绿色圆圈是这三节点的 hash(m)在Hash环中的落点。

现在要为数据分配其要存储的节点。该数据对象的hash(o)按照逆/顺时针方向距离哪个节点的hash(m)最近，就将该数据存储在哪个节点。这样就会形成上图所示的分配结果。

该算法的最大优点是，节点的扩容与缩容，仅对按照逆/顺时针方向距离该节点最近的节点有影响，对其它节点无影响。

当节点数量较少时，非常容易形成数据倾斜问题，且节点变化影响的节点数量占比较大，即影响的数据量较大。所以，该方式不适合数据节点较少的场景。

2.3虚拟槽分区算法

该算法首先虚拟出一个固定数量的整数集合，该集合中的每个整数称为一个slot槽。这个槽的数量一般是远远大于节点数量的。然后再将所有slot槽平均映射到各个节点之上。例如，Redis 分布式系统中共虚拟了16384个slot槽，其范围为[0, 16383]。假设共有3个节点，那么slot槽与节点间的映射关系如下图所示：

图片.png

而数据只与slot槽有关系，与节点没有直接关系。数据只通过其key的hash(key)映射到slot槽：slot=hash(key)%slotNums。这也是该算法的一个优点，解耦了数据与节点，客户端无需维护节点，只需维护与slot槽的关系即可。

Redis数据分区采用的就是该算法。其计算槽点的公式为slot=CRC16(key)%16384。CRC16()是一种带有校验功能的、具有良好分散功能的、特殊的 hash 算法函数。其实 Redis中计算槽点的公式不是上面的那个，而是：slot=CRC16(key)&16383。

若要计算a%b，如果b是2的整数次幂，那么a%b=a&(b-1)。