什么是一致性哈希 | 青训营笔记这是我参与「第五届青训营」伴学笔记创作活动的第 13 天一致性哈希是什么，使用场景，

这是我参与「第五届青训营」伴学笔记创作活动的第 13 天

一致性哈希是什么，使用场景，解决了什么问题？

如何分配请求

在学习 nginx 之初，可能你还只能潦潦草草挂个页面，但你绝对不能不知道它的一个重要功能就是实现负载均衡。随着用户量的激增，一台服务器显然不够，多节点运作才支撑得住如此庞大的并发量与数据量

那么问题来了，如何将不同用户的请求分散到不同节点上并绑定呢？（不考虑共用远程数据库）

有句老话说得好（谁说的已经不重要了，你说他是鲁迅说的也行）：“计算机科学领域的任何问题都可以通过增加一个中间层来解决”。那么在这里我们选择增设一个负载均衡层进行轮流转发，甚至可以根据不同硬件设备性能来更改转发权重——即为 加权轮询

加权轮询（ Weighted round robin ）是网络中用于调度数据流的算法，也可用于调度进程。

加权轮询[1]是轮询调度的一般化。加权轮询在队列或一系列任务上循环，每个轮次中各数据包或进程按权重获得运行机会。

加权轮询[2]有若干种类，比如经典加权轮询和交替加权轮询。

然而对于大多数分布式系统而言，每个节点存储的数据是不同的，该算法就显得有些不足了，我们需要做一定的改动，来使得请求与节点绑定

一般哈希仍有不足

当然，这种情况下哈希是一个优质的解决方案，因为相同输入结果具有唯一性，且映射较为分散。一般来说，取模运算最为干净又卫生： $hash(key)\ %\ n$ 此处的 n 即是节点数，这代表结果从 0 到 n-1 都会映射到相应的节点。

不过看到这里，它的几个大问题就显露出来了：

不能为节点设置权重
更改节点结构会造成大量的资源损失

如果节点数量发生了变化，也就是在对系统做扩容或者缩容时，必须迁移改变了映射关系的数据，然而在实际生产环境里，动辄成百上千台服务器，如果采用这种方案，更改一下就意味着数据的疯狂迁移（最坏情况下所有都要迁移一遍）

为了解决上述两个问题，我们沿着哈希的路继续往下走

一致性哈希

一致性哈希算法就很好地解决了分布式系统在扩容或者缩容时，发生过多的数据迁移的问题。

既然节点数改变会造成最终结果改变，那我们换一个常数不就可以让结果固定了吗？而一致哈希算法规定对 2^32 进行取模运算，最终结果是一个固定的值。

而映射又成为了一项新的难题，如果仍沿用之前索引式的分配，肯定会出问题，这次我们选择将模型抽象一下：

我们可以把一致哈希算法是对 2^32 进行取模运算的结果值组织成一个圆环，就像钟表一样，钟表的圆可以理解成由 60 个点组成的圆，而此处我们把这个圆想象成由 2^32 个点组成的圆，这个圆环被称为哈希环，如下图：

一致性哈希要进行两步哈希：

第一步：对存储节点进行哈希计算，也就是对存储节点做哈希映射，比如根据节点的 IP 地址进行哈希；

第二步：当对数据进行存储或访问时，对数据进行哈希映射；

所以，一致性哈希是指将「存储节点」和「数据」都映射到一个首尾相连的哈希环上。