关于生成分布式ID的解决方案

115 阅读3分钟

为什么生成唯一ID

  • 背景:互联网多模块微服务情况下,高并发。
  • 程序:goods order
  • 数据库:goods order
  • order微服务 100个并发进入到程序中,从而导致查询不同的库中出现重复id情

采用分库分表。order1、order2等。 所以主键的生成成为问题。所以每个模块存入数据库时,需要生成唯一的ID。

image.png

分布式ID生成解决方案

1. UUID

常见的方式。可以利用数据库也可以利用程序生成,一般来说全球唯一。

gateway服务下测试uuid生成

代码例子:a8fb5e44-f841-49ff-b10b-01d3afb2b238

36*8=288bit

优点:

1)简单,代码方便。

2)生成ID性能非常好,基本不会有性能问题。

3)全球唯一,在遇见数据迁移,系统数据合并,或者数据库变更等情况下,可以从容应对。

缺点:

1)没有排序,无法保证趋势递增。

2)UUID往往是使用字符串存储,查询的效率比较低。 id int 快!

3)存储空间比较大,如果是海量数据库,就需要考虑存储量的问题。32string*8=256bit

4)传输数据量大

5)不可读。

2. Redis

gateway服务下测试redis递增

long 1=incr(id")

long 2=incr("id")

当使用数据库来生成ID性能不够要求的时候,我们可以尝试使用Redis来生成ID。这主要依赖于Redis是单线程的,所以也可以用生成全局唯一的ID。可以用Redis的原子操作 INCR和INCRBY来实现。

优点:

1)不依赖于数据库,灵活方便,且性能优于数据库。

2)数字ID天然排序,对分页或者需要排序的结果很有帮助。 id long

缺点:

1)如果系统中没有Redis,还需要引入新的组件,增加系统复杂度。

2)需要编码和配置的工作量比较大。

3)网络传输造成性能下降。

image.png

开源算法snowflake 雪花算法

snowflake是Twitter开源的分布式ID生成算法,结果是一个long型的ID。其核心思想是:使用41bit作为毫秒数,10bit作为机器的ID(5个bit是数据中心,5个bit的机器ID),12bit作为毫秒内的流水号(意味着每个节点在每毫秒可以产生 4096 个 ID),最后还有一个符号位,永远是0

image.png

优点:

  • 毫秒数在高位,自增序列在低位,整个ID都是趋势递增的。
  • 不依赖数据库等第三方系统,以服务的方式部署,稳定性更高,生成ID的性能也是非常高的。
  • 可以根据自身业务特性分配bit位,非常灵活。 32机房 32台goods

缺点: 强依赖机器时钟,如果机器上时钟回拨,会导致发号重复或者服务会处于不可用状态。