Java SE生成唯一全局ID

167 阅读4分钟

有时我们不依赖于数据库中自动递增的字段产生唯一ID,比如多表同一字段需要统一一个唯一ID,这时就需要用程序来生成一个唯一的全局ID。

UUID

从Java 5开始, UUID 类提供了一种生成唯一ID的简单方法。UUID是通用唯一识别码 (Universally Unique Identifier)的缩写,UUID来源于OSF(Open Software Foundation,开源软件基金会)的DCE(Distributed Computing Environment,分布式计算环境)规范。UUID 的目的,是让分布式系统中的所有元素,都能有唯一的辨识资讯,而不需要透过中央控制端来做辨识资讯的指定。如此一来,每个人都可以建立不与其它人冲突的 UUID。

UUID是一个128bit的数字,也可以表现为32个16进制的字符(每个字符0-F的字符代表4bit),中间用"-"分割。

  • 时间戳+UUID版本号: 分三段占16个字符(60bit+4bit),
  • Clock Sequence号与保留字段:占4个字符(13bit+3bit),
  • 节点标识:占12个字符(48bit),
  • UUID的唯一缺陷在于生成的结果串会比较长。
public class GenerateUUID {
  public static void main(String[] args) {
    // generate random UUIDs
    UUID idOne = UUID.randomUUID();
    UUID idTwo = UUID.randomUUID();
    log("UUID One: " + idOne);
    log("UUID Two: " + idTwo);
  }
}

结果为:

UUID One: 6b193443-b95d-4462-9902-a6455ebc56d6
UUID Two: 4ef9b375-839b-4150-8f31-1ed85fab63fd

随机数的哈希值

此方法使用SecureRandom和MessageDigest:

  • 启动时,初始化SecureRandom (这可能是一个冗长的操作)
  • 使用 SecureRandom生成一个随机数
  • 创建一个MessageDigest,使用某种摘要算法
  • 将MessageDigest返回的byte[]编码为某种可接受的文本形式
  • 检查结果是否已经被使用;如果尚未使用,则适合作为唯一标识符

MessageDigest类是适合于产生任意数据的“单向散列”。

public class GenerateId {
  public static void main(String... arguments) {
    try {
      SecureRandom prng = SecureRandom.getInstance("SHA1PRNG");

      String randomNum = Integer.valueOf(prng.nextInt()).toString();

      MessageDigest sha = MessageDigest.getInstance("SHA-1");
      byte[] result = sha.digest(randomNum.getBytes());

      System.out.println("Random number: " + randomNum);
      System.out.println("Message digest: " + hexEncode(result));
    } catch (NoSuchAlgorithmException ex) {
      System.err.println(ex);
    }
  }

  static private String hexEncode(byte[] input) {
    StringBuilder result = new StringBuilder();
    char[] digits = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a',
        'b', 'c', 'd', 'e', 'f'};
    for (int idx = 0; idx < input.length; ++idx) {
      byte b = input[idx];
      result.append(digits[(b & 0xf0) >> 4]);
      result.append(digits[b & 0x0f]);
    }
    return result.toString();
  }
}

结果为:

Random number: -2017013782
Message digest: 2c3bba8d4dbd3699648c5909685d21f9c64b6a8a

Twitter的snowflake

Twitter的一个全局唯一id生成器,结果是一个long型的ID。

  • 正数位(1bit):一个符号位,永远是0。
  • 时间戳(41bit) :自从2012年以来的毫秒数,能撑139年。
  • 自增序列(12bit,最大值4096):毫秒之内的自增,过了一毫秒会重新置0。
  • DataCenter ID (5 bit, 最大值32):配置值,支持多机房。
  • Worker ID ( 5 bit, 最大值32),配置值,一个机房里最多32个机器。

2.1 Snowflake算法的变化

Snowflake算法生成的唯一ID为long型数值,但如果想在应用中使用int类型的自增ID的话可以做些调整。

时间戳改为分钟(25bit),自增序列(7bit)。自增序列最大值128,在一分钟内会不够使用。可以采用预支方式取下一分钟。

此方式只适用于一个单体应用,不适合分布式系统。

/**
 * @ClassName: SnowflakeIdWorker3rd
 * @Description:snowflake算法改进
 * @author: wanghao
 * @date: 2019年12月13日 下午12:50:47
 * @version V1.0
 * 
 *          将产生的Id类型更改为Integer 32bit <br>
 *          把时间戳的单位改为分钟,使用25个比特的时间戳(分钟) <br>
 *          去掉机器ID和数据中心ID <br> 
 *          7个比特作为自增值,即2的7次方等于128。
 */
public class SnowflakeIdWorker3rd {
  /** 开始时间戳 (2019-01-01) */
  private final int twepoch = 25771200;// 1546272000000L/1000/60;

  /** 序列在id中占的位数 */
  private final long sequenceBits = 7L;

  /** 时间截向左移7位 */
  private final long timestampLeftShift = sequenceBits;

  /** 生成序列的掩码,这里为127 */
  private final int sequenceMask = -1 ^ (-1 << sequenceBits);

  /** 分钟内序列(0~127) */
  private int sequence = 0;
  private int laterSequence = 0;

  /** 上次生成ID的时间戳 */
  private int lastTimestamp = -1;

  private final MinuteCounter counter = new MinuteCounter();
  
  /** 预支时间标志位 */
  boolean isAdvance = false;

  // ==============================Constructors=====================================
  public SnowflakeIdWorker3rd() {

  }

  // ==============================Methods==========================================
  /**
   * 获得下一个ID (该方法是线程安全的)
   * 
   * @return SnowflakeId
   */
  public synchronized int nextId() {
    
    
    int timestamp = timeGen();
    // 如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
    if (timestamp < lastTimestamp) {
      throw new RuntimeException(String.format(
          "Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
    }
    
    if(timestamp > counter.get()) {
      counter.set(timestamp);
      isAdvance = false;
    }

    // 如果是同一时间生成的,则进行分钟内序列
    if (lastTimestamp == timestamp || isAdvance) {
      if(!isAdvance) {
        sequence = (sequence + 1) & sequenceMask;
      }

      // 分钟内自增列溢出
      if (sequence == 0) {
        // 预支下一个分钟,获得新的时间戳
        isAdvance = true;
        int laterTimestamp = counter.get();
        if (laterSequence == 0) {
          laterTimestamp = counter.incrementAndGet();
        }

        int nextId = ((laterTimestamp - twepoch) << timestampLeftShift) //
            | laterSequence;
        laterSequence = (laterSequence + 1) & sequenceMask;
        return nextId;
      }
    }
    // 时间戳改变,分钟内序列重置
    else {
      sequence = 0;
      laterSequence = 0;
    }

    // 上次生成ID的时间截
    lastTimestamp = timestamp;

    // 移位并通过或运算拼到一起组成32位的ID
    return ((timestamp - twepoch) << timestampLeftShift) //
        | sequence;
  }

  /**
   * 返回以分钟为单位的当前时间
   * 
   * @return 当前时间(分钟)
   */
  protected int timeGen() {
    String timestamp = String.valueOf(System.currentTimeMillis() / 1000 / 60);
    return Integer.valueOf(timestamp);
  }

  // ==============================Test=============================================
  /** 测试 */
  public static void main(String[] args) {
    SnowflakeIdWorker3rd idWorker = new SnowflakeIdWorker3rd();
    for (int i = 0; i < 1000; i++) {
      long id = idWorker.nextId();
      System.out.println(i + ": " + id);
    }
  }
}
public class MinuteCounter {
  private static final int MASK = 0x7FFFFFFF;
    private final AtomicInteger atom;
    
    public MinuteCounter() {
        atom = new AtomicInteger(0);
    }
    
    public final int incrementAndGet() {
        return atom.incrementAndGet() & MASK;
    }
    
    public int get() {
        return atom.get() & MASK;
    }
    
    public void set(int newValue) {
      atom.set(newValue & MASK);
    }
}