概述
雪花算法(Snowflake Algorithm)最初是由Twitter开源的,用于生成一个64位的长整型数字作为全局唯一的ID。这个算法是用Scala语言编写的,并且在Twitter内部得到了广泛应用。由于其简单、高效和分布式友好的特性,雪花算法后来也被其他很多公司和项目采用,并可能被移植到其他编程语言中实现。

(图片来源网络,侵删)
其结构如下:
- 第一位:未使用,因为二进制中最高位是符号位,正数是0,负数是1,一般生成的ID为正数,所以默认为0。
- 接下来的41位:用来记录时间戳(毫秒)。
- 接下来的10位:用来记录工作机器ID,包括5位datacenterId和5位workerId。10位的长度最多支持部署在1024个节点(即机器或数据中心)上。
- 最后的12位:序列号,用来记录同毫秒内产生的不同ID序号,12位的计数顺序号支持每个节点每毫秒(同一机器,同一时间截并发量)可以产生 4096 个 ID 序号。
雪花算法的优点包括:

(图片来源网络,侵删)
然而,雪花算法也有其局限性,比如当数据中心ID或工作机器ID达到上限时,就需要进行扩容或重新规划。此外,如果时钟回拨,可能会导致生成的ID出现冲突或不符合预期的情况,虽然可以通过一些策略进行避免,但仍需注意处理这类情况。
总的来说,雪花算法是一种简单、高效、灵活的分布式ID生成算法,适用于大多数分布式系统场景。但在使用时,需要根据自身业务特性和需求进行合理规划和调整。
基于Java实现的雪花算法工具类
package com.desmond.common.utils; public class SnowflakeIdWorker { /** 开始时间截 (2015-01-01) 可自定义修改 */ private final long twepoch = 1288834974657L; /** 机器id所占的位数 */ private final long workerIdBits = 5L; /** 数据标识id所占的位数 */ private final long datacenterIdBits = 5L; /** 支持的最大机器id,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */ private final long maxWorkerId = -1L ^ (-1L