深入剖析雪花算法:分布式ID生成的核心方案

news2025/4/3 3:45:52

深入剖析雪花算法:分布式ID生成的核心方案

  • 深入剖析雪花算法:分布式ID生成的核心方案
    • 一、雪花算法(Snowflake)概述
    • 二、雪花算法核心组成
      • 1. 64位二进制结构
      • 2. 时间戳起始点
    • 三、工作原理与代码实现
      • 1. 生成逻辑
      • 2. Java代码示例
      • 3. 代码详解
    • 四、雪花算法的优缺点
      • 1. 优点
      • 2. 缺点
    • 五、应用场景
    • 六、变种与优化
    • 七、替代方案对比
    • 八、总结

深入剖析雪花算法:分布式ID生成的核心方案

一、雪花算法(Snowflake)概述

雪花算法是Twitter开源的分布式ID生成算法,旨在解决分布式系统中全局唯一ID的生成问题。其核心思想是通过64位二进制数(转换为十进制约9.22亿),将时间戳、数据中心ID、机器ID和序列号等信息编码到ID中,保证ID的唯一性、递增性和可排序性。

二、雪花算法核心组成

1. 64位二进制结构

1位(未使用) | 41位时间戳 | 5位数据中心ID | 5位机器ID | 12位序列号
  • 1位符号位:固定为0,保证ID为正数。
  • 41位时间戳:精确到毫秒,可支持约69年((2^41 -1)/1000/3600/24/365 ≈ 69年)。
  • 5位数据中心ID:支持32个数据中心。
  • 5位机器ID:每个数据中心支持32台机器。
  • 12位序列号:同一毫秒内,每台机器最多生成4096个ID。

2. 时间戳起始点

通常设置为某个特定时间(如2023-01-01 00:00:00 UTC),避免ID过大。

三、工作原理与代码实现

1. 生成逻辑

  1. 获取当前时间戳:毫秒级时间戳,与起始时间戳的差值。
  2. 检查时钟回拨:若当前时间小于上一次生成时间,需等待或调整时间戳。
  3. 递增序列号:同一毫秒内,序列号从0开始递增,达到最大值后等待下一毫秒。
  4. 组合各部分:将时间戳、数据中心ID、机器ID和序列号按位组合成64位ID。

2. Java代码示例

public class SnowflakeIdGenerator {
    private final long dataCenterId;
    private final long workerId;
    private long sequence = 0L;
    private long lastTimestamp = -1L;

    public SnowflakeIdGenerator(long dataCenterId, long workerId) {
        if (dataCenterId > 31 || dataCenterId < 0) {
            throw new IllegalArgumentException("Data center ID must be between 0 and 31");
        }
        if (workerId > 31 || workerId < 0) {
            throw new IllegalArgumentException("Worker ID must be between 0 and 31");
        }
        this.dataCenterId = dataCenterId;
        this.workerId = workerId;
    }

    public synchronized long nextId() {
        long timestamp = System.currentTimeMillis();

        // 处理时钟回拨
        if (timestamp < lastTimestamp) {
            throw new RuntimeException(String.format(
                "Clock moved backwards. Refusing to generate id for %d milliseconds",
                lastTimestamp - timestamp
            ));
        }

        if (timestamp == lastTimestamp) {
            sequence = (sequence + 1) & 0xFFF; // 12位序列号最大值4095
            if (sequence == 0) {
                timestamp = waitNextMillis(lastTimestamp); // 等待下一毫秒
            }
        } else {
            sequence = 0;
        }

        lastTimestamp = timestamp;

        return (timestamp << 22) |
               (dataCenterId << 17) |
               (workerId << 12) |
                sequence;
    }

    private long waitNextMillis(long lastTimestamp) {
        long timestamp = System.currentTimeMillis();
        while (timestamp <= lastTimestamp) {
            timestamp = System.currentTimeMillis();
        }
        return timestamp;
    }

    public static void main(String[] args) {
        SnowflakeIdGenerator generator = new SnowflakeIdGenerator(1, 1);
        for (int i = 0; i < 10; i++) {
            System.out.println(generator.nextId());
        }
    }
}

3. 代码详解

  • 构造方法:初始化数据中心ID和机器ID,范围均为0-31。
  • nextId()方法
    • 获取当前时间戳,处理时钟回拨异常。
    • 同一毫秒内递增序列号,超过最大值时等待下一毫秒。
    • 通过位运算组合各部分生成ID。
  • waitNextMillis():阻塞等待直到获取新的时间戳。

四、雪花算法的优缺点

1. 优点

  • 高性能:单节点每秒可生成约409.6万个ID(32台机器 × 4096序列号/毫秒)。
  • 全局唯一:通过时间戳、数据中心ID、机器ID和序列号确保唯一性。
  • 趋势递增:时间戳高位保证ID按时间排序,便于数据库索引优化。
  • 低延迟:生成过程无需网络IO或数据库操作。

2. 缺点

  • 对时钟敏感:若服务器时钟回拨,可能导致ID重复或异常。
  • ID长度固定:64位ID占用较多存储空间,某些场景需转换为字符串。
  • 依赖系统时间:若系统时间不准确,可能影响ID生成逻辑。

五、应用场景

  1. 分布式系统:电商订单ID、支付交易ID、用户行为日志ID等。
  2. 数据库分库分表:作为分布式主键,避免跨库ID冲突。
  3. 日志系统:按时间排序的日志ID,便于快速查询和分析。
  4. 消息队列:消息唯一标识,支持幂等性处理。

六、变种与优化

  1. 调整各部分位数:根据实际需求调整时间戳、数据中心ID、机器ID和序列号的位数。例如,若数据中心数量少,可减少数据中心ID位数,增加序列号位数以支持更高并发。
  2. 解决时钟回拨
    • 补偿策略:检测到时钟回拨时,等待直到时间恢复正常。
    • 记录最大时间戳:若时间回拨不超过某个阈值,使用缓存的最大时间戳生成ID。
  3. 结合其他算法:如将雪花算法与UUID结合,生成更复杂的ID。

七、替代方案对比

方案优点缺点
雪花算法高性能、全局唯一、趋势递增依赖时钟、ID长度固定
UUID完全分布式、无中心节点无序、占用空间大、不可排序
数据库自增ID简单易用、递增性好单点瓶颈、扩展性差
Redis生成ID高性能、可扩展依赖Redis集群、需额外维护

八、总结

雪花算法是分布式系统中生成唯一ID的经典方案,通过合理的位分配和时钟管理,在性能、唯一性和可扩展性之间取得了良好平衡。理解其原理和实现,能帮助开发者在分布式系统设计中更好地选择ID生成策略。在实际应用中,可根据业务需求调整参数或结合其他方案,打造适合自身场景的ID生成系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2326934.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Mac 电脑移动硬盘无法识别的解决方法

在使用 Mac 电脑的过程中&#xff0c;不少用户都遇到过移动硬盘没有正常推出&#xff0c;导致无法识别的问题。这不仅影响了数据的传输&#xff0c;还可能让人担心硬盘内数据的安全。今天&#xff0c;我们就来详细探讨一下针对这一问题的解决方法。 当发现移动硬盘无法识别时&…

LeetCode Hot100 刷题笔记(4)—— 二叉树、图论

目录 一、二叉树 1. 二叉树的深度遍历&#xff08;DFS&#xff1a;前序、中序、后序遍历&#xff09; 2. 二叉树的最大深度 3. 翻转二叉树 4. 对称二叉树 5. 二叉树的直径 6. 二叉树的层序遍历 7. 将有序数组转换为二叉搜索树 8. 验证二叉搜索树 9. 二叉搜索树中第 K 小的元素 …

【计算机视觉】YOLO语义分割

一、语义分割简介 1. 定义 语义分割&#xff08;Semantic Segmentation&#xff09;是计算机视觉中的一项任务&#xff0c;其目标是对图像中的每一个像素赋予一个类别标签。与目标检测只给出目标的边界框不同&#xff0c;语义分割能够在像素级别上区分不同类别&#xff0c;从…

【SpringBoot + MyBatis + MySQL + Thymeleaf 的使用】

目录&#xff1a; 一&#xff1a;创建项目二&#xff1a;修改目录三&#xff1a;添加配置四&#xff1a;创建数据表五&#xff1a;创建实体类六&#xff1a;创建数据接口七&#xff1a;编写xml文件八&#xff1a;单元测试九&#xff1a;编写服务层十&#xff1a;编写控制层十一…

在ensp进行OSPF+RIP+静态网络架构配置

一、实验目的 1.Ospf与RIP的双向引入路由消息 2.Ospf引入静态路由信息 二、实验要求 需求&#xff1a; 路由器可以互相ping通 实验设备&#xff1a; 路由器router7台 使用ensp搭建实验坏境&#xff0c;结构如图所示 三、实验内容 1.配置R1、R2、R3路由器使用Ospf动态路由…

Redis安全与配置问题——AOF文件损坏问题及解决方案

Java 中的 Redis AOF 文件损坏问题全面解析 一、AOF 文件损坏的本质与危害 1.1 AOF 持久化原理 Redis 的 AOF&#xff08;Append-Only File&#xff09; 通过记录所有写操作命令实现持久化。文件格式如下&#xff1a; *2\r\n$6\r\nSELECT\r\n$1\r\n0\r\n *3\r\n$3\r\nSET\r\…

3.第二阶段x64游戏实战-分析人物移动实现人物加速

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 本次游戏没法给 内容参考于&#xff1a;微尘网络安全 上一个内容&#xff1a;2.第二阶段x64游戏实战-x64dbg的使用 想找人物的速度&#xff0c;就需要使用Ch…

Scala(三)

本节课学习了函数式编程&#xff0c;了解到它与Java、C函数式编程的区别&#xff1b;学习了函数的基础&#xff0c;了解到它的基本语法、函数和方法的定义、函数高级。。。学习到函数至简原则&#xff0c;高阶函数&#xff0c;匿名函数等。 函数的定义 函数基本语法 例子&…

什么是 Java 泛型

一、什么是 Java 泛型&#xff1f; 泛型&#xff08;Generics&#xff09; 是 Java 中一种强大的编程机制&#xff0c;允许在定义类、接口和方法时使用类型参数。通过泛型&#xff0c;可以将数据类型作为参数传递&#xff0c;从而实现代码的通用性和类型安全。 简单来说&…

Unity中根据文字数量自适应长宽的对话气泡框UI 会自动换行

使用Ugui制作一个可以根据文本数量自动调整宽度,并可以自动换行的文字UI 或者不要独立的Bg,那么一定要把bg的img设置成切片

【小也的Java之旅系列】02 分布式集群详解

文章目录 前言为什么叫小也 本系列适合什么样的人阅读正文单体优点缺点 CAP为什么CAP不可能全部满足&#xff1f;CAP 三选二 分布式事务分布式方案——SeataXA模式&#xff08;强一致&#xff09;AT模式&#xff08;自动补偿&#xff0c;默认模式&#xff09;TCC模式&#xff0…

Ubuntu里安装Jenkins

【方式1】&#xff1a;下载war包&#xff0c;直接运行&#xff0c;需提前搭建Java环境&#xff0c;要求11或17&#xff0c;不推荐&#xff0c;war包下载地址&#xff0c;将war包上传到服务器&#xff0c;直接使用命令启动 java -jar /data/jenkins/jenkins.war【方式2】&#…

C++包管理工具vcpkg的安装使用教程

前言 使用vcpkg可以更方便地安装各种库&#xff0c;省去配置的时间和配置失败的风险&#xff0c;类似python中的anaconda&#xff0c;懒人必备 参考 安装参考&#xff1a;https://bqcode.blog.csdn.net/article/details/135831901?fromshareblogdetail&sharetypeblogde…

微服务面试题:配置中心

&#x1f9d1; 博主简介&#xff1a;CSDN博客专家&#xff0c;历代文学网&#xff08;PC端可以访问&#xff1a;https://literature.sinhy.com/#/?__c1000&#xff0c;移动端可微信小程序搜索“历代文学”&#xff09;总架构师&#xff0c;15年工作经验&#xff0c;精通Java编…

Qt msvc2017程序无法用enigma vitrual box打包,用winrar打包

我们通常打包Qt程序用Enigma virtual box。这样我们的程序就可以在别的电脑上也能运行&#xff0c;但是有时候&#xff0c;我们发现Enigma virtual box在打包的时候&#xff0c;对于msvc2017需要编译的程序中引用webengineview模块&#xff0c;打包时候发现不能运行。 我们如何…

微服务集成测试 -华为OD机试真题(A卷、JavaScript)

题目描述 现在有n个容器服务&#xff0c;服务的启动可能有一定的依赖性&#xff08;有些服务启动没有依赖&#xff09;&#xff0c;其次&#xff0c;服务自身启动加载会消耗一些时间。 给你一个n n 的二维矩阵useTime&#xff0c;其中useTime[i][i]10表示服务i自身启动加载需…

Mac: 运行python读取CSV出现 permissionError

在MAC机器里&#xff0c;之前一直运行程序在某个指定的目录下读取excel和csv文件&#xff0c;没有出现错误&#xff0c;有一天突然出现错误&#xff1a;permissionError:[Errno 1] Operation not permitted&#xff0c; 具体错误信息如下&#xff1a; 经过调查得知&#xff0c…

UE5 学习笔记 FPS游戏制作30 显示击杀信息 水平框 UI模板(预制体)

文章目录 一制作单条死亡信息框水平框的使用创建一个水平框添加子元素调整子元素顺序子元素的布局插槽尺寸填充对齐 制作UI 根据队伍&#xff0c;设置文本的名字和颜色声明变量 将变量设置为构造参数根据队伍&#xff0c;设置文本的名字和颜色在构造事件中&#xff0c;获取玩家…

西门子TCP通讯过程中硬件连接突然断开

通信原理探秘又结合在工作中遇到的问题,关注到了通讯中的KeepAlive定时器的设置,所以做了如下实验。 硬件: 1513PLC TCP客户端 PC TCP服务器 前提条件:禁用PLC侧KeepAlive 程序: 测试流程: 打开PC端网络调试助手,设置为TCP服务器,打开链接; PC端打开WireShack软…

2025宁德时代测评Verify考什么?网申测评如何通过SHL笔试|附真题线上笔试考点、高分攻略、CATL新能源科技SHL测评宁德社招题目、面试攻略、求职建议

——职小豚 带你拆解新能源巨头招聘密码 一、宁德时代&#xff1a;新能源赛道「超级独角兽」 作为全球动力电池龙头&#xff0c;宁德时代&#xff08;CATL&#xff09;的江湖地位无需多言&#xff1a; 技术硬实力&#xff1a;麒麟电池、钠离子电池、无钴电池等黑科技加持&…