雪花算法snowflake

news2025/1/12 18:51:06

snowflake中文的意思是 雪花,雪片,所以翻译成雪花算法。它最早是twitter内部使用的分布式环境下的唯一ID生成算法。在2014年开源。

雪花算法产生的背景当然是twitter高并发环境下对唯一ID生成的需求,得益于twitter内部高超的技术,雪花算法流传至今并被广泛使用。它至少有如下几个特点:

  • 能满足高并发分布式系统环境下ID不重复

  • 基于时间戳,可以保证基本有序递增(有些业务场景对这个又要求)

  • 不依赖第三方的库或者中间件

  • 生成效率极高

雪花算法原理


10位的数据机器位,所以可以部署在1024个节点。

12位的序列,在毫秒的时间戳内计数。支持每个节点每毫秒产生4096个ID序号,所以最大可以支持单节点大概四百万的并发量,这个妥妥的够用了。

雪花算法java实现


public class SnowflakeIdWorker {
    /** 开始时间截 (这个用自己业务系统上线的时间) */
    private final long twepoch = 1575365018000L;

    /** 机器id所占的位数 */
    private final long workerIdBits = 10L;

    /** 支持的最大机器id,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) */
    private final long maxWorkerId = -1L ^ (-1L << workerIdBits);

    /** 序列在id中占的位数 */
    private final long sequenceBits = 12L;

    /** 机器ID向左移12位 */
    private final long workerIdShift = sequenceBits;

    /** 时间截向左移22位(10+12) */
    private final long timestampLeftShift = sequenceBits + workerIdBits;

    /** 生成序列的掩码,这里为4095 (0b111111111111=0xfff=4095) */
    private final long sequenceMask = -1L ^ (-1L << sequenceBits);

    /** 工作机器ID(0~1024) */
    private long workerId;

    /** 毫秒内序列(0~4095) */
    private long sequence = 0L;

    /** 上次生成ID的时间截 */
    private long lastTimestamp = -1L;

    //==============================Constructors=====================================
    /**
     * 构造函数
     * @param workerId 工作ID (0~1024)
     */
    public SnowflakeIdWorker(long workerId) {
        if (workerId > maxWorkerId || workerId < 0) {
            throw new IllegalArgumentException(String.format("workerId can't be greater than %d or less than 0", maxWorkerId));
        }
        this.workerId = workerId;
    }

    // ==============================Methods==========================================
    /**
     * 获得下一个ID (该方法是线程安全的)
     * @return SnowflakeId
     */
    public synchronized long nextId() {
        long timestamp = timeGen();

        //如果当前时间小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
        if (timestamp < lastTimestamp) {
            throw new RuntimeException(
                    String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
        }

        //如果是同一时间生成的,则进行毫秒内序列
        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & sequenceMask;
            //毫秒内序列溢出
            if (sequence == 0) {
                //阻塞到下一个毫秒,获得新的时间戳
                timestamp = tilNextMillis(lastTimestamp);
            }
        }
        //时间戳改变,毫秒内序列重置
        else {
            sequence = 0L;
        }

        //上次生成ID的时间截
        lastTimestamp = timestamp;

        //移位并通过或运算拼到一起组成64位的ID
        return ((timestamp - twepoch) << timestampLeftShift) //
                | (workerId << workerIdShift) //
                | sequence;
    }

    /**
     * 阻塞到下一个毫秒,直到获得新的时间戳
     * @param lastTimestamp 上次生成ID的时间截
     * @return 当前时间戳
     */
    protected long tilNextMillis(long lastTimestamp) {
        long timestamp = timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = timeGen();
        }
        return timestamp;
    }

    /**
     * 返回以毫秒为单位的当前时间
     * @return 当前时间(毫秒)
     */
    protected long timeGen() {
        return System.currentTimeMillis();
    }
}

上面第一部分说到雪花算法的性能比较高,接下来我们测试下性能:

public static void main(String[] args) {
        SnowflakeIdWorker idWorker = new SnowflakeIdWorker(1);

        long start = System.currentTimeMillis();
        int count = 0;
        for (int i = 0; System.currentTimeMillis()-start<1000; i++,count=i) {
            idWorker.nextId();
        }
        long end = System.currentTimeMillis()-start;
        System.out.println(end);
        System.out.println(count);
    }

其可以产生400w+的id,效率还是相当高的。

调整比特位分布

很多公司会根据 snowflake 算法,根据自己的业务做二次改造。举个例子。你们公司的业务评估不需要运行69年,可能10年就够了。但是集群的节点可能会超过1024个,这种情况下,你就可以把时间戳调整成39bit,然后workerid调整为12比特。同时,workerid也可以拆分下,比如根据业务拆分或者根据机房拆分等。类似如下:

源码

twitter的雪花算法:https://github.com/twitter-archive/snowflake

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/331656.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【从头开始】Java基础Day05

面向对象、三大特性、异常处理Day05面向对象构造器创建对象内存分析封装继承Super关键字重写多态instanceofStatic详解抽象类接口异常ErrorExceptionError和Exception的区别异常处理机制自定义异常类实际应用中关于异常的总结Day05 面向对象 面向对象编程的本质就是&#xff1…

在这些工厂、农田、服务区,看到智能中国的草蛇灰线

今天&#xff0c;应该很少人会怀疑&#xff0c;以AI、5G、云计算等新一代技术为核心的第四次工业革命&#xff0c;将发生在中国。正如保尔芒图在《十八世纪产业革命》中写道的那样&#xff1a;大工业的特殊性&#xff0c;并不是一下子就显露出来的。一开始&#xff0c;只是城市…

如何将VirtualBox虚拟机转换到VMware中

转换前的准备 首先需要你找到你的virtualbox以及VM安装到哪个文件夹里了&#xff0c;需要将这两个文件夹添加进环境变量Path中。 如果你记不清了&#xff0c;可以用everything全局搜索一下“VBoxManage.exe’以及“vmware-vdiskmanager.exe”&#xff0c;看一眼这个程序放到哪…

推荐几个好用的在线代码编译器

程序员最喜欢用的在线IDE代码编译器&#xff0c;功能很强大&#xff0c;类别很全&#xff01; 1.网址https://tech.io/snippet 支持 20 种编程语言&#xff0c;页面上没有杂七杂八的东西&#xff0c;非常简约&#xff0c;非常干净&#xff0c;另外&#xff0c;它上面的代码段…

UE4:使用样条生成随机路径,并使物体沿着路径行走

一、关于样条的相关知识 参考自&#xff1a;样条函数 - 馒头and花卷 - 博客园 三次样条&#xff08;cubic spline&#xff09;插值 - 知乎 B-Spline(三)样条曲线的性质 - Fun With GeometryFun With Geometry 个人理解的也不是非常深&#xff0c;但是大概要知道的就是样条具…

【C++实现红黑树】

文章目录一、红黑树的概念及性质二、红黑树节点的定义三、红黑树的插入四、红黑树的验证五、完整代码六、总结一、红黑树的概念及性质 红黑树&#xff0c;是一种二叉搜索树&#xff0c;但在每个结点上增加一个存储位表示结点的颜色&#xff0c;可以是Red或Black。 通过对任何一…

时间短/背景弱/获两国邀请函如期赴日本工程院士麾下访学

K老师因省公派要求&#xff0c;年底必须出国&#xff0c;除了申请还要办理各种派出手续&#xff0c;时间很紧张。本人为讲师&#xff0c;硕士学位&#xff0c;且没有论文及课题项目作为依托&#xff0c;学术背景较弱。通过努力&#xff0c;我们分别获得了美国夏威夷大学马诺阿分…

花了5年时间,用过市面上95%的工具,终于找到这款万能报表工具

经常有粉丝问我有“哪个报表工具好用易上手&#xff1f;”或者是“有哪些适合绝大多数普通职场人的万能报表工具&#xff1f;” 从这里我大概总结出了大家选择报表工具最期望满足的3点&#xff1a; &#xff08;1&#xff09;简单易上手&#xff1a;也就是所谓的学习门槛要低…

如何下载高程DEM

同步视频教程&#xff1a;卫星地图_高清卫星地图_卫星地图视频_下载高程等高线使用视频教程专题地图制作视频教程&#xff1a;卫星地图_高清卫星地图_卫星地图视频_地图数据应用&#xff08;制作地图效果的基本过程&#xff09;视频教程&#xff1a;如何选择中央子午线或者分度…

欧盟砍伐森林法规和遵守情况 用Dimitra技术解决森林砍伐问题

两千年前&#xff0c;西欧有80%的地区被列为森林。今天&#xff0c;这个数字只有34%。森林砍伐影响着这个星球上的每个人。它造成了大约10%的全球变暖。如果不设法解决森林砍伐问题&#xff0c;就不可能应对全球变暖。 毁林是有目的的清除林地的行为。此外&#xff0c;工业化农…

ChatGPT用不了,给你几个免费正常使用的

ChatGPT用不了&#xff0c;给你几个免费正常使用的 ChatGPT是由美国人工智能公司OpenAI开发和训练的&#xff0c;OpenAI的幕后老板是硅谷投资者山姆阿尔特曼和亿万富翁埃隆马斯克。马斯克曾在一篇推文中表示&#xff1a;ChatGPT好得吓人&#xff0c;我们距离优秀… 资源宝分享…

Java中日期格式化字符串大小写区别

最近在项目中遇到一个问题&#xff1a;前端选择时间格式化的样式&#xff0c;后端根据参数&#xff0c;进行格式化&#xff0c;前端的参数有&#xff1a;YYYY&#xff0c;YYYYMM&#xff0c;YYYYMMDD&#xff0c;YYYYMMDDHHMMSS等&#xff0c;前端全部都是大写字母&#xff0c;…

数据集笔记:Uber Movement (Speed)【python 处理数据集至时空矩阵】

Uber Movement: Lets find smarter ways forward, together. 以伦敦威斯敏斯特的一个小区域为例 1 导入库 import osmnx as ox import pandas as pd 2 读入数据 这里选取了6个月的数据 df1pd.read_csv(movement-speeds-hourly-london-2019-10.csv.zip) df2pd.read_csv(mo…

大数据---浅谈Hadoop工作原理

浅谈Hadoop工作原理 文章目录浅谈Hadoop工作原理Hadoop核心组件HDFS读写原理HDFS读文件HDFS写文件MapReduce原理Map流程Reduce流程Shuffle机制&#xff08;无序--->有序&#xff09;Hadoop核心组件 Hadoop HDFS(分布式存储系统)&#xff1a;解决海量数据存储 Hadoop YARN(集…

target31对传感器采样率限制

target31谷歌做了一些列的适配&#xff0c;其中对看似无关紧要的传感器采用率做了限制&#xff0c;最近几年很火的摇一摇开屏广告就是基于传感器去实现的。这篇文章&#xff0c;我们就一起去看一下target31对传感器采样频率的限制。 一、背景 先说一下背景&#xff1a;近期&am…

使用 QuTrunk+Amazon Deep Learning AMI(TensorFlow2)构建量子神经网络

量子神经网络是基于量子力学原理的计算神经网络模型。1995年&#xff0c;Subhash Kak 和 Ron Chrisley 独立发表了关于量子神经计算的第一个想法&#xff0c;他们致力于量子思维理论&#xff0c;认为量子效应在认知功能中起作用。然而&#xff0c;量子神经网络的典型研究涉及将…

103-并发编程详解(下篇)

这里还是续写上一章博客 线程池与Future&#xff1a; 线程池的实现原理&#xff1a; 下图所示为线程池的实现原理&#xff1a;调用方不断地向线程池中提交任务&#xff0c;线程池中有一组线程&#xff0c;不断地从队列中取 任务&#xff0c;这是一个典型的生产者—消费者模型…

python基于django的高校招生管理系统

目录 1 绪论 1 1.1课题背景 1 1.2课题研究现状 1 1.3初步设计方法与实施方案 2 1.4本文研究内容 2 2 系统开发环境 4 2.1 使用工具简介 4 2.2 环境配置 4 2.3 B/S结构简介 4 2.4 MySQL数据库 5 2.5 框架介绍 5 3 系统分析 6 3.1系统可行性分析 6 3.1.1经济可行性 6 3.1.2技术可…

Linux驱动开发基础__mmap

目录 1 引入 2 内存映射现象与数据结构 3 ARM 架构内存映射简介 3.1 一级页表映射过程 3.2 二级页表映射过程 4 怎么给 APP 新建一块内存映射 4.1 mmap 调用过程 ​编辑4.2 cache 和 buffer 4.3 驱动程序要做的事 5 编程 5.1 app编程 5.2 hello_drv_test…

操作符——“C”

各位CSDN的uu们你们好呀&#xff0c;今天&#xff0c;总算是要到我们的操作符啦&#xff0c;在C语言中&#xff0c;操作符是一个极为复杂的东西&#xff0c;下面&#xff0c;就让我们进入操作符的世界吧 算术操作符 移位操作符 位操作符 赋值操作符 单目操作符 关系操作符…