数据库使用自增ID好还是UUID好?为什么?
答:
自增ID
- 优点:
- 数字类型,占用空间小
- 数据库自动增量排序,对检索有利,读写速度快(聚簇索引的优势)
- 系统编码过程中,可以不指定id,数据库自增
- 自增的主键的值是顺序的,所以 Innodb 把每一条记录都存储在一条记录的后面。当达到页面的最大填充因子时候 ( innodb默认的最大填充因子是页大小的15/16,会留出1/16的空间留作以后的修改):下一条记录就会写入新的页中,一旦数据按照这种顺序的方式加载,主键页就会近乎于顺序的记录填满,提升了页面的最大填充率,不会有页的浪费。新插入的行一定会在原有的最大数据行下一行,mysql定位和寻址很快,不会为计算新行的位置而做出额外的消耗,减少了页分裂和碎片的产生
- 缺点
- 因自动增长,当手动插入的时候会出现麻烦,主键冲突的情况会有发生
- 分表之后控制不好会出现主键重复现象
- 新老数据合并,要是新数据主键也是数字类型,想新老数据区分会出现一些冲突
- 不安全,容易暴露信息,如果一个客户id是123456,很容易猜到有客户id是123456.
- 如果存在⼤量的数据,可能会超出⾃增长的取值范围
UUID
- 优点:
- 全局唯一性,不用担心重复的现象,对数据的拆分、合并比较友好
- 相对安全,不能简单的从uuid获取信息,但是如果自增,则容易暴露信息,如果一个客户id是123456,很容易猜到有客户id是123456.
- 缺点:
- 字符串类型,占用空间比较大
- 读写速度慢,而且索引会随着数据量的增加越来越难用
- uuid做主键新插入行的时候,写入的目标页很可能已经刷新到磁盘上并且从缓存上移除,或者还没有被加载到缓存中,innodb在插入之前不得不先找到并从磁盘读取目标页到内存中,这将导致大量的随机IO,因为写入是乱序的,innodb不得不频繁的做页分裂操作,以便为新的行分配空间,页分裂导致移动大量的数据,一次插入最少需要修改三个页以上,由于频繁的页分裂,页会变得稀疏并被不规则的填充,最终会导致数据会有碎片
雪花算法
雪花算法:雪花算法是 Twitter 推出的针对分布式环境下的 id 生成算法,其结果是一个 Long 型的 64bit id。具体实现上使用 41bit 作为毫秒数,10bit 作为机器的 id(5bit 是数据中心,5bit 是机器 id),12bit 作为毫秒内的流水号(这意味着每个节点在每毫秒内可以产生 4096 个 id),最后还有一个符号位永远是 0
- **优点:**不依赖数据库、完全在内存中生成 id、高性能高可用、容量大、每秒可生成数百万个 id、id 递增、后续插入数据库的索引时性能较高
- **缺点:**严重依赖系统时钟,如果某台机器的系统时钟发生回拨,就有可能会造成 id 冲突甚至 id 乱序