新聞中心
帶你吃透幾種大廠分布式id設計方案
作者:無聊 2021-06-04 20:09:19
網(wǎng)絡
通信技術
分布式 最近公司在擴招后端高級開發(fā),有幸成為面試官之一,其中問的最多一個問題就是分布式ID的幾種解決方案,不客氣的說前身小公司的開發(fā)答得完整的很少。

創(chuàng)新互聯(lián)公司堅持“要么做到,要么別承諾”的工作理念,服務領域包括:成都網(wǎng)站建設、成都做網(wǎng)站、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣等服務,滿足客戶于互聯(lián)網(wǎng)時代的元江縣網(wǎng)站設計、移動媒體設計的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡建設合作伙伴!
本文轉(zhuǎn)載自微信公眾號「無聊學Java」,作者無聊。轉(zhuǎn)載本文請聯(lián)系無聊學Java公眾號。
前言
最近公司在擴招后端高級開發(fā),有幸成為面試官之一,其中問的最多一個問題就是分布式ID的幾種解決方案,不客氣的說前身小公司的開發(fā)答得完整的很少。
于是就抽出了周末的時間整理了幾種主流的分布式ID生成方案,希望能夠幫助到你們。
開篇幾個問題
1. 為什么需要分布式全局唯一ID以及分布式ID的業(yè)務需求
在復雜分布式系統(tǒng)中,往往需要對大量的數(shù)據(jù)和消息進行唯一標識。
- 如在美團點評的金融、支付、餐飲、酒店等業(yè)務場景
- 貓眼電影等產(chǎn)品的系統(tǒng)中數(shù)據(jù)日漸增長,對數(shù)據(jù)分庫分表后需要有一個唯一ID來表示一條數(shù)據(jù)或者消息。
- 特別一點的如訂單、騎手、優(yōu)惠劵也都需要一個唯一ID做為標識。
此時一個能生成唯一ID的系統(tǒng)是非常必要的。
2. ID生成規(guī)則部分硬性要求
- 全局唯一:既然是唯一標識,那么全局唯一是最基本的要求。
- 趨勢遞增:在MySQL的InnoDB引擎中使用的是聚集索引,由于多數(shù)RDBMS使用Btree的數(shù)據(jù)結構來存儲索引數(shù)據(jù),在主鍵的選擇上面我們應該盡量使用有序的主鍵來保證寫入性能。
- 單調(diào)遞增:保證下一個ID一定大于上一個ID,例如事務版本號、IM增量消息、排序等特殊需求。
- 信息安全:如果ID是連續(xù)的,那么惡意用戶的扒取工作就非常容易做了,直接按照順序下載指定URL即可;如果是訂單號那么更加危險,競爭對手可以知道我們一天的單量;所以在一些應用場景下,需要ID無規(guī)則不規(guī)則,讓競爭對手不好猜。
- 含時間戳:這樣就能在開發(fā)中快速了解這個分布式ID的生成時間。
3. ID生成系統(tǒng)的可用性要求
- 高可用:發(fā)一個獲取分布式ID的請求,服務器就要保證99.999%的情況下給我創(chuàng)建一個唯一分布式ID
- 低延遲:發(fā)一個獲取分布式ID的請求,服務器就要快,極速
- 高QPS:假如并發(fā)一口氣10萬個創(chuàng)建分布式ID請求同時過來,服務器需要頂?shù)米∏页晒?chuàng)建10萬個分布式ID
通用的幾種方案
隨著系統(tǒng)架構以及業(yè)務的演變,分布式ID生成也是有N中解決方案,以下就簡單的列舉幾種。
1. UUID
這種方案估計大家都了解,最簡單的一種方案。
- public static void main(String[] args) {
- String uuid = UUID.randomUUID().toString();
- System.out.println(uuid);
- }
如果只是考慮唯一性,那么UUID基本可以滿足需求。
缺點
- 無序:無法預測他的生成順序,不能生成遞增有序的數(shù)字
- 主鍵:ID作為主鍵時在特定的環(huán)境下會存在一些問題,比如做DB主鍵的場景下,UUID非常不適用,MySQL官方有明確的建議主鍵要盡量越短越好,36位的UUID不合要求。
- 索引:會導致B+樹索引的分裂。
2. 數(shù)據(jù)庫自增主鍵
此種方案有一定的局限性,在高并發(fā)集群上此策略不可用。
3. 基于Redis生成全局ID策略
- 因為Redis是單線程,天生保證原子性,所以可以使用INCR和INCRBY來實現(xiàn)。
- 集群分布式
在Redis集群下,同樣和MySQL一樣需要設置不同的增長步數(shù),同時key需要設置有效期;可以使用Redis集群來獲取更高的吞吐量;假如一個集群中有五個Redis,那么初始化每臺Redis步長分別是1,2,3,4,5,然后步長都是5。
4. snowflake(雪花算法)
- 推特的雪花算法生成ID能夠按照時間有序生成。
- 雪花算法生成ID的結果是一個64bit大小的整數(shù),為一個Long型(轉(zhuǎn)換為字符串后長度最多19)
- 分布式系統(tǒng)內(nèi)不會產(chǎn)生ID碰撞(由datecenter和workerId作區(qū)分),并且效率較高。
結構
雪花算法的幾個核心組成部分如下圖:
號段解析
- 1bit符號位:不用,因為二進制最高位是符號位,1表示負數(shù),0表示正數(shù),生成的id一般都是用正數(shù),所以最高位固定位0
- 41bit時間戳,用于記錄時間戳,毫秒級
- 41位可以表示2^41 - 1個數(shù)字
- 如果只用來表示正整數(shù)(計算機正數(shù)包含0),可以表示的數(shù)值范圍是0-2^41 - 1,減一是因為可表示的數(shù)值范圍是從0開始算的,而不是1
- 也就是說41位可以表示2^41 - 1個毫秒的值,轉(zhuǎn)換為單位年則是69年。
- 10bit工作進程位,用于記錄工作機器id
- 可以部署在2^10 = 1024個節(jié)點,包括五位datacenterId和五位workerId
- 五位可以表示的最大整數(shù)位2^5 - 1 = 31,即可以使用0,1,2…31這32個數(shù)字來表示不同的datacenterId和workerId
- 12bit序列號,序列號,用來記錄同毫秒內(nèi) 產(chǎn)生的不同的ID
- 12bit可以表示的最大正整數(shù)位2^12 - 1 = 4095,即可以表示0,1….4094這4095個數(shù)字
- 表示同一機器同一時間戳(毫秒)中產(chǎn)生的4095個ID序號
優(yōu)點
- 所有生成的id按時間趨勢遞增
- 整個分布式內(nèi)不會產(chǎn)生重復id,因為有datacenterId和workerId來做區(qū)分。
- 毫秒數(shù)在高位,自增序列在低位,整個ID都是趨勢遞增的
- 不依賴數(shù)據(jù)庫、redis等第三方系統(tǒng),以服務的方式部署,穩(wěn)定性更高,生成ID的性能也是非常高的。
- 可以根據(jù)自身業(yè)務分配bit位,非常靈活。
缺點
- 依賴機器時鐘,如果機器時鐘回退,會導致重復ID生成
- 在單機上是遞增的,但是由于設計到分布式環(huán)境,每臺機器上的時鐘不可能完全同步,有時候會出現(xiàn)不是全局遞增的情況。(此缺點可以認為蕪鎖胃,一般分布式ID只要求趨勢遞增,并不會嚴格要求遞增,90%的需求都只需要趨勢遞增)
源碼
- /**
- * twitter的snowflake算法 -- java實現(xiàn)
- *
- * @author beyond
- * @date 2016/11/26
- */
- public class SnowFlake {
- /**
- * 起始的時間戳
- */
- private final static long START_STMP = 1480166465631L;
- /**
- * 每一部分占用的位數(shù)
- */
- private final static long SEQUENCE_BIT = 12; //序列號占用的位數(shù)
- private final static long MACHINE_BIT = 5; //機器標識占用的位數(shù)
- private final static long DATACENTER_BIT = 5;//數(shù)據(jù)中心占用的位數(shù)
- /**
- * 每一部分的最大值
- */
- private final static long MAX_DATACENTER_NUM = -1L ^ (-1L << DATACENTER_BIT);
- private final static long MAX_MACHINE_NUM = -1L ^ (-1L << MACHINE_BIT);
- private final static long MAX_SEQUENCE = -1L ^ (-1L << SEQUENCE_BIT);
- /**
- * 每一部分向左的位移
- */
- private final static long MACHINE_LEFT = SEQUENCE_BIT;
- private final static long DATACENTER_LEFT = SEQUENCE_BIT + MACHINE_BIT;
- private final static long TIMESTMP_LEFT = DATACENTER_LEFT + DATACENTER_BIT;
- private long datacenterId; //數(shù)據(jù)中心
- private long machineId; //機器標識
- private long sequence = 0L; //序列號
- private long lastStmp = -1L;//上一次時間戳
- public SnowFlake(long datacenterId, long machineId) {
- if (datacenterId > MAX_DATACENTER_NUM || datacenterId < 0) {
- throw new IllegalArgumentException("datacenterId can't be greater than MAX_DATACENTER_NUM or less than 0");
- }
- if (machineId > MAX_MACHINE_NUM || machineId < 0) {
- throw new IllegalArgumentException("machineId can't be greater than MAX_MACHINE_NUM or less than 0");
- }
- this.datacenterId = datacenterId;
- this.machineId = machineId;
- }
- /**
- * 產(chǎn)生下一個ID
- *
- * @return
- */
- public synchronized long nextId() {
- long currStmp = getNewstmp();
- if (currStmp < lastStmp) {
- throw new RuntimeException("Clock moved backwards. Refusing to generate id");
- }
- if (currStmp == lastStmp) {
- //相同毫秒內(nèi),序列號自增
- sequence = (sequence + 1) & MAX_SEQUENCE;
- //同一毫秒的序列數(shù)已經(jīng)達到最大
- if (sequence == 0L) {
- currStmp = getNextMill();
- }
- } else {
- //不同毫秒內(nèi),序列號置為0
- sequence = 0L;
- }
- lastStmp = currStmp;
- return (currStmp - START_STMP) << TIMESTMP_LEFT //時間戳部分
- | datacenterId << DATACENTER_LEFT //數(shù)據(jù)中心部分
- | machineId << MACHINE_LEFT //機器標識部分
- | sequence; //序列號部分
- }
- private long getNextMill() {
- long mill = getNewstmp();
- while (mill <= lastStmp) {
- mill = getNewstmp();
- }
- return mill;
- }
- private long getNewstmp() {
- return System.currentTimeMillis();
- }
- public static void main(String[] args) {
- SnowFlake snowFlake = new SnowFlake(2, 3);
- for (int i = 0; i < (1 << 12); i++) {
- System.out.println(snowFlake.nextId());
- }
- }
- }
測試
- //測試使用雪花算法生成ID
- //構造函數(shù)中傳入datacenterId和workerId
- SnowFlake snowFlake = new SnowFlake(1,1);
- for (int i = 0; i < 10; i++) {
- long id = snowFlake.nextId();
- System.out.println("id:" + id + "\t" + String.valueOf(id).length() + "位");
- System.out.println("------------------------------------------");
- }
Spring Boot整合雪花算法
引入hutool-all,maven依賴引入如下:
cn.hutool hutool-all 5.4.2 org.springframework.boot spring-boot-starter-web 2.2.1.RELEASE org.projectlombok lombok 1.18.16
創(chuàng)建一個SnowFlake配置類
- @Configuration
- public class SnowFlakeConfig {
- @Value("${application.datacenterId}")
- private Long datacenterId;
- @Value("${application.workerId}")
- private Long workerId;
- /***
- * 注入一個生成雪花ID的對象
- * @return
- */
- @Bean
- public Snowflake snowflake() {
- return new Snowflake(workerId,datacenterId);
- }
- }
yml配置文件:
- application:
- datacenterId: 2
- workerId: 1
- server:
- port: 7777
service 層:
- @Service
- public class OrderService {
- @Autowired
- private Snowflake snowflake;
- public String getIdBySnowFlake() {
- return String.valueOf(snowflake.nextId());
- }
- }
其他開源的解決方案
很多大廠都對雪花算法做出了改進,開源了一些改進方案,如下:
- 百度開源的分布式唯一ID生成器UidGenerator
- Leaf–美團點評分布式ID生成系統(tǒng)
分享題目:帶你吃透幾種大廠分布式ID設計方案
URL網(wǎng)址:http://m.fisionsoft.com.cn/article/copicii.html


咨詢
建站咨詢
