摘要:使用生成很多都是在分布式場景下使用,我看了下網上有其中有幾篇實現的都沒有考慮到線程安全。現在有了的鎖和協程的加持,對于我們開發線程安全和高并發模擬還是很方便的,這里用結合來學習下實現最簡單的好久沒寫,感覺沒有真寫不了了。
Twitter 的 snowflake 在分布式生成唯一 UUID 應用還是蠻廣泛的,基于 snowflake 的一些變種的算法網上也有不少。使用 snowflake 生成 UUID 很多都是在分布式場景下使用,我看了下網上有其中有幾篇 PHP 實現的都沒有考慮到線程安全。現在 PHP 有了 Swoole 的鎖和協程的加持,對于我們開發線程安全和高并發模擬還是很方便的,這里用 PHP 結合 Swoole 來學習下實現最簡單的 snowflake(好久沒寫 PHP,感覺沒有 IDE 真寫不了 PHP 了)。
先來看以下 snowflake 的結構:
生成的數值是 64 位,分成 4 個部分:
第一個 bit 為符號位,最高位為 0 表示正數
第二部分 41 個 bit 用于記錄生成 ID 時候的時間戳,單位為毫秒,所以該部分表示的數值范圍為 2^41 - 1(69 年),它是相對于某一時間的偏移量
第三部分的 10 個 bit 表示工作節點的 ID,表示數值范圍為 2^10 - 1,相當于支持 1024 個節點
第四部分 12 個 bit 表示每個工作節點沒毫秒生成的循環自增 id,最多可以生成 2^12 -1 個 id,超出歸零等待下一毫秒重新自增
先貼下代碼:
self::WORKER_MAX) { trigger_error("Worker ID 超出范圍"); exit(0); } $this->timestamp = 0; $this->workerId = $workerId; $this->sequence = 0; $this->lock = new swoole_lock(SWOOLE_MUTEX); } /** * 生成ID * @return int */ public function getId() { $this->lock->lock(); // 這里一定要記得加鎖 $now = $this->now(); if ($this->timestamp == $now) { $this->sequence++; if ($this->sequence > self::SEQUENCE_MAX) { // 當前毫秒內生成的序號已經超出最大范圍,等待下一毫秒重新生成 while ($now <= $this->timestamp) { $now = $this->now(); } } } else { $this->sequence = 0; } $this->timestamp = $now; // 更新ID生時間戳 $id = (($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence; $this->lock->unlock(); //解鎖 return $id; } /** * 獲取當前毫秒 * @return string */ public function now() { return sprintf("%.0f", microtime(true) * 1000); } }
其實邏輯并不復雜,解釋一下代碼中的位運算:
-1 ^ (-1 << self::SEQUENCE_BITS) 就是-1的二進制表示為1的補碼,其實等同于 : 2**self::SEQUENCE_BITS - 1
最后部分左移后或運算:
(($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence;
這里主要是對除了第一位符號位以外的三個部分進行左移相應的偏移量使其歸位,并通過或運算重新整合成上面 snowflake 的結構,比如我們用 3 部分 4 位來演示一下該歸并操作:
0000 0000 0010 --左移0位--> 0000 0000 0010 0000 0000 0100 --左移4位--> 0000 0100 0000 --或操作-->1000 0100 0010 0000 0000 1000 --左移8位--> 1000 0000 0000
下面借助 Swoole 的協程和 channel 來暴力測試一下,看看生成的 ID 是否會出現重復的狀況:
$snowflake = new Snowflake(1); $chan = new chan(100000); $n = 100000; for ($i = 0; $i < $n; $i++) { go(function () use ($snowflake, $chan) { $id = $snowflake->getId(); $chan->push($id); }); } go(function () use ($chan, $n) { $arr = []; for ($i = 0; $i < $n; $i++) { $id = $chan->pop(); if (in_array($id, $arr)) { exit("ID 已存在"); } array_push($arr, $id); } }); $chan->close(); echo "ok";
跑了一下,確實不會出現重復的 ID,對了,我用 Golang 同樣實現了 snowflake 并協程序方式跑了同樣的測試,PHP 的執行時間是大約 12 秒左右,Golang 只需要 1 秒。文章有什么錯誤還請指正,謝謝。
轉載請注明: 轉載自Ryan 是菜鳥 | LNMP 技術棧筆記
如果覺得本篇文章對您十分有益,何不 打賞一下
本文鏈接地址: PHP 實現 Snowflake 生成分布式唯一 ID
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/29702.html
摘要:所以就誕生了這個項目,以下為線程安全版本和非線程安全版本差別。非線程安全版本線程安全版本安裝示例注意區間在超出范圍將會報告一個致命錯誤協議版權歸屬于請遵守協議 php_snowflake 項目地址 什么是 php_snowflake? 推特分布式id生成算法SnowFlake PHP 的實現 需求 PHP >= 5.6 (5.5以下的自行測試) 不支持windows 說明 純PH...
摘要:原文地址唯一的生成并不是一件小事想說愛它也并不是像簡單來一個這樣一件容易的事為什么要唯一數據庫的自增在分庫的時候會是一場災難假設分兩個庫因為每個庫都會開始從開始自增屆時系統中將會出現兩個為的用戶自增會暴露用戶量或者其他業務量自增會讓有心者 [原文地址:https://blog.ti-node.com/blog...] 唯一ID的生成并不是一件小事 , 想說愛它 , 也并不是像簡單來一個...
摘要:出于以上兩個原因,我們需要自己的發號器來產生。與此同時,為了保證執行,具有原子性,我們使用來進行實現。由于能力和水平有限,難免會有紕漏,希望及時指出。參考文章分布式生成器實現上實現原理 1、為什么要實現發號器 很多地方我們都需要一個全局唯一的編號,也就是uuid。舉一個常見的場景,電商系統產生訂單的時候,需要有一個對應的訂單編號。在composer上我們也可以看到有很多可以產生uuid...
閱讀 1160·2021-10-15 09:39
閱讀 3064·2021-09-10 10:50
閱讀 3460·2019-08-30 15:53
閱讀 1886·2019-08-30 15:52
閱讀 2573·2019-08-29 15:31
閱讀 1983·2019-08-26 13:43
閱讀 2602·2019-08-26 13:37
閱讀 1448·2019-08-23 18:31