唯一ID生成原理與phper的深度思考

date: 2017-01-03 13:14

唯一ID引發的血案

寫這篇 blog 原因是業務中遇到 生成唯一ID的場景 卻沒有按照需求生成唯一ID,由此引發了一番 亂燉,業務中目前使用的方案:

// mysql 自增ID + 事務 + 時間 + 隨機數
public function generateTradeNumber()
{
    $tradeTime = date('YmdHi', time());

    $lastTrade     = TradeNumber::findBySql('SELECT * FROM `Trade` ORDER BY id DESC LIMIT 1 FOR UPDATE');
    $lastTradeTime = '';
    if (!empty($lastTrade)) {
        $lastTradeNumber = $lastTrade->getTradeNumber();
        $lastTradeTime   = substr($lastTradeNumber, 0, 12);
        $lastTradeSerial = substr($lastTradeNumber, 12);
        if ($tradeTime == $lastTradeTime) {
            return $lastTradeTime . ($lastTradeSerial >= 99999 ? $lastTradeSerial + 1 : '0' . ($lastTradeSerial + 1));
        }
    }

    $initSerialNumber = rand(10000, 99999);
    return $tradeTime . '0' . $initSerialNumber;
}

簡單解釋一下:

  • 唯一 TradeNumber 由 2 部分組成:當前時間 12 位 + 6 位數字
  • 時間粒度到 date('YmdHi', time())
  • 每次生成時,先鎖死最后一條 Trade,當前分鐘第一個進來的 Trade 會分配 rand(10000, 99999)(這樣做是為了保持長度一致,以及防止被人找出規律來),之后的 Trade 在此基礎上 +1

然而實際上并沒有達到 唯一ID 的目的,查詢數據庫發現還是有重復 TradeNumber 存在

php uniqid() 分析

php manual uniqid()

詳細的分析當然是直接看源碼最清楚了,不過 php manual 已經說了:based on the current time in microseconds。并且 php manual 中已經詳細說明了這個問題,詳細可以查看 php manual note 中的內容,note 中提供了另外一種方案:

function uniqidReal($lenght = 13) {
     // uniqid gives 13 chars, but you could adjust it to your needs.
     if (function_exists("random_bytes")) {
         $bytes = random_bytes(ceil($lenght / 2));
     } elseif (function_exists("openssl_random_pseudo_bytes")) {
         $bytes = openssl_random_pseudo_bytes(ceil($lenght / 2));
     } else {
         throw new Exception("no cryptographically secure random function available");
     }
     return substr(bin2hex($bytes), 0, $lenght);
 }

這種方案的原理:隨機數。當然這個隨機數概率就比 rand(10000, 99999) 小多了,畢竟加入了英文字母。那么,回到我們的主題,隨機數 === 唯一ID ?顯然,無論概率怎么小,還是存在重復的可能(-_-)。

唯一ID原理

Linux多線程與同步:http://www.cnblogs.com/vamei/archive/2012/10/09/2715393.html
《高性能linux服務器編程》- 高性能 io - 進程相關部分
唯一ID生成原理與PHP實現:http://mp.weixin.qq.com/s/bagOgzdwLyZv_ITNVnYfoQ / https://github.com/liexusong/atom

其實非常的簡單,只要保證從同一個地方產生,并按照不重復的規律生成。聯想一下 mysql 的自增ID,就是 同一張表,依次遞增。所以,自增ID真正的難點:同一個地方生成。但是,在多進程、多線程的場景下,這個 地方 就會成為 競態資源。要了解race condition, mutex和condition variable的概念,請參考上面的博文 -- Linux多線程與同步。

多線程同步方式:

  • 互斥鎖(mutex):一個線程申請了互斥鎖,然后進行 原子操作,其他進程必須要等待此線程釋放互斥鎖,才能成功申請。
  • 條件變量(condition variable):配合互斥鎖一起使用,在 多個線程等待某個條件發生 時的場景下使用
  • 讀寫鎖(reader-writer lock):和互斥鎖類似,鎖有 3 種狀態 -- R、W、unlock。如果資源上 R 鎖,其他線程可以繼續申請 R 鎖;如果需要申請 W 鎖,必須等待其他進程都釋放 R 鎖;如果資源上 W 鎖,其他線程必須等待其釋放

多進程的同步方式:

  • 管道
  • 共享內存

是不是有點峰回路轉,怎么突然跑到操作系統層面了?whatever,你曾經學的操作系統原理,就是這么有用。

再來簡單的剖析一下 唯一ID生成原理與PHP實現 這篇博文中提到的 snowflake算法:

  • 唯一ID組成:64bit, 1bit(不用)+ 41bit(時間戳)+ 10bit(機器id)+ 12bit(序列號)
  • 時間毫秒級(可以用2082年),每毫秒最多 2^12=4096 個請求,如果超過了,就分配到下一毫秒
  • 為什么分機器ID:達到分布式計算,避免不同機器間同步帶來的性能損耗

代碼就不貼了,大家自己看,挺簡單的。

唯一ID的php實現

韓天峰(Rango) - 從零開始編寫第一個PHP擴展:http://wiki.swoole.com/wiki/page/238.html
淘寶信海龍 php 擴展開發:http://www.bo56.com/category/programming-language/php-programming-language
唯一ID生成原理與PHP實現:http://mp.weixin.qq.com/s/bagOgzdwLyZv_ITNVnYfoQ / https://github.com/liexusong/atom
韓天峰(Rango) Yii/Yaf/Swoole3個框架的壓測性能對比:http://rango.swoole.com/archives/254

由于 php-fpm 是基于進程管理,每個pfm子進程都是相互獨立的,想要實現 同一個地方生成,就需要依靠擴展。而php擴展開發,不少業內大牛都貼了教程,無恥引用幾個。

推薦學習次序:

  • 韓天峰(Rango) - 從零開始編寫第一個PHP擴展
  • 淘寶信海龍 php 擴展開發系列教程
  • 查看 https://github.com/liexusong/atom 源碼:github 上的文檔只提到了 2 個函數,還是直接讀源碼吧,主要是 atom.c

測試:

  • cli 下的測試
// php test
for ($i=0; $i < 20; $i++) {
    $id = atom_next_id(); // different
    $info = atom_explain($id); // the same
    echo $id . "\t" . date('YmdHis', $info['timestamp']) . "\t" . $info['datacenter'] . "\t" . $info['worker'] . "\n";
}

// ext atom source code
retval = ((current - context->twepoch) << context->timestamp_left_shift)
    | (context->datacenter_id << context->datacenter_id_shift)
    | (context->worker_id << context->worker_id_shift)
    | context->sequence;

寫在最后

《高性能mysql》
MOOC - 《linux操作系統原理與應用》
swoole官方教程和 rango 的博客
我的 docker 環境:https://coding.net/u/daydaygo/p/docker/git
《Just for Fun》linus 自傳

由于本身的技術局限,對 mysql 中 這套 SELECT FOR UPDATE 不太熟悉,這個點有待提高,推薦《高性能mysql》。

操作系統原理到底有沒有用?如果看到 進程、線程、共享內存、管道 等等名詞感覺不太熟悉(熟悉名詞和知道怎么用還隔著好遠呢),最好還是多了解一點。

  • 推薦《linux操作系統原理與應用》:這個是大學教材,找個MOOC網看看在線視頻,網易公開課、中國大學MOOC、學堂在線 等等
  • 《高性能linux服務器編程》:還有鼎鼎大名的《Unix Network Programing》,就是實在是太厚了
  • swoole官方教程和 rango 的博客:c10k問題、時間循環、swoole/nginx/go/nodejs 實現原理對比、線程/進程/協程 對比 等等

當然,還有一個問題需要解決:說了這么半天,程序還是得要在 linux 下面跑,我的 windows 怎么辦,給自己打一下廣告,我的 docker 環境:https://coding.net/u/daydaygo/p/docker/git

最后的最后,寫在這個沒有出去浪的元旦假期:

  • 且將新火試新茶,詩酒趁年華
  • Just for Fun
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,786評論 6 534
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,656評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,697評論 0 379
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,098評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,855評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,254評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,322評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,473評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,014評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,833評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,016評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,568評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,273評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,680評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,946評論 1 288
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,730評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,006評論 2 374

推薦閱讀更多精彩內容

  • 從三月份找實習到現在,面了一些公司,掛了不少,但最終還是拿到小米、百度、阿里、京東、新浪、CVTE、樂視家的研發崗...
    時芥藍閱讀 42,325評論 11 349
  • 經過稍微整理下過去的notes,結果工作經歷和自學。綜合如下為涉及的主要技術領域,接下來將按照這個來進行文章整理。...
    DeleiGuo閱讀 585評論 0 49
  • 一開始剛玩微信時也發朋友圈也看朋友圈,但隨著微商的崛起,大量的轉發,好久也同事居多,公司有點事情就是刷屏的節奏,...
    sixrain閱讀 246評論 0 0
  • 說雞圈里五只雞,三黑倆白。那三兒找時間就啄著這倆滿雞圈躲。后來就不見了一只白雞;再后來發現,雞圈石頭縫里夾了那雞的...
    曉拙閱讀 156評論 0 0
  • 為了自己傻逼的行為記錄一章,以后會不斷更新,希望大家不要學我。 今天最傻逼的行為是: 明星項目 + 項目標題 La...
    西邊雨閱讀 871評論 0 0