美團分布式ID生成服務——支持號段模式與雪花主鍵兩種模式

原文地址:https://tech.meituan.com/2019/03/07/open-source-project-leaf.html

Leaf是美團基礎研發平臺推出的一個分布式ID生成服務,名字取自德國哲學家、數學家萊布尼茨的一句話:“There are no two identical leaves in the world.”Leaf具備高可靠、低延遲、全局唯一等特點。Leaf項目已經在Github上開源:https://github.com/Meituan-Dianping/Leaf

Leaf特性

  1. 全局唯一,絕對不會出現重復的ID,且ID整體趨勢遞增。
  2. 高可用,服務完全基于分布式架構,即使MySQL宕機,也能容忍一段時間的數據庫不可用。
  3. 高并發低延時,在CentOS 4C8G的虛擬機上,遠程調用QPS可達5W+,TP99在1ms內。
  4. 接入簡單,直接通過公司RPC服務或者HTTP調用即可接入。

Leaf誕生

Leaf第一個版本采用了預分發的方式生成ID,即可以在DB之上掛N個Server,每個Server啟動時,都會去DB拿固定長度的ID List。這樣就做到了完全基于分布式的架構,同時因為ID是由內存分發,所以也可以做到很高效。接下來是數據持久化問題,Leaf每次去DB拿固定長度的ID List,然后把最大的ID持久化下來,也就是并非每個ID都做持久化,僅僅持久化一批ID中最大的那一個。這個方式有點像游戲里的定期存檔功能,只不過存檔的是未來某個時間下發給用戶的ID,這樣極大地減輕了DB持久化的壓力。

整個服務的具體處理過程如下:


  • Leaf Server 1:從DB加載號段[1,1000]。
  • Leaf Server 2:從DB加載號段[1001,2000]。
  • Leaf Server 3:從DB加載號段[2001,3000]。

用戶通過Round-robin的方式調用Leaf Server的各個服務,所以某一個Client獲取到的ID序列可能是:1,1001,2001,2,1002,2002……也可能是:1,2,1001,2001,2002,2003,3,4……當某個Leaf Server號段用完之后,下一次請求就會從DB中加載新的號段,這樣保證了每次加載的號段是遞增的。

Leaf數據庫中的號段表格式如下:

+-------------+--------------+------+-----+-------------------+-----------------------------+
| Field       | Type         | Null | Key | Default           | Extra                       |
+-------------+--------------+------+-----+-------------------+-----------------------------+
| biz_tag     | varchar(128) | NO   | PRI |                   |                             |
| max_id      | bigint(20)   | NO   |     | 1                 |                             |
| step        | int(11)      | NO   |     | NULL              |                             |
| desc        | varchar(256) | YES  |     | NULL              |                             |
| update_time | timestamp    | NO   |     | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP |
+-------------+--------------+------+-----+-------------------+-----------------------------+

Leaf Server加載號段的SQL語句如下:

Begin
UPDATE table SET max_id=max_id+step WHERE biz_tag=xxx
SELECT tag, max_id, step FROM table WHERE biz_tag=xxx
Commit

整體上,V1版本實現比較簡單,主要是為了盡快解決業務層DB壓力的問題,而快速迭代出的一個版本。因而在生產環境中,也發現了些問題。比如:

  1. 在更新DB的時候會出現耗時尖刺,系統最大耗時取決于更新DB號段的時間。
  2. 當更新DB號段的時候,如果DB宕機或者發生主從切換,會導致一段時間的服務不可用。

Leaf雙Buffer優化

為了解決這兩個問題,Leaf采用了異步更新的策略,同時通過雙Buffer的方式,保證無論何時DB出現問題,都能有一個Buffer的號段可以正常對外提供服務,只要DB在一個Buffer的下發的周期內恢復,就不會影響整個Leaf的可用性。

在這里插入圖片描述

這個版本代碼在線上穩定運行了半年左右,Leaf又遇到了新的問題:

  1. 號段長度始終是固定的,假如Leaf本來能在DB不可用的情況下,維持10分鐘正常工作,那么如果流量增加10倍就只能維持1分鐘正常工作了。
  2. 號段長度設置的過長,導致緩存中的號段遲遲消耗不完,進而導致更新DB的新號段與前一次下發的號段ID跨度過大。

Leaf動態調整Step

假設服務QPS為Q,號段長度為L,號段更新周期為T,那么Q * T = L。最開始L長度是固定的,導致隨著Q的增長,T會越來越小。但是Leaf本質的需求是希望T是固定的。那么如果L可以和Q正相關的話,T就可以趨近一個定值了。所以Leaf每次更新號段的時候,根據上一次更新號段的周期T和號段長度step,來決定下一次的號段長度nextStep:

  • T < 15min,nextStep = step * 2
  • 15min < T < 30min,nextStep = step
  • T > 30min,nextStep = step / 2

至此,滿足了號段消耗穩定趨于某個時間區間的需求。當然,面對瞬時流量幾十、幾百倍的暴增,該種方案仍不能滿足可以容忍數據庫在一段時間不可用、系統仍能穩定運行的需求。因為本質上來講,Leaf雖然在DB層做了些容錯方案,但是號段方式的ID下發,最終還是需要強依賴DB。

MySQL高可用

在MySQL這一層,Leaf目前采取了半同步的方式同步數據,通過公司DB中間件Zebra加MHA做的主從切換。未來追求完全的強一致,會考慮切換到MySQL Group Replication。

現階段由于公司數據庫強一致的特性還在演進中,Leaf采用了一個臨時方案來保證機房斷網場景下的數據一致性:

  • 多機房部署數據庫,每個機房一個實例,保證都是跨機房同步數據。
  • 半同步超時時間設置到無限大,防止半同步方式退化為異步復制。

Leaf監控

針對服務自身的監控,Leaf提供了Web層的內存數據映射界面,可以實時看到所有號段的下發狀態。比如每個號段雙buffer的使用情況,當前ID下發到了哪個位置等信息都可以在Web界面上查看。


Leaf Snowflake

Snowflake,Twitter開源的一種分布式ID生成算法。基于64位數實現,下圖為Snowflake算法的ID構成圖。


  • 第1位置為0。
  • 第2-42位是相對時間戳,通過當前時間戳減去一個固定的歷史時間戳生成。
  • 第43-52位是機器號workerID,每個Server的機器ID不同。
  • 第53-64位是自增ID。
    這樣通過時間+機器號+自增ID的組合來實現了完全分布式的ID下發。

在這里,Leaf提供了Java版本的實現,同時對Zookeeper生成機器號做了弱依賴處理,即使Zookeeper有問題,也不會影響服務。Leaf在第一次從Zookeeper拿取workerID后,會在本機文件系統上緩存一個workerID文件。即使ZooKeeper出現問題,同時恰好機器也在重啟,也能保證服務的正常運行。這樣做到了對第三方組件的弱依賴,一定程度上提高了SLA。

未來規劃

  1. 號段加載優化:Leaf目前重啟后的第一次請求還是會同步加載MySQL,之所以這么做而非服務初始化加載號段的原因,主要是MySQL中的Leaf Key并非一定都被這個Leaf服務節點所加載,如果每個Leaf節點都在初始化加載所有的Leaf Key會導致號段的大量浪費。因此,未來會在Leaf服務Shutdown時,備份這個服務節點近一天使用過的Leaf Key列表,這樣重啟后會預先從MySQL加載Key List中的號段。
  2. 單調遞增:簡易的方式,是只要保證同一時間、同一個Leaf Key都從一個Leaf服務節點獲取ID,即可保證遞增。需要注意的問題是Leaf服務節點切換時,舊Leaf 服務用過的號段需要廢棄。路由邏輯,可采用主備的模型或者每個Leaf Key 配置路由表的方式來實現。

關于開源

分布式ID生成的方案有很多種,Leaf開源版本提供了兩種ID的生成方式:

  1. 號段模式:低位趨勢增長,較少的ID號段浪費,能夠容忍MySQL的短時間不可用。
  2. Snowflake模式:完全分布式,ID有語義。
    讀者可以按需選擇適合自身業務場景的ID下發方式。希望美團的方案能給予大家一些幫助,同時也希望各位能夠一起交流、共建。

Leaf項目Github地址:https://github.com/Meituan-Dianping/Leaf

原文地址:https://tech.meituan.com/2019/03/07/open-source-project-leaf.html

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,739評論 6 534
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,634評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,653評論 0 377
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,063評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,835評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,235評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,315評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,459評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,000評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,819評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,004評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,560評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,257評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,676評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,937評論 1 288
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,717評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,003評論 2 374

推薦閱讀更多精彩內容

  • 生成ID的基本要求 1.必須全局唯一,包括在分布式的環境下2.一般都需要單調遞增,因為一般都會存到數據庫,而Inn...
    知止9528閱讀 883評論 0 0
  • sqlmap用戶手冊 說明:本文為轉載,對原文中一些明顯的拼寫錯誤進行修正,并標注對自己有用的信息。 ======...
    wind_飄閱讀 2,073評論 0 5
  • MYSQL 基礎知識 1 MySQL數據庫概要 2 簡單MySQL環境 3 數據的存儲和獲取 4 MySQL基本操...
    Kingtester閱讀 7,830評論 5 116
  • 為什么分布式系統需要用到ID生成系統 在復雜分布式系統中,往往需要對大量的數據和消息進行唯一標識。如在美團點評的金...
    愛情小傻蛋閱讀 473評論 0 0
  • 50cmx50cm《紅梅斗方》2.25平尺 廖又蓉國畫紅梅 兼工帶寫無裝裱
    4182204ab311閱讀 667評論 0 2