數據異構的武器-BINLOG+MQ

1、定義

何謂數據異構,上周交易部門商品的同事過來做分享,又看到這個詞,他的PPT里面是 數據庫異構。其實我們以前做的事情,也是可以成為數據異構。比如我們將DB里面的數據持久化到REDIS里面去,就是一種數據異構的方式。如果要下個定義的話:把數據按需(數據結構、存取方式、存取形式)異地構建存儲。

2、常見應用場景

分庫分表中有一個最為常見的場景,為了提升數據庫的查詢能力,我們都會對數據庫做分庫分表操作。比如訂單庫,開始的時候我們是按照訂單ID維度去分庫分表,那么后來的業務需求想按照商家維度去查詢,比如我想查詢某一個商家下的所有訂單,就非常麻煩。這個時候通過數據異構就能很好的解決此問題,比如下圖

異構維度.png

總結起來大概有以下幾種場景

  1. 數據庫鏡像
  2. 數據庫實時備份
  3. 多級索引
  4. search build(比如分庫分表后的多維度數據查詢)
  5. 業務cache刷新
  6. 價格、庫存變化等重要業務消息

3、數據異構方向

異構的幾種方向.png

在日常業務開發中大致可以分為以上幾種數據去向,DB-DB這種方式,一般常見于分庫分表后,聚合查詢的時候,比如我們按照訂單ID去分庫分表,那么這個時候我們要按照用戶ID去查詢,查詢這個用戶下面的訂單就非常不方便了,當然可以使用統一加到內存中去,但這樣不太好。所以我們就可以用數據庫異構的方式,重新按照用戶ID的維度來分一個表,像在上面常見應用場景中介紹的那樣。把數據異構到redis、elasticserach、slor中去要解決的問題跟按照多維度來查詢的需求差不多。這些存儲天生都有聚合的功能。當然同時也可以提高查詢性能,應對大訪問量,比如redis這種抗量銀彈。

4、數據異構的常用方法

3.1、完整克隆

這個很簡單就是將數據庫A,全部拷貝一份到數據庫B,這樣的使用場景是離線統計跑任務腳本的時候可以。缺點也很突出,不適用于持續增長的數據。

3.2、標記同步

這個是業務場景比較簡單的時候,理想情況下數據不會發生改變,比如日志數據,這個時候可以去標記,比如時間戳,這樣當發生故障的時候還可以回溯到上一次同步點,開始重新同步數據。

3.3、BINLOG方式

通過實時的訂閱mysql的binlog日志,消費到這些日志后,重新構建數據結構插入一個新的數據庫或者是其他存儲比如es、slor等等。訂閱binlog日志可以比較好的能保證數據的一致性。

3.4、MQ方式

業務數據寫入DB的同時,也發送MQ一份,也就是業務里面實現雙寫。這種方式比較簡單,但也很難保證數據一致性,對簡單的業務場景可以采用這種方式。

5、binlog和mq方式重點介紹

5.1、binglog
5.1.1、訂閱binglog日志異構流程圖
canal異構方式.png
5.1.2、使用說明

binglog是數據的日志記錄方式,每次對數據的操作都會有binlog日志?,F在開源的訂閱binlog日志的組件,比如使用比較廣泛的canal,它是阿里開源的基于mysql數據庫binlog的增量訂閱和消費組件。由于cannal服務器目前讀取的binlog事件只保存在內存中,并且只有一個canal客戶端可以進行消費。所以如果需要多個消費客戶端,可以引入activemq或者kafka。如上圖綠色虛線框部分。我們還需要確保全量對比來保證數據的一致性(canal+mq的重試機制基本可以保證寫入異構庫之后的數據一致性),這個時候可以有一個全量同步WORKER程序來保證,如上圖深綠色部分。

5.1.3、canal的工作原理:

先來看下mysql主備(主從)復制原理如下圖,在此原理基礎之上我們再來理解canal的實現原理就一眼能明白了。

mysql主備復制實現原理.jpg

mysql主備(主從)復制原理,從上層來看,復制分成三步:

  1. master將改變記錄到二進制日志(binary log)中(這些記錄叫做二進制日志事件,binary log events,可以通過show binlog events進行查看);
  2. slave將master的binary log events拷貝到它的中繼日志(relay log);
  3. slave重做中繼日志中的事件,將改變反映它自己的數據。
    再來看下canal的原理,如下圖:
    canal工作原理.jpg

    cannal實現原理相對比較簡單(參照上面的mysql主備復制實現原理):
  4. canal模擬mysql slave的交互協議,偽裝自己為mysql slave,向mysql master發送dump協議
  5. mysql master收到dump請求,開始推送binary log給slave(也就是canal)
  6. canal解析binary log對象(原始為byte流)
    我們在部署canal server的時候要部署多臺,來保證高可用。但是canal的原理,是只有一臺服務器在跑處理,其它的服務器作為熱備。canal server的高可用是通過zookeeper來維護的。
    有關canal更具體的使用和詳細原理請參照:https://github.com/alibaba/canal
5.1.4、注意點
  • 1、確認MySQL開啟binlog,使用show variables like 'log_bin'; 查看ON為已開啟
  • 2、確認目標庫可以產生binlog,show master status 注意Binlog_Do_DB,Binlog_Ignore_DB參數
  • 3、確認binlog格式為ROW,使用show variables like 'binlog_format'; 非ROW模式登錄MySQL執行 set global binlog_format=ROW; flush logs; 或者通過更改MySQL配置文件并重啟MySQL生效。
  • 4、為保證binlake服務可以獲取Binlog,需添加授權,執行 GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON . TO 'admin'@'%' identified by 'admin'; FLUSH PRIVILEGES;
5.2、mq方式
MQ異構方式.png

mq的方式,就相對簡單,實際上是在業務邏輯中寫DB的同時去寫一次MQ,但是這種方式不能夠保證數據一致性,就是不能保證跨資源的事務。注:調用第三方遠程RPC的操作一定不要放到事務中。

6、總結

本文主要敘述了數據異構的使用場景,方法。這里面涉及到的activemq以及canal并沒有深入分析,關于這塊的內容可以直接參考相關具體文檔,文中已給了鏈接地址。根據數據異構的定義,將數據異地構建存儲,我們可以應用的地方就非常多,文中說的分庫分表之后按照其它維度來查詢的時候,我們想脫離DB直接用緩存比如redis來抗量的時候。數據異構這種方式都能夠很好的幫助我們來解決諸如此類的問題。
轉載請注明出處,并附上鏈接http://www.lxweimin.com/p/99d1762b2fda

參考資料:https://github.com/alibaba/canal

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,739評論 6 534
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,634評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 176,653評論 0 377
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,063評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,835評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,235評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,315評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,459評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,000評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,819評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,004評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,560評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,257評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,676評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,937評論 1 288
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,717評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,003評論 2 374

推薦閱讀更多精彩內容