Kafka入門總結

最近在工作中遇到一個這樣的需求,為區塊鏈網絡寫一個中間件,以發布-消費模型對上鏈流量進行整型,解決區塊鏈TPS低的問題。當上層高并發的流量過來后,流量統一進入中間件層,中間件對消息整合后才發送到區塊鏈上。

針對這個需求,經調研后決定選用Kafka,再次記錄下學習過程。

一、Kafka簡介

1.1 是什么

Apache Kafka 是一款開源的消息引擎系統。所謂的消息引擎系統,根據維基百科的定義:消息引擎系統是一組規范,企業利用這組規范在不同系統之間傳遞語義準確的消息,實現松耦合的異步式數據傳遞。通俗的講就是A發送消息到消息引起系統,B從消息引擎系統中讀取A發送的消息,消息引擎系統處理的核心對象就是消息。
Kafka采用二進制字節序列對消息進行編碼,從而在不同系統直接進行傳輸。Kafka支持兩種消息傳輸模型:

  • 點對點模型(Peer to Peer,P2P),A發布的消息只能被B消費。
  • 發布-訂閱模型,不同的消息根據關聯性抽象為主題(Topic),發布者向主題發送消息,訂閱者訂閱主題獲得消息,發布者和訂閱者是多對多的關系。

同時,Kafka又不僅僅是消息引擎系統,也是一個分布式流處理平臺。在0.10.0.0之前的版本中,官方對Kafka的定位是分布式、分區化且帶備份功能的提交日志(Commit Log)服務,而隨著Kafka的流行和應用場景越來越廣泛,很多公司將Kafka應用到了企業內部的數據管道中,一個系統的數據流入Kafka在流入另一個系統,基于Kafka在數據流轉中扮演的角色,社區在0.10.0.0版本中正式推出了流處理組件Kafka Streams,從這個版本開始,Kafka正式升級為分布式流處理平臺。

Kafka除了是消息引擎系統、分布式流處理平臺外,還能夠被用作分布式存儲系統。就目前而言,Kafka還是主要被用作消息引擎系統,不過分布式流處理平臺也被越來越多的人接受。

1.2 解決了什么問題

Kafka主要適用于兩類應用場景:

  • 構造實時的消息管道,在不同系統/應用直接可靠的傳輸消息(數據),相當于消息隊列。Kafka主要作為消息引擎系統使用。
  • 構建實時的流式應用程序,通過對topic進行轉換從而實現流處理。Kafka主要作為分布式流處理平臺使用。

Kafka作為消息引擎系統,最核心的價值是解決了“削峰填谷”的問題。利用Kafka可以對上下游系統進行流量解耦,上游系統瞬時突發流量,可以平緩的過渡到下游系統,不至于造成系統雪崩。

二、關鍵概念

Kafka有很多的專業術語,在剛接觸時,如果對這些術語沒有弄明白就直接動手實踐,會有些無所適從的感覺。

Record-消息
消息是Kafka主要的處理對象。

Topic-主題
主題是在消息之上的一種邏輯封裝,在實際使用中多用來區分具體的業務。在Kafka的發布-消費模型中,發布訂閱的對象就是主題。

Producer-生產者
向主題發布消息的客戶端稱為生產者,生產者可以向一個或多個主題發送消息。

Consumer-消費者
從主題中獲取消息的客戶端程序成為消費者。消費者可以同時訂閱從一個或多個主題。

Broker
Broker是Kafka的服務器端的服務進程,一個Kafka集群由多個Broker組成,Broker負責接收和處理客戶端(生產者和消費者)發送的請求并對消息進行持久化。

Replication-備份機制
Kafka實現高可用的機制之一。Kafka會把相同的數據拷貝到不同的機器上,這些相同的數據稱為副本(Replica)。Kafka定義了兩種副本:

  • 領導者副本(Leader Replica),對外提供服務,生產者向領導者副本寫消息,消費者從領導者副本讀消息。
  • 追隨者副本(Follower Replica),不對外提供服務,向領導者副本發送請求,同步最新消息,與領導者保持同步。

Partition-分區
副本機制保證了Kafka消息的持久化,確不能解決伸縮性問題,當領導者副本過多,會導致單臺機器的Broker服務無法承載。針對這個問題,Kafka使用分區來解決。
Kafka將每個主題劃分為多個分區,每個分區是一組有序的消息日志,生產者生產的消息只會被發送到一個分區中。分區編號采用有序整數,從0開始。
副本是在分區的層級上定義的,每個分區可以配置若干個副本,其中只有一個領導者副本,若干個追隨者副本。

Consumer Offset-消費者位移
生產者向分區寫入消息時,每條消息在分區中的位置信息由一個叫位移(Offset)的數據來表征。分區位移從0開始,并依次累加。

Consumer Group-消費者組
Kafka實現點對點消費模型的方法是引入了消費者組。消費者組是指多個消費者實例共同組成的一個組,同時消費多個分區以實現高吞吐。

Rebalance-重平衡
消費者組內某個消費者實例掛掉后,其他消費者實例自動重新分配訂閱主題分區的過程。Rebalance 是 Kafka 消費者端實現高可用的重要手段。

從Kafka的核心概念中,可以看到三層消息架構:

  • 第一層是主題層,每個主題可以配置 M 個分區,而每個分區又可以配置 N 個副本。
  • 第二層是分區層,每個分區的 N 個副本中只能有一個充當領導者角色,對外提供服務;其他 N-1 個副本是追隨者副本,只是提供數據冗余之用。
  • 第三層是消息層,分區中包含若干條消息,每條消息的位移從 0 開始,依次遞增。最后,客戶端程序只能與分區的領導者副本進行交互。

Kafka各概念之間的關系如下圖所示。


image.png

三、參考

https://kafka.apachecn.org/intro.html
http://gk.link/a/103IA

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,333評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,491評論 3 416
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,263評論 0 374
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,946評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,708評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,186評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,255評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,409評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,939評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,774評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,976評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,518評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,209評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,641評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,872評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,650評論 3 391
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,958評論 2 373