Kafka保證消息不丟失不重復

簡單總結：
消費端重復消費：建立去重表
消費端丟失數據：關閉自動提交offset，處理完之后受到移位，enable.auto.commit=false 關閉自動提交位移
生產端重復發送：消費端消費之前從去重表中判重
生產端丟失數據：這個是最麻煩的情況
解決策略：
1.異步方式緩沖區滿了，就阻塞在那，等著緩沖區可用，不能清空緩沖區
2.發送消息之后回調函數，發送成功就發送下一條，發送失敗就記在日志中，等著定時腳本來掃描（發送失敗可能并不真的發送失敗，只是沒收到反饋，定時腳本可能會重發）

數據丟失情況：
1）使用同步模式的時候，有3種狀態保證消息被安全生產，在配置為1（只保證寫入leader成功）的話，如果剛好leader partition掛了，數據就會丟失。
2）還有一種情況可能會丟失消息，就是使用異步模式的時候，當緩沖區滿了，如果配置為0（還沒有收到確認的情況下，緩沖池一滿，就清空緩沖池里的消息），數據就會被立即丟棄掉。

只要能避免上述兩種情況，那么就可以保證消息不會被丟失。
1）就是說在同步模式的時候，確認機制設置為-1，也就是讓消息寫入leader和所有的副本。
2）還有，在異步模式下，如果消息發出去了，但還沒有收到確認的時候，緩沖池滿了，在配置文件中設置成不限制阻塞超時的時間，也就說讓生產端一直阻塞，這樣也能保證數據不會丟失。

ack:
ack確認機制設置為0，表示不等待響應，不等待borker的確認信息，最小延遲，producer無法知道消息是否發生成功，消息可能丟失，但具有最大吞吐量。
ack確認機制設置為-1，也就是讓消息寫入leader和所有的副本，ISR列表中的所有replica都返回確認消息。
ack確認機制設置為1，leader已經接收了數據的確認信息，replica異步拉取消息，比較折中。
ack確認機制設置為2，表示producer寫partition leader和其他一個follower成功的時候，broker就返回成功，無論其他的partition follower是否寫成功。
ack確認機制設置為 "all" 即所有副本都同步到數據時send方法才返回, 以此來完全判斷數據是否發送成功, 理論上來講數據不會丟失。
min.insync.replicas=1 意思是至少有1個replica返回成功，否則product異常

總結：
消息的完整性和系統的吞吐量是互斥的，為了確保消息不丟失就必然會損失系統的吞吐量
producer：
1、ack設置-1
2、設置副本同步成功的最小同步個數為副本數-1
3、加大重試次數
4、同步發送
5、對于單條數據過大，要設置可接收的單條數據的大小
6、對于異步發送，通過回調函數來感知丟消息，使用KafkaProducer.send(record, callback)方法而不是send(record)方法
7、配置不允許非ISR(In-Sync Replicas，副本同步隊列）集合中的副本當leader。所有的副本（replicas）統稱為 Assigned Replicas，即 AR
8、客戶端緩沖區滿了也可能會丟消息；或者異步情況下消息在客戶端緩沖區還未發送，客戶端就宕機
9、block.on.buffer.full = true
consumer：
1、enable.auto.commit=false 關閉自動提交位移

unclean.leader.election.enable 設置為 false（默認參數為 true），意思是，當存有你最新一條記錄的 replication 宕機的時候，Kafka 自己會選舉出一個主節點，如果默認允許還未同步你最新數據的 replication 所在的節點被選舉為主節點的話，你的數據將會丟失，因此這里應該按需將參數調控為 false；

retries設置大一些。設置大于0的值將使客戶端重新發送任何數據，一旦這些數據發送失敗。注意，這些重試與客戶端接收到發送錯誤時的重試沒有什么不同。允許重試將潛在的改變數據的順序，如果這兩個消息記錄都是發送到同一個partition，則第一個消息失敗第二個發送成功，則第二條消息會比第一條消息出現要早。

replication.factor > min.insync.replicas。如果兩者相等，當一個副本掛掉了分區也就沒法正常工作了。通常設置replication.factor = min.insync.replicas + 1即可。

同一分區消息亂序：
假設a,b兩條消息，a先發送后由于發送失敗重試，這時順序就會在b的消息后面，可以設置max.in.flight.requests.per.connection=1來避免
max.in.flight.requests.per.connection：限制客戶端在單個連接上能夠發送的未響應請求的個數。設置此值是1表示kafka broker在響應請求之前client不能再向同一個broker發送請求，但吞吐量會下降

0.11.0之后的版本：
冪等性發送：
引入了Producer ID（PID）和Sequence Number實現Producer的冪等語義。

Producer ID：每個新的Producer在初始化的時候會被分配一個唯一的PID
Sequence Number：對于每個PID，該Producer發送數據的每個<Topic, Partition>都對應一個從0開始單調遞增的Sequence Number。

Broker端也會為每個<PID, Topic, Partition>維護一個序號，并且每次Commit一條消息時將其對應序號遞增。對于接收的每條消息，如果其序號比Broker維護的序號（即最后一次Commit的消息的序號）大一，則Broker會接受它，否則將其丟棄：

如果消息序號比Broker維護的序號大一以上，說明中間有數據尚未寫入，也即亂序，此時Broker拒絕該消息，Producer拋出InvalidSequenceNumber
如果消息序號小于等于Broker維護的序號，說明該消息已被保存，即為重復消息，Broker直接丟棄該消息，Producer拋出DuplicateSequenceNumber

這種機制很好的解決了數據重復和數據亂序的問題。
事務機制：
多個操作要么全部成功要么全部失敗。Kafka事務的本質是，將一組寫操作（如果有）對應的消息與一組讀操作（如果有）對應的Offset的更新進行同樣的標記（即Transaction Marker）來實現事務中涉及的所有讀寫操作同時對外可見或同時對外不可見。

補充ISR：
HW 俗稱高水位，HighWatermark 的縮寫，取一個 partition 對應的 ISR 中最小的 LEO 作為 HW，consumer 最多只能消費到 HW 所在的位置。另外每個 replica 都有 HW,leader 和 follower 各自負責更新自己的 HW 的狀態。對于 leader 新寫入的消息，consumer 不能立刻消費，leader 會等待該消息被所有 ISR 中的 replicas 同步后更新 HW，此時消息才能被 consumer 消費。這樣就保證了如果 leader 所在的 broker 失效，該消息仍然可以從新選舉的 leader 中獲取。對于來自內部 broKer 的讀取請求，沒有 HW 的限制。
下圖詳細的說明了當 producer 生產消息至 broker 后，ISR 以及 HW 和 LEO 的流轉過程：

由此可見，Kafka 的復制機制既不是完全的同步復制，也不是單純的異步復制。事實上，同步復制要求所有能工作的 follower 都復制完，這條消息才會被 commit，這種復制方式極大的影響了吞吐率。而異步復制方式下，follower 異步的從 leader 復制數據，數據只要被 leader 寫入 log 就被認為已經 commit，這種情況下如果 follower 都還沒有復制完，落后于 leader 時，突然 leader 宕機，則會丟失數據。而 Kafka 的這種使用 ISR 的方式則很好的均衡了確保數據不丟失以及吞吐率。
Kafka 的 ISR 的管理最終都會反饋到 Zookeeper 節點上。具體位置為：/brokers/topics/[topic]/partitions/[partition]/state。目前有兩個地方會對這個 Zookeeper 的節點進行維護：
1.Controller 來維護：Kafka 集群中的其中一個 Broker 會被選舉為 Controller，主要負責 Partition 管理和副本狀態管理，也會執行類似于重分配 partition 之類的管理任務。在符合某些特定條件下，Controller 下的 LeaderSelector 會選舉新的 leader，ISR 和新的 leader_epoch 及 controller_epoch 寫入 Zookeeper 的相關節點中。同時發起 LeaderAndIsrRequest 通知所有的 replicas。
2.leader 來維護：leader 有單獨的線程定期檢測 ISR 中 follower 是否脫離 ISR, 如果發現 ISR 變化，則會將新的 ISR 的信息返回到 Zookeeper 的相關節點中。

參考文獻：
https://www.infoq.cn/article/depth-interpretation-of-kafka-data-reliability

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,505評論 6贊 533
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,556評論 3贊 418
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事?！?“怎么了？”我有些...
開封第一講書人閱讀 176,463評論 0贊 376
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,009評論 1贊 312
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,778評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,218評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,281評論 3贊 441
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,436評論 0贊 288
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,969評論 1贊 335
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,795評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,993評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,537評論 5贊 359
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,229評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,659評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,917評論 1贊 286
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,687評論 3贊 392
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,990評論 2贊 374

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

Kafka保證消息不丟失不重復

Kafka保證消息不丟失不重復

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

Kafka保證消息不丟失不重復

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频