Kafka Manager實現原理與填坑

Kafka Manager 簡介
  • Kafka Manager 可能是現在能找到的最好的可視化的Kafka管理工具, 感謝Yahoo-我人生中打開的一個網站-的開源;
  • 使用Kafka Manager, 基本上之前需要運行Kafka相應命令行工具的工作現在都可以可視化的完成:
    1. 創建Topic, 調整消息保存時長, Partition數量等等配置;
    2. 管理Topic, 包括Reassign Partitions, Preferred Replica Election等等;
    3. 消費情況查看, 支持offset保存到zk和broker兩種方式, 列出所有消費的group, 消費每個partition的詳情;
  1. 集群的簡單健康狀態查看,包括partition分布是否均衡, leader分布是否均衡等;
  2. 通過JMX查看各種指標, 比如各個broker的網絡流量和消息進出數據, 每個Topic消息的讀寫速度等;
  • 下面我們會先簡單介紹下Kafka Manager的實現和在使用中遇到的幾種坑;
Kafka Manager實現
  • 實現語言: Scala
  • 用到的框架和第三方庫:
  1. Play framework: Kafka-Mananger本質上是個Web應用, 因此使用play framework的MVC架構實現;
  2. AKKA: 用于構建高并發、分布式和容錯的應用. Kafka Manager中的所有請求都使用akka來異步處理;
  3. Apache Curator Framework: 用于訪問zookeeper;
  4. Kafka Sdk: 用于獲取各Topic的last offset, 使用Admin接口實現各種管理功能;
  • 編譯:
    整個工程使用 sbt 構建, 具體編譯流程可以在githut上找到. sbt在build過程中會加載很多第三方依賴, 這個在國內有時會很慢, 各種同學各顯神通吧.
  • 實現:
    其實kafka manager的代碼還是很清晰易閱讀的, 如果熟悉scala和play的話應該沒有難度. 不同本人也是現學現用, 好慚愧~~~. 咱們這里撿重點的說吧, 不分析具體代碼實現,只講下實現的方法:
  1. 獲取集群中所有Topic
    使用Curator訪問zk獲取,并監聽zk相關節點 /brokers/topics 的變化;
  2. 獲取Topic的partiton, leader, replicas信息
    也是從zk獲取, /brokers/topics/[topic]/partitions;
  3. 獲取Topic的各partition的last offset
    使用kafka sdk發送OffsetRequest到kafka集群來獲得, 這個獲取的動作會被封裝成Future[PartitionOffsetsCapture], 每個topic一個Future, 使用Google的LoadingCache來存儲這些future, 利用LoadingCache的超時淘汰機制來周期性的創建新的Future來間隔地發送OffsetRequest獲取當前最新的last offset;
  4. 獲取Kafka本身管理的group的消費情況
    使用kafka sdk不斷地消費"__consumer_offsets"這個topic, 來獲取所有group的消費情況,關于__consumer_offsets參考 Committing and fetching consumer offsets in Kafka
  5. 獲取zookeeper管理的group的消費情況
    肯定是從zk上讀取, /consumers

上面的這些實現都在 KafkaStateActor.scala 這個文件里.

  • 各種Acotr的關系簡圖,僅供參考
kafka-manager.png
Kafka Manager遇到的坑
  • 多個kafka manager來管理同一個kafka集群:
    你會發現在kafka manager里無法看到所有offset使用kafka本身管理的group.
    前面我們講過使用kafka sdk不斷地消費"__consumer_offsets", 看看這段代碼(在KafkaStateActor.scala中):
    props.put("group.id", "KafkaManagerOffsetCache")
    props.put("bootstrap.servers", bootstrapBrokerList.list.map(bi => s"${bi.host}:${bi.port}").mkString(","))
    props.put("exclude.internal.topics", "false")
    props.put("enable.auto.commit", "false")
    props.put("key.deserializer", "org.apache.kafka.common.serialization.ByteArrayDeserializer")
    props.put("value.deserializer", "org.apache.kafka.common.serialization.ByteArrayDeserializer")
    props.put("auto.offset.reset", "latest")

props.put("group.id", "KafkaManagerOffsetCache")這句說明不管啟動了幾個kafka manager, 消費"__consumer_offsets"都使用同一個group.
解決方案: group.id從配置文件中讀取,每個kafka manager使用不同的group id;

  • 客戶端使用某些sdk(比如librdkafka)消費topic, 客戶端crash后, 在kafka manager上查看其group的消費情況, 仍然一直能看到"Consumer Instance Owner"
    原因在于處理從broker返回的GroupMetadata response時沒有處理異常情況:
              case GroupMetadataKey(version, key) =>
                    val value: GroupMetadata = readGroupMessageValue(key, ByteBuffer.wrap(record.value()))
                    value.allMemberMetadata.foreach {
                      mm =>
                        mm.assignment.foreach {
                          case (topic, part) =>
                            groupTopicPartitionMemberMap += (key, topic, part) -> mm
                        }
                    }
                }

這里的record.value可能為空, 此時應作清理工作:

                  if (null != record &&                                                                                                   
                      null != record.value()) {                                                                                           
                        val value: GroupMetadata = readGroupMessageValue(key, ByteBuffer.wrap(record.value()))                            
                        value.allMemberMetadata.foreach {                                                                                               
                          mm =>                                                                                                                         
                            mm.assignment.foreach {                                                                                                     
                              case (topic, part) =>                                                                                                     
                                groupTopicPartitionMemberMap += (key, topic, part) -> mm                                                                
                            }
                        }                                                                                                                               
                        } else {                                                                                                                          
                          groupTopicPartitionMemberMap.foreach {                                                                                          
                            case ((group, topic, part), mmd) =>                                                                                           
                              if (group == key) {                                                                                                         
                                var tmp = mmd                                                                                                             
                                tmp.memberId = ""                                                                                                         
                                tmp.clientHost = ""                                                                                                       
                                groupTopicPartitionMemberMap += (key, topic, part) -> tmp                                                                 
                              }                                                                                                                           
                          }                                                                                                                               
                        }          
  • Yikes! Ask timed out on [ActorSelection[Anchor(akka://kafka-manager-system/), Path(/user/kafka-manager)]] after [5000 ms]
    訪問kafka manager時出現上面的超時提示, 遇到這個問題,好學不服輸的你肯定會上網各種搜, 然后你會去改kafka manager的各種配置, 調大各種thread pool的容量, 增大queue size, 甚至開大jvm的使用內存, 然而問題并沒有解決, 看來只剩下定時重啟這一招兒了.

這里提供一種解決方案: 這個超時是Actor在執行異步請求時一直等不到返回結果造成的, 主要是前面講過的"獲取Topic的各partition的last offset的Future"沒有返回結果,這些Future是通過Await.ready來阻塞拿到result的, 然而在kafka manager中這個Await.ready沒有給timeout, 是一直等待, 那咱們就給個timeout好了, 代碼在ActorModel.scala中, 有好幾處Await.ready的調用.

找到根源: 再也不用定時重啟, 提了一個pull request到官方:Use a separate thread to get the topic offsets to fixed bug 'Yikes! Ask timed out...', 主要就是不再使用 Future[PartitionOffsetCapture]來獲取topic offset, 因為這個會產生大量的Future, 進而會產生大量的task提交到ThreadExcutor, 其實只需要啟動一個單獨的線程來作這件事就好了.

  • Consumer offset的詳情不完整
    通過上面的源碼分析我們知道km是通過消費"__consumer_offsets"來獲取某一個組的消費情況的,消費這個topic,和消費用戶自己的topic沒什么兩樣, km里使用"props.put("auto.offset.reset", "latest")"默認offset無效時從最新位置來拉取, 如果一個group用戶已經有段時間沒有提交offset(但還沒有完全過期), 則此時在km上看不到相應的gorup信息, 可以簡單改為"props.put("auto.offset.reset", "earliest")"

  • 同名group消費不同topic后,其中一個group的消費進程結束后, 仍可以看到其消費詳情
    這個問題是最近被發現,之前應該是一直存在著,沒能引起重視.
    這里提供一種簡單的,hack的解決方案:

case GroupMetadataKey(version, key) =>
                   if (null != record &&                                                                                                   
                     null != record.value()) {                                                                                           
                       val value: GroupMetadata = readGroupMessageValue(key, ByteBuffer.wrap(record.value()))                            
                       var topicSet:Set[String] = Set()

                       value.allMemberMetadata.foreach {                                                                                               
                         mm =>                                                                                                                         
                           mm.assignment.foreach {                                                                                                     
                             case (topic, part) =>                                                                                                     
                               topicSet += topic
                               groupTopicPartitionMemberMap += (key, topic, part) -> mm                                                                
                           }
                         }

                         groupTopicPartitionMemberMap.foreach {                                                                                          
                           case ((group, topic, part), mmd) =>                                                                                           
                             if (group == key &&
                               !topicSet.contains(topic)) {                                                                                                         
                               var tmp = mmd                                                                                                             
                               tmp.memberId = ""                                                                                                         
                               tmp.clientHost = ""                                                                                                       
                               groupTopicPartitionMemberMap += (key, topic, part) -> tmp                                                                 
                             }                                                                                                                           
                         }                                                                                                                               
                       
                       } else {                                                                                                                          
                         groupTopicPartitionMemberMap.foreach {                                                                                          
                           case ((group, topic, part), mmd) =>                                                                                           
                             if (group == key) {                                                                                                         
                               var tmp = mmd                                                                                                             
                               tmp.memberId = ""                                                                                                         
                               tmp.clientHost = ""                                                                                                       
                               groupTopicPartitionMemberMap += (key, topic, part) -> tmp                                                                 
                             }                                                                                                                           
                         }                                                                                                                               
                       }                                                                                                                                 
               }

今天就寫這么多, 其他坑以后遇到再補充.

之前一直在寫kafka的源碼解析,大家有興趣也可以指正一下 源碼解析

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,002評論 6 542
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,400評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 178,136評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,714評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,452評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,818評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,812評論 3 446
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,997評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,552評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,292評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,510評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,035評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,721評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,121評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,429評論 1 294
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,235評論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,480評論 2 379

推薦閱讀更多精彩內容