一、準備工作
- 服務器:最好是多臺,大于等于2
- 已經(jīng)搭建好的zookeeper集群
- 下載軟件kafka_2.11-0.10.0.1.tgz
二、創(chuàng)建目錄
#創(chuàng)建目錄
cd /opt/
mkdir kafka #創(chuàng)建項目目錄
cd kafka
mkdir kafkalogs #創(chuàng)建kafka消息目錄,主要存放kafka消息
#解壓軟件
tar -zxvf kafka_2.11-0.10.0.1.tgz
三、修改配置文件
進入到config目錄
cd /opt/kafka/kafka_2.11-0.10.0.1/config/
主要關(guān)注:server.properties 這個文件即可,我們可以發(fā)現(xiàn)在目錄下:
有很多文件,這里可以發(fā)現(xiàn)有Zookeeper文件,我們可以根據(jù)Kafka內(nèi)帶的zk集群來啟動,但是建議使用獨立的zk集群。
connect-console-sink.properties log4j.properties
connect-console-source.properties producer.properties
connect-distributed.properties server.properties
connect-file-sink.properties server1.properties
connect-file-source.properties server2.properties
connect-log4j.properties server3.properties
connect-standalone.properties tools-log4j.properties
consumer.properties zookeeper.properties
修改配置文件:
broker.id=0 #當前機器在集群中的唯一標識,和zookeeper的myid性質(zhì)一樣
port=19092 #當前kafka對外提供服務的端口默認是9092
host.name=192.168.7.100 #這個參數(shù)默認是關(guān)閉的,在0.8.1有個bug,DNS解析問題,失敗率的問題。
num.network.threads=3 #這個是borker進行網(wǎng)絡處理的線程數(shù)
num.io.threads=8 #這個是borker進行I/O處理的線程數(shù)
log.dirs=/opt/kafka/kafkalogs/ #消息存放的目錄,這個目錄可以配置為“,”逗號分割的表達式,上面的num.io.threads要大于這個目錄的個數(shù)這個目錄,如果配置多個目錄,新創(chuàng)建的topic他把消息持久化的地方是,當前以逗號分割的目錄中,那個分區(qū)數(shù)最少就放那一個
socket.send.buffer.bytes=102400 #發(fā)送緩沖區(qū)buffer大小,數(shù)據(jù)不是一下子就發(fā)送的,先回存儲到緩沖區(qū)了到達一定的大小后在發(fā)送,能提高性能
socket.receive.buffer.bytes=102400 #kafka接收緩沖區(qū)大小,當數(shù)據(jù)到達一定大小后在序列化到磁盤
socket.request.max.bytes=104857600 #這個參數(shù)是向kafka請求消息或者向kafka發(fā)送消息的請請求的最大數(shù),這個值不能超過java的堆棧大小
num.partitions=1 #默認的分區(qū)數(shù),一個topic默認1個分區(qū)數(shù)
log.retention.hours=168 #默認消息的最大持久化時間,168小時,7天
message.max.byte=5242880 #消息保存的最大值5M
default.replication.factor=2 #kafka保存消息的副本數(shù),如果一個副本失效了,另一個還可以繼續(xù)提供服務
replica.fetch.max.bytes=5242880 #取消息的最大直接數(shù)
log.segment.bytes=1073741824 #這個參數(shù)是:因為kafka的消息是以追加的形式落地到文件,當超過這個值的時候,kafka會新起一個文件
log.retention.check.interval.ms=300000 #每隔300000毫秒去檢查上面配置的log失效時間(log.retention.hours=168 ),到目錄查看是否有過期的消息如果有,刪除
log.cleaner.enable=false #是否啟用log壓縮,一般不用啟用,啟用的話可以提高性能
zookeeper.connect=localhost:2181,localhost:2182,localhost:2183 #設置zookeeper的連接端口
四、啟動Kafka集群
1.啟動服務
#從后臺啟動Kafka集群(3臺都需要啟動)
cd
/opt/kafka/kafka_2.11-0.10.0.1//bin #進入到kafka的bin目錄
./kafka-server-start.sh -daemon ../config/server.properties
2.檢查服務是否啟動
#執(zhí)行命令jps
20348 Jps
4233 QuorumPeerMain
18991 Kafka
3.創(chuàng)建topic
#創(chuàng)建Topic
./kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 2 --partitions 1 --topic meinv
#解釋
--replication-factor 2 #復制兩份
--partitions 1 #創(chuàng)建1個分區(qū)
--topic #主題為meinv
'''在一臺服務器上創(chuàng)建一個發(fā)布者'''
#創(chuàng)建一個broker,發(fā)布者
./kafka-console-producer.sh --broker-list 192.168.7.100:19092 --topic meinv
'''在一臺服務器上創(chuàng)建一個訂閱者'''
./kafka-console-consumer.sh --zookeeper localhost:12181 --topic meinv --from-beginning