zookeeper入門看這篇就夠了

zookeeper

1.1.zookeeper概述

zookeeper是一個(gè)分布式協(xié)調(diào)服務(wù)的開源框架。主要是用來解決分布式集群中應(yīng)用系統(tǒng)的一致性問題,例如怎么避免同時(shí)操作同一數(shù)據(jù)造成臟讀問題。
zookeeper本質(zhì)上是一個(gè)分布式的小文件存儲(chǔ)系統(tǒng)。提供基于類似文件系統(tǒng)的目錄樹方式的數(shù)據(jù)存儲(chǔ),并且可以對(duì)樹中的節(jié)點(diǎn)進(jìn)行有效管理,從而用來維護(hù)和監(jiān)控你存儲(chǔ)的數(shù)據(jù)的狀態(tài)變化。通過監(jiān)控這些數(shù)據(jù)狀態(tài)的變化,從而可以達(dá)到基于數(shù)據(jù)的集群管理。例如:統(tǒng)一命名服務(wù)、分布式配置管理、分布式消息隊(duì)列、分布式鎖、分布式協(xié)調(diào)等功能。

1.2.zookeeper的文件系統(tǒng)

zookeeper維護(hù)一個(gè)類似文件系統(tǒng)的數(shù)據(jù)結(jié)構(gòu):


圖片.png

1.3.zookeeper特性

圖片.png
  • 全局?jǐn)?shù)據(jù)一致:每個(gè)server保存一份相同的數(shù)據(jù)副本,client無論連接到哪個(gè)server,展示的數(shù)據(jù)都是一致的,這是最重要的特性;
  • 可靠性:如果消息被其中一臺(tái)服務(wù)器接收,那么將被所有服務(wù)器接收(刪除某一臺(tái)的1.txt文件,那么所有服務(wù)器上的副本都會(huì)被刪除);
  • 順序性:包括全局有序和偏序兩種。全局有序指的是如果在一臺(tái)服務(wù)器上消息a在消息b前發(fā)布,那么所有server上的消息a都將在消息b之前發(fā)布。偏序則指的是如果一個(gè)消息b在消息a后被同一個(gè)發(fā)送者發(fā)布,a必將排在b前面(消息可以理解為刪除操作);
  • 數(shù)據(jù)更新原子性:一次數(shù)據(jù)更新要么成功(半數(shù)以上算成功),要么失敗,不存在中間狀態(tài);
  • 實(shí)時(shí)性:zookeeper保證了客戶端在同一時(shí)間間隔范圍內(nèi)獲得服務(wù)器的更新信息,或者服務(wù)器失效的信息;

1.4.zookeeper集群角色

圖片.png

Leader

  • zookeeper集群工作的核心;
  • 事務(wù)請(qǐng)求(寫操作)的唯一調(diào)度和處理者,保證集群事務(wù)處理的順序性;
  • 對(duì)于create、setData、delete等有寫操作的請(qǐng)求,則需要統(tǒng)一轉(zhuǎn)發(fā)給Leader處理,Leader需要決定編號(hào)、執(zhí)行操作,這個(gè)過程稱為一個(gè)事務(wù);

Follower

  • 處理客戶端非事務(wù)(寫操作)的請(qǐng)求,轉(zhuǎn)發(fā)事務(wù)請(qǐng)求給Leader;
  • 參與集群Leader選舉投票;
    此外,針對(duì)訪問量大的zookeeper集群,還可以新添加觀察者角色。

Observer

  • 觀察者角色,觀察zookeeper集群的最新狀態(tài)變化并將這些狀態(tài)同步過來,其對(duì)于非事務(wù)請(qǐng)求可以進(jìn)行獨(dú)立處理(和Follower功能一樣),對(duì)于事務(wù)請(qǐng)求,則會(huì)轉(zhuǎn)發(fā)給Leader服務(wù)器來處理;
  • 不會(huì)參與任何形式的投票,只提供非事務(wù)服務(wù),通常用于在不影響集群事務(wù)處理能力的前提下提升集群的非事務(wù)處理能力。

zookeeper集群搭建

zookeeper集群搭建的是zookeeper分布式模式安裝。通常由2n+1臺(tái)server組成。這是因?yàn)闉榱吮WCLeader選舉(基于Paxos算法)能夠得到多數(shù)的支持,所以zookeeper集群數(shù)量一般為奇數(shù)。
zookeeper運(yùn)行需要Java環(huán)境,所以需要提前安裝JDK。對(duì)于安裝Leader+Follower的集群,大致過程如下:

  1. 配置主機(jī)名稱到IP地址的映射關(guān)系;
  2. 修改zookeeper配置文件;
  3. 遠(yuǎn)程復(fù)制分發(fā)安裝文件;
  4. 設(shè)置myid;
  5. 啟動(dòng)zookeeper集群;

如果想要使用Observer模式,可在對(duì)應(yīng)節(jié)點(diǎn)的配置文件添加如下配置:

peerType=observer

其次,必須在配置文件指定哪些節(jié)點(diǎn)被指定為Observer,如:

server.1:localhost:2181:3181:observer

安裝過程

wget http://mirror.bit.edu.cn/apache/zookeeper/stable/apache-zookeeper-3.4.5.tar.gz
tar -zxvf zookeeper-3.4.5.tar.gz
mv zookeeper-3.4.5 zookeeper

## 修改配置文件
cd zookeeper/conf
cp zoo_sample.cfg zoo.cfg
vim zoo.cfg  添加內(nèi)容
dataDir=/root/apps/zookeeper/zkdata
server.1=mini1:2888:3888     ## (心跳端口、選舉端口)
server.2=mini2:2888:3888
server.3=mini3:2888:3888

## 創(chuàng)建文件夾:
cd /home/hadoop/zookeeper/
mkdir zkdata

## 在data文件夾下新建myid文件,myid的文件內(nèi)容為:
cd zkdata
echo 1 > myid

## 分發(fā)安裝包到其他機(jī)器
scp -r /root/apps root@mini2:/root/
scp -r /root/apps root@mini3:/root/

## 修改其他機(jī)器的配置文件
## 修改myid文件
到mini2上:修改myid為:2
到mini3上:修改myid為:3

##啟動(dòng)(每臺(tái)機(jī)器)
zkServer.sh start
或者編寫一個(gè)腳本來批量啟動(dòng)所有機(jī)器:
for host in "mini1 mini2 mini3"
do
    ssh $host "source/etc/profile;/root/apps/zookeeper/bin/zkServer.sh start"
done

##查看集群狀態(tài)
jps(查看進(jìn)程)
zkServer.sh status(查看集群狀態(tài),主從信息)

如果啟動(dòng)不成功,可以觀察zookeeper.out日志,查看錯(cuò)誤信息進(jìn)行排查

配置文件參數(shù)說明:

  • tickTime:這個(gè)時(shí)間作為zookeeper服務(wù)器之間或客戶端與服務(wù)器之間維持心跳的時(shí)間間隔,也就是說每個(gè)tickTime時(shí)間就會(huì)發(fā)送一個(gè)心跳;
  • initLimit:這個(gè)配置項(xiàng)是用來配置zookeeper接收客戶端(這里所說的客戶端不是用戶連接zookeeper服務(wù)器集群中連接到Leader的Follower服務(wù)器)初始化連接時(shí)最長(zhǎng)能忍受多少個(gè)心跳時(shí)間間隔數(shù)。當(dāng)已經(jīng)超過10個(gè)心跳的時(shí)間(也就是tickTime)長(zhǎng)度后zookeeper服務(wù)器還沒有收到客戶端的返回信息,那么表明這個(gè)客戶端連接失敗。總的時(shí)間長(zhǎng)度就是10*2000=20s;
  • syncLimit:這個(gè)配置項(xiàng)標(biāo)識(shí)Leader和Follower之間發(fā)送消息,請(qǐng)求和應(yīng)答時(shí)間長(zhǎng)度,最長(zhǎng)不能超過多少個(gè)tickTime的時(shí)間長(zhǎng)度,總的時(shí)間長(zhǎng)度就是5*2000=10秒;
  • dataDir:就是zookeeper保存數(shù)據(jù)的目錄,默認(rèn)情況下zookeeper將寫數(shù)據(jù)的日志文件也保存在這個(gè)目錄里;
  • clientPort:這個(gè)端口就是客戶端連接zookeeper服務(wù)器的端口,zookeeper會(huì)監(jiān)聽客戶端的訪問請(qǐng)求;
  • server.A=B:C:D:A是一個(gè)數(shù)字,表示這是第幾臺(tái)服務(wù)器,B是這個(gè)服務(wù)器的IP地址或主機(jī)名,C是用來集群成員的信息交換,表示這個(gè)服務(wù)器在集群中的Leader服務(wù)器交換信息的端口,D代表在Leader掛掉時(shí),專門用來進(jìn)行選舉Leader所用的端口;

3.zookeeper數(shù)據(jù)模型

zookeeper的數(shù)據(jù)模型,在結(jié)構(gòu)上和標(biāo)準(zhǔn)文件系統(tǒng)的非常相似。擁有一個(gè)層次命名空間,都是采用樹形結(jié)構(gòu),zookeeper樹中的每個(gè)節(jié)點(diǎn)被稱為Znode。和文件系統(tǒng)的目錄樹一樣,zookeeper樹中的每個(gè)節(jié)點(diǎn)都可以擁有子節(jié)點(diǎn),但也有不同之處:

  1. Znode兼具文件和目錄兩種特點(diǎn)。既像文件一樣維護(hù)者數(shù)據(jù)、元信息、ACL、時(shí)間戳等數(shù)據(jù)結(jié)構(gòu),并可以具有子Znode。用戶對(duì)Znode具有增刪改查等操作(權(quán)限允許的情況下);
  2. Znode具有原子性操作。讀操作將獲取與節(jié)點(diǎn)相關(guān)的所有數(shù)據(jù),寫操作也將替換掉節(jié)點(diǎn)的所有數(shù)據(jù),另外每一個(gè)節(jié)點(diǎn)都擁有自己的ACL(訪問控制權(quán)限列表),這個(gè)列表規(guī)定了用戶的權(quán)限,即限定了特定用戶對(duì)目標(biāo)節(jié)點(diǎn)可以執(zhí)行的操作;
  3. Znode節(jié)點(diǎn)存儲(chǔ)數(shù)據(jù)大小有限制。zookeeper雖然可以關(guān)聯(lián)一些數(shù)據(jù),但并沒有被設(shè)計(jì)為常規(guī)的數(shù)據(jù)庫(kù)或大數(shù)據(jù)存儲(chǔ),相反的是,它用來管理調(diào)度數(shù)據(jù),比如分布式應(yīng)用中的配置文件信息、狀態(tài)信息、匯集信息等等,這些數(shù)據(jù)的共同特征就是他們都是很小的數(shù)據(jù),通常是以kb為大小單位。zookeeper的服務(wù)器和客戶端都設(shè)計(jì)為嚴(yán)格檢查并限制每個(gè)Znode的數(shù)據(jù)大小最大為1M,但在常規(guī)使用中應(yīng)該遠(yuǎn)小于此值;
  4. Znode通過路徑引用。如同unix的文件路徑,路徑必須是絕對(duì)的,因此他們必須是由斜杠開頭,除此之外,他們必須是唯一的,也就是說每一個(gè)路徑只有一個(gè)表示,并且有一些限制,字符串/zookeeper用以保存管理信息,比如關(guān)鍵配額信息;

3.1.數(shù)據(jù)結(jié)構(gòu)圖

未完待續(xù)......

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,501評(píng)論 6 544
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,673評(píng)論 3 429
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,610評(píng)論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,939評(píng)論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 72,668評(píng)論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 56,004評(píng)論 1 329
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,001評(píng)論 3 449
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 43,173評(píng)論 0 290
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,705評(píng)論 1 336
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 41,426評(píng)論 3 359
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,656評(píng)論 1 374
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,139評(píng)論 5 364
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,833評(píng)論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,247評(píng)論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,580評(píng)論 1 295
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 52,371評(píng)論 3 400
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,621評(píng)論 2 380

推薦閱讀更多精彩內(nèi)容