分布式是以縮短單個(gè)任務(wù)的執(zhí)行時(shí)間來(lái)提升效率的,而集群則是通過(guò)提高單位時(shí)間內(nèi)執(zhí)行的任務(wù)數(shù)來(lái)提升效率。
集群主要分為:高可用集群(High Availability Cluster),負(fù)載均衡集群(Load Balance Cluster,nginx即可實(shí)現(xiàn)),科學(xué)計(jì)算集群(High Performance Computing Cluster)。
分布式是指將不同的業(yè)務(wù)分布在不同的地方;而集群指的是將幾臺(tái)服務(wù)器集中在一起,實(shí)現(xiàn)同一業(yè)務(wù)。分布式中的每一個(gè)節(jié)點(diǎn),都可以做集群。 而集群并不一定就是分布式的。
為了解決大型網(wǎng)站的訪問(wèn)量大、并發(fā)量高、海量數(shù)據(jù)的問(wèn)題,我們一般會(huì)考慮業(yè)務(wù)拆分和分布式部署。我們可以把那些關(guān)聯(lián)不太大的業(yè)務(wù)獨(dú)立出來(lái),部署到不同的機(jī)器上,從而實(shí)現(xiàn)大規(guī)模的分布式系統(tǒng)。但這之中也有一個(gè)問(wèn)題,那就是用戶如何選擇相應(yīng)的機(jī)器的問(wèn)題,這也被稱(chēng)為訪問(wèn)統(tǒng)一入口問(wèn)題,而解決的方法是我們可以在集群機(jī)器的前面增加負(fù)載均衡設(shè)備,實(shí)現(xiàn)流量分發(fā)(總圖如下)。
負(fù)載均衡就是將負(fù)載(工作任務(wù)、訪問(wèn)請(qǐng)求等)進(jìn)行平衡、分?jǐn)偟蕉鄠€(gè)操作單元(服務(wù)器、組件等)上進(jìn)行執(zhí)行,是解決高性能,單點(diǎn)故障(高可用,如果你是單機(jī)版網(wǎng)絡(luò),一旦服務(wù)器掛掉了,那么用戶就無(wú)法請(qǐng)求了,但對(duì)于集群來(lái)說(shuō),一臺(tái)服務(wù)器掛掉了,負(fù)載均衡器會(huì)把用戶的請(qǐng)求發(fā)送給其他的服務(wù)器進(jìn)行處理),擴(kuò)展性(這里主要是指水平伸縮)的終極解決方案。
Nginx
nginx大家可以上其?官網(wǎng)?去下載最新版,解壓后復(fù)制到部署目錄,對(duì)于Nginx的配置網(wǎng)上的資料很多,這里就不再贅述了,只總結(jié)一下Nginx使用的注意事項(xiàng):
1.nginx的負(fù)載均衡配置中默認(rèn)是采用輪詢(xún)的方式,這種方式中,每個(gè)請(qǐng)求按時(shí)間順序逐一分配到不同的后端服務(wù)器,如果后端服務(wù)器down掉,能自動(dòng)剔除,但存在各個(gè)服務(wù)器的session共享問(wèn)題。
2.另外一種方式是ip_hash:每個(gè)請(qǐng)求按訪問(wèn)的ip的hash結(jié)果分配,如果訪問(wèn)的IP是固定的,那么在正常情況下,該用戶的請(qǐng)求都會(huì)分配到后臺(tái)的同一臺(tái)服務(wù)器去處理,但是如果用戶每次請(qǐng)求的IP都不同呢?所以這種方式也同1的方式一樣都存在這么一個(gè)問(wèn)題:session在各個(gè)服務(wù)器上的共享問(wèn)題。
3.,如果集群中的服務(wù)器的性能不一,可以通過(guò)配置各個(gè)服務(wù)器的權(quán)值來(lái)實(shí)現(xiàn)資源利用率的最大化,即性能好的優(yōu)先選擇
也許你會(huì)問(wèn),既然IP可能變化,那么用戶用頁(yè)面請(qǐng)求時(shí)的cookie的ID應(yīng)該是確定的吧!那么我們可以用cookie_id來(lái)進(jìn)行hash,然后在通過(guò)負(fù)載均衡器分發(fā)到對(duì)應(yīng)的服務(wù)器上,這樣就可以解決session問(wèn)題了,其實(shí)當(dāng)初本人也有想到這個(gè)方案,但最后本人也放棄這個(gè)方案了,因?yàn)槭歉鶕?jù)cookid_id確實(shí)可以把該用戶的請(qǐng)求唯一的分發(fā)到那臺(tái)獨(dú)一無(wú)二的服務(wù)器上,那如果這臺(tái)服務(wù)器掛掉了,那么根據(jù)這種分發(fā)策略,豈不是在這服務(wù)器上請(qǐng)求資源的用戶都不能訪問(wèn)了,你說(shuō)是不是呢?
解決服務(wù)器共享session問(wèn)題:使用redis來(lái)共享各個(gè)服務(wù)器的session,并同時(shí)通過(guò)redis來(lái)緩存一些常用的資源,加快用戶獲得請(qǐng)求資源的速度(個(gè)人比較喜歡redis,當(dāng)然你們也可以使用memcache來(lái)實(shí)現(xiàn),不過(guò),memcache不能做到持久化,這樣這臺(tái)服務(wù)器一掛掉,那么所有的資源也都沒(méi)有了......)。
不過(guò),本人覺(jué)得這樣進(jìn)行集群部署,最好配上數(shù)據(jù)庫(kù)的主從部署,因?yàn)槿绻诩褐兄环峙湟粋€(gè)數(shù)據(jù)庫(kù)服務(wù)器,那么這個(gè)系統(tǒng)的瓶頸將會(huì)出現(xiàn)在數(shù)據(jù)庫(kù)的操作上,雖然redis能減輕這種負(fù)擔(dān),但對(duì)于數(shù)據(jù)量大的還是有一定影響的,而且數(shù)據(jù)庫(kù)的主從部署也可以防止因某個(gè)數(shù)據(jù)庫(kù)服務(wù)器的掛掉而丟失用戶的信息。