Hadoop學習（一）：完全分布式集群環境搭建

1. 設置免密登錄

(1) 新建普通用戶hadoop：useradd hadoop
(2) 在主節點master上生成密鑰對，執行命令ssh-keygen -t rsa便會在home文件夾下生成 .ssh 文件以及id_rsa和id_rsa.pub文件 注意：.ssh文件夾的權限為700，否則會影響其他機器的免密登錄
(3) 執行命令：

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 600 authorized_keys   #修改文件的權限為600

(4) 將authorized_keys文件拷貝到下一個主機上后重復上述操作。
scp ~/.ssh/authorized_keys hadoop@slave1:/home/hadoop/.ssh/authorized_keys
若拷貝出錯，則在.ssh文件可手動建立，但是注意修改其權限為700：chmod 700 .ssh
。。。
以此類推，最終在最后一個節點上的authorized_keys上包括了所有主機的公鑰，再將它拷貝到其他節點上，完成免密登錄的設置。

2.設置hosts文件

本人搭建的Hadoop環境包括有一個主節點和三個從節點，配置為：一個NameNode，一個SecondaryNameNode以及兩個DataNode。
/etc/hosts添加配置如下

10.0.209.122 master122 hadoop-NameNode-122
10.0.209.123 slave123 hadoop-SecondaryNameNode-123
10.0.209.124 slave124 hadoop-DataNode-124
10.0.209.125 slave125 hadoop-DataNode-125

在一個主機上配置完成后，將該文件拷貝到其他節點之上。

3.安裝Hadoop

首先，在master節點上，使用root用戶在/usr/local/文件夾下新建hadoop文件夾，并修改該文件夾對普通用戶有讀寫權限

mkdir /usr/local/hadoop
chmod 777 /usr/local/hadoop

使用普通用戶hadoop登錄：su hadoop
下載jdk1.8安裝包以及hadoop的安裝包，并加壓文件到/usr/local/hadoop下

wget wget http://apache.claz.org/hadoop/common/hadoop-2.8.1/hadoop-2.8.1.tar.gz
tar -xzvf  hadoop-2.8.1.tar.gz -C /usr/local/hadoop

加壓后/usr/local/hadoop/文件夾下包含jdk1.8以及hadoop2.8.1，
切換到root用戶，編輯/etc/profile文件

JAVA_HOME=/usr/local/hadoop/jdk1.8.0_102
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
HADOOP_HOME=/usr/local/hadoop/hadoop-2.8.1
PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export JAVA_HOME
export PATH
export HADOOP_HOME
export CLASSPATH

保存后執行source /etc/profile 使其立即生效。
然后執行java -version和hadoop version驗證，配置安裝成功。

4.配置Hadoop集群

(1). 配置core-site.xml

修改Hadoop核心配置文件/usr/local/hadoop/etc/hadoop/core-site.xml，通過fs.default.name指定NameNode的IP地址和端口號，通過hadoop.tmp.dir指定hadoop數據存儲的臨時文件夾。

<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/hadoop/hadoop-2.8.1/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master122:9000</value>
</property>
</configuration>

特別注意：如沒有配置hadoop.tmp.dir參數，此時系統默認的臨時目錄為：/tmp/hadoo-hadoop。而這個目錄在每次重啟后都會被刪除，必須重新執行format才行，否則會出錯。

(2).配置hdfs-site.xml

修改HDFS核心配置文件/usr/local/hadoop/etc/hadoop/hdfs-site.xml，通過dfs.replication指定HDFS的備份因子為3，通過dfs.name.dir指定namenode節點的文件存儲目錄，通過dfs.data.dir指定datanode節點的文件存儲目錄。

<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/usr/local/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/usr/local/hadoop/hdfs/data</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name> #配置SecondaryNameNode
<value>slave123:50090</value>
</property>
</configuration>

(3).配置mapred-site.xml

拷貝mapred-site.xml.template為mapred-site.xml，再進行修改。

cp /usr/local/hadoop/hadoop-2.8.1/etc/hadoop/mapred-site.xml.template /usr/local/hadoop/hadoop-2.8.1/etc/hadoop/mapred-site.xml  
vi /usr/local/hadoop/hadoop-2.8.1/etc/hadoop/mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapred.job.tracker</name>

  <value>http://hadoop-master:9001</value>

</property>
</configuration>

(4).配置yarn-site.xml

<configuration>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop-master</value>
</property>
</configuration>

(5).配置masters文件

增加/usr/local/hadoop/etc/hadoop/masters文件，該文件指定namenode節點所在的服務器機器。添加namenode節點的主機名master122；不建議使用IP地址，因為IP地址可能會變化，但是主機名一般不會變化。另外，為將SecondaryNameNode與NameNode分開，可將SecondaryNameNode節點的主機也加入到masters文件之中。

master122
slave123

(6).配置slaves節點（Master主機特有）

修改/usr/local/hadoop/etc/hadoop/slaves文件，該文件指定哪些服務器節點是datanode節點。刪除locahost，添加所有datanode節點的主機名，如下所示。
vi /usr/local/hadoop/hadoop-2.8.1/etc/hadoop/slaves

slave123
slave124
slave125

(7).配置hadoop-env.sh文件

修改jdk的目錄，以及集群間免密互連的端口（由于本人修改了ssh的默認端口，而hadoop默認是以22端口連接，所以需要進行添加配置）

export JAVA_HOME=/usr/local/hadoop/jdk1.8.0_102   #修改jdk路徑
export HADOOP_SSH_OPTS="-p 22000"  #添加ssh自定義端口

(8).配置ssh客戶端配置

由于修改了ssh的默認端口，使得在使用ssh以及scp時都要加上-p/-P 非常的繁瑣（主要是因為懶，懶是人類進步的階梯），所以修改ssh的客戶端配置，使其默認配置端口為自定義端口。
vi /etc/ssh/ssh_config

Port 22000    #將源端口22修改為自定義端口22000

5.同步配置到其他節點

第4步配置是在主節點master上進行的配置，下面要將上述配置好的jdk以及hadoop軟件包拷貝到其他從節點上，首先在各個從節點建立文件夾/usr/local/hadoop，并將其權限設置為777，然后用普通用戶hadoop執行命令：

scp -r /usr/local/hadoop/* slave123:/usr/local/hadoop/ &
scp -r /usr/local/hadoop/* slave124:/usr/local/hadoop/ &
scp -r /usr/local/hadoop/* slave125:/usr/local/hadoop/ &

由于已經配置ssh客戶端的連接端口，所以這里不需要特意指定，加‘&’因為hadoop/下包含jdk以及hadoop軟件包，文件很大，放入后臺執行更方便。
下面繼續將/etc/profile下的JAVA_HOME和HADOOP_HOME配置同步配置到其他節點，至此集群的搭建配置完成。

6.啟動集群

在主節點master上進入到/usr/local/hadoop/hadoop-2.8.1/執行命令：

bin/hadoop namenode -format  #格式化namenode，第一次啟動服務前執行的操作，以后不需要執行。

然后啟動hadoop:

sbin/start-all.sh

執行jps命令查看運行情況
通過簡單的jps命令雖然可以查看HDFS文件管理系統、MapReduce服務是否啟動成功，但是無法查看到Hadoop整個集群的運行狀態。我們可以通過hadoop dfsadmin -report進行查看。用該命令可以快速定位出哪些節點掛掉了，HDFS的容量以及使用了多少，以及每個節點的硬盤使用情況。
停止hadoop命令：sbin/stop-all.sh

至此，hadoop集群搭建配置完畢。

7.可能的錯誤

The authenticity of host ‘0.0.0.0 (0.0.0.0)’ can’t be established.

解決方案：關閉SELINUX

-- 關閉SELINUX
# vim /etc/selinux/config
-- 注釋掉
#SELINUX=enforcing
#SELINUXTYPE=targeted
— 添加
SELINUX=disabled

最后編輯于：2017.12.10 21:26:30

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 230,578評論 6贊 544
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 99,701評論 3贊 429
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 178,691評論 0贊 383
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,974評論 1贊 318
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 72,694評論 6贊 413
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 56,026評論 1贊 329
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 44,015評論 3贊 450
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 43,193評論 0贊 290
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 49,719評論 1贊 336
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 41,442評論 3贊 360
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,668評論 1贊 374
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 39,151評論 5贊 365
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,846評論 3贊 351
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 35,255評論 0贊 28
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 36,592評論 1贊 295
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 52,394評論 3贊 400
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 48,635評論 2贊 380

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

Hadoop學習（一）：完全分布式集群環境搭建

Hadoop學習（一）：完全分布式集群環境搭建

1. 設置免密登錄

2.設置hosts文件

3.安裝Hadoop

4.配置Hadoop集群

(1). 配置core-site.xml

(2).配置hdfs-site.xml

(3).配置mapred-site.xml

(4).配置yarn-site.xml

(5).配置masters文件

(6).配置slaves節點（Master主機特有）

(7).配置hadoop-env.sh文件

(8).配置ssh客戶端配置

5.同步配置到其他節點

6.啟動集群

7.可能的錯誤

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

Hadoop學習（一）：完全分布式集群環境搭建

1. 設置免密登錄

2.設置hosts文件

3.安裝Hadoop

4.配置Hadoop集群

(1). 配置core-site.xml

(2).配置hdfs-site.xml

(3).配置mapred-site.xml

(4).配置yarn-site.xml

(5).配置masters文件

(6).配置slaves節點（Master主機特有）

(7).配置hadoop-env.sh文件

(8).配置ssh客戶端配置

5.同步配置到其他節點

6.啟動集群

7.可能的錯誤

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频