Hadoop學習(一):完全分布式集群環境搭建

1. 設置免密登錄

(1) 新建普通用戶hadoop:useradd hadoop
(2) 在主節點master上生成密鑰對,執行命令ssh-keygen -t rsa便會在home文件夾下生成 .ssh 文件以及id_rsa和id_rsa.pub文件 注意:.ssh文件夾的權限為700,否則會影響其他機器的免密登錄
(3) 執行命令:

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 600 authorized_keys   #修改文件的權限為600

(4) 將authorized_keys文件拷貝到下一個主機上后重復上述操作。
scp ~/.ssh/authorized_keys hadoop@slave1:/home/hadoop/.ssh/authorized_keys
若拷貝出錯,則在.ssh文件 可手動建立,但是注意修改其權限為700:chmod 700 .ssh
。。。
以此類推,最終在最后一個節點上的authorized_keys上包括了所有主機的公鑰,再將它拷貝到其他節點上,完成免密登錄的設置。

2.設置hosts文件

本人搭建的Hadoop環境包括有一個主節點和三個從節點,配置為:一個NameNode,一個SecondaryNameNode以及兩個DataNode。
/etc/hosts添加配置如下

10.0.209.122 master122 hadoop-NameNode-122
10.0.209.123 slave123 hadoop-SecondaryNameNode-123
10.0.209.124 slave124 hadoop-DataNode-124
10.0.209.125 slave125 hadoop-DataNode-125

在一個主機上配置完成后,將該文件拷貝到其他節點之上。

3.安裝Hadoop

首先,在master節點上,使用root用戶在/usr/local/文件夾下新建hadoop文件夾,并修改該文件夾對普通用戶有讀寫權限

mkdir /usr/local/hadoop
chmod 777 /usr/local/hadoop

使用普通用戶hadoop登錄:su hadoop
下載jdk1.8安裝包以及hadoop的安裝包,并加壓文件到/usr/local/hadoop下

wget wget http://apache.claz.org/hadoop/common/hadoop-2.8.1/hadoop-2.8.1.tar.gz
tar -xzvf  hadoop-2.8.1.tar.gz -C /usr/local/hadoop

加壓后/usr/local/hadoop/文件夾下包含jdk1.8以及hadoop2.8.1,
切換到root用戶,編輯/etc/profile文件

JAVA_HOME=/usr/local/hadoop/jdk1.8.0_102
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
HADOOP_HOME=/usr/local/hadoop/hadoop-2.8.1
PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export JAVA_HOME
export PATH
export HADOOP_HOME
export CLASSPATH

保存后執行source /etc/profile 使其立即生效。
然后執行java -version和hadoop version驗證,配置安裝成功。

4.配置Hadoop集群

(1). 配置core-site.xml

修改Hadoop核心配置文件/usr/local/hadoop/etc/hadoop/core-site.xml,通過fs.default.name指定NameNode的IP地址和端口號,通過hadoop.tmp.dir指定hadoop數據存儲的臨時文件夾。

<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/hadoop/hadoop-2.8.1/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master122:9000</value>
</property>
</configuration>

特別注意:如沒有配置hadoop.tmp.dir參數,此時系統默認的臨時目錄為:/tmp/hadoo-hadoop。而這個目錄在每次重啟后都會被刪除,必須重新執行format才行,否則會出錯。

(2).配置hdfs-site.xml

修改HDFS核心配置文件/usr/local/hadoop/etc/hadoop/hdfs-site.xml,通過dfs.replication指定HDFS的備份因子為3,通過dfs.name.dir指定namenode節點的文件存儲目錄,通過dfs.data.dir指定datanode節點的文件存儲目錄。

<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/usr/local/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/usr/local/hadoop/hdfs/data</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name> #配置SecondaryNameNode
<value>slave123:50090</value>
</property>
</configuration>

(3).配置mapred-site.xml

拷貝mapred-site.xml.template為mapred-site.xml,再進行修改。

cp /usr/local/hadoop/hadoop-2.8.1/etc/hadoop/mapred-site.xml.template /usr/local/hadoop/hadoop-2.8.1/etc/hadoop/mapred-site.xml  
vi /usr/local/hadoop/hadoop-2.8.1/etc/hadoop/mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapred.job.tracker</name>

  <value>http://hadoop-master:9001</value>

</property>
</configuration>

(4).配置yarn-site.xml

<configuration>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop-master</value>
</property>
</configuration>

(5).配置masters文件

增加/usr/local/hadoop/etc/hadoop/masters文件,該文件指定namenode節點所在的服務器機器。添加namenode節點的主機名master122;不建議使用IP地址,因為IP地址可能會變化,但是主機名一般不會變化。另外,為將SecondaryNameNode與NameNode分開,可將SecondaryNameNode節點的主機也加入到masters文件之中。

master122
slave123

(6).配置slaves節點(Master主機特有)

修改/usr/local/hadoop/etc/hadoop/slaves文件,該文件指定哪些服務器節點是datanode節點。刪除locahost,添加所有datanode節點的主機名,如下所示。
vi /usr/local/hadoop/hadoop-2.8.1/etc/hadoop/slaves

slave123
slave124
slave125

(7).配置hadoop-env.sh文件

修改jdk的目錄,以及集群間免密互連的端口(由于本人修改了ssh的默認端口,而hadoop默認是以22端口連接,所以需要進行添加配置)

export JAVA_HOME=/usr/local/hadoop/jdk1.8.0_102   #修改jdk路徑
export HADOOP_SSH_OPTS="-p 22000"  #添加ssh自定義端口

(8).配置ssh客戶端配置

由于修改了ssh的默認端口,使得在使用ssh以及scp時都要加上-p/-P 非常的繁瑣(主要是因為懶是人類進步的階梯),所以修改ssh的客戶端配置,使其默認配置端口為自定義端口。
vi /etc/ssh/ssh_config

Port 22000    #將源端口22修改為自定義端口22000

5.同步配置到其他節點

第4步配置是在主節點master上進行的配置,下面要將上述配置好的jdk以及hadoop軟件包拷貝到其他從節點上,首先在各個從節點建立文件夾/usr/local/hadoop,并將其權限設置為777,然后用普通用戶hadoop執行命令:

scp -r /usr/local/hadoop/* slave123:/usr/local/hadoop/ &
scp -r /usr/local/hadoop/* slave124:/usr/local/hadoop/ &
scp -r /usr/local/hadoop/* slave125:/usr/local/hadoop/ &

由于已經配置ssh客戶端的連接端口,所以這里不需要特意指定,加‘&’因為hadoop/下包含jdk以及hadoop軟件包,文件很大,放入后臺執行更方便。
下面繼續將/etc/profile下的JAVA_HOME和HADOOP_HOME配置同步配置到其他節點,至此集群的搭建配置完成。

6.啟動集群

在主節點master上進入到/usr/local/hadoop/hadoop-2.8.1/執行命令:

bin/hadoop namenode -format  #格式化namenode,第一次啟動服務前執行的操作,以后不需要執行。

然后啟動hadoop:

sbin/start-all.sh

執行jps命令查看運行情況
通過簡單的jps命令雖然可以查看HDFS文件管理系統、MapReduce服務是否啟動成功,但是無法查看到Hadoop整個集群的運行狀態。我們可以通過hadoop dfsadmin -report進行查看。用該命令可以快速定位出哪些節點掛掉了,HDFS的容量以及使用了多少,以及每個節點的硬盤使用情況。
停止hadoop命令:sbin/stop-all.sh

至此,hadoop集群搭建配置完畢。

7.可能的錯誤

The authenticity of host ‘0.0.0.0 (0.0.0.0)’ can’t be established.

解決方案:關閉SELINUX

-- 關閉SELINUX
# vim /etc/selinux/config
-- 注釋掉
#SELINUX=enforcing
#SELINUXTYPE=targeted
— 添加
SELINUX=disabled
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,578評論 6 544
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,701評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,691評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,974評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,694評論 6 413
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 56,026評論 1 329
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,015評論 3 450
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,193評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,719評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,442評論 3 360
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,668評論 1 374
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,846評論 3 351
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,255評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,592評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,394評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,635評論 2 380

推薦閱讀更多精彩內容