Hadoop 學習系列（一）之Hadoop偽分布式環(huán)境搭建

原文地址：http://pengtuo.tech/2018/09/04/hadoop-pseudo-distributed/

以這篇文章開啟大數(shù)據(jù)開發(fā)系列教程更新，本人也是努力學習中

1. 環(huán)境要求

首先 Java 版本不低于 Hadoop 相應(yīng)版本要求，一般的，Hadoop 大版本號在 2.6 以前的支持 Java 6，Hadoop 大版本號在 2.7 ~ 3.0 之間的支持 Java 7，Hadoop 版本在 3.0 之后的支持 Java 8

詳細可見官網(wǎng) Hadoop Java Versions

本文所用的 Hadoop 版本為 hadoop-2.6.0-cdh5.7.0，這個版本很穩(wěn)定，屬于大多企業(yè)使用的 Hadoop 版本，Java 版本使用的是 java version "1.7.0_80"

在 Linux 中下載，執(zhí)行以下命令：

下載 Java 8

wget --no-check-certificate -c --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u161-b12/2f38c3b165be4555a1fa6e98c45e0808/jdk-8u161-linux-x64.tar.gz

下載 Java 7

wget --no-check-certificate -c --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn/java/jdk/7u80-b15/jdk-7u80-linux-x64.tar.gz?AuthParam=1523684058_82b7921ee0def49bd2a0930187900e60

下載 hadoop-2.6.0-cdh5.7.0

wget --no-check-certificate -c --header "Cookie: oraclelicense=accept-securebackup-cookie" http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz

本人的建議文件管理方式，將這些下載都存儲到 ~/downloads/ 文件夾里，然后解壓到 ~/app/ 文件里

2. 環(huán)境配置

2.1 配置 Java

執(zhí)行解壓命令

tar -zxvf jdk-8u161-linux-x64.tar.gz -C ~/app/

創(chuàng)建.profile 文件，如果有就不用創(chuàng)建了，然后在.profile 文件里添加

export JAVA_HOME=/root/app/jdk1.7.0_80
export PATH=$JAVA_HOME/bin:$PATH

保存退出后，執(zhí)行 source .profile 讓配置生效

2.2 配置 ssh 免密登錄

HDFS 是由一個 NameNode，一個 SecodaryNameNode，以及 n 個 DataNode 組成，當有多臺物理機時，NameNode 與 DataNode 是分布在不同的物理機上，部署則需要 NameNode 能夠直接與 DataNode 進行通信，通信方式之一就是使用 SSH (Secure Shell)，所以需要在之間設(shè)置免密登錄

因為本次是 Hadoop 偽分布式搭建，本機同時充當 NameNode 與 DataNode 角色，所以只需要配置一個本機的 SSH 免密登錄

執(zhí)行：

ssh-keygen -t rsa
cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

即可

2.3 修改 hadoop 配置文件

解壓 hadoop 壓縮包：

tar -zxvf hadoop-2.6.0-cdh5.7.0.tar.gz -C ~/app/

在 .profile 文件里添加：

export HADOOP_HOME=/root/app/hadoop-2.6.0-cdh5.7.0
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export PATH=$HADOOP_HOME/bin:$PATH

Hadoop 的配置文件都在 hadoop_home/etc/hadoop/ 里，如果你的文件管理方式和我一樣的話，則是在 ~/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop/ 中

在 hadoop-env.sh 中添加：

export JAVA_HOME= 你的 java home 路徑

在 core-site.xml 中添加：

<configuration>

<property>
    <name>fs.defaultFS</name>
    <value>hdfs:// {你的 IP 地址或 hostname} :8020</value>
</property>

<property>
    <name>hadoop.tmp.dir</name>
    <value>~/app/tmp</value>
</property>

</configuration>

在 hdfs-site.xml 中添加：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

2.4 啟動 hdfs

首先格式化文件系統(tǒng)

注意：僅第一次執(zhí)行即可，不要重復執(zhí)行

cd ~/app/hadoop-2.6.0-cdh5.7.0
bin/hdfs namenode -format

然后啟動 namenode 和 datanode

sbin/start-dfs.sh

檢驗是否啟動成功，執(zhí)行 jps，如果顯示：

3644 SecondaryNameNode
3341 NameNode
3450 DataNode
4141 Jps

則表示環(huán)境配置成功，如果少一個就表示啟動沒有成功，則需要檢查相應(yīng)的日志進行錯誤排查

3. 錯誤排查

NameNode、SecondaryNameNode以及DataNode的啟動日志都在~/app/hadoop-2.6.0-cdh5.7.0/logs/中，查看對應(yīng)的.log文件可獲得啟動信息以及錯誤日志

本人配置過程的遇到的錯誤有：

(1) 地址綁定錯誤：

Problem binding to [aliyun:8030] 
java.net.BindException: Cannot assign requested address; 
For more details see:  http://wiki.apache.org/hadoop/BindException

Caused by: java.net.BindException: Cannot assign requested address

解決方法：本人是在阿里云服務(wù)器上配置，在 /etc/hosts 文件中，主機名配置IP不能用公網(wǎng)IP，需要用內(nèi)網(wǎng)IP

(2) 在啟動 hadoop 時，有 log4j 的 warning 警告信息

解決方法：vim etc/hadoop/log4j.properties，然后添加 log4j.logger.org.apache.hadoop.util.NativeCodeLoader=ERROR

注意：此方法只是修改了 log4j 的活躍等級，并不是解決了 warning 的根源，屬于治標不治本

(3) 執(zhí)行 jps 后，只啟動了 NameNode 與 SecondaryNameNode，沒有啟動 DataNode
查看日志得到錯誤日志：

2018-09-04 11:47:38,166 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool <registering> (Datanode Uuid unassigned) service to aliyun/172.16.252.38:8020. Exiting.
java.io.IOException: All specified directories are failed to load.
    at org.apache.hadoop.hdfs.server.datanode.DataStorage.recoverTransitionRead(DataStorage.java:478)
    at org.apache.hadoop.hdfs.server.datanode.DataNode.initStorage(DataNode.java:1394)
    at org.apache.hadoop.hdfs.server.datanode.DataNode.initBlockPool(DataNode.java:1355)
    at org.apache.hadoop.hdfs.server.datanode.BPOfferService.verifyAndSetNamespaceInfo(BPOfferService.java:317)
    at org.apache.hadoop.hdfs.server.datanode.BPServiceActor.connectToNNAndHandshake(BPServiceActor.java:228)
    at org.apache.hadoop.hdfs.server.datanode.BPServiceActor.run(BPServiceActor.java:829)
    at java.lang.Thread.run(Thread.java:745)

這個是文件系統(tǒng)初試化時出了問題

解決方法：停止已啟動的節(jié)點，停止命令為 sbin/stop-dfs.sh，刪除 ~/app/tmp/dfs 文件夾，然后重新到 ~/app/hadoop-2.6.0-cdh-5.7.0/ 執(zhí)行 bin/hdfs namenode -format，然后啟動 sbin/start-dfs.sh，此時就能夠成功啟動

強烈注意：bin/hdfs namenode -format 是格式化文件系統(tǒng)命令，如果你是初次搭建，可以用此方法暴力解決，但是如果已經(jīng)使用了 Hadoop 一段時間，HDFS 存在重要數(shù)據(jù)，則需要另找它法。

OK，后面將會講解 Hadoop 的重要組成部分以及相關(guān)知識

最后編輯于：2018.10.03 12:47:37

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,739評論 6贊 534
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 98,634評論 3贊 419
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 176,653評論 0贊 377
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,063評論 1贊 314
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,835評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 55,235評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,315評論 3贊 442
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 42,459評論 0贊 289
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 49,000評論 1贊 335
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 40,819評論 3贊 355
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,004評論 1贊 370
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,560評論 5贊 362
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 44,257評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,676評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,937評論 1贊 288
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,717評論 3贊 393
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 48,003評論 2贊 374

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

Hadoop 學習系列（一）之Hadoop偽分布式環(huán)境搭建

Hadoop 學習系列（一）之Hadoop偽分布式環(huán)境搭建

1. 環(huán)境要求

2. 環(huán)境配置

2.1 配置 Java

2.2 配置 ssh 免密登錄

2.3 修改 hadoop 配置文件

2.4 啟動 hdfs

3. 錯誤排查

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

Hadoop 學習系列（一）之Hadoop偽分布式環(huán)境搭建

1. 環(huán)境要求

2. 環(huán)境配置

2.1 配置 Java

2.2 配置 ssh 免密登錄

2.3 修改 hadoop 配置文件

2.4 啟動 hdfs

3. 錯誤排查

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频