Hadoop 學習系列(一)之Hadoop偽分布式環(huán)境搭建

原文地址:http://pengtuo.tech/2018/09/04/hadoop-pseudo-distributed/

以這篇文章開啟大數(shù)據(jù)開發(fā)系列教程更新,本人也是努力學習中

1. 環(huán)境要求

首先 Java 版本不低于 Hadoop 相應(yīng)版本要求,一般的,Hadoop 大版本號在 2.6 以前的支持 Java 6,Hadoop 大版本號 在 2.7 ~ 3.0 之間的支持 Java 7,Hadoop 版本在 3.0 之后的支持 Java 8

詳細可見官網(wǎng) Hadoop Java Versions

本文所用的 Hadoop 版本為 hadoop-2.6.0-cdh5.7.0,這個版本很穩(wěn)定,屬于大多企業(yè)使用的 Hadoop 版本,Java 版本使用的是 java version "1.7.0_80"

在 Linux 中下載,執(zhí)行以下命令:

  • 下載 Java 8
wget --no-check-certificate -c --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u161-b12/2f38c3b165be4555a1fa6e98c45e0808/jdk-8u161-linux-x64.tar.gz
  • 下載 Java 7
wget --no-check-certificate -c --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn/java/jdk/7u80-b15/jdk-7u80-linux-x64.tar.gz?AuthParam=1523684058_82b7921ee0def49bd2a0930187900e60
  • 下載 hadoop-2.6.0-cdh5.7.0
wget --no-check-certificate -c --header "Cookie: oraclelicense=accept-securebackup-cookie" http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz

本人的建議文件管理方式,將這些下載都存儲到 ~/downloads/ 文件夾里,然后解壓到 ~/app/ 文件里

2. 環(huán)境配置

2.1 配置 Java

執(zhí)行解壓命令

tar -zxvf jdk-8u161-linux-x64.tar.gz -C ~/app/

創(chuàng)建.profile 文件,如果有就不用創(chuàng)建了,然后在.profile 文件里添加

export JAVA_HOME=/root/app/jdk1.7.0_80
export PATH=$JAVA_HOME/bin:$PATH

保存退出后,執(zhí)行 source .profile 讓配置生效

2.2 配置 ssh 免密登錄

HDFS 是由一個 NameNode,一個 SecodaryNameNode,以及 n 個 DataNode 組成,當有多臺物理機時,NameNodeDataNode 是分布在不同的物理機上,部署則需要 NameNode 能夠直接與 DataNode 進行通信,通信方式之一就是使用 SSH (Secure Shell),所以需要在之間設(shè)置免密登錄

因為本次是 Hadoop 偽分布式搭建,本機同時充當 NameNodeDataNode 角色,所以只需要配置一個本機的 SSH 免密登錄

執(zhí)行:

ssh-keygen -t rsa
cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

即可

2.3 修改 hadoop 配置文件

解壓 hadoop 壓縮包:

tar -zxvf hadoop-2.6.0-cdh5.7.0.tar.gz -C ~/app/

.profile 文件里添加:

export HADOOP_HOME=/root/app/hadoop-2.6.0-cdh5.7.0
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export PATH=$HADOOP_HOME/bin:$PATH

Hadoop 的配置文件都在 hadoop_home/etc/hadoop/ 里,如果你的文件管理方式和我一樣的話,則是在 ~/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop/

hadoop-env.sh 中添加:

export JAVA_HOME= 你的 java home 路徑

core-site.xml 中添加:

<configuration>

<property>
    <name>fs.defaultFS</name>
    <value>hdfs:// {你的 IP 地址或 hostname} :8020</value>
</property>

<property>
    <name>hadoop.tmp.dir</name>
    <value>~/app/tmp</value>
</property>

</configuration>

hdfs-site.xml 中添加:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

2.4 啟動 hdfs

首先格式化文件系統(tǒng)

注意:僅第一次執(zhí)行即可,不要重復執(zhí)行

cd ~/app/hadoop-2.6.0-cdh5.7.0
bin/hdfs namenode -format

然后啟動 namenodedatanode

sbin/start-dfs.sh

檢驗是否啟動成功,執(zhí)行 jps,如果顯示:

3644 SecondaryNameNode
3341 NameNode
3450 DataNode
4141 Jps

則表示環(huán)境配置成功,如果少一個就表示啟動沒有成功,則需要檢查相應(yīng)的日志進行錯誤排查

3. 錯誤排查

NameNodeSecondaryNameNode以及DataNode的啟動日志都在~/app/hadoop-2.6.0-cdh5.7.0/logs/中,查看對應(yīng)的.log文件可獲得啟動信息以及錯誤日志

本人配置過程的遇到的錯誤有:

(1) 地址綁定錯誤:

Problem binding to [aliyun:8030] 
java.net.BindException: Cannot assign requested address; 
For more details see:  http://wiki.apache.org/hadoop/BindException

Caused by: java.net.BindException: Cannot assign requested address

解決方法:本人是在阿里云服務(wù)器上配置,在 /etc/hosts 文件中,主機名配置IP不能用公網(wǎng)IP,需要用內(nèi)網(wǎng)IP

(2) 在啟動 hadoop 時,有 log4jwarning 警告信息

解決方法:vim etc/hadoop/log4j.properties,然后添加 log4j.logger.org.apache.hadoop.util.NativeCodeLoader=ERROR

注意:此方法只是修改了 log4j 的活躍等級,并不是解決了 warning 的根源,屬于治標不治本

(3) 執(zhí)行 jps 后,只啟動了 NameNodeSecondaryNameNode,沒有啟動 DataNode
查看日志得到錯誤日志:

2018-09-04 11:47:38,166 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool <registering> (Datanode Uuid unassigned) service to aliyun/172.16.252.38:8020. Exiting.
java.io.IOException: All specified directories are failed to load.
    at org.apache.hadoop.hdfs.server.datanode.DataStorage.recoverTransitionRead(DataStorage.java:478)
    at org.apache.hadoop.hdfs.server.datanode.DataNode.initStorage(DataNode.java:1394)
    at org.apache.hadoop.hdfs.server.datanode.DataNode.initBlockPool(DataNode.java:1355)
    at org.apache.hadoop.hdfs.server.datanode.BPOfferService.verifyAndSetNamespaceInfo(BPOfferService.java:317)
    at org.apache.hadoop.hdfs.server.datanode.BPServiceActor.connectToNNAndHandshake(BPServiceActor.java:228)
    at org.apache.hadoop.hdfs.server.datanode.BPServiceActor.run(BPServiceActor.java:829)
    at java.lang.Thread.run(Thread.java:745)

這個是文件系統(tǒng)初試化時出了問題

解決方法:停止已啟動的節(jié)點,停止命令為 sbin/stop-dfs.sh,刪除 ~/app/tmp/dfs 文件夾,然后重新到 ~/app/hadoop-2.6.0-cdh-5.7.0/ 執(zhí)行 bin/hdfs namenode -format,然后啟動 sbin/start-dfs.sh,此時就能夠成功啟動

強烈注意bin/hdfs namenode -format格式化文件系統(tǒng)命令,如果你是初次搭建,可以用此方法暴力解決,但是如果已經(jīng)使用了 Hadoop 一段時間,HDFS 存在重要數(shù)據(jù),則需要另找它法。

OK,后面將會講解 Hadoop 的重要組成部分以及相關(guān)知識

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,739評論 6 534
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,634評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,653評論 0 377
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,063評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,835評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,235評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,315評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,459評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,000評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,819評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,004評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,560評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,257評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,676評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,937評論 1 288
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,717評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,003評論 2 374

推薦閱讀更多精彩內(nèi)容

  • 終極算法 關(guān)注微信號每天收聽我們的消息終極算法為您推送精品閱讀 前言 Hadoop 在大數(shù)據(jù)技術(shù)體系中的地位至關(guān)...
    Yespon閱讀 130,179評論 12 168
  • 一、系統(tǒng)參數(shù)配置優(yōu)化 1、系統(tǒng)內(nèi)核參數(shù)優(yōu)化配置 修改文件/etc/sysctl.conf,添加如下配置,然后執(zhí)行s...
    張偉科閱讀 3,768評論 0 14
  • 1. Hadoop常用組件: 1. hadoop commons :hadoop基礎(chǔ)模塊。 2. HDFS:存儲數(shù)...
    奉先閱讀 863評論 0 2
  • 今天早晨我和媽媽寫完字,我們一起看數(shù)學書,我們把別的都寫完了,就只差長度單位了。我和媽媽開始練習長度單位了,第...
    M張皓軒M閱讀 170評論 0 0
  • “時間總是顯得那么短暫而不夠。” 人生其實不長,若以70為人的平均壽命,那么不過只能活25567天,61360...
    泠鹿閱讀 170評論 0 0