安裝與配置大數據軟件

配置所需軟件:

①、VirtualBox-5.2.0-118431-Win.exe

②、Ubuntu14.04.5

③、jdk-8u151-linux-x64.tar.gz

④、hadoop-2.7.3.tar.gz


(一)、下載并安裝VirtualBox

? ? ? ? 默認安裝


(二)、安裝Ubuntu14.04.5







然后“繼續”,“下一步”

信息填完后點擊繼續安裝完成后會重新進入系統。


(三)、創建用戶hadoop

$ sudo ?adduser ?hadoop

并按照提示輸入hadoop用戶的密碼,例如密碼設定為 hadoop。注意輸入密碼的時候是不顯示的。并將hadoop用戶添加進sudo用戶組

$ sudo ?usermod ?-G ?sudo ?hadoop

輸入

$ cd ../ ? ??#進入到home目錄

$ cd ../ ? ?#進入到根目錄

輸入

$ sudo gedit ~/etc/sudoers ? ?#打開sudoers配置文件

root ? ? ALL = (ALL:ALL) ? ?ALL下面添加如下代碼:

hadoop????ALL = (ALL:ALL) ? ?ALL

保存并退出。

注銷切換成hadoop用戶



(四)、安裝JDK

? ? ①下載JDK

? ? ? ? ? ? ??jdk-8u151-linux-x64.tar.gz

? ? ②安裝解壓

將下載下來的 .tar.gz 文件解壓。使用如下命令解壓:

$ sudo ?tar ?zxvf ?./jdk-8u151-linux-x64.tar.gz

為了方便管理,將解壓后的文件移至另一個目錄下

$ sudo ?mkdir ?/usr/lib/jvm

$ sudo ?mv ?jdk1.8.0_151 ?/usr/lib/jvm

③設置環境變量

編輯用戶主目錄下的.bashrc文件

$ vim ?~/.bashrc

在該文件的末尾追加以下幾行代碼:

export ?JAVA_HOME=/usr/lib/jvm/jdk1.8.0_151

export ?CLASSPATH=${JAVA_HOME}/lib

export ?PATH=${JAVA_HOME}/bin:$PATH

為了讓更改立即生效,執行如下命令:

$ source ?~/.bashrc

④驗證JDK

$ java ?-version


(五)、安裝Hadoop2.7.3

①下載hadoop2.7.3

hadoop-2.7.3.tar.gz

②安裝hadoop-2.7.3

進入到下載目錄

將下載下來的 .tar.gz 文件解壓。使用如下命令解壓:

$ sudo ?tar ?zxvf ?hadoop-2.7.3.tar.gz

為了方便管理,將解壓后的文件移至另一個目錄下

$ sudo? mv? hadoop-2.7.3? /usr/local/hadoop

為安裝目錄添加權限

$ sudo ?chmod ?777 ?/usr/local/hadoop

③配置hadoop2.7.3

編輯用戶主目錄下的.bashrc文件

$ gedit? ~/.bashrc

$ vim ?~/.bashrc

在該文件的末尾追加以下幾行代碼:

#HADOOP START

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_151

export HADOOP_INSTALL=/usr/local/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin

export PATH=$PATH:$HADOOP_INSTALL/sbin

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"

#HADOOP END

保存退出后,激活新加的環境變量

$ source ? ~/.bashrc

④驗證安裝是否成功

$ cd ?/usr/local/hadoop

$ mkdir ?./input

$ cp ./etc/hadoop/*.xml ./input ? ?#將配置文件作為輸入文件

$ ? ./bin/hadoop ?jar ?./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep ?./input ?./output ?'dfs[a-z.]+'

$ cat ?./output/* ? ?#查看運行結果

出現以下結果即可。

(六)、安裝SSH、配置SSH無密碼登陸

$ sudo apt-get install openssh-server

$ ssh localhost

輸入yes

$ exit ? ? ? ?#退出剛才的 ssh localhost

$ cd ~/.ssh/ ? ? ? ?#若沒有該目錄,請先執行一次ssh localhost

$ ssh-keygen -t rsa ? ? ? #會有提示,都按回車就可以

$ cat ./id_rsa.pub >> ./authorized_keys ? ?#加入授權

然后輸入

$ ssh localhost

結果如下:



(七)、安裝hadoop-偽分布式配置

Hadoop 可以在單節點上以偽分布式的方式運行,Hadoop 進程以分離的 Java 進程來運行,節點既作為 NameNode 也作為 DataNode,同時,讀取的是 HDFS 中的文件。

①修改配置文件

Hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/ 中,偽分布式需要修改2個配置文件 core-site.xml hdfs-site.xml 。Hadoop的配置文件是 xml 格式,每個配置以聲明 property 的 name 和 value 的方式來實現。

修改配置文件 core-site.xml (通過 gedit 編輯會比較方便: gedit ./etc/hadoop/core-site.xml),將當中的

<configuration>

</configuration>

修改為如下配置:

<configuration>

<property>


<name>hadoop.tmp.dir</name>

< value> file:/usr/local/hadoop/tmp< /value>

< description> Abase for other temporary directories.< /description>

</property>

< property>

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</ property>

</ configuration>

同樣的,修改配置文件 hdfs-site.xml

<configuration>

? ??<property>

? ??????<name>dfs.replication</name>

? ?????? ? ?????<value>1</value>

? ?????? </property>

? ?????? <property>

? ?????? ? ?????? <name>dfs.namenode.name.dir</name>

? ?????? ? ? ?<value>file:/usr/local/hadoop/tmp/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/usr/local/hadoop/tmp/dfs/data</value>

</property>

</configuration>

執行 NameNode 的格式化:

./bin/hdfs ?namenode ?–format

成功的話,會看到 “successfully formatted” “Exitting with status 0” 的提示,若為 “Exitting with status 1” 則是出錯

③開啟 NameNode 和 DataNode 守護進程。

./sbin/start-dfs.sh

關閉守護進程

./sbin/stop-dfs.sh

若出現以下SSH提示,輸入yes即可。


④通過jps查看啟動的Hadoop進程


⑤運行Hadoop偽分布式實例

./bin/hdfs ?dfs ?-mkdir -p ?/usr/hadoop

./bin/hdfs ?dfs ?-mkdir ?input

./bin/hdfs ?dfs ?-put ?./etc/hadoop/* ?.xml ?input

./bin/hdfs ?dfs ?-ls ?input

./bin/hadoop ?jar ?./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar ?grep ?./input ?./output ?'dfs[a-z.]+'

./bin/hdfs ?dfs ?-cat ?output/*


⑥成功啟動后,可以訪問 Web 界面

http://localhost:50070 查看 NameNodeDatanode 信息,還可以在線查看 HDFS 中的文件。



(八)、啟動YARN

①首先修改配置文件 mapred-site.xml,這邊需要先進行重命名:

②編輯mapred-site.xml?文件,

gedit ?./etc/hadoop/mapred-site.xml

<configuration>

? ??<property>

? ??????<name>yarn.nodemanager.aux-services</name>

? ??????<value>yarn</value>

? ??</property>

</configuration>

修改配置文件 yarn-site.xml

<configuration>

? ? <property>

? ?????<name>yarn.nodemanager.aux-services</name>

? ?????<value>mapreduce shuffle</value>

? ??</property>

</configuration>

④啟動 YARN 了(需要先執行過 ./sbin/start-dfs.sh)

./sbin/start-dfs.sh? ? #啟動YARN

./sbin/mr-jobhistory-daemon.sh ?start ?historyserver? ? #開啟歷史服務器,才能在Web中查看任務運行情況

關閉YARN

./sbin/stop-yarn.sh

啟動 YARN 有個好處是可以通過 Web 界面查看任務的運行情況:http://localhost:8088/cluster,如下圖所示


不啟動 YARN 需重命名 mapred-site.xml

如果不想啟動 YARN,務必把配置文件 mapred-site.xml 重命名,改成 mapred-site.xml.template,需要用時改回來就行。

否則在該配置文件存在,而未開啟 YARN 的情況下,運行程序會提示 “Retrying connect to server: 0.0.0.0/0.0.0.0:8032” 的錯誤,這也是為何該配置文件初始文件名為 mapred-site.xml.template

⑤開啟 NameNode 和 DataNode 守護進程。

./sbin/start-dfs.sh

到此hadoop大數據已配置完成。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,885評論 6 541
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,312評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,993評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,667評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,410評論 6 411
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,778評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,775評論 3 446
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,955評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,521評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,266評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,468評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,998評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,696評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,095評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,385評論 1 294
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,193評論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,431評論 2 378

推薦閱讀更多精彩內容