虛擬機(jī)克隆及大數(shù)據(jù)之hadoop學(xué)習(xí)筆記

快照? ---還原點

克隆注意點

1.修改主機(jī)名? ? vi? /etc/sysconfig/network

2.修改mac地址? ? vi /etc/sysconfig/network-scripts/ifcfg-eth0

HWADDR=00:0C:29:CD:79:8C? ---刪掉

UUID=57d4....? ? ? ? ? ? ? ? ? ? ? ? ? ? --刪掉

vi /etc/udev/rules.d/70-persistent-net.rules

--? 刪除錯誤的mac地址所在的行

3.重啟網(wǎng)絡(luò)服務(wù)

# service network restart

Hadoop? -----大數(shù)據(jù)基礎(chǔ)平臺

Lucene? 開源的高性能全文檢索工具包

Nutch? ? 開源的Web搜索引擎

--Doug Couting

谷歌公司(三大論文):

MapReduce? -- 計算框架模型(分而治之)? ? ? ? ? ? ----->MapReduce

GFS? ? ? ? ? ? ? ? --存儲數(shù)據(jù)? ? -->HDFS(hadoop distributed file system)

BigTable ? ? ? --存儲數(shù)據(jù)

---->MapReduce,HDFS加入apache 基金會? ,合并后也就是今天的Hadoop

大數(shù)據(jù)定義:海量數(shù)據(jù)里面挖掘/發(fā)現(xiàn)/采集/分析有價值的信息.

Hadoop? 四個重要組成部分

common? ---基礎(chǔ)模塊

HDFS? ? ? ? --存儲數(shù)據(jù) (讀-寫)? 一次寫入,多次讀取

--namenode? 存儲元數(shù)據(jù)(數(shù)據(jù)存儲的位置)

--datanode? ? 數(shù)據(jù)

Yarn? ? ? ? ? -- 資源管理(CPU/內(nèi)存/虛擬代碼)(2.x版本新增)

--ResourceManager

--NodeManger

MapReduce? --計算模型(分而治之)? ? key/value

-- 分? map

--合? ? reduce

Hadoop 生態(tài)系統(tǒng)

單機(jī)模式

偽分布式模式? --用于開發(fā)測試

分布式模式

偽分布式模式搭建:

環(huán)境準(zhǔn)備-----

1.系統(tǒng)的主機(jī)名(root用戶)

#vi? /etc/sysconfig/network

hadoop-senior.summer.com(不要用下劃線)

2.創(chuàng)建普通用hadoop(后期都使用這個用戶)

修改密碼# echo 123456 | passwd --stdin hadoop

3.把ip地址設(shè)置成靜態(tài)ip

#setup? --console(虛擬機(jī)圖形化界面)

或者

vi /etc/sysconfig/network-scripts/ifcfg-eth0

BOOTPROTO=none

IPADDR=192.168.153.128

NETMASK=255.255.255.0

GATEWAY=192.168.153.2

DNS1=202.96.209.5

DNS2=8.8.8.8

4.關(guān)閉防火墻和selinux

service iptables stop

chkconfig iptables off

vi /etc/sysconfig/selinux

SELINUX=disabled (進(jìn)去默認(rèn)是enforing)

5 修改host

vi /etc/sysconfig/selinux

[root@localhost ~]# vi /etc/hosts

6.重啟服務(wù)器

目錄準(zhǔn)備

[root@hadoop-senior ~]# mkdir /opt/modules(root用戶才能執(zhí)行)

[root@hadoop-senior ~]# mkdir /opt/softwares(root用戶才能執(zhí)行)

更改權(quán)限

[root@hadoop-senior ~]# chown -R hadoop:hadoop /opt/(hadoop用戶能執(zhí)行)

軟件包準(zhǔn)備

上傳 到softwares

安裝jdk 到modules

用root用戶修改vi /etc/profile 配置java_

#JAVA HOME

JAVA_HOME=/opt/modules/jdk1.7.0_67

PATH=$PATH:$JAVA_HOME/bin

hadoop用戶下 執(zhí)行? $ source /etc/profile

用root用戶刪除之前本身自帶的java 包

# rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.50.1.11.5.el6_3.x86_64 tzdata-java-2012j- ? ? ? 1.el6.noarch java-1.7.0-openjdk-1.7.0.9-2.3.4.1.el6_3.x86_64

用hadoop用戶安裝hadoop

$ tar zxvf hadoop-2.5.0.tar.gz? -C /opt/modules/

使用notepad++工具修改配置

配置HDFS 相關(guān):

/opt/modules/hadoop-2.5.0/etc/hadoop

hadoop-env.sh :

-- export JAVA_HOME=/opt/modules/jdk1.7.0_67

yarn-env.sh:

--export JAVA_HOME=/opt/modules/jdk1.7.0_67

mapred-env.sh:

--export JAVA_HOME=/opt/modules/jdk1.7.0_67

core-site.xml:

fs.defaultFS

hdfs://hadoop-senior.summer.com:8020

hdfs-site.xml:

dfs.replication

1

啟動hdfs --->>(第一次啟動hdfs服務(wù)要格式化)format? ---->start

bin/hdfs namenode -format

先啟動namenode

$ sbin/hadoop-daemon.sh start namenode

在啟動datanode

$ sbin/hadoop-daemon.sh start datanode

查看 jps (查看java進(jìn)程命令 )

3379 Jps

3306 DataNode

3231 NameNode

測試上傳文件

$ bin/hdfs -help (查看幫助)

步驟:

----bin/hdfs dfs -mkdir /input? 在集群下創(chuàng)建input目錄

bin/hdfs dfs -put /etc/yum.conf? /input? 上傳/etc/yum.conf 到input目錄下

bin/hdfs dfs -ls /input? 列出input目錄

bin/hdfs dfs -cat /input/yum.conf? 查看input目錄下的yun.conf

tips :可以通過瀏覽器查看

http://192.168.153.128:50070

配置Yarn相關(guān):

配置

yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

mapred-site.xml

mapreduce.framework.name

yarn

$ sbin/yarn-daemon.sh? start resourcemanager

$ sbin/yarn-daemon.sh? start nodemanager

[hadoop@hadoop-senior hadoop-2.5.0]$ jps

3855 NodeManager

3912 Jps

3788 ResourceManager

3306 DataNode

3231 NameNode

通過瀏覽器瀏覽? 192.168.153.128:8088

簡單的mapreduce 測試

創(chuàng)建一個 文件 vi sort.txt

上傳到hdfs目錄input下bin/hdfs dfs -put sort.txt? /input

執(zhí)行jar包中的命令bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar? wordcount /input/sort.txt /output

總結(jié)

配置的所有文件:

hadoop-env.sh? ? core-site.xml? hdfs-site.xml

yarn-env.sh? ? mapred-env.sh

yarn-site.xml? mapred-site.xml

日志:

.log:通過log4j,記錄大部分應(yīng)用程序的日志信息

.out:記錄標(biāo)準(zhǔn)輸出和標(biāo)準(zhǔn)錯誤日志

Hadoop 常用shell命令:

$ bin/hdfs dfs

-put? /ect/passwd? ? ? /? 上傳文件passwd 到 /根目錄

-ls

-cat? ? -text 查看文件內(nèi)容

-mkdir [-p]? 創(chuàng)建目錄

-mv? 移動文件

-cp? 復(fù)制

-du? 統(tǒng)計

-chmod 修改權(quán)限

Hadoop 比較重要的配置選項:

namenode:元數(shù)據(jù)?

datanode: 數(shù)據(jù)存儲目錄?

系統(tǒng)默認(rèn):

文件名:core-default.xml /hdfs-default.xml /yarn-default.xml

位置存在/hadoop-2.5/share/hadoop/對應(yīng)的模塊的jar包中

自定義的:

位置:$HADOOP_HOME/etc/hadoop

文件名:core-site.xml /hdfs-site.xml/yarn-site.xml/

自定義namenode 節(jié)點? datanode 節(jié)點

hdfs-sitem.xml? --聲明namenode 節(jié)點所在的服務(wù)器

dfs.namenode.http-address

hdfs://hadoop-senior.summer.com:50070

core-sitem.xml-- 定義datanode 數(shù)據(jù)存放的目錄

hadoop.temp.dir

/opt/modules/hadoop-2.5.0/data

yarn-sitem.xml? ? -- 聲明哪臺服務(wù)器存resoucemanager

yarn.resourcemanager.hostname

hadoop-senior.summer.com

修改配置文件后停止服務(wù),重新格式化namenode,,在重啟

283? sbin/hadoop-daemon.sh stop namenode

284? sbin/hadoop-daemon.sh stop datanode

285? sbin/yarn-daemon.sh stop resourcemanager

286? sbin/yarn-daemon.sh stop nodemanager

287? jps

288? bin/hdfs dfs namenode -format

291? sbin/hadoop-daemon.sh? start namenode

292? sbin/hadoop-daemon.sh? start datanode

293? sbin/yarn-daemon.sh start resourcemanager

294? sbin/yarn-daemon.sh start nodemanager

日志聚合

---? 日志上傳到HDFS

yarn-site.xml

yarn.log-aggregation-enable

true

yarn.log-aggregation.retain-seconds

8640

mapred-site.xml

mapreduce.jobhistory.webapp.address

hadoop-senior.summer.com:19888

啟動服務(wù) (查看job history服務(wù))

$ sbin/mr-jobhistory-daemon.sh? start historyserver

最后一共啟動的服務(wù)

[hadoop@hadoop-senior hadoop-2.5.0]$ jps

5032 DataNode

6656 Jps

5571 ResourceManager

4949 NameNode

5820 NodeManager

5957 JobHistoryServer

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,182評論 6 543
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,489評論 3 429
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,290評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,776評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 72,510評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,866評論 1 328
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,860評論 3 447
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 43,036評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,585評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 41,331評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,536評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,058評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,754評論 3 349
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,154評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,469評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,273評論 3 399
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 48,505評論 2 379

推薦閱讀更多精彩內(nèi)容