hadoop認(rèn)識(shí)與環(huán)境部署(版本2.6.4)

Hadoop認(rèn)識(shí)

Hadoop包含的模塊:

  • Hadoop Common:支持其他hadoop模塊的公用工具包;
  • HDFS:高吞吐量訪問的分布式文件系統(tǒng);
  • Hadoop YARN:任務(wù)調(diào)度和集群資源管理的框架;
  • Hadoop MapReduce:基于YARN并行處理大數(shù)據(jù)集的系統(tǒng)。

Hadoop其他相關(guān)項(xiàng)目:

  • Ambari:一個(gè)web管理工具;
  • Avro:數(shù)據(jù)序列化系統(tǒng);
  • Cassandra:可擴(kuò)展的無單點(diǎn)失敗的多主數(shù)據(jù)庫;
  • Chukwa:管理大分布式系統(tǒng)的數(shù)據(jù)集系統(tǒng);
  • HBase:支持大表存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)的可擴(kuò)展的分布式數(shù)據(jù)庫;
  • Hive:數(shù)據(jù)倉庫基礎(chǔ)設(shè)施,提供數(shù)據(jù)匯總和即席查詢;
  • Mahout:可擴(kuò)展的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘庫;
  • Pig:一個(gè)高層次的數(shù)據(jù)流語言和并行計(jì)算執(zhí)行框架;
  • Spark:Hadoop的數(shù)據(jù)的快速和通用計(jì)算引擎。Spark提供了支持廣泛的應(yīng)用,包括ETL,機(jī)器學(xué)習(xí),流處理和圖形計(jì)算的簡單和表現(xiàn)的編程模型;
  • Tez:廣義數(shù)據(jù)流編程框架;
  • ZooKeeper:分布式應(yīng)用的高性能協(xié)調(diào)服務(wù)。

Hadoop偽分布式環(huán)境配置

  • 下載Hadoop,直接去官網(wǎng)下載;
  • 修改hadoop的java環(huán)境,下載完hadoop后,解壓,找到hadoop中etc/hadoop/hadoop-env.sh
# set to the root of your Java installation
export JAVA_HOME=/usr/java/latest(設(shè)置為java的安裝目錄)
  • 配置
    1. etc/hadoop/core-site.xml
      <configuration>
          <property>
              <name>fs.defaultFS</name>
              <value>hdfs://localhost:9000</value>
          </property>
      </configuration>
      
    2. etc/hadoop/hdfs-site.xml
      <configuration>
          <property>
              <name>dfs.replication</name>
              <value>1</value>
          </property>
      </configuration>
      
  • 執(zhí)行
    1. 格式化文件系統(tǒng)
      $ bin/hdfs namenode -format
      
    2. 啟動(dòng)后臺(tái)線程
      $ sbin/start-dfs.sh
      
    3. 瀏覽器訪問
      http://localhost:50070/
    4. 執(zhí)行MapReduce任務(wù)
      $ bin/hdfs dfs -mkdir /user  // 創(chuàng)建目錄
      $ bin/hdfs dfs -mkdir /user/<username>  //username必須是當(dāng)前登錄用戶名,否則會(huì)報(bào)找不到input目錄的錯(cuò)誤
      
    5. 賦值目錄文件
      $ bin/hdfs dfs -put etc/hadoop input
      
    6. 運(yùn)行例子
      $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output 'dfs[a-z.]+'
      
    7. 測(cè)試輸出結(jié)果
      $ bin/hdfs dfs -get output output
      $ cat output/*
      或者
      $ bin/hdfs dfs -cat output/*
      
    8. 關(guān)閉
      $ sbin/stop-dfs.sh
      
  • YARN的方式執(zhí)行任務(wù)
    1-4部同上
    • 配置etc/hadoop/mapred-site.xml
      首先從mapred-site-template.xml拷貝一份重命名為mapred-site.xml,然后再修改mapred-site.xml文件
      <configuration>
          <property>
              <name>mapreduce.framework.name</name>
              <value>yarn</value>
          </property>
      </configuration>
      
    • 配置etc/hadoop/yarn-site.xml
      <configuration>
          <property>
              <name>yarn.nodemanager.aux-services</name>
              <value>mapreduce_shuffle</value>
          </property>
      </configuration>
      
    • 以yarn方式啟動(dòng)
      $ sbin/start-yarn.sh
      
    • 瀏覽器查看
      http://localhost:8088/
    • 停止
      $ sbin/stop-yarn.sh
      
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,461評(píng)論 6 532
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,538評(píng)論 3 417
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 176,423評(píng)論 0 375
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,991評(píng)論 1 312
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,761評(píng)論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,207評(píng)論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,268評(píng)論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,419評(píng)論 0 288
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,959評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,782評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,983評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,528評(píng)論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,222評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,653評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,901評(píng)論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,678評(píng)論 3 392
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,978評(píng)論 2 374

推薦閱讀更多精彩內(nèi)容

  • 簡述 hadoop 集群一共有4種部署模式,詳見《hadoop 生態(tài)圈介紹》。HA聯(lián)邦模式解決了單純HA模式的性能...
    mtide閱讀 13,118評(píng)論 8 20
  • 之前的有點(diǎn)忘記了,這里在云筆記拿出來再玩玩.看不懂的可以留言 大家可以嘗試下Ambari來配置Hadoop的相關(guān)環(huán)...
    HT_Jonson閱讀 2,983評(píng)論 0 50
  • 簡述 hadoop 集群一共有4種部署模式,詳見《hadoop 生態(tài)圈介紹》。HA模式的集群里面會(huì)部署兩臺(tái)NN(最...
    mtide閱讀 7,085評(píng)論 0 10
  • 簡述 hadoop 集群一共有4種部署模式,詳見《hadoop 生態(tài)圈介紹》。完全分布式模式將hadoop部署在至...
    mtide閱讀 4,154評(píng)論 0 10
  • 最近,我的朋友華哥失戀了??粗綍r(shí)很堅(jiān)強(qiáng),很優(yōu)秀的一個(gè)男人,卻陷入了前所未有的迷茫與痛苦。他失眠,酗酒,甚至,曠工...
    云淑閱讀 256評(píng)論 0 3