HDFS個人學習總結

WHAT

HDFS:分布式文件系統

Feather:
  • 檢測和快速自動恢復
  • 支持大文件存儲
  • 對文件實行一次寫入、多次讀取的訪問模式
Drawback:
  • 延遲高(對于低延遲的訪問需求,可以使用HBase)
  • 無法高效存儲大量小文件
  • 不支持修改文件,只能執行追加操作
Structure:
  • NameNode:管理文件系統的命名空間,維護文件系統樹、所有文件、目錄以及塊的元數據,元數據有兩種namespace image和edit log。
    namenode擁有block和datanode之間的映射關系,但是它并不持久化這些信息,這些信息來源依賴于datanode啟動時向namenode發送的報告。
  • SecondaryNameNode:輔助的NameNode,周期性的將edit log文件合并(HDFS的HA機制)
  • DataNode :datanode維護著最終的block,并定期向namenode發送該datanode包含的block列表(心跳機制)。
HDFS架構

WHERE

整個工作流上的位置

HOW

  • hadoop fs -ls : 查看HDFS下的文件列表
  • hadoop fs -mkdir:創建目錄
  • hadoop fs -put:上傳文件
  • hadoop fs -get:下載文件到本地
  • hadoop fs -cat:查看文件內容
  • hadoop fs -rm:刪除文件
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 首先,我們在使用前先看看HDFS是什麼?這將有助于我們是以后的運維使用和故障排除思路的獲得。 HDFS采用mast...
    W_Bousquet閱讀 4,240評論 0 2
  • HDFS的設計目標 通過上一篇文章的介紹我們已經了解到HDFS到底是怎樣的東西,以及它是怎樣通過多副本機制來提供高...
    陌上疏影涼閱讀 1,465評論 0 3
  • 題記:正值學校運動會假期,想吸收點新鮮的血液。心血來潮搭了個hadoop的偽分布式,了解了下HDFS。 HDFS簡...
    朱曉飛閱讀 794評論 0 0
  • 先思考問題 我們處在一個大數據的時代已經是不爭的事實,這主要表現在數據源多且大,如互聯網數據,人們也認識到數據里往...
    墻角兒的花閱讀 7,432評論 0 9
  • 翻譯自:原文。 大多數的開發者在使用Gralde時都選擇使用Gradle Wrapper。這非常好,因為使用Gra...
    aicaprio閱讀 744評論 0 1