好玩的大數據之10:Hadoop Shell

一、Hadoop Shell簡介

改編自:http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_shell.html


Hadoop Shell調用文件系統(FS)Shell命令應使用?bin/hadoop fs <args>的形式。 所有的的FS shell命令使用URI路徑作為參數。URI格式是scheme://authority/path。對HDFS文件系統,scheme是hdfs,對本地文件系統,scheme是file。其中scheme和authority參數都是可選的,如果未加指定,就會使用配置中指定的默認scheme。一個HDFS文件或目錄比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child,或者更簡單的/parent/child(假設你配置文件中的默認值是namenode:namenodeport)。大多數FS Shell命令的行為和對應的Unix Shell命令類似,不同之處會在下面介紹各命令使用詳情時指出。出錯信息會輸出到stderr,其他信息輸出到stdout

二、Hadoop Shell命令列表


Hadoop FS Shell命令列表

? ? ? ? ? ? ? ? ? ? ? ? 為方便文本復制,再來一遍文本版本得

????????????????????????????cat????chgrp????chmod????chown????copyFromLocal

????????????????????????????copyToLocal????cp????du????dus????expunge

????????????????????????????get????getmerge????ls????lsr????mkdir

????????????????????????????movefromLocal????mv????put????rm????rmr

????????????????????????????setrep????stat????tail????test????ext

????????????????????????????touchz

三、實驗數據準備


????????為了對這些命令進行試驗,先做一些準備工作,由于terminal對中文顯示支持的不好,所以建議使用英文文本作為例子,可以到http://www.chinadaily.com.cn/摘取幾段英文文本,做幾個英文的文本文件。

? ? 目錄創建

? ? ? ? ? ? ? ? hadoop fs -mkdir -p /fs-test/news

? ??????????????hadoop fs -mkdir -p /fs-test/words

????文件準備

? ? ? ? ? ? ? ? news01.txt

? ? ? ? ? ? ? ? news02.txt

? ? ? ? ? ? ? ? news03.txt

????????????????words01.txt

????????????????words02.txt

? ? ? ? ? ? ? ? words03.txt

? ? ? ? ?將這幾個文件放入到hdfs中

????????????????hadoop fs -put news*.txt /fs-test/news

????????????????hadoop fs -put news*.txt /fs-test/words

? ? ? ? ?展示/fs-test及其子目錄

? ??????????????hadoop fs -ls -R /fs-test

四、Hadoop FS Shell例子


1 cat

? ??????使用方法:hadoop fs -cat URI [URI …]

????????將路徑指定文件的內容輸出到stdout

????????示例:

????????????????hadoop fs -cat hdfs://master:9000/fs-test/news/news01.txt hdfs://master:9000/fs-test/words/words01.txt

????????????????hadoop fs -cat /fs-test/news/news01.txt /fs-test/words/words01.txt

????????????????hadoop fs -cat file:///home/hadoop/share/news/news01.txt

2 chgrp

? ??????使用方法:hadoop fs -chgrp [-R] GROUP URI [URI …]

? ??????改變文件所屬的組。使用-R將使改變在目錄結構下遞歸進行。命令的使用者必須是文件的所有者或者超級用戶。

3 chmod

? ??????使用方法:hadoop fs -chmod [-R] <MODE[,MODE]... | OCTALMODE> URI [URI …]

? ??????改變文件的擁有者。使用-R將使改變在目錄結構下遞歸進行。命令的使用者必須是超級用戶。

? ??????示例:

? ??????????????hadoop fs -chmod? -R 777 hdfs://master:9000/fs-test/news/news01.txt

chmod

4 chown

????????使用方法:hadoop fs -chown [-R] [OWNER][:[GROUP]] URI [URI ]

????????改變文件的擁有者。使用-R將使改變在目錄結構下遞歸進行。命令的使用者必須是超級用戶。

5 copyFromLocal

????????使用方法:hadoop fs -copyFromLocal <localsrc> URI

????????除了限定源路徑是一個本地文件外,和put命令相似。

? ??????示例:

? ??????hadoop fs -ls /fs-test/news

????????hadoop fs -rm hdfs://master:9000/fs-test/news/news01.txt

? ??????hadoop fs -ls /fs-test/news

? ??????hadoop fs -copyFromLocal file:///home/hadoop/share/news/news01.txt hdfs://master:9000/fs-test/news

????????hadoop fs -ls /fs-test/news

copyFromLocal

6 cp

????????使用方法:hadoop fs -cp URI [URI …] <dest>

????????將文件從源路徑復制到目標路徑。這個命令允許有多個源路徑,此時目標路徑必須是一個目錄。

????????示例:

????????????hadoop fs -ls /fs-test/news

????????????hadoop fs -rm hdfs://master:9000/fs-test/news/*

????????????hadoop fs -ls /fs-test/news

????????????hadoop fs -cp?file:///home/hadoop/share/news/news01.txt hdfs://master:9000/fs-test/news

????????????hadoop fs -cp?file:///home/hadoop/share/news/news01.txt? file:///home/hadoop/share/news/news02.txt?file:///home/hadoop/share/news/news03.txt hdfs://master:9000/fs-test/news

????????????hadoop fs -ls /fs-test/news

cp

7 du

????????使用方法:hadoop fs -du URI [URI …]

????????顯示目錄中所有文件的大小,或者當只指定一個文件時,顯示此文件的大小。

????????示例:

????????????????hadoop fs -du file:///home/hadoop/share hdfs://master:9000/fs-test

du

8 dus(?廢棄,推薦使用-du -s?)

????????使用方法:hadoop fs -dus <args>?

????????顯示文件的大小。

? ??????示例:

????????????????hadoop fs -dus?file:///home/hadoop/share?hdfs://master:9000/fs-test

????????????????hadoop fs -du -s?file:///home/hadoop/share?hdfs://master:9000/fs-test

dus

9 expunge

????????使用方法:hadoop fs -expunge

????????清空回收站。請參考HDFS設計文檔以獲取更多關于回收站特性的信息。

10 get

????????使用方法:hadoop fs -get [-ignorecrc] [-crc] <src> <localdst>

????????復制文件到本地文件系統。可用-ignorecrc選項復制CRC校驗失敗的文件。使用-crc選項復制文件以及CRC信息。

????????示例:

? ? ? ? ? ? ? ? mkdir?/home/hadoop/share/tmp

? ? ? ? ? ? ? ? hadoop fs -get hdfs://master:9000/user/hadoop/fs-test/news/*? /home/hadoop/share/tmp

? ? ? ? ? ? ? ? ls?/home/hadoop/share/tmp

get

11 getmerge

????????使用方法:hadoop fs -getmerge <src> <localdst> [addnl]

????????接受一個源目錄和一個目標文件作為輸入,并且將源目錄中所有的文件連接成本地目標文件。addnl是可選的,用于指定在每個文件結尾添加一個換行符。

????????示例:

12 ls

????????使用方法:hadoop fs -ls <args>

????????如果是文件,則按照如下格式返回文件信息:

????????????????文件名 <副本數> 文件大小 修改日期 修改時間 權限 用戶ID 組ID

????????如果是目錄,則返回它直接子文件的一個列表,就像在Unix中一樣。目錄返回列表的信息如下:

????????????????目錄名 <dir> 修改日期 修改時間 權限 用戶ID 組ID

????????示例:

? ??????????????hadoop fs -ls hdfs://master:9000/fs-test/news

????????????????hadoop fs -ls -R hdfs://master:9000/fs-test

ls

13 lsr(?廢棄,推薦使用ls -R)

????????使用方法:hadoop fs -lsr <args>

????????ls命令的遞歸版本。類似于Unix中的ls -R。

????????示例:

????????????????hadoop fs -lsr hdfs://master:9000/fs-test

????????????????hadoop fs -ls -R hdfs://master:9000/fs-test

lsr

14 mkdir

????????使用方法:hadoop fs -mkdir <paths>

????????接受路徑指定的uri作為參數,創建這些目錄。其行為類似于Unix的mkdir -p,它會創建路徑中的各級父目錄。

????????示例:

????????????????hadoop fs -mkdir hdfs://master:9000/fs-test/t1?hdfs://master:9000/fs-test/t2

mkdir

15 movefromLocal

????????使用方法:dfs -moveFromLocal <src> <dst>

16 mv

? ? ? ? 使用方法:hadoop fs -mv URI [URI …] <dest>

????????將文件從源路徑移動到目標路徑。這個命令允許有多個源路徑,此時目標路徑必須是一個目錄。不允許在不同的文件系統間移動文件。

????????示例:

????????????????hadoop fs -ls hdfs://master:9000/fs-test/t1

????????????????hadoop fs -mv hdfs://master:9000/fs-test/news/news01.txt hdfs://master:9000/fs-test/t1

????????????????hadoop fs -mv /fs-test/news/news02.txt?/fs-test/news/news03.txt /fs-test/t1

????????????????hadoop fs -ls hdfs://master:9000/fs-test/t1

????????????????hadoop fs -ls hdfs://master:9000/fs-test/news

????????????????hadoop fs -mv /fs-test/t1/* /fs-test/news

????????????????hadoop fs -ls hdfs://master:9000/fs-test/t1

????????????????hadoop fs -ls hdfs://master:9000/fs-test/news

mv

17 put

????????使用方法:hadoop fs -put <localsrc> ... <dst>

????????從本地文件系統中復制單個或多個源路徑到目標文件系統。也支持從標準輸入中讀取輸入寫入目標文件系統。

????????示例:

? ???????????????hadoop fs -rm hdfs://master:9000/fs-test/t1/*

????????????????hadoop fs -put? /home/hadoop/share/news/* hdfs://master:9000/fs-test/t1

? ??????????????hadoop fs -ls hdfs://master:9000/fs-test/t1

????????????????hadoop fs -put - hdfs://master:9000/fs-test/t1/stdio.txt

????????????????????????????從標準輸入中讀取輸入。CTRL+D結束輸入

????????????????hadoop fs -ls hdfs://master:9000/fs-test/t1

? ??????????????hadoop fs -cat hdfs://master:9000/fs-test/t1/stdio.txt


18 rm

????????使用方法:hadoop fs -rm URI [URI …]

????????刪除指定的文件。只刪除非空目錄和文件。請參考rmr命令了解遞歸刪除。

????????示例:

????????????????hadoop fs -rm hdfs://master:9000/fs-test/t1/*

19 rmr(已廢棄,推薦使用-rm -r)

????????使用方法:hadoop fs -rmr URI [URI …]

????????delete的遞歸版本。

????????示例:

????????????????hadoop fs -rm hdfs://master:9000/fs-test/t1

????????????????hadoop fs -rm -r hdfs://master:9000/fs-test/t1

20 setrep

????????使用方法:hadoop fs -setrep [-R] <path>

????????改變一個文件的副本系數。-R選項用于遞歸改變目錄下所有文件的副本系數。

????????示例:

????????????????hadoop fs -setrep -w 3 -R hdfs://master:9000/fs-test/news/news01.txt

21 stat

????????使用方法:hadoop fs -stat URI [URI …]

????????返回指定路徑的統計信息。

????????示例:

????????????hadoop fs -stat?hdfs://master:9000/fs-test/news/news01.txt

22 tail

????????使用方法:hadoop fs -tail [-f] URI

????????將文件尾部1K字節的內容輸出到stdout。支持-f選項,行為和Unix中一致。

????????示例:

????????????????hadoop fs -tail hdfs://master:9000/fs-test/news/news01.txt

23 test

????????使用方法:hadoop fs -test -[ezd] URI

????????選項:

????????????????-e 檢查文件是否存在。如果存在則返回0。

????????????????-z 檢查文件是否是0字節。如果是則返回0。

????????????????-d 如果路徑是個目錄,則返回1,否則返回0。

????????示例:

????????????????hadoop fs -test -e hdfs://master:9000/fs-test/news/news01.txt

24 text

????????使用方法:hadoop fs -text <src>

????????將源文件輸出為文本格式。允許的格式是zip和TextRecordInputStream。

25 touchz

????????使用方法:hadoop fs -touchz URI [URI …]

????????創建一個0字節的空文件。

? ??????????hadoop fs -touchz?hdfs://master:9000/fs-test/t2/zero.txt

? ??????????hadoop fs -ls hdfs://master:9000/fs-test/t2/zero.txt

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容