hadoop 命令操作hdfs 目錄權限管理

與其通過規章制度讓大家遵守某項規定，時而還要擔驚受怕總有那么一小嘬人冒天下之大不韙以身試法踐踏規定，一勞永逸解決信任問題的終極辦法看似有些獨裁專制，對于有特立獨行思想的刺頭，最好的根治手段就是閹割。現實中用囚籠囚禁犯人，在計算機系統中則是通過權限管理限制每一個人的操作范圍。

image.png

由于公司的大數據平臺搭建的比較簡陋，還要讓之前根本沒有接觸過 hadoop平臺的開發算法人員使用，他們的錯誤操作經常給你帶來意外的驚喜和感動的淚水，我心里有十萬個 MMP。。。

所以剛開始就想干脆像初中小學那樣寫個班規似的使用規范吧，但是規范的約束力是有限的，需要大家相互信任，但是總有人會錯誤操作的風險，怎么辦怎么辦，只能通過強制的方法解決這個局面。
好漢大部分都是被逼上梁山的，平臺的演進大多也是根據眼前出現的問題不斷精益求精的。所以搭建權限管理勢在必行。

先簡單介紹一下思想，其實有兩種方式，
一種是配置 ugi 的xml ，
一種是直接在 linux 創建相應的用戶和組，然后把 hdfs 的某一文件夾的操作權限賦予該用戶和組，
第一種侵入性小，配置簡單，第二種則簡單粗暴好操作但如果有成百上千的hadoop操作用戶則是一個不簡單的力氣活，最好有一個腳本可以自動化操作這些。為了盡快見效，我選擇了第二種,而且還要搭配著與我們的hadoop 任務提交機器使用。

我們數據算法小組現在一共五個人，人少就給每個人設置了一個賬號權限，還另外設置了一個 dev 及guests 的賬號，方便其他組和新加入的小伙伴臨時使用
下面開始操作了
1.在 hadoop master 的節點創建這些賬戶，為了這些賬戶好管理，也要創建一個組，組可以先用戶創建也可以在用戶之后創建

useradd medev && echo da@opo#8N5 | passwd --stdin medev
echo "medev ALL=(ALL) NOPASSWD:ALL" >> /etc/sudoers
groupadd datadev
usermod -a -G datadev medev
這些命令需要在 root 用戶下使用

2.登錄到每個用戶的shell 中，然后把原來 java hadoop path 的環境變量粘貼復制到新創建的用戶的 ~/.bashrc，保存并退出，然后
vi ~/.bashrc

export JAVA_HOME=/usr/local/java
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export SCALA_HOME=/usr/local/scala
export SQOOP_HOME=/usr/local/sqoop
export PATH=$SQOOP_HOME/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/usr/local/java/bin:/usr/local/hadoop/bin:/usr/local/hadoop/sbin:/usr/local/java/bin:/usr/local/hadoop/bin:/usr/local/hadoop/sbin:/root/bin:/usr/local/java/bin:/usr/local/hadoop/bin:/usr/local/hadoop/sbin:/usr/local/scala/bin

source ~/.bashrc
【注意，第二步我們只給 dev 和guests 兩個用戶這樣在 Master設置了，其他個人賬號沒有設置，主要是防止這些同事無意登錄到 Master 節點錯誤操作，但是所有新創建的用戶，我們在任務提交機器都這樣配置了】

3.使用hadoop fs -chown user:group /dirpath ，為 hdfs 上的用戶分配目錄操作權限，大前提是這樣的原來的日志流目錄還是 hadoop 管理員 hadoop 和組 supergroup 的，在 hdfs根目錄下創建一個總的 /outputs目錄，dev 用戶可以操控這個目錄及子目錄，然后其他的個人賬號，只可以操控在 /outputs/下的各自的子目錄集，比如 muller 只可以操作
/outputs/mulleroutput，整個 /outputs目錄都屬于該用戶組

hadoop fs -chown -R medev:datadev /Outputs/devoutput

這個操作需要在 hadoop管理員的身份執行

然后可以在 Master 使用 hadoop fs -put -get -mkdir -rm -r 命令來測試，果然都可以實現目錄權限的管理,不屬于你的只有查看和mapreduce的權限，不能創建不能刪除不能下載，只能在自己的目錄下肆意妄為。
rm: Permission denied: user=meDev, access=WRITE, inode="/":hadoop:supergroup:drwxr-xr-x

put: Permission denied: user=medev, access=WRITE, inode="/xial":hadoop:supergroup:drwxr-xr-x

mkdir: Permission denied: user=medev, access=WRITE, inode="/":hadoop:supergroup:drwxr-xr-x

get: /usr/local/hadoop/part-00000.deflate.COPYING (Permission denied)
5.然后在 hadoop 任務提交機器繼續創建同名的用戶和配置環境變量即可，然后測試完全沒有壓力

但是我們還是太天真了，我們做好了 hdfs 目錄權限管理，卻發現無法進行 mapreduce了，在運行 hadoop 自帶的 wordcount ，也報權限不足，細細的看，發現問題的嚴重性，獨自的用戶因為不屬于 supergroup 組，無法rwx hadoop的根目錄的 /tmp目錄，此目錄是放置 map 中間值得目錄，難道你忘記了嗎，hadoop 在進行 mapreduce時，會把中間結果保存在硬盤上，實際是hdfs的 /tmp目錄中，如果操作用戶沒有權限操作 /tmp也是無法進行mapReduce的，
17/10/27 19:52:21 INFO client.RMProxy: Connecting to ResourceManager at hadoop-master/194.168.255.155:8032 org.apache.hadoop.security.AccessControlException: Permission denied: user=linkedmeGuests, access=EXECUTE, inode="/tmp/hadoop-yarn":hadoop:supergroup:drwx------
所以要把 /tmp 目錄的權限設置為 777，單單 /tmp設置了還不可以，還要把其子目錄都要配置為777的權限，切換到hadoop 管理員操作

hadoop fs -chmod -R 777 /tmp

然后再運行發現又失敗了，發現對output的目錄沒有操作權限，
17/10/27 19:56:30 INFO mapreduce.Job: Job job_1508742787565_0140 running in uber mode : false
17/10/27 19:56:30 INFO mapreduce.Job: map 0% reduce 0%
17/10/27 19:56:30 INFO mapreduce.Job: Job job_1508742787565_0140 failed with state FAILED due to: Job setup failed : org.apache.hadoop.security.AccessControlException: Permission denied: user=meGuests, access=WRITE, inode="/Outputs/DannyOutputs":Danny:datadev:drwxr-xr-x

這個當然了，我們規定了每個賬號用戶的可以操作的output目錄，其他別人的目錄都不允許操作，所以只要把output 的目錄設置成自己的output目錄創建子目錄才可以正常操作，結果運行成功了

另外的重點！！！
我們還要配置一下 hdfs 相關 output目錄的存儲大小上限，這樣方便管理，不然有人的output太大，都不曉得竟然會超過源日志大小，這就尷尬了
》bin/hdfs dfs -put readme.txt /finance

》bin/hdfs dfs -du -s /finance
》3901 /finance

》bin/hdfs dfsadmin -setSpaceQuota 4000 /finance
設置/finance的大小上限為4000個字節

》bin/hdfs dfs -put readme1.txt /finance
由于已經超出4000個字節，則會報錯
》bin/hdfs dfsadmin -clrSpaceQuota /finance 將配額清除掉
》bin/hdfs dfs -put readme1.txt /finance 這次上傳就不會錯了~

[apache-nutch-1.2.rar 大約248M]
bin/hdfs fsck /finance/apache-nutch-1.2.rar
參考 http://www.cnblogs.com/i80386/p/3580107.html

這樣把這些用戶賬號分配并告知使用者，并告知禁止使用root 和管理者用戶角色并不可使用他人賬號，這樣就可以愉快的進行 hdfs 的文件權限管理了，
尤其要注意，密碼不要太簡單，因外要外網登陸，不然被黑也是常事。

另外 hadoop的 acl 需要關注，未來也是需要配置的，
http://www.lxweimin.com/p/2c8949340f6c
還要配置 hadoop的 ugi

最后編輯于：2017.12.11 06:08:07

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,505評論 6贊 533
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,556評論 3贊 418
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 176,463評論 0贊 376
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,009評論 1贊 312
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,778評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,218評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,281評論 3贊 441
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,436評論 0贊 288
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,969評論 1贊 335
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,795評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,993評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,537評論 5贊 359
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,229評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,659評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,917評論 1贊 286
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,687評論 3贊 392
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,990評論 2贊 374

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

hadoop 命令操作hdfs 目錄權限管理

hadoop 命令操作hdfs 目錄權限管理

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

hadoop 命令操作hdfs 目錄權限 管理

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

hadoop 命令操作hdfs 目錄權限管理