hadoop學(xué)習(xí)之java操作hdfs

之前已經(jīng)在服務(wù)器上安裝好了hadoop,下面紀(jì)錄下用java操作hdfs和中間遇到的一些問題,使用的是分布式模式
hdfs的介紹此處不贅述,可以自己去查閱相關(guān)資料進(jìn)行了解

一 本地配置hadoop環(huán)境變量

此處默認(rèn)已經(jīng)具備jdk環(huán)境.
將hadoop的壓縮包解壓到任意目錄

image.png

在環(huán)境變量中配置HADOOP_HOME變量,值為hadoop所在的目錄

image.png

打開cmd窗口,在其中輸入hadoop version,出現(xiàn)如下界面即為環(huán)境變量配置成功

image.png

二 建立項(xiàng)目

我使用的ide是idea,采用maven來管理項(xiàng)目.

建立好maven項(xiàng)目之后,在pom文件下引入下述依賴.

<!--hadoop 通用依賴-->
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-common</artifactId>
    <version>2.9.0</version>
</dependency>
<!--hadoop hdfs依賴-->
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-hdfs</artifactId>
    <version>2.9.0</version>
</dependency>
<!--hadoop 客戶端依賴-->
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-client</artifactId>
    <version>2.9.0</version>
</dependency>

三 編寫測(cè)試類及解決遇到的問題

新建一個(gè)java文件,HdfsTest.java

package com.example.hadoopdemo.hdfs;


import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.permission.FsPermission;
import org.junit.Test;

import java.io.IOException;

public class HdfsTest {
    /**
    * 測(cè)試在hdfs文件系統(tǒng)中
    */
    @Test
    public void testHdfsCreateDir() throws IOException {
        //創(chuàng)建配置對(duì)象
        Configuration  conf = new Configuration();
        //設(shè)置文件系統(tǒng)
        conf.set("fs.defaultFS","hdfs://hadoop01:8020/");
        try {
            //獲取文件系統(tǒng)
            FileSystem fileSystem = FileSystem.get(conf);
        } catch (IOException e) {
            e.printStackTrace();
        }
        //新建path對(duì)象
        Path path = new Path("/data");
        //創(chuàng)建path對(duì)象所對(duì)應(yīng)的目錄
        fileSystem.mkdirs(path, FsPermission.getDefault());
    }
}

運(yùn)行上面的測(cè)試方法,發(fā)現(xiàn)報(bào)了如下錯(cuò)誤

image.png

這是因?yàn)樵诒镜剡\(yùn)行hadoop程序需要依賴一些依賴庫和工具類,hadoop 2.9.0的依賴版本可以從下面百度云鏈接中下載

鏈接:https://pan.baidu.com/s/1-hmTd7avPFpR8DK3GRgIBg 密碼:tcnw

下載完成后根據(jù)本機(jī)的位數(shù)選擇對(duì)應(yīng)的版本

image.png

將其中的所有文件都放到hadoop的bin目錄下

image.png

此時(shí)在運(yùn)行發(fā)現(xiàn)又報(bào)了錯(cuò),錯(cuò)誤信息如下

TIM圖片20180408150221.png

這是因?yàn)槲襤adoop文件系統(tǒng)是用用戶hadoop進(jìn)行初始化的,而我本地windows的用戶并不是hadoop,所以沒有權(quán)限操作這個(gè)文件系統(tǒng)

解決辦法如下:
一 是配置環(huán)境變量,HADOOP_USER_NAME,值為用戶名,為hadoop

image.png

二 是在程序運(yùn)行時(shí)加jvm參數(shù) -DHADHOOP_USER_NAME=hadoop

image.png

三 是使用get的重載方法,直接提供用戶名

image.png

此時(shí)再運(yùn)行測(cè)試方法,可以看到運(yùn)行成功

這時(shí)我們?nèi)シ?wù)器上執(zhí)行一下hadoop dfs -ls -R /

image.png

可以看到文件夾創(chuàng)建成功

四 基本的hdfs操作

下面貼出一些hdfs基本操作

package com.example.hadoopdemo.hdfs;


import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import org.apache.hadoop.fs.permission.FsPermission;
import org.junit.Test;

import java.io.IOException;
import java.lang.reflect.InvocationTargetException;
import java.lang.reflect.Method;

public class HdfsTest {


    /**
     * 靜態(tài)初始化配置對(duì)象和文件系統(tǒng)對(duì)象
     */
    private static Configuration conf;
    static FileSystem fileSystem;

    static {
        conf = new Configuration();
        conf.set("fs.defaultFS", "hdfs://hadoop01:8020/", "aaaa");
        try {
            fileSystem = FileSystem.get(conf);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 創(chuàng)建目錄
     *
     * @throws IOException
   */
    @Test
    public void testHdfsCreateDir() throws IOException {
        Path path = new Path("/data");
        fileSystem.mkdirs(path, FsPermission.getDefault());
    }

    /**
     * 創(chuàng)建文件
     *
     * @throws IOException
     */
    @Test
    public void testHdfsCreateFile() throws IOException {
        Path path = new Path("/data/hello.txt");
        FSDataOutputStream fos = fileSystem.create(path);
        fos.write("你好".getBytes());
        fos.close();
    }

    /**
     * 讀取文件內(nèi)容
     *
     * @throws IOException
     */
    @Test
    public void testHdfsReadFile() throws IOException {
        Path path = new Path("/data/hello.txt");
        FSDataInputStream fis = fileSystem.open(path);
        byte[] buffer = new byte[1024];
        fis.read(buffer);
        System.out.println(new String(buffer));
    }


    /**
     * 獲取文件信息
     *
     * @throws IOException
     */
    @Test
    public void testHdfsGetFileStatus() throws IOException {
        Path path = new Path("/data/hello.txt");
        FileStatus fileStatus = fileSystem.getFileStatus(path);
        //fileStatus下有很多get方法獲取文件的基礎(chǔ)屬性,下面列出幾個(gè)
        //獲取文件擁有者
        String owner = fileStatus.getOwner();
        //是否是目錄
        boolean isDirectory = fileStatus.isDirectory();
        //是否是文件
        boolean isFile = fileStatus.isFile();
        //文件大小
        long len = fileStatus.getLen();

        System.out.println("文件擁有者:" + owner);
        System.out.println("是否是目錄:" + isDirectory);
        System.out.println("是否是文件:" + isFile);
        System.out.println("文件大小:" + len);
    }


    /**
     * 通過反射獲取文件的所有可獲取的屬性
     *
     * @throws IOException
     */
    @Test
    public void testHdfsReflectGetFileStatus() throws IOException, InvocationTargetException,IllegalAccessException {
        Path path = new Path("/data/hello.txt");
        FileStatus fileStatus = fileSystem.getFileStatus(path);
        Class<? extends FileStatus> fileStatusClass = fileStatus.getClass();
        Method[] methods = fileStatusClass.getMethods();
        //如果path不是symbolic的話 調(diào)用getSymbolic方法會(huì)報(bào)錯(cuò),所以排除下
        for (Method method : methods) {
            String name = method.getName();
            if (name.startsWith("get") && !name.equals("getSymlink")) {
                Object result = method.invoke(fileStatus);
                System.out.println(name.substring(3) + ":" + result);
            } else if(name.startsWith("is")){
                Object result = method.invoke(fileStatus);
                System.out.println(name + ":" + result);
            }
        }
    }
}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,739評(píng)論 6 534
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,634評(píng)論 3 419
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,653評(píng)論 0 377
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,063評(píng)論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,835評(píng)論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,235評(píng)論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,315評(píng)論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,459評(píng)論 0 289
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,000評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,819評(píng)論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,004評(píng)論 1 370
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,560評(píng)論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,257評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,676評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,937評(píng)論 1 288
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,717評(píng)論 3 393
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,003評(píng)論 2 374

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 134,786評(píng)論 18 139
  • 當(dāng)數(shù)據(jù)量增大到超出了單個(gè)物理計(jì)算機(jī)存儲(chǔ)容量時(shí),有必要把它分開存儲(chǔ)在多個(gè)不同的計(jì)算機(jī)中。那些管理存儲(chǔ)在多個(gè)網(wǎng)絡(luò)互連的...
    單行線的旋律閱讀 1,940評(píng)論 0 7
  • 《牛奶可樂經(jīng)濟(jì)學(xué)》讀書筆記 第7章市場(chǎng)信號(hào)揭密 經(jīng)濟(jì)學(xué)家大多假定,人和公司對(duì)與自身決策相關(guān)的成本及效益,都掌握著充...
    陳羽文齋閱讀 688評(píng)論 0 0
  • 2017年6月17號(hào)Helen的成功日記。1、朝夕閱讀開始第四本書《習(xí)慣的力量》復(fù)習(xí)日。2、平板撐60秒一次3、天...
    A00Helen閱讀 314評(píng)論 0 0
  • 公司之前的項(xiàng)目是企業(yè)版即時(shí)通訊,為了快速開發(fā)服務(wù)器和客戶端采用的AnyChat,自己初步總結(jié)下。 介紹 AnyCh...
    夏了夏天_feea閱讀 994評(píng)論 0 0