學習Java中的IO,首先要理解Java中IO的流模型。
所謂流,可以假想成河流,流的數據源,就是河流的發源地,流是單向的,流的單向性,就像河流的水流是單向的一樣。
歡迎訪問本人博客:http://wangnan.tech
Java中的流可以從兩方面的分類
- 輸入流和輸出流
- 節點流和處理流
輸入流和輸出流,就是程序和外部的數據源進行IO操作。這些數據源可以是可以是內存,文件,還可以是網絡上的一個URL。
輸入流和輸出流的定義都是相對程序來說的,也就是輸入流是從外部讀取數據進入程序,然后由程序處理。輸出流是從程序中輸出的數據。
節點流和處理流。節點流是直接跟數據源連接的流,而處理流是用來裝飾節點流的,是為使節點流有更多的功能。
io流 | 輸入流 | 輸出流 |
---|---|---|
字節流 | InputStream | OutputStream |
字符流 | Reader | Writer |
對于上面的字節流和字符流,他們的區別就在于字節流會以字節的形式來處理數據,而字符流會以字符的形式來處理數據。
對于字節流的輸入流,就是 InputStream的抽象類向下延伸。因為數據源可以在在文件中,在內存中。所以,一般的字節輸入流有 FileInputStream、ByteArrayInputStream 等方法。因此,對應的,就有字節輸出流的 FileOutputStream、ByteArrayOutputStream。
而對于字符流的輸入流,就是 Reader的抽象類的向下延伸。
同樣的,數據源可以在文件中,在內存中。
因此,一般的字符輸入流有 FileReader、CharArrayReader等方法。
輸出流也相對應。
上面了解了節點流。下面是處理流。
所謂處理流,就是不直接連接到數據源,而是對連接數據流的節點流進行裝飾,使得流能提供更多更好的功能。
常見的處理流有
緩沖流。BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream。
這種流是就是為增加了緩沖功能,提高的IO效率。字節流轉為字符流。 InputStreamReader,InputStreamWriter,當然,可以在創建此類的時候設置字符編碼。
對象序列化流。ObjectInputStream、ObjectOutputStream。
各種類型數據的輸入輸出。DataInputStream、DataOutputStream。
行流。LineNumberReader;LineNumberInputStream
打印流。PrintWriter;PrintOutputStream。
再次理解一下流的概念
流是一組有順序的,有起點和終點的字節集合,是對數據傳輸的總稱或抽象。即數據在兩設備間的傳輸稱為流,流的本質是數據傳輸,根據數據傳輸特性將流抽象為各種類,方便更直觀的進行數據操作。
字符流和字節流
字符流的由來: 因為數據編碼的不同,而有了對字符進行高效操作的流對象。本質其實就是基于字節流讀取時,去查了指定的碼表。
字節流和字符流的區別:
- 讀寫單位不同:字節流以字節(8bit)為單位,字符流以字符為單位,根據碼表映射字符,一次可能讀多個字節。
- 處理對象不同:字節流能處理所有類型的數據(如圖片、avi等),而字符流只能處理字符類型的數據。
結論:只要是處理純文本數據,就優先考慮使用字符流。 除此之外都使用字節流。
輸入流和輸出流
對輸入流只能進行讀操作,對輸出流只能進行寫操作,程序中需要根據待傳輸數據的不同特性而使用不同的流。
Java IO流對象
- 輸入字節流InputStreamIO 中輸入字節流的繼承圖可見下圖,可以看出:
- InputStream 是所有的輸入字節流的父類,它是一個抽象類。
- ByteArrayInputStream、StringBufferInputStream、FileInputStream 是三種基本的介質流,它們分別從Byte 數組、StringBuffer、和本地文件中讀取數據。PipedInputStream 是從與其它線程共用的管道中讀取數據,與Piped 相關的知識后續單獨介紹。
- ObjectInputStream 和所有FilterInputStream 的子類都是裝飾流(裝飾器模式的主角)。
- 輸入字節流InputStreamIO 中輸入字節流的繼承圖可見下圖,可以看出:
- OutputStream 是所有的輸出字節流的父類,它是一個抽象類。
- ByteArrayOutputStream、FileOutputStream 是兩種基本的介質流,它們分別向Byte 數組、和本地文件中寫入數據。PipedOutputStream 是向與其它線程共用的管道中寫入數據,
- ObjectOutputStream 和所有FilterOutputStream 的子類都是裝飾流。
- 字節流的輸入與輸出的對應
圖中藍色的為主要的對應部分,紅色的部分就是不對應部分。紫色的虛線部分代表這些流一般要搭配使用。從上面的圖中可以看出Java IO 中的字節流是極其對稱的。“存在及合理”我們看看這些字節流中不太對稱的幾個類吧!
- LineNumberInputStream 主要完成從流中讀取數據時,會得到相應的行號,至于什么時候分行、在哪里分行是由改類主動確定的,并不是在原始中有這樣一個行號。在輸出部分沒有對應的部分,我們完全可以自己建立一個LineNumberOutputStream,在最初寫入時會有一個基準的行號,以后每次遇到換行時會在下一行添加一個行號,看起來也是可以的。好像更不入流了。
- PushbackInputStream 的功能是查看最后一個字節,不滿意就放入緩沖區。主要用在編譯器的語法、詞法分析部分。輸出部分的BufferedOutputStream 幾乎實現相近的功能。
- StringBufferInputStream 已經被Deprecated,本身就不應該出現在InputStream 部分,主要因為String 應該屬于字符流的范圍。已經被廢棄了,當然輸出部分也沒有必要需要它了!還允許它存在只是為了保持版本的向下兼容而已。
- SequenceInputStream 可以認為是一個工具類,將兩個或者多個輸入流當成一個輸入流依次讀取。完全可以從IO 包中去除,還完全不影響IO 包的結構,卻讓其更“純潔”――純潔的Decorator 模式。
- PrintStream 也可以認為是一個輔助工具。主要可以向其他輸出流,或者FileInputStream 寫入數據,本身內部實現還是帶緩沖的。本質上是對其它流的綜合運用的一個工具而已。一樣可以踢出IO 包!System.out 和System.out 就是PrintStream 的實例!
-
字符輸入流Reader在上面的繼承關系圖中可以看出:
- Reader 是所有的輸入字符流的父類,它是一個抽象類。
- CharReader、StringReader 是兩種基本的介質流,它們分別將Char 數組、String中讀取數據。PipedReader 是從與其它線程共用的管道中讀取數據。
- BufferedReader 很明顯就是一個裝飾器,它和其子類負責裝飾其它Reader 對象。
- FilterReader 是所有自定義具體裝飾流的父類,其子類PushbackReader 對Reader 對象進行裝飾,會增加一個行號。
- InputStreamReader 是一個連接字節流和字符流的橋梁,它將字節流轉變為字符流。FileReader 可以說是一個達到此功能、常用的工具類,在其源代碼中明顯使用了將FileInputStream 轉變為Reader 的方法。我們可以從這個類中得到一定的技巧。Reader 中各個類的用途和使用方法基本和InputStream 中的類使用一致。后面會有Reader 與InputStream 的對應關系。
-
字符輸出流Writer在上面的關系圖中可以看出:
- Writer 是所有的輸出字符流的父類,它是一個抽象類。
- CharArrayWriter、StringWriter 是兩種基本的介質流,它們分別向Char 數組、String 中寫入數據。PipedWriter 是向與其它線程共用的管道中寫入數據,
- BufferedWriter 是一個裝飾器為Writer 提供緩沖功能。
- PrintWriter 和PrintStream 極其類似,功能和使用也非常相似。
- OutputStreamWriter 是OutputStream 到Writer 轉換的橋梁,它的子類FileWriter 其實就是一個實現此功能的具體類(具體可以研究一SourceCode)。功能和使用和OutputStream 極其類似,后面會有它們的對應圖。
字符流的輸入與輸出的對應
- 字符流與字節流轉換轉換流的特點:
- 其是字符流和字節流之間的橋梁
- 可對讀取到的字節數據經過指定編碼轉換成字符
- 可對讀取到的字符數據經過指定編碼轉換成字節
何時使用轉換流?
- 當字節和字符之間有轉換動作時;
- 流操作的數據需要編碼或解碼時。
具體的對象體現:
- InputStreamReader:字節到字符的橋梁
- OutputStreamWriter:字符到字節的橋梁
這兩個流對象是字符體系中的成員,它們有轉換作用,本身又是字符流,所以在構造的時候需要傳入字節流對象進來。
File類File類是對文件系統中文件以及文件夾進行封裝的對象,可以通過對象的思想來操作文件和文件夾。 File類保存文件或目錄的各種元數據信息,包括文件名、文件長度、最后修改時間、是否可讀、獲取當前文件的路徑名,判斷指定文件是否存在、獲得當前目錄中的文件列表,創建、刪除文件和目錄等方法。
RandomAccessFile類該對象并不是流體系中的一員,其封裝了字節流,同時還封裝了一個緩沖區(字符數組),通過內部的指針來操作字符數組中的數據。 該對象特點:
- 該對象只能操作文件,所以構造函數接收兩種類型的參數:a.字符串文件路徑;b.File對象。
- 該對象既可以對文件進行讀操作,也能進行寫操作,在進行對象實例化時可指定操作模式(r,rw)
注意:該對象在實例化時,如果要操作的文件不存在,會自動創建;如果文件存在,寫數據未指定位置,會從頭開始寫,即覆蓋原有的內容。 可以用于多線程下載或多個線程同時寫數據到文件。