linux inode

今天(2013-10-9)研究文件系統的時候看到一篇講linux inode的文章,深受啟發。
大部分引用加少部分自己的理解,如下:

文件儲存在硬盤上,硬盤的最小存儲單位叫做"扇區"(Sector)。每個扇區儲存512字節(相當于0.5KB)。
操作系統讀取硬盤的時候,不會一個個扇區地讀取,這樣效率太低,而是一次性連續讀取多個扇區,即一次性讀取一個"塊"(block)。這種由多個扇區組成的"塊",是文件存取的最小單位。"塊"的大小,最常見的是4KB,即連續八個 sector組成一個 block。
文件數據都儲存在"塊"中,那么很顯然,我們還必須找到一個地方儲存文件的元信息,比如文件的創建者、文件的創建日期、文件的大小等等。這種儲存文件元信息的區域就叫做inode,中文譯名為"索引節點"。
每一個文件都有對應的inode,里面包含了與該文件有關的一些信息。

  • 文件的字節數
  • 文件擁有者的User ID
  • 文件的Group ID
  • 文件的讀、寫、執行權限
  • 文件的時間戳,共有三個:ctime指inode上一次變動的時間,mtime指文件內容上一次變動的時間,atime指文件上一次打開的時間。
  • 鏈接數,即有多少文件名指向這個inode
  • 文件數據block的位置
    (注:這里沒有包含文件名是因為可以有多個文件名對應一個inode)

inode也會消耗硬盤空間,所以硬盤格式化的時候,操作系統自動將硬盤分成兩個區域。一個是數據區,存放文件數據;另一個是inode區(inode table),存放inode所包含的信息。
每個inode節點的大小,一般是128字節或256字節。inode節點的總數,在格式化時就給定,一般是每1KB或每2KB就設置一個inode,注意:在格式化的時候,只是為inode分配存儲空間,也就是說,系統中設定好一個文件數據和inode所占空間的比例,之后所有的inode將從這塊固定的區域分配,這樣,一個系統的inode數量的最大值就是固定的,換句話說,系統中最大的文件數目也是固定的。
所以,經常會發現系統中明明有剩余空間,卻無法創建文件,就是因為inode的空間不足。
可以通過 df -i 命令來查看inode的使用情況。每個inode都有一個號碼,操作系統用inode號碼來識別不同的文件。
這里值得重復一遍,Unix/Linux系統內部不使用文件名,而使用inode號碼來識別文件。對于系統來說,文件名只是inode號碼便于識別的別稱或者綽號。

表面上,用戶通過文件名,打開文件。實際上,系統內部這個過程分成三步:首先,系統找到這個文件名對應的inode號碼;其次,通過inode號碼,獲取inode信息;最后,根據inode信息,找到文件數據所在的block,讀出數據。
使用 'ls -i' 命令,可以看到文件名對應的inode號碼。

硬鏈接:
一般情況下,文件名和inode號碼是"一一對應"關系,每個inode號碼對應一個文件名。但是,Unix/Linux系統允許,多個文件名指向同一個inode號碼。
這意味著,可以用不同的文件名訪問同樣的內容;對文件內容進行修改,會影響到所有文件名;但是,刪除一個文件名,不影響另一個文件名的訪問。這種情況就被稱為"硬鏈接"(hard link)。
inode信息中有一項叫做"鏈接數",記錄指向該inode的文件名總數,這時就會增加1。
反過來,刪除一個文件名,就會使得inode節點中的"鏈接數"減1。當這個值減到0,表明沒有文件名指向這個inode,系統就會回收這個inode號碼,以及其所對應block區域。
這里順便說一下目錄文件的"鏈接數"。創建目錄時,默認會生成兩個目錄項:"."和".."。前者的inode號碼就是當前目錄的inode號碼,等同于當前目錄的"硬鏈接";后者的inode號碼就是當前目錄的父目錄的inode號碼,等同于父目錄的"硬鏈接"。所以,任何一個目錄的"硬鏈接"總數,總是等于2加上它的子目錄總數(含隱藏目錄)。

軟鏈接:
除了硬鏈接以外,還有一種特殊情況。文件A和文件B的inode號碼雖然不一樣,但是文件A的內容是文件B的路徑。讀取文件A時,系統會自動將訪問者導向文件B。因此,無論打開哪一個文件,最終讀取的都是文件B。這時,文件A就稱為文件B的"軟鏈接"(soft link)或者"符號鏈接(symbolic link)。
這意味著,文件A依賴于文件B而存在,如果刪除了文件B,打開文件A就會報錯:"No such file or directory"。這是軟鏈接與硬鏈接最大的不同:文件A指向文件B的文件名,而不是文件B的inode號碼,文件B的inode"鏈接數"不會因此發生變化。

inode的特殊作用:
由于inode號碼與文件名分離,這種機制導致了一些Unix/Linux系統特有的現象。
1 文件名包含特殊字符,無法正常刪除。這時,直接刪除inode節點,就能起到刪除文件的作用
'find . -inum INODE_NUM -delete'。
2 移動文件或重命名文件,只是改變文件名,不影響inode號碼。
3 打開一個文件以后,系統就以inode號碼來識別這個文件,不再考慮文件名。
第3點使得軟件更新變得簡單,可以在不關閉軟件的情況下進行更新,不需要重啟。因為系統通過inode號碼,識別運行中的文件,不通過文件名。更新的時候,新版文件以同樣的文件名,生成一個新的inode,不會影響到運行中的文件。等到下一次運行這個軟件的時候,文件名就自動指向新版文件,舊版文件的inode則被回收。
每個文件存在兩個計數器:i_count 與 i_nlink,即引用計數與硬鏈接計數。結構體 inode 中的 i_count 用于跟蹤文件被訪問的數量,而 i_nlink 則是上述使用 ls -l 等命令查看到的文件硬鏈接數。或者說 i_count 跟蹤文件在內存中的情況,而 i_nlink 則是磁盤計數器。當文件被刪除時,則 i_nlink 先被設置成 0。文件的這兩個計數器使得 Linux 系統升級或程序更新變的容易。系統或程序可在不關閉的情況下(即文件 i_count 不為 0),將新文件以同樣的文件名進行替換,新文件有自己的 inode 及 data block,舊文件會在相關進程關閉后被完整的刪除。

原文鏈接:
http://www.ruanyifeng.com/blog/2011/12/inode.html   
http://www.ibm.com/developerworks/cn/linux/l-cn-hardandsymb-links/ 
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • inode是一個重要概念,是理解Unix/Linux文件系統和硬盤儲存的基礎。理解inode,不僅有助于提高系統操...
    Kenis閱讀 464評論 1 4
  • 轉自:http://www.ruanyifeng.com/blog/2011/12/inode.htmlhttp:...
    JackyTsuuuy閱讀 442評論 0 3
  • 是這樣的,剛上的一節數據結構課,學習了B樹.里面提到了B樹主要用于文件索引.書上的結構體定義如下 但是文件的索引k...
    小吉快跑呀閱讀 776評論 0 2
  • 房間深綠色的窗戶,緊緊的關閉著,窗外的聲聲雨滴敲響著屋檐邊的鐵皮,敲響禮物街道,濺起一層白蒙蒙的雨霧,宛如縹緲的白...
    圓謹閱讀 312評論 2 3
  • 誰活著也不容易, 誰都得給誰留條活路。 筆記創作:心靈使者 蘇溪 ?嚴正法律聲明 本文版權受我國相關法律及適用之國...
    更好時代閱讀 92評論 0 0