Git學習筆記(1) --- 內部存儲模式

雖然一直使用git 作為版本管理工具,但是對git內部到底是如何儲存一直沒有去研究過,對git也只限于知其然的階段,這總歸不是一種好的狀態,所以這段時間斷斷續續看了一些關于git內部的知識,本文用以記錄和交流

存儲方案

git內部存儲是采用key-value的形式。

value代表git內部數據結構,不代表文件真正的內容,這一點尤其要注意。以blob為例,其結構如下圖所示:

value

value數據結構包含了:

  1. 標識符,blob是git針對單個文件的數據結構

  2. size,文件內容的大小

  3. \0,分隔符

  4. content,單個文件真正的內容

key代表將value經過加密后得到的值,git采用的加密方式是SHA-1

key包含以及幾個特點:

  1. 是長度為40位十六進制的字符串

  2. 相同的value總是產生相同的key

存儲位置

當我們使用git init時,通常會用這么一段文字:Initialized empty Git repository in /**/**/.git/,由此可見,git在所有的數據都存儲在.git的文件夾里,而.git是隱藏文件,所有通常是不顯示出來的,而文件存儲是在.git下的objects目錄中, objects的文件結構是:


.git

├── objects

│  ├── 04

│  │  └── 4d4024553293e6e8edee445c477ffc9129bc95

│  ├── 0d

│  │  └── 21313c5cd81c608f3413deb2004e1276046add

│  ├── info

│  └── pack

其中類似于04,0d這種文件夾就是以key的前兩位作為文件夾文字,文件夾名加上文件名剛好是40位長度的key

infopack文件夾是git用于優化存儲所生成的

其他數據結構

git在使用blob存儲后,雖然我們得到了文件內容的存儲,但是這還是不夠的,我們還需要把文件名,文件夾結構等等信息存儲起來,所以我們還要用其他數據結構,git使用tree來存儲這些數據

tree

tree的數據結構如圖所示:

tree

tree主要包含了:

  1. 標識符tree

  2. size,大小

  3. \0,分隔符

  4. 對其他的tree或者blob的指針,包括了(標識符,key,文件或文件夾名)

通過blob和tree,git就能夠將項目中真正的文件結構,文件名,以及文件內容存儲起來,blob與tree的關系如圖所示:

blob & tree

需要注意的是:相同的文件內容只會出存儲一次。舉例說明:如果我們項目中有一個叫hello.txt, 如果對應的blob是8ab68,當我們復制一份hello.txt后,我們存儲的指針對應的blob還是8ab68,其實這些很好理解,我們之前說過SHA-1的特點就是相同的value總是產生相同的key,示意圖如下:

identical content

commit

雖然tree和blob已經達到了存儲的功能,但是還沒有和版本管理掛鉤,我們需要知道每一個提交更改了哪些文件夾,哪些文件,以及更改歷史。所以我們還要一個版本管理的數據結構,git使用commit來存儲。

commit的結構如圖:

commit

commit主要包含了:

  1. 標識符commit

  2. size,大小

  3. tree,指向對應的tree的指針

  4. parent,指向上一個commit得指針

  5. auther,提交的人

  6. message,提交的message

所以.git/objects里面的那一堆的文件最后可以以下圖的方式可視化:

commit history

查看命令

當我們直接打開.git/objects里面某個文件時,我們無法直接看出有效信息,因為每一個文件內容都是被壓縮過的,但是我們可以通過以下命令查看:


git cat-file -t [file name] #t -> 會打印出標識符

git cat-file -p [file name] #p -> 會打印出內容

例如:某一個項目中只有一個first.txt的文件,first.txt的內容是"1",當我們做了一次提交后:


# objects包含內容

$ tree .git/objects

.git/objects

├── 56

│  └── a6051ca2b02b04ef92d5150c9ef600403cb1de

├── cf

│  └── 58af35d755cf6d8416d2ec341cfc85f05321ed

├── ed

│  └── 20a2c52efb48d3281e255e4a54b5d428689c8b

├── info

└── pack

5 directories, 3 files

# first.txt

$ git cat-file -t 56a60

blob

$ git cat-file -p 56a60

1%

# 文件結構tree

$ git cat-file -t cf58a

tree

$ git cat-file -p cf58a

100644 blob 56a6051ca2b02b04ef92d5150c9ef600403cb1de    first.txt

# 提交commit

$ git cat-file -t ed20a

commit

$ git cat-file -p ed20a

tree cf58af35d755cf6d8416d2ec341cfc85f05321ed

author wjXu <wjxu.com> 1548078881 +0800

committer wjXu <wjxu.com> 1548078881 +0800

master commit

需要注意的是:實際的commit包含了了auther以及committer兩個內容,關于兩者的區別,簡單做一個解釋:auther是指最早提交的人,由于git擁有修改歷史的功能,所有后續可能還要其他的人對這個歷史作修改,所以committer是指上一個修改該提交的人

官方解釋:You may be wondering what the difference is between author and committer. The author is the person who originally wrote the patch, whereas the committer is the person who last applied the patch. So, if you send in a patch to a project and one of the core members applies the patch, both of you get credit — you as the author and the core member as the committer.

總結

到此,我們大概梳理了一下git內部的存儲,簡單總結一下,git內部包含了三種數據結構:blob,tree,commit;其中blob用于儲存文件內容,tree用于存儲文件名字以及文件結構,commit用于存儲每一次提交的改變;三者相互配合,就能夠實現版本記錄的基本功能,當然我們也要知道這只是最基礎的部分,git在這之上還做了很多其他的優化。

希望這篇文件能夠讓大家了解git的一些內部的原理,在日后的使用中,能更加的心中有數,如果對本文有什么意見和建議,歡迎討論和指正!??!

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,702評論 6 534
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,615評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 176,606評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,044評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,826評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,227評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,307評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,447評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,992評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,807評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,001評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,550評論 5 361
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,243評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,667評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,930評論 1 287
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,709評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,996評論 2 374

推薦閱讀更多精彩內容

  • Blob Object 10.1中說啦,git本質是一個內容可尋址的系統,所以Git的核心就是一個 key-val...
    老沈Rosen閱讀 1,418評論 0 0
  • Git 基礎 基本原理 客戶端并不是只提取最新版本的文件快照,而是把代碼倉庫完整的鏡像下來。這樣一來,任何一處協同...
    __silhouette閱讀 15,926評論 5 147
  • Git 命令行學習筆記 Git 基礎 基本原理 客戶端并不是只提取最新版本的文件快照,而是把代碼倉庫完整的鏡像下來...
    sunnyghx閱讀 3,944評論 0 11
  • 1 一位大叔摻起他,大叔不年輕,禿頂,發福的肚子宣示著中年對他身體的占領。灰色臟兮兮的POLO衫,水洗牛仔褲。 ...
    宇小天閱讀 1,372評論 1 2
  • 本書不是一本游戲方法論書籍,無法教你如何制作游戲,本書探討的是關于游戲更為本質的問題,例,游戲是什么?為什么有的游...
    段皓文閱讀 1,283評論 0 0