?索引 為為了加速數據檢索 減少磁盤IO操作 而創建的一種分散存儲的數據結構。索引是由各大引擎來實現的。
索引的好處:減少存儲引擎需要掃描的數據量、把隨機IO變成順序IO、幫主我們在進行分組排序的等操作的時候避免使用臨時表。
普通二叉樹
普通二叉樹由于本身存儲的特性, 會造成高瘦的這種情況, 而我們要的是矮胖,這樣在查詢數據的時候,才能更快找到數據。高瘦的話? 層次太深了不利于查找,于是這里就出現了AVL樹
平衡二叉查找樹
又稱AVL樹
規則 左子節點 和右子節點高度差不能超過1 超過就會進行旋轉 來保持兩個節點之間的高度差,這個方案很好的解決了二叉查找樹退化成鏈表的問題,把插入,查找,刪除的時間復雜度最好情況和最壞情況都維持在O(logN)。但是頻繁旋轉會使插入和刪除犧牲掉O(logN)左右的時間,不過相對二叉查找樹來說,時間上穩定了很多。
但是這種數據結構在mysql里面還是不能滿足, 因為每個節點 存放一個關鍵字 加上數據區 再加上子節點引用
造成的缺點:
最壞情況下磁盤的IO次數由樹的高度決定,所以減少磁盤IO次數就必須壓縮樹的高度,讓瘦高的樹盡量變成矮胖的樹,這樣B-樹就誕生了
B-樹
多路平衡查找樹:它在平衡二叉樹的基礎上做了增強。
1.數中每個節點之多有m個孩子(m>2)
2.根結點至少擁有兩顆子樹(存在子樹的情況下)
3.除了根結點以外,其余每個分支結點至少擁有 m/2 棵子樹
4.所有的葉節點都在同一層上
如圖:
????????B-樹的搜索,從根結點開始,對結點內的關鍵字(有序)序列進行二分查找,如果命中則結束,否則進入查詢關鍵字所屬范圍的兒子結點;重復,直到所對應的兒子指針為空,或已經是葉子結點。
B-樹的特性:
1.任何一個關鍵字出現且只出現在一個結點中;
2.搜索有可能在非葉子結點結束;
3.其搜索性能等價于在關鍵字全集內做一次二分查找;
但是這種還是不能滿足mysql的要求于是就出現了b+樹B+樹 可以看成是B-樹的 加強版
如圖:
B+樹和B-樹的區別:
1.B+樹關鍵字搜索采用閉合區間
2.B+ 非葉節點不保存數據相關信息,只保存關鍵字和子節點的引用
3.B+ 關鍵字對應的數據保存在葉子節點中
4.葉子節點是順序排列的,相鄰的節點具有順序應用關系
相比B-樹的優點:
1.掃表能力強
2.磁盤讀寫能力強
3.排序能力更強
4.查詢效率更穩定
B+樹 在Myisam中B+樹體現形式:
如圖:
? ? ? ? ? ?主鍵索引和輔助索引都會有一個指針指向數據區, 為什么是這樣存儲,這是跟myisam的數據存儲有關的,myisam中 索引 和數據都有一個單獨文件存儲。
B+樹 在在Inodb中B+樹體現形式:
Myisam 和Innodb 查找數據方式的區別
?Innodb 中儲存數據中索引和數據都是放在一個文件中。由主鍵索引指針指向數據區, 其他輔助索引也都是指向主鍵索引的指針,也就是輔助索引每次查詢都是去找主鍵索引然后再找到數據。如果表沒有主鍵,Innodb 為建一個隱式的主鍵。
Mysiam :數據和索引文件時單獨存放的,主鍵和輔助索引 都是指針指向數據區的
索引相關知識補充:
1.每張表的索引 不超過5個
2.索引字段寬度盡量短
3.使用離散度高的列作為索引
4.經常用的列優先(組合索引。最左匹配)
????????以上只是針對自己理解整理索引相關的知識,當然也借見其他帖子一些關于Tree的語句。這里對于各種樹并沒有詳細對各種樹做說明,有說的不對,不詳細的請指出來,萬分感謝。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-----小河土。