《MySQL自學筆記》之索引

索引的分類

按照類型分類

  • 主鍵索引 : 一個表的主鍵就是一種特殊的唯一索引,不能有控制,一個表只能有一個主鍵
  • 普通索引 : 是最基本的索引,它沒有任何限制
  • 唯一索引 : 索引列的值必須唯一,但允許有空值,如果是組合索引,則列值的組合必須唯一
  • 全文索引 : 主要用來查找文本中的關鍵字,而不是直接與索引中的值相比較
    按照數量還可以分成:單列索引組合索引

索引的操作

創建索引

create [UNIQUE|FULLTEXT|SPATIAL|不填(不填表示普通索引)] index 索引名稱 [USING index_type(索引類型:默認是Btree)] on 表名(列1(長度),列2...)
#列里面可以指定長度,指定了特定的長度就表示用了前綴索引

刪除索引

alter table 表名 drop index 索引名;

查看索引

show index from 表名 [FROM db_name]

前綴索引

對于BLOB,TEXT或很長的VARCHAR類型列如果要作為索引顯然是不合適的,這時候可以用前綴索引,MySQL不允許索引這些列的完成長度。

創建前綴索引

只需要在創建索引的時候加上長度

create [UNIQUE|FULLTEXT|SPATIAL|不填(不填表示普通索引)] index 索引名稱 [USING index_type(索引類型:默認是Btree)] on 表名(列1(長度),列2...)
#列里面可以指定長度,指定了特定的長度就表示用了前綴索引
如何決定前綴索引的長度

1.首先先計算得到完整列的比例

select count(DISTINCT name) / count(*) from student;
#查詢不重復列跟總列的比例,例如得到值為0.0322

2.繼續執行

select count(DISTINCT LEFT(name,3)) / count(*) from student;
select count(DISTINCT LEFT(name,4)) / count(*) from student;
#算出來的值如果接近于0.0332則可以選擇對應的長度
前綴索引的缺點

Mysql無法使用前綴索引做group by , order by,也無法使用其做覆蓋掃描

多列索引(組合索引)

多列索引是指一個索引中使用了多個列,不是多個單個索引

索引最左匹配原則

如果是聯合索引,那么key也由多個列組成,同時,索引只能用于查找key是否存在(相等),遇到范圍查詢(>、<、between、like左匹配)等就不能進一步匹配了,后續退化為線性查找。因此,列的排列順序決定了可命中索引的列數。
例子:

如有索引(a, b, c, d),相當于我們建立了(a),(a,b),(a,b,c)索引,查詢條件a = 1 and b in (2) and c > 3 and d = 4,則會在每個節點依次命中a、b、c,無法命中d。(很簡單:索引命中只能是相等的情況,不能是范圍匹配)
#不需要糾結=和in的順序,mysql會自動優化以匹配盡可能多的索引

如何選定哪個列可以作為最左的索引,這里有一個例子可以參考:
如下,有一個表需要選擇customer_id或者staff_id誰作為最左邊的索引,根據下面的語句:

select count(distinct customer_id)/count(*),count(distinct staff_id)/count(*),count(*) from student;
# count(distinct customer_id)/count(*) : 0.0324
#count(distinct staff_id)/count(*) : 0.0001
#count(*) : 1453566

如下面數據可知customer_id的不可重復性(基數)更高,適合作為第一項索引


image.png
聚簇索引

聚簇索引的兩大特點:

  • 使用記錄主鍵值的大小進行記錄和頁的排序
    1. 頁內的記錄是按照主鍵的大小順序排成一個單向鏈表
    2. 各個存放用戶記錄的頁也是根據頁中記錄的主鍵大小順序排成一個雙向鏈表
      3.各個存放目錄項的頁也是根據頁中記錄的主鍵大小順序排成一個雙向鏈表
  • B+樹的葉子節點存儲的是完整的用戶記錄
    我們把具有這兩種特性的B+樹稱為聚簇索引,所有完整的用戶記錄都存放在這個聚簇索引的葉子節點處。這種聚簇索引并不需要我們在MySQL語句中顯式的去創建,InnoDB存儲引擎會自動的為我們創建聚簇索引。另外有趣的一點是,在InnoDB存儲引擎中,聚簇索引就是數據的存儲方式(所有的用戶記錄都存儲在了葉子節點),也就是所謂的索引即數據
索引優化建議
  • 盡可能的擴展索引,不要新建立索引。比如表中已經有了a的索引,現在要加(a,b)的索引,那么只需要修改原來的索引即可,為什么不新建一個b列索引呢,因為mysql查詢只能使用一個索引,如果條件是 a =1 and b=2 實際上也只能用到其中一個索引
  • 最左前綴匹配原則。這是非常重要、非常重要、非常重要(重要的事情說三遍)的原則,MySQL會一直向右匹配直到遇到范圍查詢(>,<,BETWEEN,LIKE)就停止匹配
  • 盡量選擇區分度高的列作為索引,區分度的公式COUNT(DISTINCT col) / COUNT(*)。表示字段不重復的比率,比率越大我們掃描的記錄數就越少
  • 索引列不能參與計算,比如,FROM_UNIXTIME(create_time) = '2016-06-06' 就不能使用索引
  • 單個多列組合索引和多個單列索引的檢索查詢效果不同,因為在執行SQL時,MySQL只能使用一個索引,會從多個單列索引中選擇一個限制最為嚴格的索引

InnoDB索引原理

InnoDB的存儲結構

\color{red}{InnoDB}是一個將表中的數據存儲到磁盤上的存儲引擎。他的存儲方式是將數據劃分為若干個頁,以頁作為磁盤和內存之間交互的基本單位,InnoDB中頁的大小一般為 \color{red}{16KB}

image.png

如圖,記錄存在頁中,按照單向鏈表方式存儲,頁與頁之間采用雙向列表連接。

參考

數據庫兩大神器【索引和鎖】
MySQL的索引

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容