數(shù)據(jù)庫索引(Oracle和Mysql)學(xué)習(xí)總結(jié)

索引概念:

? ? 索引是關(guān)系數(shù)據(jù)庫中用于存放每一條記錄的一種對象,主要目的是加快數(shù)據(jù)的讀取速度和完整性檢查。建立索引是一項技術(shù)性要求高的工作。一般在數(shù)據(jù)庫設(shè)計階段的與數(shù)據(jù)庫結(jié)構(gòu)一道考慮。應(yīng)用系統(tǒng)的性能直接與索引的合理直接有關(guān)。

一、Oracle索引

1、索引類型

列出常見常用的幾種索引類型,如下:

非唯一索引(最常用)NonUnique

唯一索引Unique

位圖索引Bitmap

分區(qū)索引Partitioned

非分區(qū)索引NonPartitioned

正常型B樹 Normal

基于函數(shù)的索引??Function-based

2、索引結(jié)構(gòu)

B-tree:

適合與大量的增、刪、改(OLTP);

不能用包含OR操作符的查詢;

適合高基數(shù)的列(唯一值多)

典型的樹狀結(jié)構(gòu);

每個結(jié)點都是數(shù)據(jù)塊;

大多都是物理上一層、兩層或三層不定,邏輯上三層;

葉子塊數(shù)據(jù)是排序的,從左向右遞增;

在分支塊和根塊中放的是索引的范圍;

Bitmap:

適合與決策支持系統(tǒng);

做UPDATE代價非常高;

非常適合OR操作符的查詢;

基數(shù)比較少的時候才能建位圖索引;

樹型結(jié)構(gòu):

索引頭

開始ROWID,結(jié)束ROWID(先列出索引的最大范圍)

BITMAP

每一個BIT對應(yīng)著一個ROWID,它的值是1還是0,如果是1,表示著BIT對應(yīng)的ROWID有值

1. b-tree索引

Oracle數(shù)據(jù)庫中最常見的索引類型是b-tree索引,也就是B-樹索引,以其同名的計算科學(xué)結(jié)構(gòu)命名。CREATE INDEX語句時,默認就是在創(chuàng)建b-tree索引。沒有特別規(guī)定可用于任何情況。

2. 位圖索引(bitmap index)

位圖索引特定于該列只有幾個枚舉值的情況,比如性別字段,標示字段比如只有0和1的情況。

3. 基于函數(shù)的索引

比如經(jīng)常對某個字段做查詢的時候是帶函數(shù)操作的,那么此時建一個函數(shù)索引就有價值了。

4. 分區(qū)索引和全局索引

這2個是用于分區(qū)表的時候。前者是分區(qū)內(nèi)索引,后者是全表索引

5. 反向索引(REVERSE)

這個索引不常見,但是特定情況特別有效,比如一個varchar(5)位字段(員工編號)含值(10001,10002,10033,10005,10016..)

這種情況默認索引分布過于密集,不能利用好服務(wù)器的并行

但是反向之后10001,20001,33001,50001,61001就有了一個很好的分布,能高效的利用好并行運算。

6.HASH索引

HASH索引可能是訪問數(shù)據(jù)庫中數(shù)據(jù)的最快方法,但它也有自身的缺點。集群鍵上不同值的數(shù)目必須在創(chuàng)建HASH集群之前就要知道。需要在創(chuàng)建HASH集群的時候指定這個值。使用HASH索引必須要使用HASH集群。

3、索引原理

若沒有索引,搜索某個記錄時(例如查找name='wish')需要搜索所有的記錄,因為不能保證只有一個wish,必須全部搜索一遍

若在name上建立索引,oracle會對全表進行一次搜索,將每條記錄的name值哪找升序排列,然后構(gòu)建索引條目(name和rowid),存儲到索引段中,查詢name為wish時即可直接查找對應(yīng)地方

創(chuàng)建了索引并不一定就會使用,oracle自動統(tǒng)計表的信息后,決定是否使用索引,表中數(shù)據(jù)很少時使用全表掃描速度已經(jīng)很快,沒有必要使用索引

4、建立索引的原則

1.如果有兩個或者以上的索引,其中有一個唯一性索引,而其他是非唯一,這種情況下oracle將使用唯一性索引而完全忽略非唯一性索引

2. 至少要包含組合索引的第一列(即如果索引建立在多個列上,只有它的第一個列被where子句引用時,優(yōu)化器才會使用該索引)

3. 小表不要簡歷索引

4. 對于基數(shù)大的列適合建立B樹索引,對于基數(shù)小的列適合簡歷位圖索引

5. 列中有很多空值,但經(jīng)常查詢該列上非空記錄時應(yīng)該建立索引

6. 經(jīng)常進行連接查詢的列應(yīng)該創(chuàng)建索引

7. 使用create index時要將最常查詢的列放在最前面

8. LONG(可變長字符串數(shù)據(jù),最長2G)和LONG RAW(可變長二進制數(shù)據(jù),最長2G)列不能創(chuàng)建索引

9.限制表中索引的數(shù)量(創(chuàng)建索引耗費時間,并且隨數(shù)據(jù)量的增大而增大;索引會占用物理空間;當對表中的數(shù)據(jù)進行增加、刪除和修改的時候,索引也要動態(tài)的維護,降低了數(shù)據(jù)的維護速度)

5、索引使用原則

經(jīng)常檢索排序大表中40%或非排序表7%的行,建議建索引;

為了改善多表關(guān)聯(lián),索引列用于聯(lián)結(jié);

列中的值相對比較唯一;

取值范圍(大:B*樹索引,小:位圖索引);

Date型列一般適合基于函數(shù)的索引;

列中有許多空值,不適合建立索引

二、MySQL索引

1、索引類型

單列索引(普通索引,唯一索引,主鍵索引)、組合索引、全文索引、空間索引

單列索引:一個索引只包含單個列,但一個表中可以有多個單列索引。

普通索引:MySQL中基本索引類型,沒有什么限制,允許在定義索引的列中插入重復(fù)值和空值,純粹為了查詢數(shù)據(jù)更快一點。

唯一索引:索引列中的值必須是唯一的,但是允許為空值。

主鍵索引:是一種特殊的唯一索引,不允許有空值。

組合索引:在表中的多個字段組合上創(chuàng)建的索引,只有在查詢條件中使用了這些字段的左邊字段時,索引才會被使用,使用組合索引時遵循最左前綴集合。這個如果還不明白,等后面舉例講解時在細說

  全文索引,只有在MyISAM引擎上才能使用,只能在CHAR,VARCHAR,TEXT類型字段上使用全文索引,介紹了要求,說說什么是全文索引,就是在一堆文字中,通過其中的某個關(guān)鍵字等,就能找到該字段所屬的記錄行,比如有"你是個大煞筆,二貨 ..." 通過大煞筆,可能就可以找到該條記錄。這里說的是可能,因為全文索引的使用涉及了很多細節(jié),我們只需要知道這個大概意思,如果感興趣進一步深入使用它,那么看下面測試該索引時,會給出一個博文,供大家參考。

  空間索引:空間索引是對空間數(shù)據(jù)類型的字段建立的索引,MySQL中的空間數(shù)據(jù)類型有四種,GEOMETRY、POINT、LINESTRING、POLYGON。在創(chuàng)建空間索引時,使用SPATIAL關(guān)鍵字。要求,引擎為MyISAM,創(chuàng)建空間索引的列,必須將其聲明為NOT NULL。

2、索引原理

在MySQL中,存儲引擎用類似的方法使用索引,其先在索引中查找對應(yīng)的值,然后根據(jù)匹配的索引記錄找到對應(yīng)的數(shù)據(jù)行,最后將數(shù)據(jù)結(jié)果集返回給客戶端。

3、索引使用原則

最左前綴匹配原則

mysql會一直向右匹配直到遇到范圍查詢(>、<、between、like)就停止匹配。比如a = 1 and b = 2 and c > 3 and d = 4,如果建立(a,b,c,d)順序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引則都可以用到,a,b,d的順序可以任意調(diào)整。

=和in可以亂序

比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意順序,mysql的查詢優(yōu)化器會幫你優(yōu)化成索引可以識別的形式。

盡量選擇區(qū)分度高的列作為索引

區(qū)分度的公式是count(distinct col)/count(*),表示字段不重復(fù)的比例,比例越大我們掃描的記錄數(shù)越少,唯一鍵的區(qū)分度是1,而一些狀態(tài)、性別字段可能在大數(shù)據(jù)面前區(qū)分度就是0,那可能有人會問,這個比例有什么經(jīng)驗值嗎?使用場景不同,這個值也很難確定,一般需要join的字段我們都要求是0.1以上,即平均1條掃描10條記錄。

索引列不能參與計算,保持列“干凈”

比如from_unixtime(create_time) = ’2014-05-29’就不能使用到索引,原因很簡單,b+樹中存的都是數(shù)據(jù)表中的字段值,但進行檢索時,需要把所有元素都應(yīng)用函數(shù)才能比較,顯然成本太大。所以語句應(yīng)該寫成create_time = unix_timestamp(’2014-05-29’);

盡量的擴展索引,不要新建索引

比如表中已經(jīng)有a的索引,現(xiàn)在要加(a,b)的索引,那么只需要修改原來的索引即可。

4、高性能索引列

獨立的列

前綴索引和索引的選擇性

多列索引

選擇合適的索引列順序

聚簇索引

覆蓋索引

使用索引掃描來做排序

冗余和重復(fù)索引

未使用的索引

------------------------------------------------------------------------------------------------------------------------------

本文來自 旭日Follow_24 的CSDN 博客 ,全文地址請點擊:https://mp.csdn.net/postedit/80910082

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容