不用索引會怎樣
索引是什么?
以及如何建立索引,如何使用索引來改善性能,
以及索引可能降低性能的情況;
https://segmentfault.com/a/1190000003072424
索引能夠快速提高查詢速度;
如果不使用索引,mysql必須從第一條記錄開始然后讀完整個表直到找出相關(guān)的行;
表越大花費的時間越多,但也不全是這樣;
索引是數(shù)據(jù)結(jié)構(gòu);
所以,在數(shù)據(jù)之外,數(shù)據(jù)庫系統(tǒng)還維護著滿足特定查找算法的數(shù)據(jù)結(jié)構(gòu),這些數(shù)據(jù)結(jié)構(gòu)以某種方式引用(指向)數(shù)據(jù),這樣就可以在這些數(shù)據(jù)結(jié)構(gòu)上實現(xiàn)高級查找算法。這種數(shù)據(jù)結(jié)構(gòu),就是索引。
索引數(shù)據(jù)結(jié)構(gòu)分析
這個索引是個啥結(jié)構(gòu)呢?換句話說,為啥這個結(jié)構(gòu)就能提高檢索速度呢?
若沒有索引,搜索某個記錄時(例如查找name='wish')需要搜索所有的記錄,因為不能保證只有一個wish,必須全部搜索一遍
若在name上建立索引,oracle會對全表進行一次搜索,將每條記錄的name值查找升序排列,然后構(gòu)建索引條目(name和row_id),存儲到索引段中,查詢name為wish時即可直接查找對應(yīng)地方
3.創(chuàng)建了索引并不一定就會使用,oracle自動統(tǒng)計表的信息后,決定是否使用索引,表中數(shù)據(jù)很少時使用全表掃描速度已經(jīng)很快,沒有必要使用索引
舉例說明索引的工作機制
表A中有兩個字段
id,name
表中現(xiàn)在有1000萬條數(shù)據(jù)
需求:根據(jù)name查詢出對應(yīng)的id
如果沒有索引,那就得查詢表中所有記錄,就得把1000萬條數(shù)據(jù)都得挨個查一遍,你說慢不慢。
現(xiàn)在根據(jù)name建立索引,
索引表結(jié)構(gòu):
id,name,value
其中value是表A的id,以json數(shù)組的方式存放(因為會有多個name相同的情況存在);
然后可以根據(jù)排序規(guī)則對name進行排序,
根據(jù)算法可以直接定位到name在索引表中的位置,
然后就可以取出表A 中的id所在的記錄。
簡而言之,就是通過建立索引,可以直達表A中的記錄。
當(dāng)然快了,想必須查詢表A要查詢1000萬條數(shù)據(jù),通過建立索引,以算法大大減少了查詢量。
索引的弊端
內(nèi)存增加;
資源消耗增加;
確實,索引能夠極大地提高數(shù)據(jù)檢索效率,也能夠改善排序分組操作的性能,但有不能忽略的一個問題就是索引是完全獨立于基礎(chǔ)數(shù)據(jù)之外的一部分數(shù)據(jù)。假設(shè)在Table ta 中的Column ca 創(chuàng)建了索引 idx_ta_ca,那么任何更新 Column ca 的操作,MySQL在更新表中 Column ca的同時,都須要更新Column ca 的索引數(shù)據(jù),調(diào)整因為更新帶來鍵值變化的索引信息。而如果沒有對 Column ca 進行索引,MySQL要做的僅僅是更新表中 Column ca 的信息。這樣,最明顯的資源消耗就是增加了更新所帶來的 IO 量和調(diào)整索引所致的計算量。此外,Column ca 的索引idx_ta_ca須要占用存儲空間,而且隨著 Table ta 數(shù)據(jù)量的增加,idx_ta_ca 所占用的空間也會不斷增加,所以索引還會帶來存儲空間資源消耗的增加。