性能不理想的系統(tǒng)中除了一部分是因?yàn)閼?yīng)用程序的負(fù)載確實(shí)超過了服務(wù)器的實(shí)際處理能力外,更多的是因?yàn)橄到y(tǒng)存在大量的SQL語句需要優(yōu)化。為了獲得穩(wěn)定的執(zhí)行性能,SQL語句越簡單越好。對(duì)復(fù)雜的SQL語句,要設(shè)法對(duì)之進(jìn)行簡化。
常見的簡化規(guī)則##
- 不要有超過5個(gè)以上的表連接(JOIN);
- 考慮使用臨時(shí)表或表變量存放中間結(jié)果;
- 少用子查詢;
- 視圖嵌套不要過深,一般視圖嵌套不要超過2個(gè)為宜;
- 連接的表越多,其編譯的時(shí)間和連接的開銷也越大,性能越不好控制。最好是把連接拆開成較小的幾個(gè)部分逐個(gè)順序執(zhí)行。優(yōu)先執(zhí)行那些能夠大量減少結(jié)果的連接。拆分的好處不僅僅是減少SQL Server優(yōu)化的時(shí)間,更使得SQL語句能夠以你可以預(yù)測的方式和順序執(zhí)行。如果一定需要連接很多表才能得到數(shù)據(jù),那么很可能意味著設(shè)計(jì)上的缺陷;
- 連接是outer join,非常不好。因?yàn)閛uter join意味著必須對(duì)左表或右表查詢所有行。如果表很大而沒有相應(yīng)的where語句,那么outer join很容易導(dǎo)致table scan或index scan。要盡量使用inner join避免scan整個(gè)表。
優(yōu)化建議##
- **限制結(jié)果集 **要盡量減少返回的結(jié)果行,包括行數(shù)和字段列數(shù)。返回的結(jié)果越大,意味著相應(yīng)的SQL語句的logical reads 就越大,對(duì)服務(wù)器的性能影響就越甚。
一個(gè)很不好的設(shè)計(jì)就是返回表的所有數(shù)據(jù):
Select * from tablename
即使表很小也會(huì)導(dǎo)致并發(fā)問題。更壞的情況是,如果表有上百萬行的話,那后果將是災(zāi)難性的。它不但可能帶來極重的磁盤IO,更有可能把數(shù)據(jù)庫緩沖區(qū)中的其他緩存數(shù)據(jù)擠出,使得這些數(shù)據(jù)下次必須再從磁盤讀取。必須設(shè)計(jì)良好的SQL語句,使得其有where語句或TOP語句來限制結(jié)果集大小。
- 合理的表設(shè)計(jì) SQL Server 2005將支持表分區(qū)技術(shù)。利用表分區(qū)技術(shù)可以實(shí)現(xiàn)數(shù)據(jù)表的流動(dòng)窗口功能。在流動(dòng)窗口中可以輕易的把歷史數(shù)據(jù)移出,把新的數(shù)據(jù)加入,從而使表的大小基本保持穩(wěn)定。 另外,表的設(shè)計(jì)未必需要非常范式化。有一定的字段冗余可以增加SQL語句的效率,減少JOIN的數(shù)目,提高語句的執(zhí)行速度。
處理百萬級(jí)以上的數(shù)據(jù)提高查詢速度的方法##
- 應(yīng)盡量避免在 where 子句中使用!=或<>操作符,否則將引擎放棄使用索引而進(jìn)行全表掃描。
- 對(duì)查詢進(jìn)行優(yōu)化,應(yīng)盡量避免全表掃描,首先應(yīng)考慮在 where 及 order by 涉及的列上建立索引。
- 應(yīng)盡量避免在 where 子句中對(duì)字段進(jìn)行 null 值判斷,否則將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描,如:
select id from t where num is null
可以在num上設(shè)置默認(rèn)值0,確保表中num列沒有null值,然后這樣查詢:
select id from t where num=0
- 應(yīng)盡量避免在 where 子句中使用 or 來連接條件,否則將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描,如:
select id from t where num=10 or num=20
可以這樣查詢:
select id from t where num=10 union all select id from t where num=20
- 下面的查詢也將導(dǎo)致全表掃描:(不能前置百分號(hào))
select id from t where name like ‘%abc%’ 若要提高效率,可以考慮全文檢索。
- in 和 not in 也要慎用,否則會(huì)導(dǎo)致全表掃描,如:
select id from t where num in(1,2,3)
對(duì)于連續(xù)的數(shù)值,能用 between 就不要用 in 了:
select id from t where num between 1 and 3
- 如果在 where 子句中使用參數(shù),也會(huì)導(dǎo)致全表掃描。因?yàn)镾QL只有在運(yùn)行時(shí)才會(huì)解析局部變量,但優(yōu)化程序不能將訪問計(jì)劃的選擇推遲到運(yùn)行時(shí);它必須在編譯時(shí)進(jìn)行選擇。然而,如果在編譯時(shí)建立訪問計(jì)劃,變量的值還是未知的,因而無法作為索引選擇的輸入項(xiàng)。如下面語句將進(jìn)行全表掃描:
select id from t where num=@num
- 應(yīng)盡量避免在 where 子句中對(duì)字段進(jìn)行表達(dá)式操作,這將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描。如:
select id from t where num/2=100
應(yīng)改為:
select id from t where num=100*2
- 應(yīng)盡量避免在where子句中對(duì)字段進(jìn)行函數(shù)操作,這將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描。如:
select id from t where substring(name,1,3)=’abc’ – name以abc開頭的id
select id from t where datediff(day,createdate,’2005-11-30′)=’2005-11-30′ 生成的id
應(yīng)改為:
select id from t where name like ‘a(chǎn)bc%’
select id from t where createdate>=’2005-11-30′ and createdate<’2005-12-1′
不要在 where 子句中的“=”左邊進(jìn)行函數(shù)、算術(shù)運(yùn)算或其他表達(dá)式運(yùn)算,否則系統(tǒng)將可能無法正確使用索引。
在使用索引字段作為條件時(shí),如果該索引是復(fù)合索引,那么必須使用到該索引中的第一個(gè)字段作為條件時(shí)才能保證系統(tǒng)使用該索引,否則該索引將不會(huì)被使用,并且應(yīng)盡可能的讓字段順序與索引順序相一致。
很多時(shí)候用 exists 代替 in 是一個(gè)好的選擇:
select num from a where num in(select num from b)
用下面的語句替換:
select num from a where exists(select 1 from b where num=a.num)
并不是所有索引對(duì)查詢都有效,SQL是根據(jù)表中數(shù)據(jù)來進(jìn)行查詢優(yōu)化的,當(dāng)索引列有大量數(shù)據(jù)重復(fù)時(shí),SQL查詢可能不會(huì)去利用索引,如一表中有字段 sex,male、female幾乎各一半,那么即使在sex上建了索引也對(duì)查詢效率起不了作用。
索引并不是越多越好,索引固然可以提高相應(yīng)的 select 的效率,但同時(shí)也降低了 insert 及 update 的效率,因?yàn)?insert 或 update 時(shí)有可能會(huì)重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個(gè)表的索引數(shù)最好不要超過6個(gè),若太多則應(yīng)考慮一些不常使用到的列上建的索引是否有必要。 **
應(yīng)盡可能的避免更新 clustered 索引數(shù)據(jù)列,因?yàn)?clustered 索引數(shù)據(jù)列的順序就是表記錄的物理存儲(chǔ)順序,一旦該列值改變將導(dǎo)致整個(gè)表記錄的順序的調(diào)整,會(huì)耗費(fèi)相當(dāng)大的資源。若應(yīng)用系統(tǒng)需要頻繁更新 clustered 索引數(shù)據(jù)列,那么需要考慮是否應(yīng)將該索引建為 clustered 索引。
盡量使用數(shù)字型字段,若只含數(shù)值信息的字段盡量不要設(shè)計(jì)為字符型,這會(huì)降低查詢和連接的性能,并會(huì)增加存儲(chǔ)開銷。這是因?yàn)橐嬖谔幚聿樵兒瓦B接時(shí)會(huì)逐個(gè)比較字符串中每一個(gè)字符,而對(duì)于數(shù)字型而言只需要比較一次就夠了。
盡可能的使用 varchar/nvarchar 代替 char/nchar ,因?yàn)槭紫茸冮L字段存儲(chǔ)空間小,可以節(jié)省存儲(chǔ)空間,其次對(duì)于查詢來說,在一個(gè)相對(duì)較小的字段內(nèi)搜索效率顯然要高些。
任何地方都不要使用 select * from t ,用具體的字段列表代替“*”,不要返回用不到的任何字段。
盡量使用表變量來代替臨時(shí)表。如果表變量包含大量數(shù)據(jù),請(qǐng)注意索引非常有限(只有主鍵索引)。
避免頻繁創(chuàng)建和刪除臨時(shí)表,以減少系統(tǒng)表資源的消耗。
臨時(shí)表并不是不可使用,適當(dāng)?shù)厥褂盟鼈兛梢允鼓承├谈行В纾?dāng)需要重復(fù)引用大型表或常用表中的某個(gè)數(shù)據(jù)集時(shí)。但是,對(duì)于一次性事件,最好使用導(dǎo)出表。
在新建臨時(shí)表時(shí),如果一次性插入數(shù)據(jù)量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果數(shù)據(jù)量不大,為了緩和系統(tǒng)表的資源,應(yīng)先create table,然后insert。
如果使用到了臨時(shí)表,在存儲(chǔ)過程的最后務(wù)必將所有的臨時(shí)表顯式刪除,先 truncate table ,然后 drop table ,這樣可以避免系統(tǒng)表的較長時(shí)間鎖定。
盡量避免使用游標(biāo),因?yàn)橛螛?biāo)的效率較差,如果游標(biāo)操作的數(shù)據(jù)超過1萬行,那么就應(yīng)該考慮改寫。
使用基于游標(biāo)的方法或臨時(shí)表方法之前,應(yīng)先尋找基于集的解決方案來解決問題,基于集的方法通常更有效。
與臨時(shí)表一樣,游標(biāo)并不是不可使用。對(duì)小型數(shù)據(jù)集使用 FAST_FORWARD 游標(biāo)通常要優(yōu)于其他逐行處理方法,尤其是在必須引用幾個(gè)表才能獲得所需的數(shù)據(jù)時(shí)。在結(jié)果集中包括“合計(jì)”的例程通常要比使用游標(biāo)執(zhí)行的速度快。如果開發(fā)時(shí) 間允許,基于游標(biāo)的方法和基于集的方法都可以嘗試一下,看哪一種方法的效果更好。
在所有的存儲(chǔ)過程和觸發(fā)器的開始處設(shè)置 SET NOCOUNT ON ,在結(jié)束時(shí)設(shè)置 SET NOCOUNT OFF 。無需在執(zhí)行存儲(chǔ)過程和觸發(fā)器的每個(gè)語句后向客戶端發(fā)送 DONE_IN_PROC 消息。
盡量避免向客戶端返回大數(shù)據(jù)量,若數(shù)據(jù)量過大,應(yīng)該考慮相應(yīng)需求是否合理。
盡量避免大事務(wù)操作,提高系統(tǒng)并發(fā)能力。