問題1:char、varchar的區別是什么?
varchar是變長而char的長度是固定的。如果你的內容是固定大小的,你會得到更好的性能。
問題2: TRUNCATE和DELETE的區別是什么?
DELETE命令從一個表中刪除某一行,或多行,TRUNCATE命令永久地從表中刪除每一行。
問題3:什么是觸發器,MySQL中都有哪些觸發器?
觸發器是指一段代碼,當觸發某個事件時,自動執行這些代碼。在MySQL數據庫中有如下六種觸發器:
1、Before Insert
2、After Insert
3、Before Update
4、After Update
5、Before Delete
6、After Delete
問題4:FLOAT和DOUBLE的區別是什么?
FLOAT類型數據可以存儲至多8位十進制數,并在內存中占4字節。
DOUBLE類型數據可以存儲至多18位十進制數,并在內存中占8字節。
問題5:如何在MySQL種獲取當前日期?
SELECT CURRENT_DATE();
問題6:如何查詢第n高的工資?
SELECT DISTINCT(salary) from employee ORDER BY salary DESC LIMIT n-1,1
問題7:請寫出下面MySQL數據類型表達的意義(int(0)、char(16)、varchar(16)、datetime、text)
知識點分析
此題考察的是MySQL數據類型。MySQL數據類型屬于MySQL數據庫基礎,由此延伸出的知識點還包括如下內容:
MySQL基礎操作
MySQL存儲引擎
MySQL鎖機制
MySQL事務處理、存儲過程、觸發器
數據類型考點:
1、整數類型,
包括TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT,分別表示1字節、2字節、3字節、4字節、8字節整數。任何整數類型都可以加上UNSIGNED屬性,表示數據是無符號的,即非負整數。
長度:
整數類型可以被指定長度,例如:INT(11)表示長度為11的INT類型。長度在大多數場景是沒有意義的,它不會限制值的合法范圍,只會影響顯示字符的個數,而且需要和UNSIGNED ZEROFILL屬性配合使用才有意義。
例子,
假定類型設定為INT(5),屬性為UNSIGNED ZEROFILL,如果用戶插入的數據為12的話,那么數據庫實際存儲數據為00012。2、實數類型,
包括FLOAT、DOUBLE、DECIMAL。
DECIMAL可以用于存儲比BIGINT還大的整型,能存儲精確的小數。
而FLOAT和DOUBLE是有取值范圍的,并支持使用標準的浮點進行近似計算。
計算時FLOAT和DOUBLE相比DECIMAL效率更高一些,DECIMAL你可以理解成是用字符串進行處理。3、字符串類型,
包括VARCHAR、CHAR、TEXT、BLOB
VARCHAR用于存儲可變長字符串,它比定長類型更節省空間。
VARCHAR使用額外1或2個字節存儲字符串長度。列長度小于255字節時,使用1字節表示,否則使用2字節表示。
VARCHAR存儲的內容超出設置的長度時,內容會被截斷。
CHAR是定長的,根據定義的字符串長度分配足夠的空間。
CHAR會根據需要使用空格進行填充方便比較。
CHAR適合存儲很短的字符串,或者所有值都接近同一個長度。
CHAR存儲的內容超出設置的長度時,內容同樣會被截斷。
使用策略:
對于經常變更的數據來說,CHAR比VARCHAR更好,因為CHAR不容易產生碎片。
對于非常短的列,CHAR比VARCHAR在存儲空間上更有效率。
使用時要注意只分配需要的空間,更長的列排序時會消耗更多內存。
盡量避免使用TEXT/BLOB類型,查詢時會使用臨時表,導致嚴重的性能開銷。
4、枚舉類型(ENUM),
把不重復的數據存儲為一個預定義的集合。
有時可以使用ENUM代替常用的字符串類型。
ENUM存儲非常緊湊,會把列表值壓縮到一個或兩個字節。
ENUM在內部存儲時,其實存的是整數。
盡量避免使用數字作為ENUM枚舉的常量,因為容易混亂。
排序是按照內部存儲的整數5、日期和時間類型,
盡量使用timestamp,空間效率高于datetime,
用整數保存時間戳通常不方便處理。
如果需要存儲微妙,可以使用bigint存儲。
看到這里,這道真題是不是就比較容易回答了。
答:int(0)表示數據是INT類型,長度是0、char(16)表示固定長度字符串,長度為16、varchar(16)表示可變長度字符串,長度為16、datetime表示時間類型、text表示字符串類型,能存儲大字符串,最多存儲65535字節數據)
MySQL基礎操作:
常見操作
MySQL的連接和關閉:mysql -u -p -h -P
-u:指定用戶名
-p:指定密碼
-h:主機
-P:端口
進入MySQL命令行后:G、c、q、s、h、d
G:打印結果垂直顯示
c:取消當前MySQL命令
q:退出MySQL連接
s:顯示服務器狀態
h:幫助信息
d:改變執行符
MySQL存儲引擎:
1、InnoDB存儲引擎,
默認事務型引擎,最重要最廣泛的存儲引擎,性能非常優秀。
數據存儲在共享表空間,可以通過配置分開。也就是多個表和索引都存儲在一個表空間中,可以通過配置文件改變此配置。
對主鍵查詢的性能高于其他類型的存儲引擎。
內部做了很多優化,從磁盤讀取數據時會自動構建hash索引,插入數據時自動構建插入緩沖區。
通過一些機制和工具支持真正的熱備份。
支持崩潰后的安全恢復。
支持行級鎖。
支持外鍵。
2、MyISAM存儲引擎,
擁有全文索引、壓縮、空間函數。
不支持事務和行級鎖、不支持崩潰后的安全恢復。
表存儲在兩個文件,MYD和MYI。
設計簡單,某些場景下性能很好,例如獲取整個表有多少條數據,性能很高。
全文索引不是很常用,不如使用外部的ElasticSearch或Lucene。
3、其他表引擎,
Archive、Blackhole、CSV、Memory
使用策略
在大多數場景下建議使用InnoDB存儲引擎。
MySQL鎖機制
表鎖是日常開發中的常見問題,因此也是面試當中最常見的考察點,當多個查詢同一時刻進行數據修改時,就會產生并發控制的問題。共享鎖和排他鎖,就是讀鎖和寫鎖。
共享鎖,不堵塞,多個用戶可以同時讀一個資源,互不干擾。
排他鎖,一個寫鎖會阻塞其他的讀鎖和寫鎖,這樣可以只允許一個用戶進行寫入,防止其他用戶讀取正在寫入的資源。
鎖的粒度
表鎖,系統開銷最小,會鎖定整張表,MyIsam使用表鎖。
行鎖,最大程度的支持并發處理,但是也帶來了最大的鎖開銷,InnoDB使用行鎖。
MySQL事務處理
MySQL提供事務處理的表引擎,也就是InnoDB。
服務器層不管理事務,由下層的引擎實現,所以同一個事務中,使用多種引擎是不靠譜的。
需要注意,在非事務表上執行事務操作,MySQL不會發出提醒,也不會報錯。
存儲過程
為以后的使用保存的一條或多條MySQL語句的集合,因此也可以在存儲過程中加入業務邏輯和流程。
可以在存儲過程中創建表,更新數據,刪除數據等等。
使用策略
可以通過把SQL語句封裝在容易使用的單元中,簡化復雜的操作
可以保證數據的一致性
可以簡化對變動的管理
觸發器
提供給程序員和數據分析員來保證數據完整性的一種方法,它是與表事件相關的特殊的存儲過程。
使用場景
可以通過數據庫中的相關表實現級聯更改。
實時監控某張表中的某個字段的更改而需要做出相應的處理。
例如可以生成某些業務的編號。
注意不要濫用,否則會造成數據庫及應用程序的維護困難。
大家需要牢記以上基礎知識點,重點是理解數據類型CHAR和VARCHAR的差異,表存儲引擎InnoDB和MyISAM的區別。
問題8:請說明InnoDB和MyISAM的區別
InnoDB支持事務,MyISAM不支持;
InnoDB數據存儲在共享表空間,MyISAM數據存儲在文件中;
InnoDB支持行級鎖,MyISAM只支持表鎖;
InnoDB支持崩潰后的恢復,MyISAM不支持;
InnoDB支持外鍵,MyISAM不支持;
InnoDB不支持全文索引,MyISAM支持全文索引;
問題9:innodb引擎的特性
插入緩沖(insert buffer)
二次寫(double write)
自適應哈希索引(ahi)
預讀(read ahead)
問題10:請列舉3個以上表引擎
InnoDB、MyISAM、Memory
問題11:請說明varchar和text的區別
varchar可指定字符數,text不能指定,內部存儲varchar是存入的實際字符數+1個字節(n<=255)或2個字節(n>255),text是實際字符數+2個字節。
text類型不能有默認值。
varchar可直接創建索引,text創建索引要指定前多少個字符。varchar查詢速度快于text,在都創建索引的情況下,text的索引幾乎不起作用。
查詢text需要創建臨時表。
問題11:varchar(50)中50的含義
最多存放50個字符,varchar(50)和(200)存儲hello所占空間一樣,但后者在排序時會消耗更多內存,因為order by col采用fixed_length計算col長度(memory引擎也一樣)。
問題12:int(20)中20的含義
是指顯示字符的長度,不影響內部存儲,只是當定義了ZEROFILL時,前面補多少個 0
問題13:簡單描述MySQL中,索引,主鍵,唯一索引,聯合索引的區別,對數據庫的性能有什么影響?
知識點分析
此真題主要考察的是MySQL索引的基礎和類型,由此延伸出的知識點還包括如下內容:
MySQL索引的創建原則
MySQL索引的注意事項
MySQL索引的原理
下面我們就來將這些知識一網打盡
索引的基礎
索引類似于書籍的目錄,要想找到一本數的某個特定主題,需要先查找書的目錄,定位對應的頁碼
存儲引擎使用類似的方式進行數據查詢,先去索引當中找到對應的值,然后根據匹配的索引找到對應的數據行。
創建索引的語法:
首先創建一個表:create table t1 (id int primary key,username varchar(20),password varchar(20));
創建單個索引的語法:CREATE INDEX 索引名 on 表名(字段名)
索引名一般是:表名_字段名
給id創建索引:CREATE INDEX t1_id on t1(id);
創建聯合索引的語法:CREATE INDEX 索引名 on 表名(字段名1,字段名2)
給username和password創建聯合索引:CREATE index t1_username_password ON t1(username,password)
其中index還可以替換成unique,primary key,分別代表唯一索引和主鍵索引
刪除索引:DROP INDEX t1_username_password ON t1
索引對性能的影響:
大大減少服務器需要掃描的數據量。
幫助服務器避免排序和臨時表。
將隨機I/O變順序I/O。
大大提高查詢速度。
降低寫的速度(不良影響)。
磁盤占用(不良影響)。
索引的使用場景:
對于非常小的表,大部分情況下全表掃描效率更高。
中到大型表,索引非常有效。
特大型的表,建立和使用索引的代價會隨之增大,可以使用分區技術來解決。
索引的類型:
索引很多種類型,是在MySQL的存儲引擎實現的。
普通索引:最基本的索引,沒有任何約束限制。
唯一索引:和普通索引類似,但是具有唯一性約束。
主鍵索引:特殊的唯一索引,不允許有空值。
索引的區別:
-一個表只能有一個主鍵索引,但是可以有多個唯一索引。
主鍵索引一定是唯一索引,唯一索引不是主鍵索引。
主鍵可以與外鍵構成參照完整性約束,防止數據不一致。
聯合索引:將多個列組合在一起創建索引,可以覆蓋多個列。(也叫復合索引,組合索引)
外鍵索引:只有InnoDB類型的表才可以使用外鍵索引,保證數據的一致性、完整性、和實現級聯操作(基本不用)。
全文索引:MySQL自帶的全文索引只能用于MyISAM,并且只能對英文進行全文檢索 (基本不用)
MySQL索引的創建原則
最適合創建索引的列是出現在WHERE或ON子句中的列,或連接子句中的列而不是出現在SELECT關鍵字后的列。
索引列的基數越大,數據區分度越高,索引的效果越好。
對于字符串進行索引,應該制定一個前綴長度,可以節省大量的索引空間。
根據情況創建聯合索引,聯合索引可以提高查詢效率。
避免創建過多的索引,索引會額外占用磁盤空間,降低寫操作效率。
主鍵盡可能選擇較短的數據類型,可以有效減少索引的磁盤占用提高查詢效率。
MySQL索引的注意事項
1、聯合索引遵循前綴原則
KEY(a,b,c)WHERE a = 1 AND b = 2 AND c = 3WHERE a = 1 AND b = 2WHERE a = 1#以上SQL語句可以用到索引WHERE b = 2 AND c = 3WHERE a = 1 AND c = 3#以上SQL語句用不到索引
2、LIKE查詢,%不能在前
WHERE name LIKE "%wang%"#以上語句用不到索引,可以用外部的ElasticSearch、Lucene等全文搜索引擎替代。
3、列值為空(NULL)時是可以使用索引的,但MySQL難以優化引用了可空列的查詢,它會使索引、索引統計和值更加復雜。可空列需要更多的儲存空間,還需要在MySQL內部進行特殊處理。
4、如果MySQL估計使用索引比全表掃描更慢,會放棄使用索引,例如:
表中只有100條數據左右。對于SQL語句WHERE id > 1 AND id < 100,MySQL會優先考慮全表掃描。
5、如果關鍵詞or前面的條件中的列有索引,后面的沒有,所有列的索引都不會被用到。
6、列類型是字符串,查詢時一定要給值加引號,否則索引失效,例如:
列name varchar(16),存儲了字符串"100"
WHERE name = 100;
以上SQL語句能搜到,但無法用到索引。
MySQL索引的原理
MySQL索引是用一種叫做聚簇索引的數據結構實現的,下面我們就來看一下什么是聚簇索引。
聚簇索引是一種數據存儲方式,它實際上是在同一個結構中保存了B+樹索引和數據行,InnoDB表是按照聚簇索引組織的(類似于Oracle的索引組織表)。
注:B+ 樹是一種樹數據結構,是一個n叉排序樹,每個節點通常有多個孩子,一棵B+樹包含根節點、內部節點和葉子節點。根節點可能是一個葉子節點,也可能是一個包含兩個或兩個以上孩子節點的節點。B+ 樹通常用于數據庫和操作系統的文件系統中。NTFS, ReiserFS, NSS, XFS, JFS, ReFS 和BFS等文件系統都在使用B+樹作為元數據索引。B+ 樹的特點是能夠保持數據穩定有序,其插入與修改擁有較穩定的對數時間復雜度。B+ 樹元素自底向上插入。
InnoDB通過主鍵聚簇數據,如果沒有定義主鍵,會選擇一個唯一的非空索引代替,如果沒有這樣的索引,會隱式定義個主鍵作為聚簇索引。
下圖形象說明了聚簇索引表(InnoDB)和普通的堆組織表(MyISAM)的區別:
最常問的MySQL面試題三——每個開發人員都應該知道
對于普通的堆組織表來說(右圖),表數據和索引是分別存儲的,主鍵索引和二級索引存儲上沒有任何區別。
而對于聚簇索引表來說(左圖),表數據是和主鍵一起存儲的,主鍵索引的葉結點存儲行數據,二級索引的葉結點存儲行的主鍵值。
聚簇索引表最大限度地提高了I/O密集型應用的性能,但它也有以下幾個限制:
1)插入速度嚴重依賴于插入順序,按照主鍵的順序插入是最快的方式,否則將會出現頁分裂,嚴重影響性能。因此,對于InnoDB表,我們一般都會定義一個自增的ID列為主鍵。
2)更新主鍵的代價很高,因為將會導致被更新的行移動。因此,對于InnoDB表,我們一般定義主鍵為不可更新。
3)二級索引訪問需要兩次索引查找,第一次找到主鍵值,第二次根據主鍵值找到行數據。
二級索引的葉節點存儲的是主鍵值,而不是行指針,這是為了減少當出現行移動或數據頁分裂時二級索引的維護工作,但會讓二級索引占用更多的空間。
解題方法
在一些MySQL索引基礎考題中,我們可以輕松的通過索引基礎和類型來解決此類問題,對于一些索引創建注意事項方面的考點,我們可以通過索引創建原則和注意事項來解決。
問題14:創建MySQL聯合索引應該注意什么?
需遵循前綴原則
問題15:列值為NULL時,查詢是否會用到索引?
在MySQL里NULL值的列也是走索引的。當然,如果計劃對列進行索引,就要盡量避免把它設置為可空,MySQL難以優化引用了可空列的查詢,它會使索引、索引統計和值更加復雜。
****問題16:以下語句是否會應用索引:SELECT* FROM users WHERE YEAR(adddate) < 2007;****
不會,因為只要列涉及到運算,MySQL就不會使用索引。
問題17:MyISAM索引實現?
MyISAM存儲引擎使用B+Tree作為索引結構,葉節點的data域存放的是數據記錄的地址。MyISAM的索引方式也叫做非聚簇索引的,之所以這么稱呼是為了與InnoDB的聚簇索引區分。
問題17:MyISAM索引與InnoDB索引的區別?
InnoDB索引是聚簇索引,MyISAM索引是非聚簇索引。
InnoDB的主鍵索引的葉子節點存儲著行數據,因此主鍵索引非常高效。
MyISAM索引的葉子節點存儲的是行數據地址,需要再尋址一次才能得到數據。
InnoDB非主鍵索引的葉子節點存儲的是主鍵和其他帶索引的列數據,因此查詢時做到覆蓋索引會非常高效。
問題18:以下三條sql 如何建索引,只建一條怎么建?
WHERE a=1 AND b=1WHERE b=1WHERE b=1 ORDER BY time DESC
以順序b,a,time建立聯合索引,CREATE INDEX table1_b_a_time ON index_test01(b,a,time)。因為最新MySQL版本會優化WHERE子句后面的列順序,以匹配聯合索引順序。
問題19:有A(id,sex,par,c1,c2),B(id,age,c1,c2)兩張表,其中A.id與B.id關聯,現在要求寫出一條SQL語句,將B中age>50的記錄的c1,c2更新到A表中同一記錄中的c1,c2字段中
考點分析
這道題主要考察的是MySQL的關聯UPDATE語句
延伸考點:
MySQL的關聯查詢語句
MySQL的關聯UPDATE語句
針對剛才這道題,答案可以是如下兩種形式的寫法:
UPDATE A,B SET A.c1 = B.c1, A.c2 = B.c2 WHERE A.id = B.idUPDATE A INNER JOIN B ON A.id=B.id SET A.c1 = B.c1,A.c2=B.c2再加上B中age>50的條件:UPDATE A,B set A.c1 = B.c1, A.c2 = B.c2 WHERE A.id = B.id and B.age > 50;UPDATE A INNER JOIN B ON A.id = B.id set A.c1 = B.c1,A.c2 = B.c2 WHERE B.age > 50
MySQL的關聯查詢語句
六種關聯查詢
交叉連接(CROSS JOIN)
內連接(INNER JOIN)
外連接(LEFT JOIN/RIGHT JOIN)
聯合查詢(UNION與UNION ALL)
全連接(FULL JOIN)
交叉連接(CROSS JOIN)
SELECT * FROM A,B(,C)或者SELECT * FROM A CROSS JOIN B (CROSS JOIN C)#沒有任何關聯條件,結果是笛卡爾積,結果集會很大,沒有意義,很少使用內連接(INNER JOIN)SELECT * FROM A,B WHERE A.id=B.id或者SELECT * FROM A INNER JOIN B ON A.id=B.id多表中同時符合某種條件的數據記錄的集合,INNER JOIN可以縮寫為JOIN
內連接分為三類
等值連接:ON A.id=B.id
不等值連接:ON A.id > B.id
自連接:SELECT * FROM A T1 INNER JOIN A T2 ON T1.id=T2.pid
外連接(LEFT JOIN/RIGHT JOIN)
左外連接:LEFT OUTER JOIN, 以左表為主,先查詢出左表,按照ON后的關聯條件匹配右表,沒有匹配到的用NULL填充,可以簡寫成LEFT JOIN
右外連接:RIGHT OUTER JOIN, 以右表為主,先查詢出右表,按照ON后的關聯條件匹配左表,沒有匹配到的用NULL填充,可以簡寫成RIGHT JOIN
聯合查詢(UNION與UNION ALL)
SELECT * FROM A UNION SELECT * FROM B UNION ...
就是把多個結果集集中在一起,UNION前的結果為基準,需要注意的是聯合查詢的列數要相等,相同的記錄行會合并
如果使用UNION ALL,不會合并重復的記錄行
效率 UNION 高于 UNION ALL
全連接(FULL JOIN)
MySQL不支持全連接
可以使用LEFT JOIN 和UNION和RIGHT JOIN聯合使用
SELECT * FROM A LEFT JOIN B ON A.id=B.id UNIONSELECT * FROM A RIGHT JOIN B ON A.id=B.id
嵌套查詢
用一條SQL語句得結果作為另外一條SQL語句得條件,效率不好把握
SELECT * FROM A WHERE id IN (SELECT id FROM B)
解題方法
根據考題要搞清楚表的結果和多表之間的關系,根據想要的結果思考使用那種關聯方式,通常把要查詢的列先寫出來,然后分析這些列都屬于哪些表,才考慮使用關聯查詢
問題20:
為了記錄足球比賽的結果,設計表如下:
team:參賽隊伍表
match:賽程表
其中,match賽程表中的hostTeamID與guestTeamID都和team表中的teamID關聯,查詢2006-6-1到2006-7-1之間舉行的所有比賽,并且用以下形式列出:拜仁 2:0 不萊梅 2006-6-21
首先列出需要查詢的列:
表team
teamID teamName
表match
match ID
hostTeamID
guestTeamID
matchTime matchResult
其次列出結果列:
- 主隊 結果 客對 時間
初步寫一個基礎的SQL:
SELECT hostTeamID,matchResult,matchTime guestTeamID from match where matchTime between "2006-6-1" and "2006-7-1";
通過外鍵聯表,完成最終SQL:
select t1.teamName,m.matchResult,t2.teamName,m.matchTime from match as m left join team as t1 on m.hostTeamID = t1.teamID, left join team t2 on m.guestTeamID=t2.guestTeamID where m.matchTime between "2006-6-1" and "2006-7-1"
問題21:UNION與UNION ALL的區別?
如果使用UNION ALL,不會合并重復的記錄行
效率 UNION 高于 UNION ALL
問題22:一個6億的表a,一個3億的表b,通過外鍵tid關聯,你如何最快的查詢出滿足條件的第50000到第50200中的這200條數據記錄。
- 1、如果A表TID是自增長,并且是連續的,B表的ID為索引
select * from a,b where a.tid = b.id and a.tid>50000 limit 200;
- 2、如果A表的TID不是連續的,那么就需要使用覆蓋索引.TID要么是主鍵,要么是輔助索引,B表ID也需要有索引。
select * from b , (select tid from a limit 50000,200) a where b.id = a .tid;
問題23:拷貝表( 拷貝數據, 源表名:a 目標表名:b)
insert into b(a, b, c) select d,e,f from a;
問題24: Student(S#,Sname,Sage,Ssex) 學生表 Course(C#,Cname,T#) 課程表 SC(S#,C#,score) 成績表 Teacher(T#,Tname) 教師表 查詢沒學過“葉平”老師課的同學的學號、姓名
select Student.S#,Student.Snamefrom Studentwhere S# not in (select distinct( SC.S#) from SC,Course,Teacher where SC.C#=Course.C# and Teacher.T#=Course.T# and Teacher.Tname=’葉平’);
問題25:隨機取出10條數據
SELECT * FROM users WHERE id >= ((SELECT MAX(id) FROM users)-(SELECT MIN(id) FROM users)) * RAND() + (SELECT MIN(id) FROM users) LIMIT 10#此方法效率比直接用SELECT * FROM users order by rand() LIMIT 10高很多
問題26:請簡述項目中優化SQL語句執行效率的方法,從哪些方面,SQL語句性能如何分析?
考點分析:
這道題主要考察的是查找分析SQL語句查詢速度慢的方法
延伸考點:
優化查詢過程中的數據訪問
優化長難的查詢語句
優化特定類型的查詢語句
如何查找查詢速度慢的原因
記錄慢查詢日志,分析查詢日志,不要直接打開慢查詢日志進行分析,這樣比較浪費時間和精力,可以使用pt-query-digest工具進行分析
使用show profile
set profiling=1;開啟,服務器上所有執行語句會記錄執行時間,存到臨時表中show profilesshow profile for query 臨時表ID
使用show status
show status會返回一些計數器,show global status會查看所有服務器級別的所有計數
有時根據這些計數,可以推測出哪些操作代價較高或者消耗時間多
show processlist
觀察是否有大量線程處于不正常的狀態或特征
最常問的MySQL面試題五——每個開發人員都應該知道
使用explain
分析單條SQL語句
優化查詢過程中的數據訪問
訪問數據太多導致查詢性能下降
確定應用程序是否在檢索大量超過需要的數據,可能是太多行或列
確認MySQL服務器是否在分析大量不必要的數據行
避免犯如下SQL語句錯誤
查詢不需要的數據。解決辦法:使用limit解決
多表關聯返回全部列。解決辦法:指定列名
總是返回全部列。解決辦法:避免使用SELECT *
重復查詢相同的數據。解決辦法:可以緩存數據,下次直接讀取緩存
是否在掃描額外的記錄。解決辦法:
使用explain進行分析,如果發現查詢需要掃描大量的數據,但只返回少數的行,可以通過如下技巧去優化:
使用索引覆蓋掃描,把所有的列都放到索引中,這樣存儲引擎不需要回表獲取對應行就可以返回結果。
改變數據庫和表的結構,修改數據表范式
重寫SQL語句,讓優化器可以以更優的方式執行查詢。
優化長難的查詢語句
一個復雜查詢還是多個簡單查詢
MySQL內部每秒能掃描內存中上百萬行數據,相比之下,響應數據給客戶端就要慢得多
使用盡可能小的查詢是好的,但是有時將一個大的查詢分解為多個小的查詢是很有必要的。
切分查詢
將一個大的查詢分為多個小的相同的查詢
一次性刪除1000萬的數據要比一次刪除1萬,暫停一會的方案更加損耗服務器開銷。
分解關聯查詢,讓緩存的效率更高。
執行單個查詢可以減少鎖的競爭。
在應用層做關聯更容易對數據庫進行拆分。
查詢效率會有大幅提升。
較少冗余記錄的查詢。
優化特定類型的查詢語句
count(*)會忽略所有的列,直接統計所有列數,不要使用count(列名)
MyISAM中,沒有任何where條件的count(*)非常快。
當有where條件時,MyISAM的count統計不一定比其它引擎快。
可以使用explain查詢近似值,用近似值替代count(*)
增加匯總表
使用緩存
優化關聯查詢
確定ON或者USING子句中是否有索引。
確保GROUP BY和ORDER BY只有一個表中的列,這樣MySQL才有可能使用索引。
優化子查詢
用關聯查詢替代
優化GROUP BY和DISTINCT
這兩種查詢據可以使用索引來優化,是最有效的優化方法
關聯查詢中,使用標識列分組的效率更高
如果不需要ORDER BY,進行GROUP BY時加ORDER BY NULL,MySQL不會再進行文件排序。
WITH ROLLUP超級聚合,可以挪到應用程序處理
優化LIMIT分頁
LIMIT偏移量大的時候,查詢效率較低
可以記錄上次查詢的最大ID,下次查詢時直接根據該ID來查詢
優化UNION查詢
- UNION ALL的效率高于UNION
優化WHERE子句
解題方法
對于此類考題,先說明如何定位低效SQL語句,然后根據SQL語句可能低效的原因做排查,先從索引著手,如果索引沒有問題,考慮以上幾個方面,數據訪問的問題,長難查詢句的問題還是一些特定類型優化的問題,逐一回答。
SQL語句優化的一些方法?
1.對查詢進行優化,應盡量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。
2.應盡量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如:
select id from t where num is null可以在num上設置默認值0,確保表中num列沒有null值,然后這樣查詢:select id from t where num=
3.應盡量避免在 where 子句中使用!=或<>操作符,否則引擎將放棄使用索引而進行全表掃描。
4.應盡量避免在 where 子句中使用or 來連接條件,否則將導致引擎放棄使用索引而進行全表掃描,如:
select id from t where num=10 or num=20可以這樣查詢:select id from t where num=10 union all select id from t where num=20
- 5.in 和 not in 也要慎用,否則會導致全表掃描,如:
select id from t where num in(1,2,3) 對于連續的數值,能用 between 就不要用 in 了:select id from t where num between 1 and 3
6.下面的查詢也將導致全表掃描:select id from t where name like ‘%李%’若要提高效率,可以考慮全文檢索。
7. 如果在 where 子句中使用參數,也會導致全表掃描。因為SQL只有在運行時才會解析局部變量,但優化程序不能將訪問計劃的選擇推遲到運行時;它必須在編譯時進行選擇。然 而,如果在編譯時建立訪問計劃,變量的值還是未知的,因而無法作為索引選擇的輸入項。如下面語句將進行全表掃描:
select id from t where num=@num可以改為強制查詢使用索引:select id from t with(index(索引名)) where num=@num
- 8.應盡量避免在 where 子句中對字段進行表達式操作,這將導致引擎放棄使用索引而進行全表掃描。如:
select id from t where num/2=100應改為:select id from t where num=100*2
- 9.應盡量避免在where子句中對字段進行函數操作,這將導致引擎放棄使用索引而進行全表掃描。如:
select id from t where substring(name,1,3)=’abc’ ,name以abc開頭的id應改為:select id from t where name like ‘abc%’
- 10.不要在 where 子句中的“=”左邊進行函數、算術運算或其他表達式運算,否則系統將可能無法正確使用索引。