阿里開發(fā)強制要求的11條索引創(chuàng)建規(guī)范,提高性能
1. 【強制】業(yè)務(wù)上具有唯一特性的字段,即使是多個字段的組合,也必須建成唯一索引。
說明:不要以為唯一索引影響了insert速度,這個速度損耗可以忽略,但提高查找速度是明顯的;另外,即使在應(yīng)用層做了非常完善的校驗控制,只要沒有唯一索引,根據(jù)墨菲定律,必然有臟數(shù)據(jù)產(chǎn)生。
2. 【強制】超過三個表禁止join。需要join的字段,數(shù)據(jù)類型必須絕對一致;多表關(guān)聯(lián)查詢時,保證被關(guān)聯(lián)的字段需要有索引。
說明:即使雙表join也要注意表索引、SQL性能。
3. 【強制】在varchar字段上建立索引時,必須指定索引長度,沒必要對全字段建立索引,根據(jù)實際文本區(qū)分度決定索引長度即可。
說明:索引的長度與區(qū)分度是一對矛盾體,一般對字符串類型數(shù)據(jù),長度為20的索引,區(qū)分度會高達90%以上,可以使用count(distinct left(列名, 索引長度))/count(*)的區(qū)分度來確定。
4. 【強制】頁面搜索嚴禁左模糊或者全模糊,如果需要請走搜索引擎來解決。
說明:索引文件具有B-Tree的最左前綴匹配特性,如果左邊的值未確定,那么無法使用此索引。
5. 【推薦】如果有order by的場景,請注意利用索引的有序性。order by ***的字段是組合索引的一部分,并且放在索引組合順序的***,避免出現(xiàn)file_sort的情況,影響查詢性能。
正例:where a=? and b=? order by c; 索引:a_b_c 反例:索引中有范圍查找,那么索引有序性無法利用,如:WHERE a>10 ORDER BY b; 索引a_b無法排序。
6. 【推薦】利用覆蓋索引來進行查詢操作,避免回表。
說明:如果一本書需要知道第11章是什么標題,會翻開第11章對應(yīng)的那一頁嗎?目錄瀏覽一下就好,這個目錄就是起到覆蓋索引的作用。
正例:能夠建立索引的種類分為主鍵索引、唯一索引、普通索引三種,而覆蓋索引只是一種查詢的一種效果,用explain的結(jié)果,extra列會出現(xiàn):using index。
7. 【推薦】利用延遲關(guān)聯(lián)或者子查詢優(yōu)化超多分頁場景。
說明:MySQL并不是跳過offset行,而是取offset+N行,然后返回放棄前offset行,返回N行,那當(dāng)offset特別大的時候,效率就非常的低下,要么控制返回的總頁數(shù),要么對超過特定閾值的頁數(shù)進行SQL改寫。
正例:先快速定位需要獲取的id段,然后再關(guān)聯(lián): SELECT a.* FROM 表1 a, (select id from 表1 where 條件 LIMIT 100000,20 ) b where a.id=b.id
8. 【推薦】 SQL性能優(yōu)化的目標:至少要達到 range 級別,要求是ref級別,如果可以是consts***。 說明:
1)consts 單表中最多只有一個匹配行(主鍵或者唯一索引),在優(yōu)化階段即可讀取到數(shù)據(jù)。 2)ref 指的是使用普通的索引(normal index)。
3)range 對索引進行范圍檢索。 反例:explain表的結(jié)果,type=index,索引物理文件全掃描,速度非常慢,這個index級別比較range還低,與全表掃描是小巫見大巫。
9. 【推薦】建組合索引的時候,區(qū)分度***的在最左邊。
說明:存在非等號和等號混合時,在建索引時,請把等號條件的列前置。如:where c>? and d=? 那么即使c的區(qū)分度更高,也必須把d放在索引的最前列,即索引idx_d_c。
正例:如果where a=? and b=? ,如果a列的幾乎接近于唯一值,那么只需要單建idx_a索引即可。
10. 【推薦】防止因字段類型不同造成的隱式轉(zhuǎn)換,導(dǎo)致索引失效。
11. 【參考】創(chuàng)建索引時避免有如下極端誤解:
1)寧濫勿缺。認為一個查詢就需要建一個索引。
2)寧缺勿濫。認為索引會消耗空間、嚴重拖慢更新和新增速度。
3)抵制惟一索引。認為業(yè)務(wù)的惟一性一律需要在應(yīng)用層通過“先查后插”方式解決。