如何避免回表查詢?什么是索引覆蓋? | 1分鐘MySQL優(yōu)化系列
《迅猛定位低效SQL?》留了一個尾巴:
- select id,name where name='shenjian'
- select id,name,sex where name='shenjian'
多查詢了一個屬性,為何檢索過程完全不同?
- 什么是回表查詢?
- 什么是索引覆蓋?
- 如何實現(xiàn)索引覆蓋?
- 哪些場景,可以利用索引覆蓋來優(yōu)化SQL?
這些,這是今天要分享的內(nèi)容。
畫外音:本文試驗基于MySQL5.6-InnoDB。
一、什么是回表查詢?
這先要從InnoDB的索引實現(xiàn)說起,InnoDB有兩大類索引:
- 聚集索引(clustered index)
- 普通索引(secondary index)
InnoDB聚集索引和普通索引有什么差異?
InnoDB聚集索引的葉子節(jié)點存儲行記錄,因此, InnoDB必須要有,且只有一個聚集索引:
- 如果表定義了PK,則PK就是聚集索引;
- 如果表沒有定義PK,則第一個not NULL unique列是聚集索引;
- 否則,InnoDB會創(chuàng)建一個隱藏的row-id作為聚集索引;
畫外音:所以PK查詢非常快,直接定位行記錄。
InnoDB普通索引的葉子節(jié)點存儲主鍵值。
畫外音:注意,不是存儲行記錄頭指針,MyISAM的索引葉子節(jié)點存儲記錄指針。
舉個栗子,不妨設(shè)有表:
- t(id PK, name KEY, sex, flag);
畫外音:id是聚集索引,name是普通索引。
表中有四條記錄:
- 1, shenjian, m, A
- 3, zhangsan, m, A
- 5, lisi, m, A
- 9, wangwu, f, B
兩個B+樹索引分別如上圖:
- id為PK,聚集索引,葉子節(jié)點存儲行記錄;
- name為KEY,普通索引,葉子節(jié)點存儲PK值,即id;
既然從普通索引無法直接定位行記錄,那普通索引的查詢過程是怎么樣的呢?
通常情況下,需要掃碼兩遍索引樹。
例如:
- select * from t where name='lisi';
是如何執(zhí)行的呢?
如粉紅色路徑,需要掃碼兩遍索引樹:
- 先通過普通索引定位到主鍵值id=5;
- 在通過聚集索引定位到行記錄;
這就是所謂的回表查詢,先定位主鍵值,再定位行記錄,它的性能較掃一遍索引樹更低。
二、什么是索引覆蓋(Covering index)?
額,樓主并沒有在MySQL的官網(wǎng)找到這個概念。
畫外音:治學(xué)嚴謹吧?
借用一下SQL-Server官網(wǎng)的說法。
MySQL官網(wǎng),類似的說法出現(xiàn)在explain查詢計劃優(yōu)化章節(jié),即explain的輸出結(jié)果Extra字段為Using index時,能夠觸發(fā)索引覆蓋。
不管是SQL-Server官網(wǎng),還是MySQL官網(wǎng),都表達了:只需要在一棵索引樹上就能獲取SQL所需的所有列數(shù)據(jù),無需回表,速度更快。
三、如何實現(xiàn)索引覆蓋?
常見的方法是:將被查詢的字段,建立到聯(lián)合索引里去。
仍是《迅猛定位低效SQL?》中的例子:
- create table user (
- id int primary key,
- name varchar(20),
- sex varchar(5),
- index(name)
- )engine=innodb;
第一個SQL語句:
- select id,name from user where name='shenjian';
能夠命中name索引,索引葉子節(jié)點存儲了主鍵id,通過name的索引樹即可獲取id和name,無需回表,符合索引覆蓋,效率較高。
畫外音,Extra:Using index。
第二個SQL語句:
- select id,name,sex from user where name='shenjian';
能夠命中name索引,索引葉子節(jié)點存儲了主鍵id,但sex字段必須回表查詢才能獲取到,不符合索引覆蓋,需要再次通過id值掃碼聚集索引獲取sex字段,效率會降低。
畫外音,Extra:Using index condition。
如果把(name)單列索引升級為聯(lián)合索引(name, sex)就不同了。
- create table user (
- id int primary key,
- name varchar(20),
- sex varchar(5),
- index(name, sex)
- )engine=innodb;
可以看到:
- select id,name ... where name='shenjian';
- select id,name,sex ... where name='shenjian';
都能夠命中索引覆蓋,無需回表。
畫外音,Extra:Using index。
四、哪些場景可以利用索引覆蓋來優(yōu)化SQL?
場景1:全表count查詢優(yōu)化
原表為:
- user(PK id, name, sex);
直接:
- select count(name) from user;
不能利用索引覆蓋。
添加索引:
- alter table user add key(name);
就能夠利用索引覆蓋提效。
場景2:列查詢回表優(yōu)化
- select id,name,sex ... where name='shenjian';
這個例子不再贅述,將單列索引(name)升級為聯(lián)合索引(name, sex),即可避免回表。
場景3:分頁查詢
- select id,name,sex ... order by name limit 500,100;
將單列索引(name)升級為聯(lián)合索引(name, sex),也可以避免回表。
InnoDB聚集索引普通索引,回表,索引覆蓋,希望這1分鐘大家有收獲。
提示,如果你不清楚explain結(jié)果Extra字段為Using index的含義,請閱讀前序文章:《如何利用工具,迅猛定位低效SQL?》
【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系原作者】

戳這里,看該作者更多好文