我們一起聊聊 SQL 性能優化神器

作者：蘇三 2024-07-11 08:26:00

數據庫其他數據庫

rows顯示了檢查的估計行數，rows× filtered顯示了與下表連接的行數。例如，如果 rows為1000且 filtered為50.00（50％），則與下表連接的行數為1000×50％= 500。

對于互聯網公司來說，隨著用戶量和數據量的不斷增加，慢查詢是無法避免的問題。一般情況下如果出現慢查詢，意味著接口響應慢、接口超時等問題。如果是高并發的場景，可能會出現數據庫連接被占滿的情況，直接導致服務不可用。

慢查詢的確會導致很多問題，我們要如何優化慢查詢呢？

主要解決辦法有：

監控sql執行情況，發郵件、短信報警，便于快速識別慢查詢sql
打開數據庫慢查詢日志功能
簡化業務邏輯
代碼重構、優化
異步處理
sql優化
索引優化

其他的辦法先不說，后面有機會再單獨介紹。今天我重點說說索引優化，因為它是解決慢查詢sql問題最有效的手段。

如何查看某條sql的索引執行情況呢？

沒錯，在sql前面加上explain關鍵字，就能夠看到它的執行計劃，通過執行計劃，我們可以清楚的看到表和索引執行的情況，索引有沒有執行、索引執行順序和索引的類型等。

索引優化的步驟是：

使用explain查看sql執行計劃
判斷哪些索引使用不當
優化sql，sql可能需要多次優化才能達到索引使用的最優值

既然索引優化的第一步是使用explain，我們先全面的了解一下它。

explain介紹

先看看mysql的官方文檔是怎么描述explain的：

圖片

EXPLAIN可以使用于 SELECT， DELETE， INSERT， REPLACE，和 UPDATE語句。
當EXPLAIN與可解釋的語句一起使用時，MySQL將顯示來自優化器的有關語句執行計劃的信息。也就是說，MySQL解釋了它將如何處理該語句，包括有關如何連接表以及以何種順序連接表的信息。
當EXPLAIN與非可解釋的語句一起使用時，它將顯示在命名連接中執行的語句的執行計劃。
對于SELECT語句， EXPLAIN可以顯示的其他執行計劃的警告信息。

explain詳解

explain的語法：

{EXPLAIN | DESCRIBE | DESC}
    tbl_name [col_name | wild]

{EXPLAIN | DESCRIBE | DESC}
    [explain_type]
    {explainable_stmt | FORCONNECTION connection_id}

explain_type: {
    EXTENDED
  | PARTITIONS
  | FORMAT = format_name
}

format_name: {
    TRADITIONAL
  | JSON
}

explainable_stmt: {
    SELECTstatement
  | DELETEstatement
  | INSERTstatement
  | REPLACEstatement
  | UPDATEstatement
}

用一條簡單的sql看看使用explain關鍵字的效果：

explain select * from test1;

執行結果：從上圖中看到執行結果中會顯示12列信息，每列具體信息如下：

說白了，我們要搞懂這些列的具體含義才能正常判斷索引的使用情況。

話不多說，直接開始介紹吧。

id列

該列的值是select查詢中的序號，比如：1、2、3、4等，它決定了表的執行順序。

某條sql的執行計劃中一般會出現三種情況：

id相同
id不同
id相同和不同都有

那么這三種情況表的執行順序是怎么樣的呢？

1.id相同

執行sql如下：

explain select * from test1 t1 inner join test1 t2 on t1.id=t2.id

結果：

圖片

我們看到執行結果中的兩條數據id都是1，是相同的。

這種情況表的執行順序是怎么樣的呢？

答案：從上到下執行，先執行表t1，再執行表t2。

執行的表要怎么看呢？

答案：看table字段，這個字段后面會詳細解釋。

2.id不同

執行sql如下：

explain select * from test1 t1 where t1.id = (select id from  test1 t2 where  t2.id=2);

結果：

圖片

我們看到執行結果中兩條數據的id不同，第一條數據是1，第二條數據是2。

這種情況表的執行順序是怎么樣的呢？

答案：序號大的先執行，這里會從下到上執行，先執行表t2，再執行表t1。

3.id相同和不同都有

執行sql如下：

explain
select t1.* from test1 t1
inner join (select max(id) mid from test1 group by id) t2
on t1.id=t2.mid

結果：

圖片

我們看到執行結果中三條數據，前面兩條數據的的id相同，第三條數據的id跟前面的不同。

這種情況表的執行順序又是怎么樣的呢？

答案：先執行序號大的，先從下而上執行。遇到序號相同時，再從上而下執行。所以這個列子中表的順序順序是：test1、t1、

也許你會在這里心生疑問：<derived2> 是什么鬼？

它表示派生表，別急后面會講的。

還有一個問題：id列的值允許為空嗎？

答案在后面揭曉。

select_type列

該列表示select的類型。具體包含了如下11種類型：

圖片

但是常用的其實就是下面幾個：

類型	含義
SIMPLE	簡單SELECT查詢，不包含子查詢和UNION
PRIMARY	復雜查詢中的最外層查詢，表示主要的查詢
SUBQUERY	SELECT或WHERE列表中包含了子查詢
DERIVED	FROM列表中包含的子查詢，即衍生
UNION	UNION關鍵字之后的查詢
UNION RESULT	從UNION后的表獲取結果集

下面看看這些SELECT類型具體是怎么出現的：

SIMPLE執行sql如下：

explain select * from test1;

結果：

圖片

它只在簡單SELECT查詢中出現，不包含子查詢和UNION，這種類型比較直觀就不多說了。

PRIMARY和 SUBQUERY執行sql如下：

explain select * from test1 t1 where t1.id = (select id from  test1 t2 where  t2.id=2);

結果：

圖片

我們看到這條嵌套查詢的sql中，最外層的t1表是PRIMARY類型，而最里面的子查詢t2表是SUBQUERY類型。

DERIVED執行sql如下：

explain
select t1.* from test1 t1
inner join (select max(id) mid from test1 group by id) t2
on t1.id=t2.mid

結果：

圖片

最后一條記錄就是衍生表，它一般是FROM列表中包含的子查詢，這里是sql中的分組子查詢。

UNION 和 UNION RESULT執行sql如下：

explain
select * from test1
union
select* from test2

結果：

圖片

test2表是UNION關鍵字之后的查詢，所以被標記為UNION，test1是最主要的表，被標記為PRIMARY。而<union1,2>表示id=1和id=2的表union，其結果被標記為UNION RESULT。

UNION 和 UNION RESULT一般會成對出現。

此外，回答上面的問題：id列的值允許為空嗎？

如果仔細看上面那張圖，會發現id列是可以允許為空的，并且是在SELECT類型為： UNION RESULT的時候。

table列

該列的值表示輸出行所引用的表的名稱，比如前面的：test1、test2等。

但也可以是以下值之一：

<unionM,N>：具有和id值的行的M并集N。
<derivedN>：用于與該行的派生表結果id的值N。派生表可能來自（例如）FROM子句中的子查詢。
<subqueryN>：子查詢的結果，其id值為N

partitions列

該列的值表示查詢將從中匹配記錄的分區

type列

該列的值表示連接類型，是查看索引執行情況的一個重要指標。包含如下類型：

圖片

執行結果從最好到最壞的的順序是從上到下。

我們需要重點掌握的是下面幾種類型：

system > const > eq_ref > ref > range > index > ALL

在演示之前，先說明一下test2表中只有一條數據：

圖片

并且code字段上面建了一個普通索引：

圖片

下面逐一看看常見的幾個連接類型是怎么出現的：

system這種類型要求數據庫表中只有一條數據，是const類型的一個特例，一般情況下是不會出現的。
const通過一次索引就能找到數據，一般用于主鍵或唯一索引作為條件的查詢sql中，執行sql如下：

explain select * from test2 where id=1;

結果：

圖片

eq_ref常用于主鍵或唯一索引掃描。執行sql如下：

explain select * from test2 t1 inner join test2 t2 on t1.id=t2.id;

結果：

圖片

此時，有人可能感到不解，const和eq_ref都是對主鍵或唯一索引的掃描，有什么區別？

答：const只索引一次，而eq_ref主鍵和主鍵匹配，由于表中有多條數據，一般情況下要索引多次，才能全部匹配上。

ref常用于非主鍵和唯一索引掃描。執行sql如下：

explain select * from test2 where code = '001';

結果：

圖片

range常用于范圍查詢，比如：between ... and 或 In 等操作，執行sql如下：

explain select * from test2 where id between 1 and 2;

結果：

圖片

index全索引掃描。執行sql如下：

explain select code from test2;

結果：

圖片

ALL全表掃描。執行sql如下：

explain select *  from test2;

結果：

圖片

possible_keys列

該列表示可能的索引選擇。

請注意，此列完全獨立于表的順序，這就意味著possible_keys在實踐中，某些鍵可能無法與生成的表順序一起使用。

圖片

如果此列是NULL，則沒有相關的索引。在這種情況下，您可以通過檢查該WHERE 子句以檢查它是否引用了某些適合索引的列，從而提高查詢性能。

key列

該列表示實際用到的索引。

可能會出現possible_keys列為NULL，但是key不為NULL的情況。

演示之前，先看看test1表結構：

圖片

test1表中數據：

圖片

使用的索引：

圖片

code和name字段使用了聯合索引。

執行sql如下：

explain select code  from test1;

結果：

圖片

這條sql預計沒有使用索引，但是實際上使用了全索引掃描方式的索引。

key_len列

該列表示使用索引的長度。上面的key列可以看出有沒有使用索引，key_len列則可以更進一步看出索引使用是否充分。不出意外的話，它是最重要的列。

圖片

有個關鍵的問題浮出水面：key_len是如何計算的？

決定key_len值的三個因素：

1.字符集

2.長度

3.是否為空

常用的字符編碼占用字節數量如下：

圖片

目前我的數據庫字符編碼格式用的：UTF8占3個字節。

mysql常用字段占用字節數：

字段類型	占用字節數
char(n)	n
varchar(n)	n + 2
tinyint	1
smallint	2
int	4
bigint	8
date	3
timestamp	4
datetime	8

此外，如果字段類型允許為空則加1個字節。

上圖中的 184是怎么算的？184 = 30 * 3 + 2 + 30 * 3 + 2

再把test1表的code字段類型改成char，并且改成允許為空：

圖片

執行sql如下：

explain select code  from test1;

結果：

圖片

怎么算的？

183 = 30 * 3 + 1 + 30 * 3 + 2

還有一個問題：為什么這列表示索引使用是否充分呢，還有使用不充分的情況？

執行sql如下：

explain select code  from test1 where code='001';

結果：

圖片

上圖中使用了聯合索引：idx_code_name，如果索引全匹配key_len應該是183，但實際上卻是92，這就說明沒有使用所有的索引，索引使用不充分。

ref列

該列表示索引命中的列或者常量。

執行sql如下：

explain select *  from test1 t1 inner join test1 t2 on t1.id=t2.id where t1.code='001';

結果：

我們看到表t1命中的索引是const(常量)，而t2命中的索引是列sue庫的t1表的id字段。

rows列

該列表示MySQL認為執行查詢必須檢查的行數。

圖片

對于InnoDB表，此數字是估計值，可能并不總是準確的。

filtered列

該列表示按表條件過濾的表行的估計百分比。最大值為100，這表示未過濾行。值從100減小表示過濾量增加。

圖片

rows顯示了檢查的估計行數，rows× filtered顯示了與下表連接的行數。例如，如果 rows為1000且 filtered為50.00（50％），則與下表連接的行數為1000×50％= 500。

Extra列

該字段包含有關MySQL如何解析查詢的其他信息，這列還是挺重要的，但是里面包含的值太多，就不一一介紹了，只列舉幾個常見的。

Impossible WHERE表示WHERE后面的條件一直都是false，執行sql如下：

explain select code  from test1 where 'a' = 'b';

結果：

圖片

Using filesort表示按文件排序，一般是在指定的排序和索引排序不一致的情況才會出現。執行sql如下：

explain select code  from test1 order by name desc;

結果：

圖片

這里建立的是code和name的聯合索引，順序是code在前，name在后，這里直接按name降序，跟之前聯合索引的順序不一樣。

Using index表示是否用了覆蓋索引，說白了它表示是否所有獲取的列都走了索引。

圖片

上面那個例子中其實就用到了：Using index，因為只返回一列code，它字段走了索引。
Using temporary表示是否使用了臨時表，一般多見于order by 和 group by語句。執行sql如下：

explain select name  from test1 group by name;

結果：

圖片

Using where表示使用了where條件過濾。
Using join buffer

表示是否使用連接緩沖。來自較早聯接的表被部分讀取到聯接緩沖區中，然后從緩沖區中使用它們的行來與當前表執行聯接。

索引優化的過程

1.先用慢查詢日志定位具體需要優化的sql

2.使用explain執行計劃查看索引使用情況

3.重點關注：

key（查看有沒有使用索引）

key_len（查看索引使用是否充分）

type（查看索引類型）

Extra（查看附加信息：排序、臨時表、where條件為false等）

一般情況下根據這4列就能找到索引問題。

4.根據上1步找出的索引問題優化sql

5.再回到第2步

責任編輯：武曉燕來源：蘇三說技術

SQL 性能優化

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

我們一起聊聊 SQL 性能優化神器

explain介紹

explain詳解

id列

1.id相同

2.id不同

3.id相同和不同都有

select_type列

table列

partitions列

type列

possible_keys列

key列

key_len列

結果：

怎么算的？

結果：

ref列

rows列

filtered列

Extra列

索引優化的過程