SQL優化-隱式字符編碼轉換
MySQL中我們知道有:
- 如果對索引字段做函數操作,可能會破壞索引值的有序性,因此優化器就決定放棄走樹搜索功能。
- 隱式類型轉換也會導致放棄走樹搜索。
因為類型轉換等價于在條件字段上使用了函數比如:
假設tradeid字段有索引,且為varchar類型:
mysql> select * from tradelog where tradeid=110717;
等價于:
mysql> select * from tradelog where CAST(tradid AS signed int) = 110717;
下面來看看隱式字符編碼轉換導致的一個慢SQL::
業務上有個SQL執行需要1.31秒:
看看執行計劃:
從執行計劃分析看出問題出在r表也就是 h_merge_result_new_indicator 表全表掃描,查看該表的表結有聯合索引。但是聯合索引范圍后會失效,于是打算新建一個聯合索引:
查看預新建聯合索引的字段選擇性:
結合選擇性來看:
create index idx_hmrni on h_merge_result_new_indicator(keyName,module,BATCH_NO);
創建后,再次查看執行計劃依然無效:
查看表結構:
另外3個表結構其中有2個utf8mb4,1個utf8:
字符集 utf8mb4 是 utf8 的超集,所以當這兩個類型的字符串在做比較的時候,MySQL 內部的操作是:先把 utf8 字符串轉成 utf8mb4 字符集,再做比較。
因此:
這部分會轉換后再與h_merge_result_new_indicator關聯。
優化就只需要將字符集編碼轉為utf8再和h_merge_result_new_indicator關聯就能用上索引:
再看查詢只需要0.02秒了:
但是還有個問題,如上執行計劃key_len是606 =(100*3+3)+(100*3+3)
也就是說,沒有用上BATCH_NO字段上的索引,我們知道索引少一個字段,占用會減少,不會太臃腫。因此,聯合索引只需要包含r(keyName,module):
drop index idx_hmrni on h_merge_result_new_indicator;
create index idx_hmrni on h_merge_result_new_indicator(keyName,module);
結論
對索引字段做函數操作,可能會破壞索引值的有序性,因此優化器就決定放棄走樹搜索功能。該例子是隱式字符編碼轉換,它們都跟其他條件索引上使用函數一樣,因為要求在索引字段上做函數操作而導致了全索引掃描。
MySQL 的優化器確實有“偷懶”的嫌疑,即使簡單地把 where id+1=1000 改寫成 where id=1000-1 就能夠用上索引快速查找,也不會主動做這個語句重寫。
保證在條件索引上不做破壞索引值的有序性,是優化索引的利器。