最常問的MySQL面試題集合
除了基礎題部分,本文還收集整理的MySQL面試題還包括如下知識點或題型:
- MySQL高性能索引
- SQL語句
- MySQL查詢優(yōu)化
- MySQL高擴展高可用
- MySQL安全性
問題1:char、varchar的區(qū)別是什么?
varchar是變長而char的長度是固定的。如果你的內容是固定大小的,你會得到更好的性能。
問題2: TRUNCATE和DELETE的區(qū)別是什么?
DELETE命令從一個表中刪除某一行,或多行,TRUNCATE命令***地從表中刪除每一行。
問題3:什么是觸發(fā)器,MySQL中都有哪些觸發(fā)器?
觸發(fā)器是指一段代碼,當觸發(fā)某個事件時,自動執(zhí)行這些代碼。在MySQL數據庫中有如下六種觸發(fā)器:
- Before Insert
- After Insert
- Before Update
- After Update
- Before Delete
- After Delete
問題4:FLOAT和DOUBLE的區(qū)別是什么?
- FLOAT類型數據可以存儲至多8位十進制數,并在內存中占4字節(jié)。
- DOUBLE類型數據可以存儲至多18位十進制數,并在內存中占8字節(jié)。
問題5:如何在MySQL種獲取當前日期?
- SELECT CURRENT_DATE();
問題6:如何查詢第n高的工資?
- SELECT DISTINCT(salary) from employee ORDER BY salary DESC LIMIT n-1,1
問題7:請寫出下面MySQL數據類型表達的意義(int(0)、char(16)、varchar(16)、datetime、text)
知識點分析
此題考察的是MySQL數據類型。MySQL數據類型屬于MySQL數據庫基礎,由此延伸出的知識點還包括如下內容:
- MySQL基礎操作
- MySQL存儲引擎
- MySQL鎖機制
- MySQL事務處理、存儲過程、觸發(fā)器
數據類型考點:
- 1、整數類型,包括TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT,分別表示1字節(jié)、2字節(jié)、3字節(jié)、4字節(jié)、8字節(jié)整數。任何整數類型都可以加上UNSIGNED屬性,表示數據是無符號的,即非負整數。
長度:整數類型可以被指定長度,例如:INT(11)表示長度為11的INT類型。長度在大多數場景是沒有意義的,它不會限制值的合法范圍,只會影響顯示字符的個數,而且需要和UNSIGNED ZEROFILL屬性配合使用才有意義。
例子,假定類型設定為INT(5),屬性為UNSIGNED ZEROFILL,如果用戶插入的數據為12的話,那么數據庫實際存儲數據為00012。
- 2、實數類型,包括FLOAT、DOUBLE、DECIMAL。
DECIMAL可以用于存儲比BIGINT還大的整型,能存儲精確的小數。
而FLOAT和DOUBLE是有取值范圍的,并支持使用標準的浮點進行近似計算。
計算時FLOAT和DOUBLE相比DECIMAL效率更高一些,DECIMAL你可以理解成是用字符串進行處理。
- 3、字符串類型,包括VARCHAR、CHAR、TEXT、BLOB
VARCHAR用于存儲可變長字符串,它比定長類型更節(jié)省空間。
VARCHAR使用額外1或2個字節(jié)存儲字符串長度。列長度小于255字節(jié)時,使用1字節(jié)表示,否則使用2字節(jié)表示。
VARCHAR存儲的內容超出設置的長度時,內容會被截斷。
CHAR是定長的,根據定義的字符串長度分配足夠的空間。
CHAR會根據需要使用空格進行填充方便比較。
CHAR適合存儲很短的字符串,或者所有值都接近同一個長度。
CHAR存儲的內容超出設置的長度時,內容同樣會被截斷。
使用策略:
對于經常變更的數據來說,CHAR比VARCHAR更好,因為CHAR不容易產生碎片。
對于非常短的列,CHAR比VARCHAR在存儲空間上更有效率。
使用時要注意只分配需要的空間,更長的列排序時會消耗更多內存。
盡量避免使用TEXT/BLOB類型,查詢時會使用臨時表,導致嚴重的性能開銷。
- 4、枚舉類型(ENUM),把不重復的數據存儲為一個預定義的集合。
有時可以使用ENUM代替常用的字符串類型。
ENUM存儲非常緊湊,會把列表值壓縮到一個或兩個字節(jié)。
ENUM在內部存儲時,其實存的是整數。
盡量避免使用數字作為ENUM枚舉的常量,因為容易混亂。
排序是按照內部存儲的整數
- 5、日期和時間類型,盡量使用timestamp,空間效率高于datetime,
用整數保存時間戳通常不方便處理。
如果需要存儲微妙,可以使用bigint存儲。
看到這里,這道真題是不是就比較容易回答了。
答:int(0)表示數據是INT類型,長度是0、char(16)表示固定長度字符串,長度為16、varchar(16)表示可變長度字符串,長度為16、datetime表示時間類型、text表示字符串類型,能存儲大字符串,最多存儲65535字節(jié)數據)
MySQL基礎操作:
常見操作
MySQL的連接和關閉:mysql -u -p -h -P
-u:指定用戶名
-p:指定密碼
-h:主機
-P:端口
進入MySQL命令行后:G、c、q、s、h、d
G:打印結果垂直顯示
c:取消當前MySQL命令
q:退出MySQL連接
s:顯示服務器狀態(tài)
h:幫助信息
d:改變執(zhí)行符
MySQL存儲引擎:
1、InnoDB存儲引擎,
- 默認事務型引擎,最重要最廣泛的存儲引擎,性能非常優(yōu)秀。
- 數據存儲在共享表空間,可以通過配置分開。也就是多個表和索引都存儲在一個表空間中,可以通過配置文件改變此配置。
- 對主鍵查詢的性能高于其他類型的存儲引擎。
- 內部做了很多優(yōu)化,從磁盤讀取數據時會自動構建hash索引,插入數據時自動構建插入緩沖區(qū)。
- 通過一些機制和工具支持真正的熱備份。
- 支持崩潰后的安全恢復。
- 支持行級鎖。
- 支持外鍵。
2、MyISAM存儲引擎,
- 擁有全文索引、壓縮、空間函數。
- 不支持事務和行級鎖、不支持崩潰后的安全恢復。
- 表存儲在兩個文件,MYD和MYI。
- 設計簡單,某些場景下性能很好,例如獲取整個表有多少條數據,性能很高。
- 全文索引不是很常用,不如使用外部的ElasticSearch或Lucene。
3、其他表引擎,
Archive、Blackhole、CSV、Memory
使用策略
在大多數場景下建議使用InnoDB存儲引擎。
MySQL鎖機制
表鎖是日常開發(fā)中的常見問題,因此也是面試當中最常見的考察點,當多個查詢同一時刻進行數據修改時,就會產生并發(fā)控制的問題。共享鎖和排他鎖,就是讀鎖和寫鎖。
- 共享鎖,不堵塞,多個用戶可以同時讀一個資源,互不干擾。
- 排他鎖,一個寫鎖會阻塞其他的讀鎖和寫鎖,這樣可以只允許一個用戶進行寫入,防止其他用戶讀取正在寫入的資源。
鎖的粒度
- 表鎖,系統(tǒng)開銷最小,會鎖定整張表,MyIsam使用表鎖。
- 行鎖,***程度的支持并發(fā)處理,但是也帶來了***的鎖開銷,InnoDB使用行鎖。
MySQL事務處理
- MySQL提供事務處理的表引擎,也就是InnoDB。
- 服務器層不管理事務,由下層的引擎實現,所以同一個事務中,使用多種引擎是不靠譜的。
- 需要注意,在非事務表上執(zhí)行事務操作,MySQL不會發(fā)出提醒,也不會報錯。
存儲過程
- 為以后的使用保存的一條或多條MySQL語句的集合,因此也可以在存儲過程中加入業(yè)務邏輯和流程。
- 可以在存儲過程中創(chuàng)建表,更新數據,刪除數據等等。
使用策略
- 可以通過把SQL語句封裝在容易使用的單元中,簡化復雜的操作
- 可以保證數據的一致性
- 可以簡化對變動的管理
觸發(fā)器
提供給程序員和數據分析員來保證數據完整性的一種方法,它是與表事件相關的特殊的存儲過程。
使用場景
- 可以通過數據庫中的相關表實現級聯(lián)更改。
- 實時監(jiān)控某張表中的某個字段的更改而需要做出相應的處理。
- 例如可以生成某些業(yè)務的編號。
- 注意不要濫用,否則會造成數據庫及應用程序的維護困難。
- 大家需要牢記以上基礎知識點,重點是理解數據類型CHAR和VARCHAR的差異,表存儲引擎InnoDB和MyISAM的區(qū)別。
問題8:請說明InnoDB和MyISAM的區(qū)別
- InnoDB支持事務,MyISAM不支持;
- InnoDB數據存儲在共享表空間,MyISAM數據存儲在文件中;
- InnoDB支持行級鎖,MyISAM只支持表鎖;
- InnoDB支持崩潰后的恢復,MyISAM不支持;
- InnoDB支持外鍵,MyISAM不支持;
- InnoDB不支持全文索引,MyISAM支持全文索引;
問題9:innodb引擎的特性
- 插入緩沖(insert buffer)
- 二次寫(double write)
- 自適應哈希索引(ahi)
- 預讀(read ahead)
問題10:請列舉3個以上表引擎
InnoDB、MyISAM、Memory
問題11:請說明varchar和text的區(qū)別
- varchar可指定字符數,text不能指定,內部存儲varchar是存入的實際字符數+1個字節(jié)(n<=255)或2個字節(jié)(n>255),text是實際字符數+2個字節(jié)。
- text類型不能有默認值。
- varchar可直接創(chuàng)建索引,text創(chuàng)建索引要指定前多少個字符。varchar查詢速度快于text,在都創(chuàng)建索引的情況下,text的索引幾乎不起作用。
- 查詢text需要創(chuàng)建臨時表。
問題11:varchar(50)中50的含義
最多存放50個字符,varchar(50)和(200)存儲hello所占空間一樣,但后者在排序時會消耗更多內存,因為order by col采用fixed_length計算col長度(memory引擎也一樣)。
問題12:int(20)中20的含義
是指顯示字符的長度,不影響內部存儲,只是當定義了ZEROFILL時,前面補多少個 0
問題13:簡單描述MySQL中,索引,主鍵,唯一索引,聯(lián)合索引的區(qū)別,對數據庫的性能有什么影響?
知識點分析
此真題主要考察的是MySQL索引的基礎和類型,由此延伸出的知識點還包括如下內容:
- MySQL索引的創(chuàng)建原則
- MySQL索引的注意事項
- MySQL索引的原理
下面我們就來將這些知識一網打盡
索引的基礎
- 索引類似于書籍的目錄,要想找到一本數的某個特定主題,需要先查找書的目錄,定位對應的頁碼
- 存儲引擎使用類似的方式進行數據查詢,先去索引當中找到對應的值,然后根據匹配的索引找到對應的數據行。
創(chuàng)建索引的語法:
- 首先創(chuàng)建一個表:create table t1 (id int primary key,username varchar(20),password varchar(20));
- 創(chuàng)建單個索引的語法:CREATE INDEX 索引名 on 表名(字段名)
- 索引名一般是:表名_字段名
- 給id創(chuàng)建索引:CREATE INDEX t1_id on t1(id);
- 創(chuàng)建聯(lián)合索引的語法:CREATE INDEX 索引名 on 表名(字段名1,字段名2)
- 給username和password創(chuàng)建聯(lián)合索引:CREATE index t1_username_password ON t1(username,password)
- 其中index還可以替換成unique,primary key,分別代表唯一索引和主鍵索引
- 刪除索引:DROP INDEX t1_username_password ON t1
索引對性能的影響:
- 大大減少服務器需要掃描的數據量。
- 幫助服務器避免排序和臨時表。
- 將隨機I/O變順序I/O。
- 大大提高查詢速度。
- 降低寫的速度(不良影響)。
- 磁盤占用(不良影響)。
索引的使用場景:
- 對于非常小的表,大部分情況下全表掃描效率更高。
- 中到大型表,索引非常有效。
- 特大型的表,建立和使用索引的代價會隨之增大,可以使用分區(qū)技術來解決。
索引的類型:
索引很多種類型,是在MySQL的存儲引擎實現的。
- 普通索引:最基本的索引,沒有任何約束限制。
- 唯一索引:和普通索引類似,但是具有唯一性約束。
- 主鍵索引:特殊的唯一索引,不允許有空值。
索引的區(qū)別:
-一個表只能有一個主鍵索引,但是可以有多個唯一索引。
- 主鍵索引一定是唯一索引,唯一索引不是主鍵索引。
- 主鍵可以與外鍵構成參照完整性約束,防止數據不一致。
- 聯(lián)合索引:將多個列組合在一起創(chuàng)建索引,可以覆蓋多個列。(也叫復合索引,組合索引)
- 外鍵索引:只有InnoDB類型的表才可以使用外鍵索引,保證數據的一致性、完整性、和實現級聯(lián)操作(基本不用)。
- 全文索引:MySQL自帶的全文索引只能用于MyISAM,并且只能對英文進行全文檢索 (基本不用)
MySQL索引的創(chuàng)建原則
- 最適合創(chuàng)建索引的列是出現在WHERE或ON子句中的列,或連接子句中的列而不是出現在SELECT關鍵字后的列。
- 索引列的基數越大,數據區(qū)分度越高,索引的效果越好。
- 對于字符串進行索引,應該制定一個前綴長度,可以節(jié)省大量的索引空間。
- 根據情況創(chuàng)建聯(lián)合索引,聯(lián)合索引可以提高查詢效率。
- 避免創(chuàng)建過多的索引,索引會額外占用磁盤空間,降低寫操作效率。
- 主鍵盡可能選擇較短的數據類型,可以有效減少索引的磁盤占用提高查詢效率。
MySQL索引的注意事項
1、聯(lián)合索引遵循前綴原則
- KEY(a,b,c)
- WHERE a = 1 AND b = 2 AND c = 3
- WHERE a = 1 AND b = 2
- WHERE a = 1
- #以上SQL語句可以用到索引
- WHERE b = 2 AND c = 3
- WHERE a = 1 AND c = 3
- #以上SQL語句用不到索引
2、LIKE查詢,%不能在前
- WHERE name LIKE "%wang%"
- #以上語句用不到索引,可以用外部的ElasticSearch、Lucene等全文搜索引擎替代。
3、列值為空(NULL)時是可以使用索引的,但MySQL難以優(yōu)化引用了可空列的查詢,它會使索引、索引統(tǒng)計和值更加復雜。可空列需要更多的儲存空間,還需要在MySQL內部進行特殊處理。
4、如果MySQL估計使用索引比全表掃描更慢,會放棄使用索引,例如:
表中只有100條數據左右。對于SQL語句WHERE id > 1 AND id < 100,MySQL會優(yōu)先考慮全表掃描。
5、如果關鍵詞or前面的條件中的列有索引,后面的沒有,所有列的索引都不會被用到。
6、列類型是字符串,查詢時一定要給值加引號,否則索引失效,例如:
列name varchar(16),存儲了字符串"100"
WHERE name = 100;
以上SQL語句能搜到,但無法用到索引。
MySQL索引的原理
- MySQL索引是用一種叫做聚簇索引的數據結構實現的,下面我們就來看一下什么是聚簇索引。
- 聚簇索引是一種數據存儲方式,它實際上是在同一個結構中保存了B+樹索引和數據行,InnoDB表是按照聚簇索引組織的(類似于Oracle的索引組織表)。
注:
B+ 樹是一種樹數據結構,是一個n叉排序樹,每個節(jié)點通常有多個孩子,一棵B+樹包含根節(jié)點、內部節(jié)點和葉子節(jié)點。根節(jié)點可能是一個葉子節(jié)點,也可能是一個包含兩個或兩個以上孩子節(jié)點的節(jié)點。
B+ 樹通常用于數據庫和操作系統(tǒng)的文件系統(tǒng)中。NTFS, ReiserFS, NSS, XFS, JFS, ReFS 和BFS等文件系統(tǒng)都在使用B+樹作為元數據索引。B+ 樹的特點是能夠保持數據穩(wěn)定有序,其插入與修改擁有較穩(wěn)定的對數時間復雜度。B+ 樹元素自底向上插入。
InnoDB通過主鍵聚簇數據,如果沒有定義主鍵,會選擇一個唯一的非空索引代替,如果沒有這樣的索引,會隱式定義個主鍵作為聚簇索引。
下圖形象說明了聚簇索引表(InnoDB)和普通的堆組織表(MyISAM)的區(qū)別:
最常問的MySQL面試題三——每個開發(fā)人員都應該知道
對于普通的堆組織表來說(右圖),表數據和索引是分別存儲的,主鍵索引和二級索引存儲上沒有任何區(qū)別。
而對于聚簇索引表來說(左圖),表數據是和主鍵一起存儲的,主鍵索引的葉結點存儲行數據,二級索引的葉結點存儲行的主鍵值。
聚簇索引表***限度地提高了I/O密集型應用的性能,但它也有以下幾個限制:
- 1)插入速度嚴重依賴于插入順序,按照主鍵的順序插入是最快的方式,否則將會出現頁分裂,嚴重影響性能。因此,對于InnoDB表,我們一般都會定義一個自增的ID列為主鍵。
- 2)更新主鍵的代價很高,因為將會導致被更新的行移動。因此,對于InnoDB表,我們一般定義主鍵為不可更新。
- 3)二級索引訪問需要兩次索引查找,***次找到主鍵值,第二次根據主鍵值找到行數據。
二級索引的葉節(jié)點存儲的是主鍵值,而不是行指針,這是為了減少當出現行移動或數據頁分裂時二級索引的維護工作,但會讓二級索引占用更多的空間。
解題方法
在一些MySQL索引基礎考題中,我們可以輕松的通過索引基礎和類型來解決此類問題,對于一些索引創(chuàng)建注意事項方面的考點,我們可以通過索引創(chuàng)建原則和注意事項來解決。
問題14:創(chuàng)建MySQL聯(lián)合索引應該注意什么?
需遵循前綴原則
問題15:列值為NULL時,查詢是否會用到索引?
在MySQL里NULL值的列也是走索引的。當然,如果計劃對列進行索引,就要盡量避免把它設置為可空,MySQL難以優(yōu)化引用了可空列的查詢,它會使索引、索引統(tǒng)計和值更加復雜。
問題16:以下語句是否會應用索引:SELECT FROM users WHERE YEAR(adddate) < 2007;*
不會,因為只要列涉及到運算,MySQL就不會使用索引。
問題17:MyISAM索引實現?
MyISAM存儲引擎使用B+Tree作為索引結構,葉節(jié)點的data域存放的是數據記錄的地址。MyISAM的索引方式也叫做非聚簇索引的,之所以這么稱呼是為了與InnoDB的聚簇索引區(qū)分。
問題17:MyISAM索引與InnoDB索引的區(qū)別?
- InnoDB索引是聚簇索引,MyISAM索引是非聚簇索引。
- InnoDB的主鍵索引的葉子節(jié)點存儲著行數據,因此主鍵索引非常高效。
- MyISAM索引的葉子節(jié)點存儲的是行數據地址,需要再尋址一次才能得到數據。
- InnoDB非主鍵索引的葉子節(jié)點存儲的是主鍵和其他帶索引的列數據,因此查詢時做到覆蓋索引會非常高效。
問題18:以下三條sql 如何建索引,只建一條怎么建?
- WHERE a=1 AND b=1
- WHERE b=1
- WHERE b=1 ORDER BY time DESC
以順序b,a,time建立聯(lián)合索引,CREATE INDEX table1_b_a_time ON index_test01(b,a,time)。因為***MySQL版本會優(yōu)化WHERE子句后面的列順序,以匹配聯(lián)合索引順序。
問題19:有A(id,sex,par,c1,c2),B(id,age,c1,c2)兩張表,其中A.id與B.id關聯(lián),現在要求寫出一條SQL語句,將B中age>50的記錄的c1,c2更新到A表中同一記錄中的c1,c2字段中
考點分析
這道題主要考察的是MySQL的關聯(lián)UPDATE語句
延伸考點:
- MySQL的關聯(lián)查詢語句
- MySQL的關聯(lián)UPDATE語句
針對剛才這道題,答案可以是如下兩種形式的寫法:
- UPDATE A,B SET A.c1 = B.c1, A.c2 = B.c2 WHERE A.id = B.id
- UPDATE A INNER JOIN B ON A.id=B.id SET A.c1 = B.c1,A.c2=B.c2
再加上B中age>50的條件:
- UPDATE A,B set A.c1 = B.c1, A.c2 = B.c2 WHERE A.id = B.id and B.age > 50;
- UPDATE A INNER JOIN B ON A.id = B.id set A.c1 = B.c1,A.c2 = B.c2 WHERE B.age > 50
MySQL的關聯(lián)查詢語句
六種關聯(lián)查詢
- 交叉連接(CROSS JOIN)
- 內連接(INNER JOIN)
- 外連接(LEFT JOIN/RIGHT JOIN)
- 聯(lián)合查詢(UNION與UNION ALL)
- 全連接(FULL JOIN)
- 交叉連接(CROSS JOIN)
- SELECT * FROM A,B(,C)或者
- SELECT * FROM A CROSS JOIN B (CROSS JOIN C)
- #沒有任何關聯(lián)條件,結果是笛卡爾積,結果集會很大,沒有意義,很少使用
內連接(INNER JOIN)
- SELECT * FROM A,B WHERE A.id=B.id或者
- SELECT * FROM A INNER JOIN B ON A.id=B.id
多表中同時符合某種條件的數據記錄的集合,INNER JOIN可以縮寫為JOIN
內連接分為三類
- 等值連接:ON A.id=B.id
- 不等值連接:ON A.id > B.id
- 自連接:SELECT * FROM A T1 INNER JOIN A T2 ON T1.id=T2.pid
外連接(LEFT JOIN/RIGHT JOIN)
- 左外連接:LEFT OUTER JOIN, 以左表為主,先查詢出左表,按照ON后的關聯(lián)條件匹配右表,沒有匹配到的用NULL填充,可以簡寫成LEFT JOIN
- 右外連接:RIGHT OUTER JOIN, 以右表為主,先查詢出右表,按照ON后的關聯(lián)條件匹配左表,沒有匹配到的用NULL填充,可以簡寫成RIGHT JOIN
聯(lián)合查詢(UNION與UNION ALL)
- SELECT * FROM A UNION SELECT * FROM B UNION ...
就是把多個結果集集中在一起,UNION前的結果為基準,需要注意的是聯(lián)合查詢的列數要相等,相同的記錄行會合并
- 如果使用UNION ALL,不會合并重復的記錄行
- 效率 UNION 高于 UNION ALL
- 全連接(FULL JOIN)
MySQL不支持全連接
可以使用LEFT JOIN 和UNION和RIGHT JOIN聯(lián)合使用
- SELECT * FROM A LEFT JOIN B ON A.id=B.id UNION
- SELECT * FROM A RIGHT JOIN B ON A.id=B.id
嵌套查詢
用一條SQL語句得結果作為另外一條SQL語句得條件,效率不好把握
- SELECT * FROM A WHERE id IN (SELECT id FROM B)
解題方法
根據考題要搞清楚表的結果和多表之間的關系,根據想要的結果思考使用那種關聯(lián)方式,通常把要查詢的列先寫出來,然后分析這些列都屬于哪些表,才考慮使用關聯(lián)查詢
問題20:
為了記錄足球比賽的結果,設計表如下:
team:參賽隊伍表
match:賽程表
其中,match賽程表中的hostTeamID與guestTeamID都和team表中的teamID關聯(lián),查詢2006-6-1到2006-7-1之間舉行的所有比賽,并且用以下形式列出:拜仁 2:0 不萊梅 2006-6-21
首先列出需要查詢的列:
- 表team
- teamID teamName
- 表match
- match ID
- hostTeamID
- guestTeamID
- matchTime matchResult
其次列出結果列:
- 主隊 結果 客對 時間
初步寫一個基礎的SQL:
- SELECT hostTeamID,matchResult,matchTime guestTeamID from match where matchTime between "2006-6-1" and "2006-7-1";
通過外鍵聯(lián)表,完成最終SQL:
- select t1.teamName,m.matchResult,t2.teamName,m.matchTime from match as m left join team as t1 on m.hostTeamID = t1.teamID, left join team t2 on m.guestTeamID=t2.guestTeamID where m.matchTime between "2006-6-1" and "2006-7-1"
問題21:UNION與UNION ALL的區(qū)別?
如果使用UNION ALL,不會合并重復的記錄行
效率 UNION 高于 UNION ALL
問題22:一個6億的表a,一個3億的表b,通過外鍵tid關聯(lián),你如何最快的查詢出滿足條件的第50000到第50200中的這200條數據記錄。
1、如果A表TID是自增長,并且是連續(xù)的,B表的ID為索引
- select * from a,b where a.tid = b.id and a.tid>50000 limit 200;
2、如果A表的TID不是連續(xù)的,那么就需要使用覆蓋索引.TID要么是主鍵,要么是輔助索引,B表ID也需要有索引。
- select * from b , (select tid from a limit 50000,200) a where b.id = a .tid;
問題23:拷貝表( 拷貝數據, 源表名:a 目標表名:b)
- insert into b(a, b, c) select d,e,f from a;
問題24: Student(S#,Sname,Sage,Ssex) 學生表 Course(C#,Cname,T#) 課程表 SC(S#,C#,score) 成績表 Teacher(T#,Tname) 教師表 查詢沒學過“葉平”老師課的同學的學號、姓名
- select Student.S#,Student.Sname
- from Student
- where S# not in (select distinct( SC.S#) from SC,Course,Teacher where SC.C#=Course.C# and Teacher.T#=Course.T# and Teacher.Tname=’葉平’);
問題25:隨機取出10條數據
- SELECT * FROM users WHERE id >= ((SELECT MAX(id) FROM users)-(SELECT MIN(id) FROM users)) * RAND() + (SELECT MIN(id) FROM users) LIMIT 10
- #此方法效率比直接用SELECT * FROM users order by rand() LIMIT 10高很多
問題26:請簡述項目中優(yōu)化SQL語句執(zhí)行效率的方法,從哪些方面,SQL語句性能如何分析?
考點分析:
這道題主要考察的是查找分析SQL語句查詢速度慢的方法
延伸考點:
- 優(yōu)化查詢過程中的數據訪問
- 優(yōu)化長難的查詢語句
- 優(yōu)化特定類型的查詢語句
如何查找查詢速度慢的原因
記錄慢查詢日志,分析查詢日志,不要直接打開慢查詢日志進行分析,這樣比較浪費時間和精力,可以使用pt-query-digest工具進行分析
使用show profile
- set profiling=1;開啟,服務器上所有執(zhí)行語句會記錄執(zhí)行時間,存到臨時表中
- show profiles
- show profile for query 臨時表ID
使用show status
show status會返回一些計數器,show global status會查看所有服務器級別的所有計數
有時根據這些計數,可以推測出哪些操作代價較高或者消耗時間多
show processlist
觀察是否有大量線程處于不正常的狀態(tài)或特征
最常問的MySQL面試題五——每個開發(fā)人員都應該知道
使用explain
分析單條SQL語句
優(yōu)化查詢過程中的數據訪問
- 訪問數據太多導致查詢性能下降
- 確定應用程序是否在檢索大量超過需要的數據,可能是太多行或列
- 確認MySQL服務器是否在分析大量不必要的數據行
- 避免犯如下SQL語句錯誤
- 查詢不需要的數據。解決辦法:使用limit解決
- 多表關聯(lián)返回全部列。解決辦法:指定列名
- 總是返回全部列。解決辦法:避免使用SELECT *
- 重復查詢相同的數據。解決辦法:可以緩存數據,下次直接讀取緩存
- 是否在掃描額外的記錄。解決辦法:
- 使用explain進行分析,如果發(fā)現查詢需要掃描大量的數據,但只返回少數的行,可以通過如下技巧去優(yōu)化:
- 使用索引覆蓋掃描,把所有的列都放到索引中,這樣存儲引擎不需要回表獲取對應行就可以返回結果。
- 改變數據庫和表的結構,修改數據表范式
- 重寫SQL語句,讓優(yōu)化器可以以更優(yōu)的方式執(zhí)行查詢。
優(yōu)化長難的查詢語句
- 一個復雜查詢還是多個簡單查詢
- MySQL內部每秒能掃描內存中上百萬行數據,相比之下,響應數據給客戶端就要慢得多
- 使用盡可能小的查詢是好的,但是有時將一個大的查詢分解為多個小的查詢是很有必要的。
- 切分查詢
- 將一個大的查詢分為多個小的相同的查詢
- 一次性刪除1000萬的數據要比一次刪除1萬,暫停一會的方案更加損耗服務器開銷。
- 分解關聯(lián)查詢,讓緩存的效率更高。
- 執(zhí)行單個查詢可以減少鎖的競爭。
- 在應用層做關聯(lián)更容易對數據庫進行拆分。
- 查詢效率會有大幅提升。
- 較少冗余記錄的查詢。
優(yōu)化特定類型的查詢語句
- count(*)會忽略所有的列,直接統(tǒng)計所有列數,不要使用count(列名)
- MyISAM中,沒有任何where條件的count(*)非常快。
- 當有where條件時,MyISAM的count統(tǒng)計不一定比其它引擎快。
- 可以使用explain查詢近似值,用近似值替代count(*)
- 增加匯總表
- 使用緩存
優(yōu)化關聯(lián)查詢
- 確定ON或者USING子句中是否有索引。
- 確保GROUP BY和ORDER BY只有一個表中的列,這樣MySQL才有可能使用索引。
優(yōu)化子查詢
- 用關聯(lián)查詢替代
- 優(yōu)化GROUP BY和DISTINCT
- 這兩種查詢據可以使用索引來優(yōu)化,是最有效的優(yōu)化方法
- 關聯(lián)查詢中,使用標識列分組的效率更高
- 如果不需要ORDER BY,進行GROUP BY時加ORDER BY NULL,MySQL不會再進行文件排序。
- WITH ROLLUP超級聚合,可以挪到應用程序處理
優(yōu)化LIMIT分頁
- LIMIT偏移量大的時候,查詢效率較低
- 可以記錄上次查詢的***ID,下次查詢時直接根據該ID來查詢
優(yōu)化UNION查詢
- UNION ALL的效率高于UNION
優(yōu)化WHERE子句
解題方法
對于此類考題,先說明如何定位低效SQL語句,然后根據SQL語句可能低效的原因做排查,先從索引著手,如果索引沒有問題,考慮以上幾個方面,數據訪問的問題,長難查詢句的問題還是一些特定類型優(yōu)化的問題,逐一回答。
SQL語句優(yōu)化的一些方法?
1.對查詢進行優(yōu)化,應盡量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。
2.應盡量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如:
select id from t where num is null可以在num上設置默認值0,確保表中num列沒有null值,然后這樣查詢:select id from t where num=
3.應盡量避免在 where 子句中使用!=或<>操作符,否則引擎將放棄使用索引而進行全表掃描。
4.應盡量避免在 where 子句中使用or 來連接條件,否則將導致引擎放棄使用索引而進行全表掃描,如:
select id from t where num=10 or num=20可以這樣查詢:select id from t where num=10 union all select id from t where num=20
5.in 和 not in 也要慎用,否則會導致全表掃描,如:
select id from t where num in(1,2,3) 對于連續(xù)的數值,能用 between 就不要用 in 了:select id from t where num between 1 and 3
6.下面的查詢也將導致全表掃描:select id from t where name like ‘%李%’若要提高效率,可以考慮全文檢索。
7. 如果在 where 子句中使用參數,也會導致全表掃描。因為SQL只有在運行時才會解析局部變量,但優(yōu)化程序不能將訪問計劃的選擇推遲到運行時;它必須在編譯時進行選擇。然 而,如果在編譯時建立訪問計劃,變量的值還是未知的,因而無法作為索引選擇的輸入項。如下面語句將進行全表掃描:
select id from t where num=@num可以改為強制查詢使用索引:select id from t with(index(索引名)) where num=@num
8.應盡量避免在 where 子句中對字段進行表達式操作,這將導致引擎放棄使用索引而進行全表掃描。如:
select id from t where num/2=100應改為:select id from t where num=100*2
9.應盡量避免在where子句中對字段進行函數操作,這將導致引擎放棄使用索引而進行全表掃描。如:
select id from t where substring(name,1,3)=’abc’ ,name以abc開頭的id應改為:
select id from t where name like ‘abc%’
10.不要在 where 子句中的“=”左邊進行函數、算術運算或其他表達式運算,否則系統(tǒng)將可能無法正確使用索引。