成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

詳解SQL中幾種常用的表連接方式

運維 數據庫運維
數據庫性能優化最主要的就是SQL優化,SQL優化的關鍵離不開三點:表的連接方式、訪問路徑和執行順序,本文重點介紹幾種常見的連接方式。

[[415934]]

本文轉載自微信公眾號「數倉寶貝庫」,作者葉樺 等。轉載本文請聯系數倉寶貝庫公眾號。

數據庫性能優化最主要的就是SQL優化,SQL優化的關鍵離不開三點:表的連接方式、訪問路徑和執行順序,本文重點介紹幾種常見的連接方式。

多表關聯查詢,查詢優化器的執行步驟具體如下。

1)訪問路徑:查詢語句中涉及多個對象,可以基于成本確定每一個對象數據的檢索方式,是選擇全表掃描還是索引訪問等。

2)連接方式:結果集之間的關聯方式,主要包括嵌套循環、哈希連接、排序合并連接等。優化器對結果集之間連接方式的判斷尤為重要,因為判斷結果將會直接影響SQL的執行效率。

3)關聯順序:當關聯對象超過2個時,首先選取兩個對象關聯得到的結果集,再與第三個結果集相關聯。

下面我們重點介紹幾種常見的連接方式。

01嵌套循環連接

圖1所示的是嵌套循環連接示意圖。

圖1 嵌套循環連接示意圖

嵌套循環查詢流程具體如下。

1)兩表關聯,優化器首先會確定驅動表,也稱外部表(outer table),另一張則是被驅動的表,也稱為內部表(inner table)。一般情況下,優化器會把數據量小的定義為驅動表,執行計劃中,驅動表在上,被驅動表在下。

2)驅動表確認之后,會從其中提取一行有效數據,在被驅動表(內部表)中查找和匹配有效數據并提取。

3)將數據返回給客戶端。

從以上步驟中我們可以看出,驅動表返回的行數直接影響了被驅動表的訪問次數,比如,驅動表根據篩選條件最終返回了10行有效數據,每返回一條就會傳值給被驅動表進行匹配,驅動表一共需要循環訪問10次。示例代碼如下:

  1. SQL> SELECT /*+ USE_NL(e d) */ e.first_name, e.last_name, e.salary, d.department_name 
  2.  
  3.   FROM hr.employees e, hr.departments d 
  4.  
  5.  WHERE d.department_name IN ('Marketing''Sales'
  6.  
  7.    AND e.department_id = d.department_id; 
  8.  
  9.  
  10.  
  11. SQL>  select * from table(dbms_xplan.DISPLAY_CURSOR(nullnull'ALLSTATS LAST')); 
  12.  
  13. SQL_ID  3nsqhdh150bx5, child number 0 
  14.  
  15. ------------------------------------- 
  16.  
  17. SELECT /*+ USE_NL(e d) */ e.first_name, e.last_name, e.salary, 
  18.  
  19. d.department_name   FROM hr.employees e, hr.departments d  WHERE 
  20.  
  21. d.department_name IN ('Marketing''Sales')    AND e.department_id = 
  22.  
  23. d.department_id 
  24.  
  25.  
  26.  
  27. Plan hash value: 2968905875 
  28.  
  29. ------------------------------------------------------------------------------------- 
  30.  
  31. | Id  | Operation          |Name       |Starts|E-Rows|A-Rows |   A-Time   | Buffers | 
  32.  
  33. ------------------------------------------------------------------------------------- 
  34.  
  35. |   0 | SELECT STATEMENT   |           |    1 |      |    36 |00:00:00.01 |      23 | 
  36.  
  37. |   1 |  NESTED LOOPS      |           |    1 |  19  |    36 |00:00:00.01 |      23 | 
  38.  
  39. |*  2 |   TABLE ACCESS FULL|DEPARTMENTS|    1 |  2   |     2 |00:00:00.01 |      8 | 
  40.  
  41. |*  3 |   TABLE ACCESS FULL|EMPLOYEES  |    2 |  10  |    36 |00:00:00.01 |     15 | 
  42.  
  43. ------------------------------------------------------------------------------------- 

從上述示例代碼中我們可以看出,DEPARTMENTS為驅動表,Starts為1,說明只訪問1次,返回2行有效數據(A-Rows為實際返回的行數),EMPLOYEES為被驅動表,Starts為2,說明訪問2次。

學過C++編程的同學應該記得,C++中的嵌套循環與下面的循環有些類似:

  1. #include <stdio.h> 
  2.  
  3. int main () 
  4.  
  5.  
  6.    int i, j; 
  7.  
  8.    for(i=1; i<100; i++) { 
  9.  
  10.       for(j=1; j <= 100; j++) 
  11.  
  12.         if(!(i%j)) break; 
  13.  
  14.       if(j > (i/j)) printf("%d \n", i); 
  15.  
  16.    } 
  17.  
  18.    return 0; 
  19.  

j的循環次數取決于i的取值范圍,我們可以將i看作驅動表,j看作被驅動表。

  • 嵌套循環連接性能主要受限于以下幾點。
  • 驅動表的返回行數。
  • 被驅動表的訪問方式:如果被驅動表的連接列基數小且選擇性差,會導致全表掃描的訪問方式,其效率變得非常低,所以我們建議連接列存在索引,且基數大選擇性高。
  • 驅動表篩選后將返回少量數據。
  • 被驅動表關聯字段需要有索引(連接列基數較大或選擇性較高)。
  • 兩表關聯后將返回少量數據。
  • 適合于OLTP系統。

Tips

如果優化器選擇了錯誤的連接方式,那么我們可以使用提示(hint)強制執行使用嵌套循環的連接方式:“/*+ USE_NL(TABLE1,TABLE2) LEADING(TABLE1) */”,其中TABLE1和TABLE2為關聯表的別名,LEADING(TABLE1)用于將TABLE1指定為驅動表。

02哈希連接

圖2所示的是哈希連接示意圖。

圖2 哈希連接示意圖

嵌套循環連接適用于兩表關聯后將返回少量數據的情況,那么返回大量數據時該采用哪種連接方式呢?答案是采用哈希連接。

哈希連接的查詢流程具體如下。

1)兩表等值關聯。

2)優化器將數據量小的表作為驅動表,在PGA的SQL 工作區域(work areas)中,將驅動表的連接列構建成一張哈希表。

3)讀取大表,對連接列進行哈希運算(檢查哈希表,以查找連接的行)。

4)將數據返回給客戶端。

從以上步驟中我們可以看出,通過哈希值進行匹配的方式,更適用于兩表等值關聯。示例代碼如下:

  1. SQL> SELECT /*+ USE_HASH(o l) */o.customer_id, l.unit_price * l.quantity 
  2.  
  3.   2    FROM oe.orders o, oe.order_items l 
  4.  
  5.   3   WHERE l.order_id = o.order_id; 
  6.  
  7.  
  8. SQL> select * from table(dbms_xplan.DISPLAY_CURSOR(nullnull'ALLSTATS LAST')); 
  9.  
  10. SQL_ID  cu980xxpu0mmq, child number 0 
  11.  
  12. ------------------------------------- 
  13.  
  14. SELECT /*+ USE_HASH(o l) */o.customer_id, l.unit_price * l.quantity 
  15.  
  16. FROM oe.orders o, oe.order_items l  WHERE l.order_id = o.order_id 
  17.  
  18.  
  19. Plan hash value: 864676608 
  20.  
  21. ------------------------------------------------------------------------------------------------------------- 
  22.  
  23. | Id  | Operation          |Name       |Starts|E-Rows|A-Rows|A-Time      |Buffers|Reads|OMem |1Mem |Used-Mem| 
  24.  
  25. ------------------------------------------------------------------------------------------------------------- 
  26.  
  27. |   0 | SELECT STATEMENT   |           |   1  |      | 665  |00:00:00.04 |   57  |   5 |     |     |         | 
  28.  
  29. |*  1 |  HASH JOIN         |           |   1  |  665 | 665  |00:00:00.04 |   57  |   5 |1888K|1888K|1531K (0)| 
  30.  
  31. |   2 |   TABLE ACCESS FULL|ORDERS     |   1  |  105 | 105  |00:00:00.04 |   6   |   5 |     |     |         | 
  32.  
  33. |   3 |   TABLE ACCESS FULL|ORDER_ITEMS|   1  |  665 | 665  |00:00:00.01 |   51  |   0 |     |     |         | 
  34.  
  35. ------------------------------------------------------------------------------------------------------------- 

從上述示例代碼中我們可以看出,ORDERS為驅動表,Starts為1,說明訪問1次,返回105行有效數據(A-Rows為實際返回的行數),ORDER_ITEMS為被驅動表,Starts也為1,說明僅訪問1次。其中,OMem、1Mem為執行所需的PGA評估值,Used-Mem為實際執行時PGA中SQL工作區域消耗的內存(即發生磁盤交換的次數),當驅動表較大,PGA的SQL 工作區域無法完全容納時,就會溢出到臨時表空間產生磁盤交互,進而影響性能。

哈希連接性能主要受限于以下兩點。

  • 等值連接。
  • PGA SQL工作區域較小,且驅動表為大表時,容易出現性能問題。

當同時滿足以下條件時,哈希連接方式將會非常有用。

  • 兩表等值關聯后返回大量數據。
  • 不同于嵌套循環連接,哈希連接被驅動表的連接字段時不需要有索引。

Tips

同樣,我們也可以使用提示強制執行使用哈希連接的方式:“/*+ USE_HASH (TABLE1,TABLE2) LEADING(TABLE1) */”。

03排序合并連接

圖3所示的是排序合并連接示意圖。

圖3 排序合并連接示意圖

哈希連接適用于兩表等值關聯后返回大量數據的情況,那么非等值關聯返回大量數據的情況又該采用哪種連接方式呢?答案是排序合并連接。

同時滿足以下條件時,排序合并連接的性能要比哈希連接得好。

  • 兩表非等值關聯(>、>=、<、<=、<>)。
  • 數據源自身有序。
  • 不必額外執行排序操作。

排序合并連接方式中沒有驅動表的概念,連接查詢流程具體如下。

1)兩表根據關聯列各自排序。

2)在內存中進行合并處理。

從以上實現步驟中我們可以看出,由于匹配的對象是連接列各自排序后的值,因此排序合并連接方式更適用于兩表非等值關聯的情形,示例代碼如下:

  1. SQL> SELECT o.customer_id, l.unit_price * l.quantity 
  2.  
  3.   FROM oe.orders o, oe.order_items l 
  4.  
  5.  WHERE l.order_id > o.order_id; 
  6.  
  7. 32233 rows selected.. 
  8.  
  9. SQL> select * from table(dbms_xplan.DISPLAY_CURSOR(nullnull'ALLSTATS LAST')); 
  10.  
  11. SQL_ID  ajyppymnhwfyf, child number 1 
  12.  
  13. ------------------------------------- 
  14.  
  15. SELECT o.customer_id, l.unit_price * l.quantity   FROM oe.orders o, 
  16.  
  17. oe.order_items l  WHERE l.order_id > o.order_id 
  18.  
  19.  
  20.  
  21. Plan hash value: 2696431709 
  22.  
  23. ----------------------------------------------------------------------------------------------------------- 
  24.  
  25. | Id  | Operation         |Name       |Starts| E-Rows | A-Rows | A-Time     |Buffers|OMem |1Mem | Used-Mem | 
  26.  
  27. ----------------------------------------------------------------------------------------------------------- 
  28.  
  29. |   0 | SELECT STATEMENT  |           |    1 |        |  32233 |00:00:00.10 |  21   |     |     |          | 
  30.  
  31. |   1 | MERGE JOIN        |           |    1 | 3 4580 |  32233 |00:00:00.10 |  21   |     |     |          | 
  32.  
  33. |   2 | SORT JOIN         |           |    1 |    105 |    105 |00:00:00.01 |   4   |11264|11264|10240  (0)| 
  34.  
  35. |   3 | TABLE ACCESS FULL |ORDERS     |    1 |    105 |    105 |00:00:00.01 |   4   |     |     |          | 
  36.  
  37. |*  4 | SORT JOIN         |           |  105 |    665 |  32233 |00:00:00.05 |  17   |59392|59392|53248  (0)| 
  38.  
  39. |   5 | TABLE ACCESS FULL |ORDER_ITEMS|    1 |    665 |    665 |00:00:00.01 |  17   |     |     |          | 
  40.  
  41. ------------------------------------------------------------------------------------------------------------ 

從上述示例所示的執行計劃中我們可以看出,ID=3的ORDERS表Starts為1,說明訪問1次,返回105行有效數據(A-Rows為實際返回行數),ORDER_ITEMS表的Starts為1,說明也只訪問1次,但ID=4的SORT JOIN表Starts為105,說明在內存中進行了105次匹配。其中,OMem、1Mem為執行排序操作所需的PGA評估值,Used-Mem為實際執行時PGA中SQL工作區域消耗的內存(即發生磁盤交換的次數)。

從以上步驟中我們可以看出,由于比較對象是兩張表的連接列order_id,所以需要各自的連接列先完成排序(ID=2和ID=4),之后再進行匹配。如果此時連接列上存在索引,那么索引返回的數據就是有序的,此時不需要再進行額外的排序操作。

Tips

同樣,我們也可以使用提示強制執行選擇排序合并連接的方式:“/*+ USE_MERGE(TABLE1,TABLE2) */”。

04笛卡爾連接

當一個或多個表連接沒有任何連接條件時,數據庫將使用笛卡兒連接。優化器將一個數據源的每一行與另一個數據源的每一行連接在一起,以創建兩組數據集的笛卡兒積。示例代碼如下:

  1. SQL> SELECT o.customer_id, l.unit_price * l.quantity 
  2.  
  3.   FROM oe.orders o, oe.order_items l; 
  4.  
  5. 69825 rows selected. 
  6.  
  7.  
  8. SQL> select * from table(dbms_xplan.DISPLAY_CURSOR(nullnull'ALLSTATS LAST')); 
  9.  
  10. SQL_ID  d3xygy88uqzny, child number 0 
  11.  
  12. ------------------------------------- 
  13.  
  14. SELECT o.customer_id, l.unit_price * l.quantity   FROM oe.orders o, 
  15.  
  16. oe.order_items l 
  17.  
  18. Plan hash value: 2616129901 
  19.  
  20. ----------------------------------------------------------------------------------------------- 
  21.  
  22. | Id  | Operation            | Name      |Starts | E-Rows | Buffers |  OMem |  1Mem | Used-Mem | 
  23.  
  24. ----------------------------------------------------------------------------------------------- 
  25.  
  26. |   0 | SELECT STATEMENT     |           |     1 |        |     125 |       |       |          | 
  27.  
  28. |   1 |  MERGE JOIN CARTESIAN|           |     1 |  69825 |     125 |       |       |          | 
  29.  
  30. |   2 |   TABLE ACCESS FULL  |ORDERS     |     1 |    105 |     108 |       |       |          | 
  31.  
  32. |   3 |   BUFFER SORT        |           |   105 |    665 |      17 | 27648 | 27648 |24576  (0)| 
  33.  
  34. |   4 |    TABLE ACCESS FULL |ORDER_ITEMS|     1 |    665 |      17 |       |       |          | 
  35.  
  36. ----------------------------------------------------------------------------------------------- 

從以上執行計劃中我們可以看出,先對表order_items進行排序,然后進行兩表的笛卡兒乘積操作,由于沒有過濾條件,當數據量很大的時候,返回的行數將會非常多,因此若無特殊情況,不建議使用沒有任何連接條件的查詢。

本文摘編于《DBA攻堅指南:左手Oracle,右手MySQL》,經出版方授權發布。

 

責任編輯:武曉燕 來源: 數倉寶貝庫
相關推薦

2010-09-25 14:48:55

SQL連接

2010-09-28 09:08:40

Oracle

2010-11-24 09:56:20

mysql拷貝表

2021-01-06 08:04:30

Linux方式提權

2020-04-27 10:00:53

負載均衡互聯網架構

2017-06-13 10:30:20

oracle連接命名

2009-09-28 10:52:33

Hibernate主鍵主鍵生成

2010-07-16 13:41:08

SQL Serverl

2010-09-08 16:03:57

SQL臨時表數據庫

2020-09-23 07:47:14

Java方式類型

2010-09-17 16:17:13

SQL內連接

2022-08-15 19:25:56

Android音頻PCM

2009-04-20 15:54:04

SQL Server重復行

2010-01-27 13:37:05

Oracle臨時表

2010-08-31 09:46:23

C#

2024-04-01 11:30:57

C#拷貝

2013-03-27 11:33:32

iOS開發iOSjson解析方式

2009-01-14 09:28:12

OracleSQL10g

2012-06-04 09:36:50

2010-03-03 10:50:22

Python字典應用方
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久av | 日韩高清国产一区在线 | 日韩欧美在线不卡 | 中文字幕亚洲一区二区三区 | 羞羞色影院 | 日本久久久影视 | 在线亚洲一区二区 | 97偷拍视频| 91国语清晰打电话对白 | 久久久精 | 欧美日韩亚洲在线 | 日韩av视屏 | 欧美精品久久 | 亚洲免费人成在线视频观看 | 中文字幕日韩欧美 | 91亚洲国产 | 日日爽 | 国产日韩欧美精品一区二区 | 欧美黄色片在线观看 | 国产美女精品 | 欧美xxxx做受欧美 | 亚洲高清视频在线观看 | 青青草亚洲 | 成人久久久 | 国产日韩欧美精品 | 国产一区二区在线看 | 91xxx在线观看 | 久久精品亚洲欧美日韩精品中文字幕 | 激情五月婷婷综合 | 男人的天堂在线视频 | 91久久视频 | 天堂一区二区三区 | 在线观看黄色电影 | 大伊人久久 | 精品欧美一区二区三区 | 高清人人天天夜夜曰狠狠狠狠 | 黄片毛片免费看 | 欧美看片 | 一区二区国产精品 | 91在线观看| 免费网站国产 |