成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

面試官問我索引為什么這快?我好像解釋不清楚了

運維 數據庫運維
在數據庫中加一定量的索引,會讓你的查詢語句,從原來的 3 秒縮短到零點幾秒的程度,但是很多人都不知道為什么要加索引,為什么加了索引之后,你的查詢語句就會起飛呢?今天阿粉來聊一下索引。

阿粉相信大家肯定都知道,在數據庫中加一定量的索引,會讓你的查詢語句,從原來的 3 秒縮短到零點幾秒的程度,但是很多人都不知道為什么要加索引,為什么加了索引之后,你的查詢語句就會起飛呢?今天阿粉來聊一下索引。

索引的類型(常見的)

  • 主鍵索引(primary key):主鍵索引這個阿粉從剛開始接觸開發的時候,就被各種灌輸,表的主鍵就默認是索引,不允許出現空值。
  • 普通索引(index/normal):MySQL中基本索引類型,沒有什么限制,允許在定義索引的列中插入重復值和空值。
  • 全文索引(fulltext):只能在文本類型CHAR,VARCHAR,TEXT類型字段上創建全文索引。MyISAM和InnoDB中都可以使用全文索引。
  • 唯一索引(unique):索引列中的值必須是唯一的,但是允許為空值。

索引的類型肯定不限制于這幾項,既然我們知道分類了,我們接下來再來看看不同索引的創建方式。

不同索引的創建方式

其實如果你真的不會去寫 SQL 去創建索引,最簡單的,Navicat 你總是會用的吧,圖形化的界面操作,你肯定也是了解的吧,那圖形化直接操作不就好了。

這樣子操作是不是簡單明了,選擇你想要創建索引的類型,然后指名你想要創建索引的字段,最后再給他加上個注釋,完美解決,但是我們還是要寫語句來看一下的。

1. 創建普通的索引

  1. ALTER TABLE table_name ADD INDEX index_name (column) 

比如我們有一張表叫做 user 我們想給 user 表中的一個叫做 phone 字段增加一個索引,應該怎么去寫呢?

  1. ALTER TABLE user ADD INDEX phoneIndex (phone) 

這時候我們就創建好了一個索引了,索引的刪除,相對來說也是非常的簡單。其實說是創建索引,實際上就是給我們原有表中的某個字段上增加一個索引,這個大家一定得清楚哈,千萬別和 Create 給搞混了。下面阿粉就直接簡單的給大家稱之為創建吧。

  1. ALTER TABLE testalter_tb1 DROP INDEX index_name 

這樣刪除我們剛才建立的索引就是

  1. ALTER TABLE user DROP INDEX phoneIndex 

這時候我們就能看到刪除成功了。

  1. > OK 
  2. > 時間: 0.012s 

2. 創建唯一索引(unique)并刪除

  1. ALTER TABLE user ADD unique phoneIndex (phone) 
  2. ALTER TABLE user DROP INDEX phoneIndex; 

千萬不要想當然的認為創建的時候我指定了索引的類型,然后刪除的時候也執行一個 ALTER TABLE user DROP unique phoneIndex; 阿粉親身實踐,確實是不成功的。

3. 創建主鍵索引(primary key)并刪除

  1. ALTER TABLE user ADD PRIMARY KEY (phone): 
  2. ALTER TABLE user DROP PRIMARY KEY 

一般我們在建表的時候,都把這個主鍵索引都建好了,所以使用的場景并不是很多見。

4. 創建全文索引(fulltext)并刪除

創建方式都差不多就是這樣

  1. ALTER TABLE user ADD FULLTEXT phoneIndex (phone) 
  2. ALTER TABLE user DROP INDEX phoneIndex; 

既然我們了解了創建的方式了,那是不是該回歸正題,說說為什么使用索引就會快,這就得涉及到索引的底層知識了,

索引的實現

在沒有索引的情況下,我們查找數據只能按照從頭到尾的順序逐行查找,每查找一行數據,意味著我們要到到磁盤相應的位置去讀取一條數據。

如果把查詢一條數據分為到磁盤中查詢和比對查詢條件兩步的話,到磁盤中查詢的時間會遠遠大于比對查詢條件的時間,這意味著在一次查詢中,磁盤io占用了大部分的時間。更進一步地說,一次查詢的效率取絕于磁盤io的次數,如果我們能夠在一次查詢中盡可能地降低磁盤io的次數,那么我們就能加快查詢的速度。

所以我們就要開始引入索引,然后分析索引底層是如何實現查找迅速的。

實際上索引的底層實際上就是樹,也就 B 樹和 B+ 樹,也可以稱之為變種的 B+ 樹。大家也都知道 Mysql中最常用的引擎像InnoDB和MyISAM,最終都選擇了B+樹作為索引。

那我們來說說這個B樹和B+樹。

B-樹,也稱為B樹,是一種平衡的多叉樹(可以對比一下平衡二叉查找樹),它比較適用于對外查找。

畫一個二階B樹:

二階B樹

那么我們為什么稱他為二階 B 樹呢?這個階數實際上就是說一個 節點 最多有幾個 子節點。

我們上面的圖,X元素,有2個子節點,A 元素,又有2個 子節點 C 和 D ,而 B 元素,又有 2 個子節點 E F ,也就是說一個節點最多有多少個子節點,我們就稱它為幾階的樹,通常這個值一般用 m 來表示。

注意我們所說的,也就是一個節點上 最多 的子節點數,如果有一個分支是有三個節點,而有一個是 兩個節點 ,那我們就稱它為 三階 B 樹。

一顆m階的 B 樹 要滿足什么條件呢?

  • 每個節點至多可以擁有m棵子樹。
  • 根節點,只有至少有2個節點(要么極端情況,就是一棵樹就一個根節點,單細胞生物,即是根,也是葉,也是樹)。
  • 非根非葉的節點至少有的Ceil(m/2)個子樹(Ceil表示向上取整,圖中3階B樹,每個節點至少有2個子樹,也就是至少有2個叉)。
  • 非葉節點中的信息包括[n,A0,K1,A1,K2,A2,…,Kn,An],,其中n表示該節點中保存的關鍵字個數,K為關鍵字且Ki
  • 從根到葉子的每一條路徑都有相同的長度,也就是說,葉子節點在相同的層,并且這些節點不帶信息,實際上這些節點就表示找不到指定的值,也就是指向這些節點的指針為空。

B樹的查詢過程和二叉排序樹比較類似,從根節點依次比較每個節點,因為每個節點中的關鍵字和左右子樹都是有序的,所以只要比較節點中的關鍵字,或者沿著指針就能很快地找到指定的關鍵字,如果查找失敗,則會返回葉子節點,即空指針。

B樹搜索的簡單偽算法如下:

  1. BTree_Search(node, key) { 
  2.     if(node == null) return null; 
  3.     foreach(node.key) 
  4.     { 
  5.         if(node.key[i] == key) return node.data[i]; 
  6.             if(node.key[i] > key) return BTree_Search(point[i]->node); 
  7.     } 
  8.     return BTree_Search(point[i+1]->node); 
  9.  
  10. data = BTree_Search(root, my_key); 

這就是個偽算法,寫的不好,大家見諒,那么什么是 B+ 樹呢?

B+ 樹是一種樹數據結構,是一個n叉樹,每個節點通常有多個孩子,一顆B+樹包含根節點、內部節點和葉子節點。根節點可能是一個葉子節點,也可能是一個包含兩個或兩個以上孩子節點的節點。

B+ 樹通常用于數據庫和操作系統的文件系統中。

NTFS, ReiserFS, NSS, XFS, JFS, ReFS 和BFS等文件系統都在使用B+樹作為元數據索引。

B+ 樹的特點是能夠保持數據穩定有序,其插入與修改擁有較穩定的對數時間復雜度。

B+ 樹元素自底向上插入。

那 B+ 樹又有哪些比較顯著的特點呢?

  • 每個父節點的元素都出現在了子節點中,分別是子節點最大或者最小的元素。
  • 在上面的這一棵樹中,根節點元素8是子節點258的最大的元素,根元素15也是。這時候要注意了,根節點最大的元素等同于整個B+樹的最大的元素,以后無論是怎么插入或者是刪除,始終都要保持最大的元素在根節點中。
  • 葉子節點,因為父節點的元素都出現在了子節點當中,因此所有的葉子節點包含了全量的元素信息。

B+樹與B樹差異

  • 有k個子節點的節點必然有k個元素
  • 非葉子節點僅具有索引作用,跟記錄有關的信息均存放在葉子節點中
  • 樹的所有葉子節點構成一個有序鏈表,可以按照元素排序的次序遍歷全部記錄
  • B樹和B+樹的區別在于,B+樹的非葉子節點只包含導航信息,不包含實際的值,所有的葉子節點和相連的節點使用鏈表相連,便于區間查找和遍歷。

說到這里,就會有讀者開始想,說了半天,沒有說到重點,為什么加了索引就快呢?

剛才阿粉也說了,數據庫讀取數據,是從磁盤上通過 IO 來進行數據的操作,一次磁盤IO操作可以取出物理存儲中相鄰的一大片數據,如果查詢的索引數據(就是B+樹中從根節點一直到葉子節點整個過程中查詢的節點數)都集中在該區域,那么只需要一次磁盤IO,否則就需要多次磁盤IO。

這么說是不是就相對的簡單明了了。

再舉出一個簡單的例子:

比如我們想要查詢 user 表中 name 為 xiaohong 的數據,在我們寫 SQL 的時候

  1. select * from user where name = 'xiaohong' 

這時候沒有索引的情況下,數據庫直接就把整個表全部掃描一遍,然后去找 name = ‘xiaohong’ 的數據

而我們給他加上索引之后,會通過索引查找去查詢名為 ‘xiaohong‘ 的數據,因為該索引已經按照字母順序排列,因此要查找名為 ‘xiaohong' 的記錄時會快很多。

大家明白了么?就像是一個詞典,我把 x 開頭的數據都給你羅列出來,然后你從 x 開頭的數據中去尋找,和你直接沒有任何處理,直接一頁一頁的翻詞典的速度,哪一個更快,相信大家也都明白了吧。

 

責任編輯:趙寧寧 來源: Java極客技術
相關推薦

2024-11-04 00:00:03

viewportDOMSPA

2025-05-12 08:40:00

前端監控DOM

2021-12-02 08:19:06

MVCC面試數據庫

2021-01-21 07:53:29

面試官Promis打印e

2020-04-16 08:22:11

HTTPS加解密協議

2022-04-10 18:10:24

CURD鏈表

2022-10-09 08:38:17

消息隊列面試官模式

2020-09-10 16:10:17

js繼承模式前端

2023-06-05 07:57:53

Kafka消息事務消息

2021-12-20 10:30:33

forforEach前端

2020-12-01 11:50:49

數據庫Redis面試

2021-11-15 09:32:06

浮點面試Java

2025-06-18 08:20:00

Redis數據庫線程

2021-08-28 09:06:11

Dubbo架構服務

2022-10-17 00:04:30

索引SQL訂單

2020-12-03 07:39:50

HashMap底層數據

2021-06-03 08:55:54

分布式事務ACID

2021-11-24 10:10:32

axios前端攔截器

2021-03-10 08:56:37

Zookeeper

2021-05-08 07:53:33

面試線程池系統
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 免费三级黄 | 男人的天堂亚洲 | 亚洲一区二区久久 | 国产精品a一区二区三区网址 | caoporn国产精品免费公开 | 国产视频在线观看一区二区三区 | 国产小视频在线看 | 国产视频1 | 一区在线播放 | 一区免费观看 | 久久久视频在线 | 亚洲视频一区在线 | 亚洲黄色一级 | 国产激情福利 | 夜夜操天天干 | 久久久www成人免费无遮挡大片 | 中文字幕免费视频 | av黄色片在线观看 | 国产日韩欧美在线一区 | 亚洲一区二区在线播放 | 免费视频久久 | 国产精品视频在线观看 | 欧洲毛片 | 欧美一级免费看 | 色在线看 | 国产精品毛片一区二区三区 | 欧美精品一区二区三区在线播放 | 91精品在线播放 | 色综合久久久久 | avhd101在线成人播放 | 一区在线观看 | 国产一区二区三区日韩 | 色久在线| 国产午夜精品一区二区三区 | 亚洲性综合网 | 国产精品 亚洲一区 | 亚洲精品免费在线观看 | 黑色丝袜三级在线播放 | ririsao久久精品一区 | 日韩欧美在线观看 | 免费一区|