關于MySQL的網絡協議分析
MySQL對大家來說,都應該很熟悉了,從大學里的課程到實際工作中數據的存儲查詢,很多時候都需要用到數據庫,很多人也寫過與數據庫交互的程序,在Java中你可能一開始會使用原生mysql-connector-java來進行操作,后來你會接觸到Hibernate,Mybatis等ORM框架,其實它們底層也是基于mysql-connector-java,但很多時候我們并不清楚程序是怎么跟數據庫具體交互的,比如執行一個SQL查詢,程序是如何從MySQL中獲取數據的呢?今天就讓我們來看看最基礎的MySQL網絡協議分析。
引言
閱讀本文之前你需要對網絡協議需要有基本的了解,比如兩臺機子之間的數據是如何通信的,硬件層可以暫時不需了解,但網絡層和傳輸層的協議要有一定的理解,比如IP數據包,TCP/IP協議,UDP協議等相關概念,有了這些基礎,有利于你閱讀本文。
背景
在歷史悠久的時代,數據庫只作為單機存儲,也不怎么需要與程序進行交互的時候的首,它的網絡通信并不是那么重要,但隨著時代的發展,數據庫不再只是單純的作為一個數據的倉庫了,它需要提供與外界的交互,比如遠程連接,程序操作數據庫等,這時候一份規范的網絡通信的協議就非常重要了,比如它是如何校驗權限,如何解析SQL語句,如何返回執行結果都需要用到相應的協議,很多時候我們并不需要接觸這些內容,因為它太底層了,我們直接使用把它們封裝好的第三方包就可以了,為什么還要去學習它的網絡協議呢?確實對于一開始學習編程的人來說,這有點操之過急,反而有時候會適得其反,但當你對這一方面有了一定的了解之后,你便會迫不及待得想去探索更深層的奧秘,去了解并學習我們平常用的第三方類庫是怎么去實現,明白它的底層原理,甚至對一些莫名其妙的bug也不會再害怕。
MySQL連接方式
分析協議,我們首先要了解如何與數據庫連接,說到MySQL連接方式,大家突然可能有點懵,其實它一直伴隨著我們,比如我們第一次裝數據庫完成后執行的第一次登錄,比如你沒有設置密碼:
- mysql -uroot
這是最基本的一種數據庫連接方式,那么MySQL連接方式到底有幾種呢?到MySQL5.7為止,總共有五種,分別是TCP/IP,TLS/SSL,Unix Sockets,Shared Memory,Named pipes,下面我們就來看看這五種的區別:
方式 | 默認開啟 | 支持系統 | 只支持本機 | 如何開啟 | 參數配置 |
---|---|---|---|---|---|
TCP/IP | 是 | 所有系統 | 否 | --skip-networking=yes/no. | --port --bind-address |
TLS/SSL | 是 | 所有系統(基于TCP/IP)之上 | 否 | --ssl=yes/no. | --ssl-* options |
Unix Sockets | 是 | 類Unix系統 | 是 | 設置--socket=<empty> 來關閉. | --socket=socket path |
Shared Memory | 否 | Windows系統 | 是 | --shared-memory=on/off. | --shared-memory-base-name=<name> |
Named pipes | 否 | Windows系統 | 否 | --enable-named-pipe=on/off. | --socket=<name> |
從上表中我們可以清晰看出每種連接方式的區別,接下里我會具體說明幾種連接是怎么操作的,由于我的機子是Mac OS系統,這里只模擬非Windows系統下的三種方式,因為這三種方式都是默認開啟的,我們不需要進行任何配置:
1.Unix Sockets:
- mysql -uroot
若你在本機使用這種方式連接MySQL數據庫的話,它默認會使用Unix Sockets。
2.TCP/IP:
- mysql --protocol=tcp -uroot
- mysql -P3306 -h127.0.0.1 -uroot
連接的時候我們指定連接協議,或者指定相應的IP及端口,我們的連接方式就變成了TCP/IP方式。
3.TLS/SSL:
- mysql --protocol=tcp -uroot --ssl=on
- mysql -P3306 -h127.0.0.1 -uroot --ssl=on
上表說過,TLS/SSL是基于TCP/IP的,所以我們只需再指定打開ssl配置即可。
然后我們可以通過以下語句來查詢目前數據庫的連接情況:
- SELECT DISTINCT connection_type from performance_schema.threads where connection_type is not null
那么我們如何選擇連接方式呢?個人總結了以下幾個原則:
- 若是你能確定程序和數據庫在同一臺機子(類Unix系統)上,推薦使用Unix Sockets,因為它效率更高;
- 若數據庫分布在不同的機子上,且能確保連接安全或者安全性要求不是那么高,推薦使用TCP/IP,反之使用TLS/SSL;
MySQL數據包
通信中最重要的就是數據,那么程序是如何和MySQL Server進行通信,并交互數據的呢?比如如何驗證賬戶,發送查詢語句,返回執行結果等,我先畫一個流程圖來模擬一下整個過程,幫助大家理解:
整個過程相對來說還是比較清晰的,我們對連接請求和斷開請求不需要過分關心,只需要了解這一點就可以了,重要的是其他幾點,那么在這幾步中,數據是怎么進行交互的呢?
其實主要就是兩步,Client將執行命令編碼成Server要求的格式傳輸給Server端執行,Server端將執行結果傳輸給Client端,Client端再根據相應的數據包格式解析獲得所需的數據。
1.基本數據類型
雖然網絡中的數據是用字節傳輸的,但它背后的數據源都是有類型的數據,MySQL協議也有基本的數據類型,好比Java中的8種基本數據類型,但MySQL協議中簡單的多,它只有兩種基本數據類型,分別為Integer(整型),String(字符串),下面我們就來看看這兩種類型。
Integer(整型)
首先Integer在MySQL協議中有兩種編碼方式,分別為FixedLengthInteger和LengthEncodedInteger,其中前者用于存儲無符號定長整數,實際中使用的不多,這里著重講一下后者。
使用LengthEncodedInteger編碼的整數可能會使用1, 3, 4, 或者9 個字節,具體使用字節取決于數值的大小,下表是不同的數據長度的整數所使用的字節數:
最小值(包含) | 最大值(不包含) | 存儲方式 |
---|---|---|
0 | 251 | 1個字節 |
251 | 2^16 | 3個字節(0xFC + 2個字節具體數據) |
2^16 | 2^24 | 4個字節(0xFD + 3個字節具體數據) |
2^24 | 2^64 | 9個字節(0xFE + 8個字節具體數據) |
舉個簡單的例子,比如1024的編碼為:
- 0xFC 0x00 0x04
其中0x代表16進制,實際數據傳輸中并沒有該標識,第一位代表這是一個251~2^16之間的數值,所以后面兩位為數值具體的值,這里使用的是小端字節序,MySQL默認使用的也是這種編碼次序,所以這里1024是0x00 0x04,字節序相關知識可以參考:理解字節序,到這里大家應該對這種編碼格式有了一定的了解了,下面我們就來看看String。
String(字符串)
String的編碼格式相對Integer來說會復雜一點,主要有以下幾種:
- FixedLengthString(定長方式):需先知道String的長度,MySQL中的一個例子就是ERR_Packet包(后續會講到)就使用了這種編碼方式,因為它的長度固定,用5個字節存儲所有數據。
- NullTerminatedString(Null結尾方式): 字符串以遇到Null作為結束標志,相應的字節為00。
- VariableLengthString(動態計算字符串長度方式): 字符串的長度取決于其他變量計算而定,比如一個字符串由Integer + Value組成,我們通過計算Integer的值來獲取Value的具體的長度。
- LengthEncodedString(指定字符串長度方式): 與VariableLengthString原理相似,是它的一種特殊情況,具體例子就是我上條舉的這個例子。
- RestOfPacketString(包末端字符串方式):一個包末端的字符串,可根據包的總長度金和當前位置得到字符串的長度,實際中并不常用。
總的來說String的編碼格式種類相對比較多,不同方式之間的區別也比較大,若要深刻理解還需從實際的例子里去學習,后續文章中我會寫幾個demo帶大家一起去探索。
2.基本數據包格式
數據包格式也主要分為兩種,一種是Server端向Client端發送的數據包格式,另一種則是Client向Server端發送的數據包。
Server to Client
Server向Client發送的數據包有兩個原則:
- 每個數據包大小不能超過2^24字節(16MB);
- 每個數據包前都需要加上數據包信息;
每個包的基本格式:
Type | Name | Description |
---|---|---|
int<3> | payload_length(包數據長度) | 具體數據包的內容長度,從出去頭部四個字節后開始的內容 |
int<1> | sequence_id(包序列id) | 每個包的序列id,總數據內容大于16MB時需要用,從0開始,依次增加,新的命令執行會重載為0 |
string | payload(具體數據) | 包中除去頭部后的具體數據內容 |
舉個列子:
例子 解釋
- 01 00 00 00 01| <li>payload_length: 1</li> <li>sequence_id: 0x00</li><li>payload: 0x01</li>
若是數據內容大于或者等于2^24-1個字節,將會拆分發送,舉個例子,比如發送16 777 215 (2^24-1) 字節的內容,則會按一下這種方式發送
- ff ff ff 00 ...
- 00 00 00 01
第一個數據包滿載,第二個數據包是一個空數據包(一種臨界情況)。
Client to Server
Client向Server端發送的格式相對來說就簡單一點了
Type | Name | Description |
---|---|---|
int<1> | 執行命令 | 執行的操作,比如切換數據庫,查詢表等操作 |
string | 參數 | 命令相應的參數 |
命令列表(摘抄自胡桃夾子的博客):
類型值 | 命令 | 功能 |
---|---|---|
0x00 | COM_SLEEP | (內部線程狀態) |
0x01 | COM_QUIT | 關閉連接 |
0x02 | COM_INIT_DB | 切換數據庫 |
0x03 | COM_QUERY | SQL查詢請求 |
0x04 | COM_FIELD_LIST | 獲取數據表字段信息 |
0x05 | COM_CREATE_DB | 創建數據庫 |
0x06 | COM_DROP_DB | 刪除數據庫 |
0x07 | COM_REFRESH | 清除緩存 |
0x08 | COM_SHUTDOWN | 停止服務器 |
0x09 | COM_STATISTICS | 獲取服務器統計信息 |
0x0A | COM_PROCESS_INFO | 獲取當前連接的列表 |
0x0B | COM_CONNECT | (內部線程狀態) |
0x0C | COM_PROCESS_KILL | 中斷某個連接 |
0x0D | COM_DEBUG | 保存服務器調試信息 |
0x0E | COM_PING | 測試連通性 |
0x0F | COM_TIME | (內部線程狀態) |
0x10 | COM_DELAYED_INSERT | (內部線程狀態) |
0x11 | COM_CHANGE_USER | 重新登陸(不斷連接) |
0x12 | COM_BINLOG_DUMP | 獲取二進制日志信息 |
0x13 | COM_TABLE_DUMP | 獲取數據表結構信息 |
0x14 | COM_CONNECT_OUT | (內部線程狀態) |
0x15 | COM_REGISTER_SLAVE | 從服務器向主服務器進行注冊 |
0x16 | COM_STMT_PREPARE | 預處理SQL語句 |
0x17 | COM_STMT_EXECUTE | 執行預處理語句 |
0x18 | COM_STMT_SEND_LONG_DATA | 發送BLOB類型的數據 |
0x19 | COM_STMT_CLOSE | 銷毀預處理語句 |
0x1A | COM_STMT_RESET | 清除預處理語句參數緩存 |
0x1B | COM_SET_OPTION | 設置語句選項 |
0x1C | COM_STMT_FETCH | 獲取預處理語句的執行結果 |
這里距一個常見的的例子,比如切換數據庫:
- use godpan
相應的報文格式則為:
- 0x02 0x67 0x6f 0x64 0x70 0x61 0x6e
其中0x02代表切換數據庫命令,后面的字節則為godpan的16進制表達。
數據包類型
有了以上的基礎,我們基本知道的與MySQL通信之間的方式以及數據格式,那么與其通信間到底有哪幾種數據包呢?接下去的內容是建立在MySQL4.1版本以后,之前版本的數據包類型這里不再論述。
這里主要分為兩個階段,第一個階段是數據庫賬戶認證階段,第二個階段則是執行具體命令階段,我們先來看看前者。
數據庫賬戶認證階段
這個階段就是我們平常所說的登錄,主要步驟如下:
1.Client與Server進行連接
2.Server向Client發送Handshake packet
3.Client與Server發送Auth packet
4.Server向Client發送OK packet或者ERR packet
這里我們來看一看上面的Handshake packet和Auth packet,OK packet和ERR packet放在另一個階段寫。
Handshake packet
Handshake packet是由Server向Client發送的初始化包,因為所有從Server向Client端發送的包都是一樣的格式,所以前面的四個字節是包頭,前三位代表Handshake packet具體內容的數據,另外包序列號為0,很顯然這個包內容小于16MB,下面是Handshake packet具體內容的格式:
相對包內容的位置 | 長度(字節) | 名稱 | 描述 |
---|---|---|---|
0 | 1 | 協議版本 | 協議版本的版本號,通常為10(0x0A) |
1 | len = strlen (server_version) + 1 | 數據庫版本 | 使用前面的NullTerminatedString格式編碼,長度為數據庫版本字符串的長度加上標示結束的的一個字節 |
len + 1 | 4 | 線程ID | 此次連接MySQL Server啟動的線程ID |
len + 5 | 8 + 1(0x00表示結束) | 挑戰隨機數(第一部分) | 用于后續賬戶密碼驗證 |
len + 14 | 2 | 協議協商 | 用于與客戶端協商通訊方式 |
len + 16 | 1 | 編碼格式 | 標識數據庫目前的編碼方式 |
len + 17 | 2 | 服務器狀態 | 用于表示服務器狀態,比如是否是事務模式或者自動提交模式 |
len + 19 | 13 | 保留字節 | 未來可能會用到,預留字節 |
len + 32 | 12 + 1(0x00表示結束) | 挑戰隨機數(第二部分) | 用于后續賬戶密碼驗證 |
上表就是整個Handshake packet的這個包結構,屬性的含義以及規范都有相應的說明,下面是我本機解析的某次連接數據庫的Handshake packet包,僅供參考:
- {protocolVersion=10, serverVersion='5.7.13', threadId=4055, scramble=[49, 97, 80, 3, 35, 118, 45, 15, 5, 118, 9, 11, 124, 93, 93, 5, 31, 47, 111, 109, 0, 0, 0, 0, 0], serverCapabilities=65535, serverLanguage=33, serverStatus=2}
Auth packet
Auth packet是由Client向Server發送的認證包,用于驗證數據庫賬戶登錄,相應內容的格式:
相對包內容的位置 | 長度(字節) | 名稱 | 描述 |
---|---|---|---|
0 | 4 | 協議協商 | 用于與服務端協商通訊方式 |
4 | 4 | 消息最長長度 | 客戶端可以發送或接收的最長長度,0表示不做任何限制 |
8 | 1 | 字符編碼 | 客服端字符編碼方式 |
9 | 23 | 保留字節 | 未來可能會用到,預留字節,用0代替 |
- 32 |不定| 認證字符串 | 主要有三部分內容<br> <li>用戶名:NullTerminatedString格式編碼</li><li>加密后的密碼:LengthEncodedString格式編碼</li><li>數據庫名稱(可選):NullTerminatedString格式編碼</li>
這部分內容是由客戶端自己生成,所以說如果我們如果要寫一個程序連接數據庫,那么這個包就得按照這個格式,不然服務端將會無法識別。
命令執行階段
在我們正確連接數據庫后,我們就要執行相應的命令了,比如切換數據庫,執行CRUD操作等,這個階段主要分為兩步,Client發送命令(上文已經給出,下面不再討論),Server端接收命令執行相應的操作,我們主要關心Server端向我們發送數據包,可分為4類和一個最基礎的報文結構Data Field:
- Data Field:包數據的一個基礎結構;
- OK包(包括PREPARE_OK):Server端發送正確處理信息的包,包頭標識為0x00;
- Error包: Server端發送錯誤信息的包,包頭標識為0xFF;
- EOF包:用于Server向Client發送結束包,包頭標識為0xFE;
- Result Set包:用于Server向Client發送的查詢結果包;
Data Field
Data Field是Server回應包里的一個核心,主要是數據的一種編碼結構,跟我之前講的LengthEncodedInteger和LengthEncodedString很類似,也主要分為三個部分
最小數據長度(包含) | 最大數據長度(不包含) | 數據長度 | 格式 |
---|---|---|---|
1 | 251 | 1個字節 | 1字節 + 具體數據 |
251 | 2^16 | 2個字節 | 0xFC + 2個字節數據長度 + 具體數據 |
2^16 | 2^24 | 4個字節 | 0xFD + 4個字節數據長度 + 具體數據 |
2^24 | 2^64 | 8個字節 | 0xFE + 8個字節數據長度 + 具體數據 |
NULL | NULL | 0個字節 | 0xFB |
要注意的一點是如果出現0xFB(251)開頭說明這個數據對應的是MySQL中的NULL。
OK 包
普通的OK包(PREPARE_OK包后面會講到)會在以下幾種情況下產生,由Server發送給相應的接收方:
- COM_PING: 連接或者測試數據庫
- COM_QUERY: 不需要查詢結果集的操作,比如INSERT, UPDATE, or ALTER TABLE
- COM_REFRESH: 數據刷新
- COM_REGISTER_SLAVE: 注冊從服務器
OK 包的主要結構:
相對包內容的位置 | 長度(字節) | 名稱 | 描述 |
---|---|---|---|
0 | 1 | 包頭標識 | 0x00 代表這是一個OK 包 |
1 | rows_len | 影響行數 | 相應操作影響的行數,比如一個Update操作的記錄是5條,那么這個值就為5 |
1 + rows_len | id_len | 自增id | 插入一條記錄時,如果是自增id的話,返回的id值 |
1 + rows_len + id_len | 2 | 服務器狀態 | 用于表示服務器狀態,比如是否是事務模式或者自動提交模式 |
3 + rows_len + id_len | 2 | 警告數 | 上次命令引起的警告數 |
5 + rows_len + id_len | msg_len | 額外信息 | 此次操作的一些額外信息 |
下面是我本機解析的某次正確連接數據庫后的OK packet包,僅供參考:
- OK{affectedRows=0, insertId=0, serverStatus=2, message='....'}
Error 包
顧名思義Error 包就是當出現錯誤的時候返回的信息,比如賬戶驗證不通過,查詢命令不合法,非空字段未指定值等相關操作,Server端都會向Client端發送Error 包。
Error 包的主要結構:
相對包內容的位置 | 長度(字節) | 名稱 | 描述 |
---|---|---|---|
0 | 1 | 包頭標識 | 0xFF 代表這是一個Error 包 |
1 | 2 | 錯誤代碼 | 該錯誤的相應錯誤代碼 |
3 | 1 | 標識位 | SQL執行狀態標識位,用'#'進行標識 |
4 | 5 | 執行狀態 | SQL的具體執行狀態 |
9 | msg_len | 錯誤信息 | 具體的錯誤信息 |
比如我們現在已經連接了數據庫,執行
- use test_database;
但是我們數據庫中并沒有test_database這個數據庫,我們將會得到相應的錯誤信息,下面是我本機解析的Error packet包,僅供參考:
- Error{errno=1046, sqlState='3D000', message='No database selected'}
EOF Packet
EOF Packet是用于標識某個階段數據結束的標志包,會在一下幾種情況中產生:
- 結果集中字段信息結束的時候;
- 結果集中列信息結束的時候;
- 服務器確認停止服務的時候;
- 客戶端發送COM_SET_OPTION and COM_DEBUG命令后,服務器回應的時候;
- 服務器請求使用MySQL4.1版本之前的認證方式的時候;
EOF 包的主要結構:
相對包內容的位置 | 長度(字節) | 名稱 | 描述 |
---|---|---|---|
0 | 1 | 包頭標識 | 0xFE 代表這是一個EOF 包 |
1 | 2 | 警告數 | 上次命令引起的警告數 |
3 | 2 | 服務器狀態 |
這里要注意的一點,我們上面分析了Data Field的結構,發現它是用0xFE作為長度需要8個字節編碼值得標識頭,所以我們在判斷一個包是否是EOF 包的時候,需要下面兩個條件:
- 標識頭(第一個字節)為0xFE;
- 包的總長度小于9個字節;
Result Set包
Result Set包產生于我們每次數據庫執行需要返回結果集的時候,Server端發送給我們的包,比如平常的SELECT,SHOW等命令,Result Set包相對比較復雜,主要包含以下五個方面:
內容 | 含義 |
---|---|
Result Set Header | 返回數據的列數量 |
Field | 返回數據的列信息(多個) |
EOF | 列結束 |
Row Data | 行數據(多個) |
EOF | 數據結束 |
我們逐個來分析,首先我們來看Result Set Header。
Result Set Header
Result Set Header表示返回數據的列數量以及一些額外的信息,其主要結構為:
長度 | 含義 |
---|---|
1-9字節 | 數據的列數量(LengthEncodedInteger編碼格式) |
1-9字節 | 額外信息(LengthEncodedInteger編碼格式) |
Field
Field表示Result Set中數據列的具體信息,可出現多次,具體次數取決于Result Set Header中數據的列數量,它的主要結構為:
長度 | 含義 |
---|---|
4 | 通常為ASCIIz字符串def |
- | 數據庫名稱(Data Field)
- | 假如查詢指定了表別名,就是表別名(Data Field)
- | 原始的表名(Data Field)
- | 假如查詢指定了列別名,就是列別名(Data Field)
- | 原始的列名(Data Field)
1 | 標識位,通常為12,表示接下去的12個字節是具體的field內容
2 | field的編碼
4 | field的長度
1 | field的類型
2 | field的標識
2 | field值的的小數點精度
2 | 預留字節
| 可選元素,如果存在,則表示該field的默認值
其中field的類型與標識具體定義和對應變量含義可參考這篇文章:MySQL協議分析
EOF 包
這里的EOF包是標識這列信息的結束,具體結構信息參考上面的EOF包解釋。
Row Data
Row Data含著的是我們需要獲取的數據,一個Result Set包里面包含著多個Row Data結構(得到的數據可能多行),每個Row Data中包含著多個字段值,它們之間沒有間隔,比如我們現在查詢到的數據為(id: 1, name: godpan) 那么Row Data內容為(1,godpan),這兩個值是連在一起的,對應的值都用LengthEncodedString編碼。
EOF 包
等待Row Data發送完之后,Server最后會向Client端發送一個EOF包,標識所有的行數據已經發送完畢。
PREPARE_OK包
PREPARE_OK包產生在Client端向Server發送預處理SQL語句,Server進行正確回應的時候,大家寫寫Java的時候肯定用過PreparedStatement,這里PreparedStatement的功能就是進行SQL的預處理,預處理的優點比較多,比如效率高,防SQL注入等,有興趣的同學可以自己去學習下。下面是PREPARE_OK包的結構:
長度 | 含義 |
---|---|
1 | 0x00(標識是一個OK包) |
4 | statement_handler_id(預處理語句id) |
2 | number of columns in result set(結果集中列的數量) |
2 | number of parameters in query(查詢語句中參數的數量) |
1 | 0x00 (填充值) |
2 | 警告數 |
比如我現在執執行下面的語句:
- PreparedStatement ps = connection.prepareStatement("SELECT * FROM `godpan_fans` where id=?");
- ps.setInteger(1, 1);
- ps.executeQuery();
得到下面的PREPARE_OK包,僅供參考:
- PSOK{statementId=1, columns=5, parameters=1}
如果上面的columns大于0,以及parameters大于0,則將有額外的兩個包傳輸,分別是columns的信息以及parameters的信息,對應信息結構:
內容 | 含義 |
---|---|
Field | columns信息(多個) |
EOF | columns信息結束 |
Field | parameters(多個) |
EOF | parameters結束 |
到此整個PREPARE_OK包發送完畢。
Row Data Binary
這個包跟上面提到的Row Data包有什么差別呢?主要有兩點:
- 用不同的方式定義NULL;
- 數據編碼不再單純的使用LengthEncodedString,而是根據數據類型的不同進行相應的編碼;
后面我會分別解釋這兩點,我們先來看看它的結構:
相對包內容的位置 | 長度(字節) | 名稱 | 描述 |
---|---|---|---|
0 | 1 | 包頭標識 | 0x00 |
1 | (col_count+7+2)/8 | Null Bit Map | 前兩位為預留字節,主要用于區別與其他的幾種包(OK,ERROR,EOF),在MySQL 5之后這兩個字節都為0X00,其中col_count為列的數量 |
(col_count+7+2)/8 + 1 | n | column values | 具體的列值,重復多次,根據值類型編碼 |
現在我們來看一下它的兩個特點,首先我們來看它是如何來定義NULL的,首先我們看到他的結構中有一個Null Bit Map,除去兩個標識位,真正用于標識數據信息的就是(col_count+7)/8位字節,這里我先給出結論,后面再給大家具體分析:
參數個數 | 長度(字節) | 具體值范圍 | 描述 |
---|---|---|---|
1-8 | 1 | -1, 2^n組合 | 1 = 2^0表示第一個參數為NULL,3 = 2^0 + 2^1表示第一個和第二參數為NULL... |
上面給出了標識NULL的基本算法,原則是哪個參數(次序為n)為NULL,則Null Bit Map相應的值加上2^n,8個參數為一個周期,以此類推。
接著我們來看一下第二點,是如何用具體值類型來對相應的值進行編碼的,這里主要分為三類,基本數據類型,時間類型,字符串類型;
- 基本數據類型:比如TINYINT使用一個字節編碼,FLOAT使用四個字節,DOUBLE使用8個字節等;
- 時間類型:使用類似LengthEncodedString的編碼方式編碼,具體可參考MySQL_PROTOCOL;
- 字符串類:不屬于上面兩類的都屬于字符串類型,使用普通的LengthEncodedString;
Execute包
Execute包顧名思義是一個執行包,它是由Client端發送到Server端的,但它和普通的命令又有點不同,它主要是用來執行預處理語句,并會攜帶相應參數,具體結構如下:
長度 | 含義 |
---|---|
1 | COM_EXECUTE(標識是一個Execute包) |
4 | 預處理語句id |
1 | 游標類型 |
4 | 預留字節 |
0 | 接下去的內容只有在有參數的情況下 |
(param_count+7)/8 | null_bit_map(描述參數中NULL的情況) |
1 | 參數綁定情況 |
n*2 | 參數類型(依次存儲) |
n | 參數具體值(非NULL)(依次存儲,使用Row Data Binary方式編碼) |
Execute包從Client端發送到Server端后可能會得到以下幾個結果:
- OK包
- ERROR包
- Result Set包(可能多個)
我們需要根據包的不同類型來進行不同的處理。
總結
本篇文章主要講述了MySQL的連接方式,通信過程及協議,以及傳輸包的基本格式和相關傳輸包的類型,內容相對來說,比較多也比較復雜,我也是將近三周才寫完,但總體按照我自學的思路走,不會太繞,有些點可能需要細心思考下,寫的有誤的地方也希望大家能指正,希望對大家有所幫助,后面可能會寫幾個實例和大家一起學習。