你可能知道事務(wù)的四大特性，但是你不一定知道事務(wù)的實(shí)現(xiàn)原理

作者：平頭哥的技術(shù)博文 2020-01-03 10:11:01

說到數(shù)據(jù)庫，那就一定會(huì)聊到事務(wù)，事務(wù)也是面試中常問的問題，我們先來一個(gè)面試場景。

說到數(shù)據(jù)庫，那就一定會(huì)聊到事務(wù)，事務(wù)也是面試中常問的問題，我們先來一個(gè)面試場景：

面試官:"事務(wù)的四大特性是什么?"我:"ACID，即原子性(Atomicity)、隔離性(Isolation)、持久性(Durability)、一致性(Consistency)!"面試官:"在 MySQL 數(shù)據(jù)庫的 InnoDB 引擎是怎么實(shí)現(xiàn)這四大特性的?"我:"這個(gè)...這個(gè)....，還真沒有了解過哎"面試官:"那我們就先這個(gè)吧，先回去吧，我們會(huì)通知你的~"

這可能是比較常見的面試場景了，你也許回答到了事務(wù)的四大特性，但是不一定知道他的實(shí)現(xiàn)原理。今天我們就來一起打卡事務(wù)的四大特性和實(shí)現(xiàn)原理，對(duì)于原理的實(shí)現(xiàn)，這篇文章只是粗略的介紹一下，更多的細(xì)節(jié)可以關(guān)注我后續(xù)的文章。

數(shù)據(jù)庫的事務(wù)有四大特性：原子性、隔離性、永久性、一致性，下面將介紹這四大特性的定義和在 InnoDB 引擎中是怎么實(shí)現(xiàn)的。

原子性

定義

一次操作是不可分割的，要么全部成功，要么全部失敗。比如我們的轉(zhuǎn)賬操作，不允許出款方成功，收款方失敗這種情況，要么都成功，要么多失敗，不可能出現(xiàn)中間狀態(tài)。

實(shí)現(xiàn)

InnoDB 引擎使用 undo log(歸滾日志)來保證原子性操作，你對(duì)數(shù)據(jù)庫的每一條數(shù)據(jù)的改動(dòng)(INSERT、DELETE、UPDATE)都會(huì)被記錄到 undo log 中，比如以下這些操作：

你插入一條記錄時(shí)，至少要把這條記錄的主鍵值記下來，之后回滾的時(shí)候只需要把這個(gè)主鍵值對(duì)應(yīng)的記錄刪掉就好了。
你刪除了一條記錄，至少要把這條記錄中的內(nèi)容都記下來，這樣之后回滾時(shí)再把由這些內(nèi)容組成的記錄插入到表中就好了。
你修改了一條記錄，至少要把修改這條記錄前的舊值都記錄下來，這樣之后回滾時(shí)再把這條記錄更新為舊值就好了。

當(dāng)事務(wù)執(zhí)行失敗或者調(diào)用了 rollback 方法時(shí)，就會(huì)觸發(fā)回滾事件，利用 undo log 中記錄將數(shù)據(jù)回滾到修改之前的樣子。

更多關(guān)于 undo log 的信息，后面再單獨(dú)開一篇文章打卡。

隔離性

定義

多個(gè)事務(wù)并發(fā)執(zhí)行的時(shí)候，事務(wù)內(nèi)部的操作與其他事務(wù)是隔離的，并發(fā)執(zhí)行的各個(gè)事務(wù)之間不能互相干擾。

實(shí)現(xiàn)

隔離性可能會(huì)引入臟讀(dirty read)、不可重復(fù)讀(non-repeatable read)、幻讀(phantom read)等問題，為了解決這些問題就引入了“隔離級(jí)別”的概念。

SQL 標(biāo)準(zhǔn)的事務(wù)隔離級(jí)別包括：讀未提交(read uncommitted)、讀提交(read committed)、可重復(fù)讀(repeatable read)和串行化(serializable)：

讀未提交：一個(gè)事務(wù)還沒提交時(shí)，它做的變更就能被別的事務(wù)看到。
讀提交：一個(gè)事務(wù)提交之后，它做的變更才會(huì)被其他事務(wù)看到。
可重復(fù)讀：一個(gè)事務(wù)執(zhí)行過程中看到的數(shù)據(jù)，總是跟這個(gè)事務(wù)在啟動(dòng)時(shí)看到的數(shù)據(jù)是一致的。當(dāng)然在可重復(fù)讀隔離級(jí)別下，未提交變更對(duì)其他事務(wù)也是不可見的。
串行化：顧名思義是對(duì)于同一行記錄，“寫”會(huì)加“寫鎖”，“讀”會(huì)加“讀鎖”。當(dāng)出現(xiàn)讀寫鎖沖突的時(shí)候，后訪問的事務(wù)必須等前一個(gè)事務(wù)執(zhí)行完成，才能繼續(xù)執(zhí)行。

SQL標(biāo)準(zhǔn)中規(guī)定，針對(duì)不同的隔離級(jí)別，并發(fā)事務(wù)可以發(fā)生不同嚴(yán)重程度的問題，具體情況如下：

上面就是幾種隔離級(jí)別可能出現(xiàn)的并發(fā)問題，但是有必要說一下，你隔離得越嚴(yán)實(shí)，效率就會(huì)越低。

InnoDB 引擎是如何保證隔離性的?利用鎖和 MVCC 機(jī)制。這里簡單的介紹一下 MVCC 機(jī)制，也叫多版本并發(fā)控制，在使用 READ COMMITTD、REPEATABLE READ 這兩種隔離級(jí)別的事務(wù)下，每條記錄在更新的時(shí)候都會(huì)同時(shí)記錄一條回滾操作，就會(huì)形成一個(gè)版本鏈，在執(zhí)行普通的 SELECT 操作時(shí)訪問記錄的版本鏈的過程，這樣子可以使不同事務(wù)的讀-寫、寫-讀操作并發(fā)執(zhí)行，從而提升系統(tǒng)性能。

持久性

定義

事務(wù)一旦提交，它對(duì)數(shù)據(jù)庫的改變就應(yīng)該是永久性的。接下來的其他操作或故障不應(yīng)該對(duì)其有任何影響。

實(shí)現(xiàn)

要保證持久性很簡單，就是每次事務(wù)提交的時(shí)候，都將數(shù)據(jù)刷磁盤上，這樣一定保證了安全性，但是要知道如果每次事務(wù)提交都將數(shù)據(jù)寫入到磁盤的話，頻繁的 IO 操作，成本太高，數(shù)據(jù)庫的性能極低，所以這種方式不可取。

InnoDB 引擎是怎么解決的?InnoDB 引擎引入了一個(gè)中間層來解決這個(gè)持久性的問題，我們把這個(gè)叫做 redo log(歸檔日志)。

為什么要引入 redo log?redo log 可以保證持久化又可以保證數(shù)據(jù)庫的性能，相比于直接刷盤，redo log 有以下兩個(gè)優(yōu)勢(shì)：

redo log體積小，畢竟只記錄了哪一頁修改了啥，因此體積小，刷盤快。
redo log是一直往末尾進(jìn)行追加，屬于順序IO。效率顯然比隨機(jī)IO來的快。

InnoDB 引擎是怎么做的?當(dāng)有一條記錄需要更新的時(shí)候，InnoDB 引擎就會(huì)先把記錄寫到 redo log 里面，并更新內(nèi)存，這個(gè)時(shí)候更新就算完成了。當(dāng)數(shù)據(jù)庫宕機(jī)重啟的時(shí)候，會(huì)將 redo log 中的內(nèi)容恢復(fù)到數(shù)據(jù)庫中，再根據(jù) undo log和 binlog 內(nèi)容決定回滾數(shù)據(jù)還是提交數(shù)據(jù)。

更多 redo log，后面我打算單獨(dú)寫一篇文章。

一致性

定義

一致性簡單一點(diǎn)說就是數(shù)據(jù)執(zhí)行前后都要處于一種合法的狀態(tài)，比如身份證號(hào)不能重復(fù)，性別只能是男或者女，高考的分?jǐn)?shù)只能在0～750之間，紅綠燈只有3種顏色，房價(jià)不能為負(fù)的等等，只有符合這些約束的數(shù)據(jù)才是有效的，比如有個(gè)小孩兒跟你說他高考考了1000分，你一聽就知道他胡扯呢。數(shù)據(jù)庫世界只是現(xiàn)實(shí)世界的一個(gè)映射，現(xiàn)實(shí)世界中存在的約束當(dāng)然也要在數(shù)據(jù)庫世界中有所體現(xiàn)。如果數(shù)據(jù)庫中的數(shù)據(jù)全部符合現(xiàn)實(shí)世界中的約束(all defined rules)，我們說這些數(shù)據(jù)就是一致的，或者說符合一致性的。

實(shí)現(xiàn)

要保證數(shù)據(jù)庫的數(shù)據(jù)一致性，要在以下兩個(gè)方面做努力：