圖解數據庫臟讀、不可重復讀、幻讀
概述
分享之前關于數據庫臟讀、不可重復讀、幻讀的相關筆記,也做個備忘!
如果沒有事務隔離,會出現什么樣的情況?
假設我們現在有這樣一張表(T),里面記錄了很多牛人的名字,我們不進行事務的隔離看看會發生什么呢?
***天,事務A訪問了數據庫,它干了一件事情,往數據庫里加上了新來的牛人的名字,但是沒有提交事務。
- insert into T values (4, '牛D');
這時,來了另一個事務B,他要查詢所有牛人的名字。
- select Name from T;
這時,如果沒有事務之間沒有有效隔離,那么事務B返回的結果中就會出現“牛D”的名字。這就是“臟讀(dirty read)”。
第二天,事務A訪問了數據庫,他要查看ID是1的牛人的名字,于是執行了
- select Name from T where ID = 1;
這時,事務B來了,因為ID是1的牛人改名字了,所以要更新一下,然后提交了事務。
- update T set Name = '不牛' where ID = 1;
接著,事務A還想再看看ID是1的牛人的名字,于是又執行了
- select Name from T where ID = 1;
結果,兩次讀出來的ID是1的牛人名字竟然不相同,這就是不可重復讀(unrepeatable read)。
第三天,事務A訪問了數據庫,他想要看看數據庫的牛人都有哪些,于是執行了
- select * from T;
這時候,事務B來了,往數據庫加入了一個新的牛人。
- insert into T values(4, '牛D');
這時候,事務A忘了剛才的牛人都有哪些了,于是又執行了。
- select * from T;
結果,***次有三個牛人,第二次有四個牛人。
相信這個時候事務A就蒙了,剛才發生了什么?這種情況就叫“幻讀(phantom problem)”。
為了防止出現臟讀、不可重復讀、幻讀等情況,我們就需要根據我們的實際需求來設置數據庫的隔離級別。下面介紹下這方面內容。
數據庫事務隔離級別
數據庫事務隔離級別分為四種(級別遞減):
1、Serializable (串行化):最嚴格的級別,事務串行執行,資源消耗***;
2、REPEATABLE READ(重復讀) :保證了一個事務不會修改已經由另一個事務讀取但未提交(回滾)的數據。避免了“臟讀取”和“不可重復讀取”的情況,但不能避免“幻讀”,但是帶來了更多的性能損失。
3、READ COMMITTED (提交讀):大多數主流數據庫的默認事務等級,保證了一個事務不會讀到另一個并行事務已修改但未提交的數據,避免了“臟讀取”,但不能避免“幻讀”和“不可重復讀取”。該級別適用于大多數系統。
4、Read Uncommitted(未提交讀) :事務中的修改,即使沒有提交,其他事務也可以看得到,會導致“臟讀”、“幻讀”和“不可重復讀取”。
臟讀、不可重復讀、幻讀:
一個數據庫可能擁有多個訪問客戶端,這些客戶端并發訪問數據庫時,若沒有采取必要的隔離措施,存在以下問題,這些問題分為5類,包括3類數據讀問題:臟讀、不可重復讀和幻讀。兩類數據更新問題:***類丟失更新、第二類丟失更新。
1、臟讀
A事務讀取B事務尚未提交的更改數據,并在這個數據的基礎上進行操作,這時候如果事務B回滾,那么A事務讀到的數據是不被承認的。例如常見的取款事務和轉賬事務:
2、不可重復讀
不可重復讀是指A事務讀取了B事務已經提交的更改數據。假如A在取款事務的過程中,B往該賬戶轉賬100,A兩次讀取的余額發生不一致。
3、幻讀
A事務讀取B事務提交的新增數據,會引發幻讀問題?;米x一般發生在計算統計數據的事務中,例如銀行系統在同一個事務中兩次統計存款賬戶的總金額,在兩次統計中,剛好新增了一個存款賬戶,存入了100,這時候兩次統計的總金額不一致。
注意:不可重復讀和幻讀的區別是:前者是指讀到了已經提交的事務的更改數據(修改或刪除),后者是指讀到了其他已經提交事務的新增數據。對于這兩種問題解決采用不同的辦法,防止讀到更改數據,只需對操作的數據添加行級鎖,防止操作中的數據發生變化;二防止讀到新增數據,往往需要添加表級鎖,將整張表鎖定,防止新增數據(oracle采用多版本數據的方式實現)。
4、通俗解釋:
臟讀:所謂的臟讀,其實就是讀到了別的事務回滾前的臟數據。比如事務B執行過程中修改了數據X,在未提交前,事務A讀取了X,而事務B卻回滾了,這樣事務A就形成了臟讀。
也就是說,當前事務讀到的數據是別的事務想要修改成為的但是沒有修改成功的數據。
不可重復讀:事務A首先讀取了一條數據,然后執行邏輯的時候,事務B將這條數據改變了,然后事務A再次讀取的時候,發現數據不匹配了,就是所謂的不可重復讀了。
也就是說,當前事務先進行了一次數據讀取,然后再次讀取到的數據是別的事務修改成功的數據,導致兩次讀取到的數據不匹配,也就照應了不可重復讀的語義。
幻讀:事務A首先根據條件索引得到N條數據,然后事務B改變了這N條數據之外的M條或者增添了M條符合事務A搜索條件的數據,導致事務A再次搜索發現有N+M條數據了,就產生了幻讀。
也就是說,當前事務讀***次取到的數據比后來讀取到數據條目少。
不可重復讀和幻讀比較:
兩者有些相似,但是前者針對的是update或delete,后者針對的insert。
為什么會出現“臟讀”?因為沒有“select”操作沒有規矩。
為什么會出現“不可重復讀”?因為“update”操作沒有規矩。
為什么會出現“幻讀”?因為“insert”和“delete”操作沒有規矩。
“讀未提(Read Uncommitted)”能預防啥?啥都預防不了。
“讀提交(Read Committed)”能預防啥?使用“快照讀(Snapshot Read)”,避免“臟讀”,但是可能出現“不可重復讀”和“幻讀”。
“可重復讀(Repeated Red)”能預防啥?使用“快照讀(Snapshot Read)”,鎖住被讀取記錄,避免出現“臟讀”、“不可重復讀”,但是可能出現“幻讀”。
“串行化(Serializable)”能預防啥?排排坐,吃果果,有效避免“臟讀”、“不可重復讀”、“幻讀”,不過效果誰用誰知道。