資深架構師解讀Java多線程與并發模型之共享對象
原創【51CTO.com原創稿件】互聯網上充斥著對Java多線程編程的介紹,每篇文章都從不同的角度介紹并總結了該領域的內容。但大部分文章都沒有說明多線程的實現本質,沒能讓開發者真正“過癮”。上篇內容從Java的線程安全鼻祖內置鎖介紹開始,讓你了解內置鎖的實現邏輯和原理以及引發的性能問題,本篇接著說明Java多線程編程中鎖的存在是為了保障共享變量的線程安全使用。下面讓我們進入正題。
以下內容如無特殊說明均指代Java環境。
第二部分:共享對象
使用Java編寫線程安全的程序關鍵在于正確的使用共享對象,以及安全的對其進行訪問管理。在第一章我們談到Java的內置鎖可以保障線程安全,對于其他的應用來說并發的安全性是在內置鎖這個“黑盒子”內保障了線程變量使用的邊界。談到線程的邊界問題,隨之而來的是Java內存模型另外的一個重要的含義,可見性。Java對可見性提供的原生支持是volatile關鍵字。
volatile關鍵字
volatile關鍵字是Java語言提供的原生實現,可以理解為“易變的”。首先看一個例子:
- public class Share {
- private static boolean ready;
- private static int number;
- private static class Node extends Thread {
- public void run() {
- while (!ready)
- Thread.yield();
- System.out.println(number);
- }
- }
- public static void main(String[] args) {
- new Node().start();
- number = 10;
- ready = true;
- }
- }
代碼2.1:變量的可見性問題
在代碼2.1中,可以看到按照正常的邏輯應該打印10之后線程停止,但是實際的情況可能是打印出0或者程序永遠不會被終止掉。其原因是沒有使用恰當的同步機制以保障線程的寫入操作對所有線程都是可見的。
我們一般將volatile理解為synchronized的輕量級實現,在多核處理器中可以保障共享變量的“可見性”,但是不能保障原子性。關于原子性問題在該章節的程序變量規則會加以說明,下面我們先看下Java的內存模型實現以了解JVM和計算機硬件是如何協調共享變量的以及volatile變量的可見性。
Java內存模型
我們都知道現代計算機都是馮諾依曼結構的,所有的代碼都是順序執行的。如果計算機需要在CPU中運算某個指令,勢必就會涉及對數據的讀取和寫入操作。由于程序數據的大部分內容都是存儲在主內存(RAM)中的,在這當中就存在著一個讀取速度的問題,CPU很快而主內存相對來說(相對CPU)就會慢上很多,為了解決這個速度階梯問題,各個CPU廠商都在CPU里面引入了高速緩存來優化主內存和CPU的數據交互。
此時當CPU需要從主內存獲取數據時,會拷貝一份到高速緩存中,CPU計算時就可以直接在高速緩存中進行數據的讀取和寫入,提高吞吐量。當數據運行完成后,再將高速緩存的內容刷新到主內存中,此時其他CPU看到的才是執行之后的結果,但在這之間存在著時間差。
看這個例子:
int counter = 0;
counter = counter + 1;
代碼2.2:自增不一致問題
代碼2.2在運行時,CPU會從主內存中讀取counter的值,復制一份到當前CPU核心的高速緩存中,在CPU執行完成加1的指令之后,將結果1寫入高速緩存中,最后將高速緩存刷新到主內存中。這個例子代碼在單線程的程序中將正確的運行下去。
但我們試想這樣一種情況,現在有兩個線程共同運行該段代碼,初始化時兩個線程分別從主內存中讀取了counter的值0到各自的高速緩存中,線程1在CPU1中運算完成后寫入高速緩存Cache1,線程2在CPU2中運算完成后寫入高速緩存Cache2,此時counter的值在兩個CPU的高速緩存中的值都是1。
此時CPU1將值刷新到主內存中,counter的值為1,之后CPU2將counter的值也刷新到主內存,counter的值覆蓋為1,最終的結果計算counter為1(正確的兩次計算結果相加應為2)。這就是緩存不一致性問題。這會在多線程訪問共享變量時出現。
解決緩存不一致問題的方案:
-
通過總線鎖LOCK#方式。
-
通過緩存一致性協議。
圖2.1 :緩存不一致問題
圖2.1中提到的兩種內存一致性協議都是從計算機硬件層面上提供的保障。CPU一般是通過在總線上增加LOCK#鎖的方式,鎖住對內存的訪問來達到目的,也就是阻塞其他CPU對內存的訪問,從而使只有一個CPU能訪問該主內存。因此需要用總線進行內存鎖定,可以分析得到此種做法對CPU的吞吐率造成的損害很嚴重,效率低下。
隨著技術升級帶來了緩存一致性協議,市場占有率較大的Intel的CPU使用的是MESI協議,該協議可以保障各個高速緩存使用的共享變量的副本是一致的。其實現的核心思想是:當在多核心CPU中訪問的變量是共享變量時,某個線程在CPU中修改共享變量數據時,會通知其他也存儲了該變量副本的CPU將緩存置為無效狀態,因此其他CPU讀取該高速緩存中的變量時,發現該共享變量副本為無效狀態,會從主內存中重新加載。但當緩存一致性協議無法發揮作用時,CPU還是會降級使用總線鎖的方式進行鎖定處理。
一個小插曲:為什么volatile無法保障的原子性
我們看下圖2.2,CPU在主內存中讀取一個變量之后,拷貝副本到高速緩存,CPU在執行期間雖然識別了變量的“易變性”,但是只能保障最后一步store操作的原子性,在load,use期間并未實現其原子性操作。
圖2.2:數據加載和內存屏障
JVM為了使我們的代碼得到最優的執行體驗,在進行自我優化時,并不保障代碼的先后執行順序(滿足Happen-Before規則的除外),這就是“指令重排”,而上面提到的store操作保障了原子性,JVM是如何實現的呢?其原因是這里存在一個“內存屏障”的指令(以后我們會談到整個內容),這個是CPU支持的一個指令,該指令只能保障store時的原子性,但是不能保障整個操作的原子性。
從整個小插曲中,我們看到了volatile雖然有可見性的語義,但是并不能真正的保證線程安全。如果要保證并發線程的安全訪問,需要符合并發程序變量的訪問規則。
并發程序變量的訪問規則
1. 原子性
程序的原子性和數據庫事務的原子性有著同樣的意義,可以保障一次操作要么全部執行成功,要不全部都不執行。
2. 可見性
可見性是微妙的,因為最終的結果總是和我們的直覺大相徑庭,當多個線程共同修改一個共享變量的值時,由于存在高速緩存中的變量副本操作,不能及時將數據刷新到主內存,導致當前線程在CP中的操作結果對其他CPU是不可見狀態。
3. 有序性
有序性通俗的理解就是程序在JVM中是按照順序執行的,但是前面已經提到了JVM為了優化代碼的執行速度,會進行“指令重排”。在單線程中“指令重排”并不會帶來安全問題,但在并發程序中,由于程序的順序不能保障,運行過程中可能會出現不安全的線程訪問問題。
綜上,要想在并發編程環境中安全的運行程序,就必須滿足原子性、可見性和有序性。只要以上任何一點沒有保障,那程序運行就可能出現不可預知的錯誤。最后我們介紹一下Java并發的“殺手锏”,Happens-Before法則,符合該法則的情況下可以保障并發環境下變量的訪問規則。
Happens-Before法則:
-
程序次序法則:線程中的每個動作A都Happens-Before于該線程中的每一個動作B,在程序中,所有的動作B都出現在動作A之后。
-
Lock法則:對于一個Lock的解鎖操作總是Happens-Before于每一個后續對該Lock的加鎖操作。
-
volatile變量法則:對于volatile變量的寫入操作Happens-Before于后續對同一個變量的讀操作。
-
線程啟動法則:在一個線程里,對Thread.start()函數的調用會Happens-Before于每一個啟動線程中的動作。
-
線程終結法則:線程中的任何動作都Happens-Before于其他線程檢測到這個線程已經終結或者從Thread.join()函數調用中成功返回或者Thread.isAlive()函數返回false。
-
中斷法則:一個線程調用另一個線程的interrupt總是Happens-Before于被中斷的線程發現中斷。
-
終結法則:一個對象的構造函數的結束總是Happens-Before于這個對象的finalizer(Java沒有直接的類似C的析構函數)的開始。
-
傳遞性法則:如果A事件Happens-Before于B事件,并且B事件Happens-Before于C事件,那么A事件Happens-Before于C事件。
當一個變量在多線程競爭中被讀取和存儲,如果并未按照Happens-Before的法則,那么他就會存在數據競爭關系。
總結
關于Java的共享變量的內容就介紹到這里,現在你已經明白Java的volatile關鍵字的含義了,了解了為什么volatile不能保障原子性的原因了,了解了Happens-Before規則能讓我們的Java程序運行的更加安全。
通過這兩節內容希望可以幫助你更深入的了解Java的并發概念中的內置鎖和共享變量。Java的并發內容還有很多,例如在某些場景下比synchronized效率要更高的Lock,阻塞隊列,同步器等。
參考文獻:
《Java并發編程實戰》
更多精彩請訪問:
-
XSS常見攻擊與防御
https://zhuanlan.zhihu.com/p/30475175
-
利用500W條微博語料對評論進行情感分析:
https://zhuanlan.zhihu.com/p/30061051
-
還在手調網絡權限?資深IT工程師都這樣玩企業組網
https://zhuanlan.zhihu.com/p/29787843
-
微服務在互聯網公司演進過程
https://zhuanlan.zhihu.com/p/29758427
作者簡介
魏靚:現就職于五阿哥(www.wuage.com)任職專職架構師工作,負責平臺的基礎設施搭建工作。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】