「重磅開篇」形成完善的多線程世界觀
本文轉(zhuǎn)載自微信公眾號「飛天小牛肉」,作者飛天小牛肉。轉(zhuǎn)載本文請聯(lián)系飛天小牛肉公眾號。
關(guān)于這篇文章我很早就想寫了,也一直不敢寫,一方面是早先知識儲備不足,另一方面主要是多線程這部分內(nèi)容確實(shí)比較高深而且每個知識點(diǎn)之間比較零散,讓人摸不著頭腦,不知道該從哪里下手。而且對于我們學(xué)生群體來講,很少有機(jī)會接觸到高并發(fā)這方面的真實(shí)場景,平常自己敲代碼也基本不會用到,所以也導(dǎo)致我們大部分同學(xué)都是面向面經(jīng)學(xué)習(xí),你問 synchronized,叭叭叭我能說一堆,你問 volatile,叭叭叭我也能說一堆,但總感覺差點(diǎn)意思,就是這些知識點(diǎn)是零散的,沒有那么一根線把它們很好的串聯(lián)起來。
所以今天我斗膽造一根線,站在小白的角度,講講多線程這部分我們到底要學(xué)啥,按照什么樣的順序去學(xué),幫助各位建立一個比較完善的知識體系,形成正確的多線程世界觀。后續(xù)的文章我也基本上會按照這根線寫下來。
然后,我目前也沒有踏入工作崗位,也沒有實(shí)際的高并發(fā)經(jīng)驗(yàn),所以只是在紙上談兵,學(xué)識尚淺,大佬們?nèi)粲X得有問題懇請評論區(qū)或者私聊我指正,晚輩感激不盡(抱拳)。
煉氣
首先,學(xué)習(xí)多線程,你肯定得知道線程是啥吧,包括線程的一些基礎(chǔ)概念(比如上下文切換),那么說到線程,肯定離不開進(jìn)程。OK,進(jìn)程和線程這兩個概念其實(shí)我們在操作系統(tǒng)這門課中都接觸過,當(dāng)然并行和并發(fā)、同步與異步等這種基本概念咱也默認(rèn)你學(xué)過,那么你還需要去了解一下 Java 線程和操作系統(tǒng)的線程有啥區(qū)別。
另外,容易被大家忽視的一點(diǎn)是,一項技術(shù)的出現(xiàn)必定不是憑空捏造的,他一定是為了某個目的而來,在某個成熟的時機(jī)應(yīng)運(yùn)而生。因此,你需要知道我們?yōu)樯兑褂枚嗑€程,多線程的出現(xiàn)解決了什么問題。
掌握上面這一步,我們稱之為煉氣,所謂煉精化氣,起步階段需一心一意、沉心靜氣。
筑基
現(xiàn)在我們已經(jīng)知道線程是啥了,那在 Java 中如何創(chuàng)建線程呢?為此你會接觸到三種創(chuàng)建線程(Thread)的方式:
- 直接使用 Thread
- Thread + Runnable
- Thread + Callable + FutureTask
學(xué)會了如何創(chuàng)建線程,我們?nèi)シ环?Thread 類的源碼,你會發(fā)現(xiàn)其中定義了 Java 線程的六種狀態(tài),也就是所謂的生命周期,它和操作系統(tǒng)中線程的五態(tài)模型又有啥區(qū)別和聯(lián)系呢?
既然都翻了 Thread 源碼,豈有不深究的道理?我們接下來去學(xué)習(xí)一下 Thread 類給我們提供了哪些控制線程的方法,它們分別能干啥,怎樣影響了線程的狀態(tài):
- start / run
- sleep / yield
- join / join(long n)
- interrupt
- setDaemon 守護(hù)線程
這一階段的學(xué)習(xí),也就是入門階段后的第一步,我們稱之為筑基。基礎(chǔ)不牢,地動山搖。
金丹
誠然,一個程序順序的運(yùn)行多個線程本身是沒有問題的,但是如果多個線程同時訪問了某個共享資源,就可能會發(fā)生不可預(yù)知的現(xiàn)象,也就是我們常說的線程安全問題,要了解這些問題產(chǎn)生的根本原因,我們就需要去深刻的了解 Java 內(nèi)存模型(Java Memory Model,JMM)。
為此,我們會學(xué)習(xí)到和線程安全息息相關(guān)的三大性質(zhì):
1)原子性:一個操作是不可中斷的,要么全部執(zhí)行成功要么全部執(zhí)行失敗(也可以說是提供互斥訪問,同一時刻只能有一個線程對數(shù)據(jù)進(jìn)行操作)
2)可見性:當(dāng)一個線程修改了共享變量后,其他線程能夠立即得知這個修改
3)有序性(或者說重排序):重排序是編譯器和處理器為了優(yōu)化程序性能而對指令序列進(jìn)行重新排序的一種手段。由于重排序的存在,可能導(dǎo)致多線程環(huán)境下程序運(yùn)行結(jié)果出錯的問題。
那么編譯器和處理器在重排序時會遵守什么原則呢?為此你會了解到數(shù)據(jù)依賴性和 as-if-serial,這里簡單介紹一下這兩個概念:
編譯器和處理器在重排序時,會遵守數(shù)據(jù)依賴性,它們不會改變存在數(shù)據(jù)依賴性關(guān)系的兩個操作的執(zhí)行順序
as-if-serial 語義的意思是:不管怎么重排序,程序的執(zhí)行結(jié)果不能被改變。編譯器,runtime 和處理器都必須遵守 as-if-serial 語義
事實(shí)上,可見性和有序性其實(shí)是互相矛盾的兩點(diǎn)。一方面,對于程序員來說,我們希望內(nèi)存模型易于理解、易于編程,為此 JMM 的設(shè)計者要為程序員提供足夠強(qiáng)的內(nèi)存可見性保證,專業(yè)術(shù)語稱之為 “強(qiáng)內(nèi)存模型”。而另一方面,編譯器和處理器則希望內(nèi)存模型對它們的束縛越少越好,這樣它們就可以做盡可能多的優(yōu)化(比如重排序)來提高性能,因此 JMM 的設(shè)計者對編譯器和處理器的限制要盡可能地放松,專業(yè)術(shù)語稱之為 “弱內(nèi)存模型”。
當(dāng)然,對于這個問題,JMM 的設(shè)計者找到了一個很好的平衡點(diǎn),那就是 happens-before,這是 JMM 最核心的概念!理解 happens-before 是理解 JMM 的關(guān)鍵。
知其然而知其所以然,這一階段,我們稱為金丹。
渡劫
具體到 Java 語言層面,是怎么保證線程安全的呢?也就是如何保證原子性、可見性和有序性呢?(保證有序性上文已經(jīng)說過了,就是使用 happens-before 原則)。
1)對于可見性,可以使用 volatile 關(guān)鍵字來保證。不僅如此,volatile 還能起到禁止指令重排的作用;
2)對于原子性,我們可以使用 鎖 和 java.util.concurrent.atomic 包中的原子類來保證。(給萌新解釋一下,java.util.concurrent,簡稱 J.U.C,就是一個包,也成為并發(fā)包。現(xiàn)在網(wǎng)上大部分博客都會直接說 JUC,對萌新不是很友好),我們可以看看 juc.atomic 中有哪些類
當(dāng)然, atomic 包下這些原子操作類保證原子性最關(guān)鍵的原因還是因?yàn)樗鼈兪褂昧?CAS 操作,于是,你需要先去深入學(xué)習(xí)一下 CAS,了解 CAS 存在的三個問題,然后再去挖一挖這些原子類的底層原理。
另外,上面我們提到的鎖這個話題其實(shí)又是一個非常核心的知識點(diǎn),在深入學(xué)習(xí)之前,你需要了解一下各種鎖的概念:
- 悲觀鎖和樂觀鎖
- 重量級鎖和輕量級鎖
- 自旋鎖
- 偏向鎖
- 重入鎖和不可重入鎖
- 公平鎖和非公平鎖
- 共享鎖和排他鎖
另外,與鎖相關(guān)的概念的還有臨界區(qū)、競態(tài)條件等,這些你都是要去了解的。
那么鎖在 Java 中具體是怎么實(shí)現(xiàn)的呢?早先 Java 程序是靠 synchronized 關(guān)鍵字實(shí)現(xiàn)鎖功能的,在我們掌握了 synchronized 的使用方式以及底層原理后,你還會接觸到與 synchronized 配套的 wait/notify/notifyAll 方法。
在 Java SE 5 之后,并發(fā)包 JUC 中新增了 Lock 接口以及相關(guān)實(shí)現(xiàn)類(放在 java.util.concurrent.locks 包下)也可以用來實(shí)現(xiàn)鎖功能。
為什么會新增這樣一個 Lock 接口及其相關(guān)實(shí)現(xiàn)類呢?因?yàn)槭褂?synchronized 關(guān)鍵字會隱式地獲取鎖,但是它將鎖的獲取和釋放固化了,也就是先獲取再釋放。當(dāng)然,這種方式簡化了同步的管理,可是擴(kuò)展性沒有顯示的鎖獲取和釋放來的好。
例如,針對一個場景,手把手進(jìn)行鎖獲取和釋放,先獲得鎖 A,然后再獲取鎖 B,當(dāng)鎖 B 獲得后,釋放鎖 A 同時獲取鎖 C,當(dāng)鎖 C 獲得后,再釋放 B 同時獲取鎖 D,以此類推。這種場景下,如果使用 synchronized 關(guān)鍵字就不那么容易實(shí)現(xiàn)了,而使用 Lock 卻容易許多。
它提供了與 synchronized 關(guān)鍵字類似的同步功能,只是在使用時需要顯式地獲取和釋放鎖。雖然它缺少了隱式獲取釋放鎖的便捷性,但是卻擁有了鎖獲取與釋放的可操作性、可中斷的獲取鎖以及超時獲取鎖等多種 synchronized 關(guān)鍵字所不具備的同步特性。
另外,還有一點(diǎn)非常重要的是!我們可以去翻一翻實(shí)現(xiàn)了 Lock 接口的類,比如 ReentrantLock(大部分文章都會直接把它翻譯成重入鎖),你會驚訝的發(fā)現(xiàn)它并沒有多少代碼,基本所有的方法都是調(diào)用了其靜態(tài)內(nèi)部類 Sync 中的方法,而 Sync 類繼承了 AbstractQueuedSynchronizer 類(也就是大名鼎鼎的 AQS,譯為隊列同步器,簡稱同步器)。
可以把 AQS 理解為一個用來構(gòu)建鎖和同步器(工具類)的框架,locks 包中的各種鎖以及接下來我們會學(xué)習(xí)的 JUC 中的工具類都是基于 AQS 來實(shí)現(xiàn)的。
OK,關(guān)于 AQS 這篇文章就不再多說了。上面我們提到了兩個并發(fā)關(guān)鍵字,synchronized 和 volatile,其實(shí)還有一個,那就是 final,可能很多小伙伴都不知道,啥?final 和并發(fā)有啥關(guān)系?當(dāng)然,這些,后續(xù)文章都會寫的。
本階段的知識非常重要,并且相對來說知識點(diǎn)比較多也比較難,因此我們稱之為渡劫。
大乘
渡劫完畢,走到這一步各位對多線程基本的知識架構(gòu)已經(jīng)有了一定的認(rèn)知,世界觀已經(jīng)初步形成,最后,就是補(bǔ)強(qiáng)的過程了,我們來看看 J.U.C 這個包還有什么東西(下圖沒有截全):
JUC 其實(shí)可以分為五大類:
- Lock 框架(locks 包)
- 原子類(atomic 包)
- 并發(fā)集合
- 線程池
- 工具類
后面三種正是我們在這一階段需要學(xué)習(xí)的。并發(fā)集合和線程池就沒啥好說的了,它們的知識點(diǎn)都比較集中,學(xué)習(xí)目標(biāo)也很明確,網(wǎng)絡(luò)上很容易就能找到一篇條理清晰的文章。
然后常用的工具類還是有必要學(xué)習(xí)下:
- CountDownLatch
- CyclicBarrier
- Semaphore
- Exchanger
所謂工具類嘛,那一定是封裝了某些比較復(fù)雜的操作,使我們可以很簡單的去完成這些操作。以 CountDownLatch 為例:在多線程協(xié)作完成業(yè)務(wù)功能時,有時候需要等待其他多個線程完成任務(wù)之后,主線程才能繼續(xù)往下執(zhí)行業(yè)務(wù)功能,在這種的業(yè)務(wù)場景下,通常可以使用 Thread 類的 join 方法,讓主線程等待被 join 的線程執(zhí)行完之后,主線程才能繼續(xù)往下執(zhí)行。而 Java 并發(fā)工具類中為我們提供了這樣一個類似 “倒計時” 的工具類 CountDownLatch,可以十分方便的完成這種業(yè)務(wù)場景。
另外,還有一個比較重要的類,我也不知道怎么給它分類,就是 ThreadLocal,江湖人稱線程隔離術(shù),必問高階考點(diǎn)。
OK,學(xué)完了本階段,多線程世界觀已完整形成,我們稱之為大乘,忘我之境,全在己心。