高頻考點之六大進(jìn)程通信機(jī)制
本文轉(zhuǎn)載自微信公眾號「飛天小牛肉」,作者飛天小牛肉 。轉(zhuǎn)載本文請聯(lián)系飛天小牛肉公眾號。
初學(xué)操作系統(tǒng)的時候,我就一直懵逼,為啥進(jìn)程同步與互斥機(jī)制里有信號量機(jī)制,進(jìn)程通信里又有信號量機(jī)制,然后你再看網(wǎng)絡(luò)上的各種面試題匯總或者博客,你會發(fā)現(xiàn)很多都是千篇一律的進(jìn)程通信機(jī)制有哪些?進(jìn)程同步與互斥機(jī)制鮮有人問津。看多了我都想把 CSDN 屏了.....,最后知道真相的我只想說為啥不能一篇博客把東西寫清楚,沒頭沒尾真的浪費時間。
希望這篇文章能夠拯救某段時間和我一樣被繞暈的小伙伴。上篇文章我已經(jīng)講過進(jìn)程間的同步與互斥機(jī)制,各位小伙伴看完這個再來看進(jìn)程通信比較好。
全文脈絡(luò)思維導(dǎo)圖如下:
1. 什么是進(jìn)程通信
顧名思義,進(jìn)程通信( InterProcess Communication,IPC)就是指「進(jìn)程之間的信息交換」。實際上,「進(jìn)程的同步與互斥本質(zhì)上也是一種進(jìn)程通信」(這也就是待會我們會在進(jìn)程通信機(jī)制中看見信號量和 PV 操作的原因了),只不過它傳輸?shù)膬H僅是信號量,通過修改信號量,使得進(jìn)程之間建立聯(lián)系,相互協(xié)調(diào)和協(xié)同工作,但是它「缺乏傳遞數(shù)據(jù)的能力」。
雖然存在某些情況,進(jìn)程之間交換的信息量很少,比如僅僅交換某個狀態(tài)信息,這樣進(jìn)程的同步與互斥機(jī)制完全可以勝任這項工作。但是大多數(shù)情況下,「進(jìn)程之間需要交換大批數(shù)據(jù)」,比如傳送一批信息或整個文件,這就需要通過一種新的通信機(jī)制來完成,也就是所謂的進(jìn)程通信。
再來從操作系統(tǒng)層面直觀的看一些進(jìn)程通信:我們知道,為了保證安全,每個進(jìn)程的用戶地址空間都是獨立的,一般而言一個進(jìn)程不能直接訪問另一個進(jìn)程的地址空間,不過內(nèi)核空間是每個進(jìn)程都共享的,所以「進(jìn)程之間想要進(jìn)行信息交換就必須通過內(nèi)核」。
下面就來我們來列舉一下 Linux 內(nèi)核提供的常見的進(jìn)程通信機(jī)制:
- 管道(也稱作共享文件)
- 消息隊列(也稱作消息傳遞)
- 共享內(nèi)存(也稱作共享存儲)
- 信號量和 PV 操作
- 信號
- 套接字(Socket)
2. 管道
匿名管道
各位如果學(xué)過 Linux 命令,那對管道肯定不陌生,Linux 管道使用豎線 | 連接多個命令,這被稱為管道符。
- $ command1 | command2
以上這行代碼就組成了一個管道,它的功能是將前一個命令(command1)的輸出,作為后一個命令(command2)的輸入,從這個功能描述中,我們可以看出「管道中的數(shù)據(jù)只能單向流動」,也就是半雙工通信,如果想實現(xiàn)相互通信(全雙工通信),我們需要創(chuàng)建兩個管道才行。
另外,通過管道符 | 創(chuàng)建的管道是匿名管道,用完了就會被自動銷毀。并且,匿名管道只能在具有親緣關(guān)系(父子進(jìn)程)的進(jìn)程間使用,。也就是說,「匿名管道只能用于父子進(jìn)程之間的通信」。
在 Linux 的實際編碼中,是通過 pipe 函數(shù)來創(chuàng)建匿名管道的,若創(chuàng)建成功則返回 0,創(chuàng)建失敗就返回 -1:
- int pipe (int fd[2]);
該函數(shù)擁有一個存儲空間為 2 的文件描述符數(shù)組:
fd[0] 指向管道的讀端,fd[1] 指向管道的寫端
fd[1] 的輸出是 fd[0] 的輸入
粗略的解釋一下通過匿名管道實現(xiàn)進(jìn)程間通信的步驟:
1)父進(jìn)程創(chuàng)建兩個匿名管道,管道 1(fd1[0]和 fd1[1])和管道 2(fd2[0]和 fd2[1]);
因為管道的數(shù)據(jù)是單向流動的,所以要想實現(xiàn)數(shù)據(jù)雙向通信,就需要兩個管道,每個方向一個。
2)父進(jìn)程 fork 出子進(jìn)程,于是對于這兩個匿名管道,子進(jìn)程也分別有兩個文件描述符指向匿名管道的讀寫兩端;
3)父進(jìn)程關(guān)閉管道 1 的讀端 fd1[0] 和 管道 2 的寫端 fd2[1],子進(jìn)程關(guān)閉管道 1 的寫端 fd1[1] 和 管道 2 的讀端 fd2[0],這樣,管道 1 只能用于父進(jìn)程寫、子進(jìn)程讀;管道 2 只能用于父進(jìn)程讀、子進(jìn)程寫。管道是用「環(huán)形隊列」實現(xiàn)的,數(shù)據(jù)從寫端流入從讀端流出,這就實現(xiàn)了父子進(jìn)程之間的雙向通信。
看完上面這些講述,我們來理解下管道的本質(zhì)是什么:對于管道兩端的進(jìn)程而言,管道就是一個文件(這也就是為啥管道也被稱為共享文件機(jī)制的原因了),但它不是普通的文件,它不屬于某種文件系統(tǒng),而是自立門戶,單獨構(gòu)成一種文件系統(tǒng),并且只存在于內(nèi)存中。
簡單來說,「管道的本質(zhì)就是內(nèi)核在內(nèi)存中開辟了一個緩沖區(qū),這個緩沖區(qū)與管道文件相關(guān)聯(lián),對管道文件的操作,被內(nèi)核轉(zhuǎn)換成對這塊緩沖區(qū)的操作」。
有名管道
匿名管道由于沒有名字,只能用于父子進(jìn)程間的通信。為了克服這個缺點,提出了有名管道,也稱做 FIFO,因為數(shù)據(jù)是先進(jìn)先出的傳輸方式。
所謂有名管道也就是提供一個路徑名與之關(guān)聯(lián),這樣,即使與創(chuàng)建有名管道的進(jìn)程不存在親緣關(guān)系的進(jìn)程,只要可以訪問該路徑,就能夠通過這個有名管道進(jìn)行相互通信。
使用 Linux 命令 mkfifo 來創(chuàng)建有名管道:
- $ mkfifo myPipe
myPipe 就是這個管道的名稱,接下來,我們往 myPipe 這個有名管道中寫入數(shù)據(jù):
- $ echo "hello" > myPipe
執(zhí)行這行命令后,你會發(fā)現(xiàn)它就停在這了,這是因為管道里的內(nèi)容沒有被讀取,只有當(dāng)管道里的數(shù)據(jù)被讀完后,命令才可以正常退出。于是,我們執(zhí)行另外一個命令來讀取這個有名管道里的數(shù)據(jù):
- $ cat < myPipe
- hello
3. 消息隊列可以看出,「管道這種進(jìn)程通信方式雖然使用簡單,但是效率比較低,不適合進(jìn)程間頻繁地交換數(shù)據(jù),并且管道只能傳輸無格式的字節(jié)流」。為此,消息傳遞機(jī)制(Linux 中稱消息隊列)應(yīng)用而生。比如,A 進(jìn)程要給 B 進(jìn)程發(fā)送消息,A 進(jìn)程把數(shù)據(jù)放在對應(yīng)的消息隊列后就可以正常返回了,B 進(jìn)程在需要的時候自行去消息隊列中讀取數(shù)據(jù)就可以了。同樣的,B 進(jìn)程要給 A 進(jìn)程發(fā)送消息也是如此。
「消息隊列的本質(zhì)就是存放在內(nèi)存中的消息的鏈表,而消息本質(zhì)上是用戶自定義的數(shù)據(jù)結(jié)構(gòu)」。如果進(jìn)程從消息隊列中讀取了某個消息,這個消息就會被從消息隊列中刪除。對比一下管道機(jī)制:
- 消息隊列允許一個或多個進(jìn)程向它寫入或讀取消息。
- 消息隊列可以實現(xiàn)消息的「隨機(jī)查詢」,不一定非要以先進(jìn)先出的次序讀取消息,也可以按消息的類型讀取。比有名管道的先進(jìn)先出原則更有優(yōu)勢。
- 對于消息隊列來說,在某個進(jìn)程往一個隊列寫入消息之前,并不需要另一個進(jìn)程在該消息隊列上等待消息的到達(dá)。而對于管道來說,除非讀進(jìn)程已存在,否則先有寫進(jìn)程進(jìn)行寫入操作是沒有意義的。
- 消息隊列的生命周期隨內(nèi)核,如果沒有釋放消息隊列或者沒有關(guān)閉操作系統(tǒng),消息隊列就會一直存在。而匿名管道隨進(jìn)程的創(chuàng)建而建立,隨進(jìn)程的結(jié)束而銷毀。
需要注意的是,消息隊列對于交換較少數(shù)量的數(shù)據(jù)很有用,因為無需避免沖突。但是,由于用戶進(jìn)程寫入數(shù)據(jù)到內(nèi)存中的消息隊列時,會發(fā)生從用戶態(tài)「拷貝」數(shù)據(jù)到內(nèi)核態(tài)的過程;同樣的,另一個用戶進(jìn)程讀取內(nèi)存中的消息數(shù)據(jù)時,會發(fā)生從內(nèi)核態(tài)拷貝數(shù)據(jù)到用戶態(tài)的過程。因此,「如果數(shù)據(jù)量較大,使用消息隊列就會造成頻繁的系統(tǒng)調(diào)用,也就是需要消耗更多的時間以便內(nèi)核介入」。
4. 共享內(nèi)存
為了避免像消息隊列那樣頻繁的拷貝消息、進(jìn)行系統(tǒng)調(diào)用,共享內(nèi)存機(jī)制出現(xiàn)了。
顧名思義,共享內(nèi)存就是允許不相干的進(jìn)程將同一段物理內(nèi)存連接到它們各自的地址空間中,使得這些進(jìn)程可以訪問同一個物理內(nèi)存,這個物理內(nèi)存就成為共享內(nèi)存。如果某個進(jìn)程向共享內(nèi)存寫入數(shù)據(jù),所做的改動將「立即」影響到可以訪問同一段共享內(nèi)存的任何其他進(jìn)程。
集合內(nèi)存管理的內(nèi)容,我們來深入理解下共享內(nèi)存的原理。首先,每個進(jìn)程都有屬于自己的進(jìn)程控制塊(PCB)和邏輯地址空間(Addr Space),并且都有一個與之對應(yīng)的頁表,負(fù)責(zé)將進(jìn)程的邏輯地址(虛擬地址)與物理地址進(jìn)行映射,通過內(nèi)存管理單元(MMU)進(jìn)行管理。「兩個不同進(jìn)程的邏輯地址通過頁表映射到物理空間的同一區(qū)域,它們所共同指向的這塊區(qū)域就是共享內(nèi)存」。
不同于消息隊列頻繁的系統(tǒng)調(diào)用,對于共享內(nèi)存機(jī)制來說,僅在建立共享內(nèi)存區(qū)域時需要系統(tǒng)調(diào)用,一旦建立共享內(nèi)存,所有的訪問都可作為常規(guī)內(nèi)存訪問,無需借助內(nèi)核。這樣,數(shù)據(jù)就不需要在進(jìn)程之間來回拷貝,所以這是最快的一種進(jìn)程通信方式。
5. 信號量和 PV 操作
實際上,對具有多 CPU 系統(tǒng)的最新研究表明,在這類系統(tǒng)上,消息傳遞的性能其實是要優(yōu)于共享內(nèi)存的,因為「消息隊列無需避免沖突,而共享內(nèi)存機(jī)制可能會發(fā)生沖突」。也就是說如果多個進(jìn)程同時修改同一個共享內(nèi)存,先來的那個進(jìn)程寫的內(nèi)容就會被后來的覆蓋。
并且,在多道批處理系統(tǒng)中,多個進(jìn)程是可以并發(fā)執(zhí)行的,但由于系統(tǒng)的資源有限,進(jìn)程的執(zhí)行不是一貫到底的, 而是走走停停,以不可預(yù)知的速度向前推進(jìn)(異步性)。但有時候我們又希望多個進(jìn)程能密切合作,按照某個特定的順序依次執(zhí)行,以實現(xiàn)一個共同的任務(wù)。
舉個例子,如果有 A、B 兩個進(jìn)程分別負(fù)責(zé)讀和寫數(shù)據(jù)的操作,這兩個線程是相互合作、相互依賴的。那么寫數(shù)據(jù)應(yīng)該發(fā)生在讀數(shù)據(jù)之前。而實際上,由于異步性的存在,可能會發(fā)生先讀后寫的情況,而此時由于緩沖區(qū)還沒有被寫入數(shù)據(jù),讀進(jìn)程 A 沒有數(shù)據(jù)可讀,因此讀進(jìn)程 A 被阻塞。
因此,為了解決上述這兩個問題,保證共享內(nèi)存在任何時刻只有一個進(jìn)程在訪問(互斥),并且使得進(jìn)程們能夠按照某個特定順序訪問共享內(nèi)存(同步),我們就可以使用進(jìn)程的同步與互斥機(jī)制,常見的比如信號量與 PV 操作。
「進(jìn)程的同步與互斥其實是一種對進(jìn)程通信的保護(hù)機(jī)制,并不是用來傳輸進(jìn)程之間真正通信的內(nèi)容的,但是由于它們會傳輸信號量,所以也被納入進(jìn)程通信的范疇,稱為低級通信」。
下面的內(nèi)容和上篇文章【看完了進(jìn)程同步與互斥機(jī)制,我終于徹底理解了 PV 操作】中所講的差不多,看過的小伙伴可直接跳到下一標(biāo)題。
信號量其實就是一個變量 ,我們可以用一個信號量來表示系統(tǒng)中某種資源的數(shù)量,比如:系統(tǒng)中只有一臺打印機(jī),就可以設(shè)置一個初值為 1 的信號量。
用戶進(jìn)程可以通過使用操作系統(tǒng)提供的一對原語來對信號量進(jìn)行操作,從而很方便的實現(xiàn)進(jìn)程互斥或同步。這一對原語就是 PV 操作:
1)「P 操作」:將信號量值減 1,表示「申請占用一個資源」。如果結(jié)果小于 0,表示已經(jīng)沒有可用資源,則執(zhí)行 P 操作的進(jìn)程被阻塞。如果結(jié)果大于等于 0,表示現(xiàn)有的資源足夠你使用,則執(zhí)行 P 操作的進(jìn)程繼續(xù)執(zhí)行。
可以這么理解,當(dāng)信號量的值為 2 的時候,表示有 2 個資源可以使用,當(dāng)信號量的值為 -2 的時候,表示有兩個進(jìn)程正在等待使用這個資源。不看這句話真的無法理解 V 操作,看完頓時如夢初醒。
2)「V 操作」:將信號量值加 1,表示「釋放一個資源」,即使用完資源后歸還資源。若加完后信號量的值小于等于 0,表示有某些進(jìn)程正在等待該資源,由于我們已經(jīng)釋放出一個資源了,因此需要喚醒一個等待使用該資源(就緒態(tài))的進(jìn)程,使之運行下去。
我覺得已經(jīng)講的足夠通俗了,不過對于 V 操作大家可能仍然有困惑,下面再來看兩個關(guān)于 V 操作的問答:
問:「信號量的值 大于 0 表示有共享資源可供使用,這個時候為什么不需要喚醒進(jìn)程」?
答:所謂喚醒進(jìn)程是從就緒隊列(阻塞隊列)中喚醒進(jìn)程,而信號量的值大于 0 表示有共享資源可供使用,也就是說這個時候沒有進(jìn)程被阻塞在這個資源上,所以不需要喚醒,正常運行即可。
問:「信號量的值 等于 0 的時候表示沒有共享資源可供使用,為什么還要喚醒進(jìn)程」?
答:V 操作是先執(zhí)行信號量值加 1 的,也就是說,把信號量的值加 1 后才變成了 0,在此之前,信號量的值是 -1,即有一個進(jìn)程正在等待這個共享資源,我們需要喚醒它。
信號量和 PV 操作具體的定義如下:
互斥訪問共享內(nèi)存
兩步走即可實現(xiàn)不同進(jìn)程對共享內(nèi)存的互斥訪問:
- 定義一個互斥信號量,并初始化為 1
- 把對共享內(nèi)存的訪問置于 P 操作和 V 操作之間
「P 操作和 V 操作必須成對出現(xiàn)」。缺少 P 操作就不能保證對共享內(nèi)存的互斥訪問,缺少 V 操作就會導(dǎo)致共享內(nèi)存永遠(yuǎn)得不到釋放、處于等待態(tài)的進(jìn)程永遠(yuǎn)得不到喚醒。

實現(xiàn)進(jìn)程同步
回顧一下進(jìn)程同步,就是要各并發(fā)進(jìn)程按要求有序地運行。
舉個例子,以下兩個進(jìn)程 P1、P2 并發(fā)執(zhí)行,由于存在異步性,因此二者交替推進(jìn)的次序是不確定的。假設(shè) P2 的 “代碼4” 要基于 P1 的 “代碼1” 和 “代碼2” 的運行結(jié)果才能執(zhí)行,那么我們就必須保證 “代碼4” 一定是在 “代碼2” 之后才會執(zhí)行。
如果 P2 的 “代碼4” 要基于 P1 的 “代碼1” 和 “代碼2” 的運行結(jié)果才能執(zhí)行,那么我們就必須保證 “代碼4” 一定是在 “代碼2” 之后才會執(zhí)行。
使用信號量和 PV 操作實現(xiàn)進(jìn)程的同步也非常方便,三步走:
- 定義一個同步信號量,并初始化為當(dāng)前可用資源的數(shù)量
- 在優(yōu)先級較「高」的操作的「后」面執(zhí)行 V 操作,釋放資源
- 在優(yōu)先級較「低」的操作的「前」面執(zhí)行 P 操作,申請占用資源
配合下面這張圖直觀理解下:
6. 信號
注意!「信號和信號量是完全不同的兩個概念」!
信號是進(jìn)程通信機(jī)制中唯一的「異步」通信機(jī)制,它可以在任何時候發(fā)送信號給某個進(jìn)程。「通過發(fā)送指定信號來通知進(jìn)程某個異步事件的發(fā)送,以迫使進(jìn)程執(zhí)行信號處理程序。信號處理完畢后,被中斷進(jìn)程將恢復(fù)執(zhí)行」。用戶、內(nèi)核和進(jìn)程都能生成和發(fā)送信號。
信號事件的來源主要有硬件來源和軟件來源。所謂硬件來源就是說我們可以通過鍵盤輸入某些組合鍵給進(jìn)程發(fā)送信號,比如常見的組合鍵 Ctrl+C 產(chǎn)生 SIGINT 信號,表示終止該進(jìn)程;而軟件來源就是通過 kill 系列的命令給進(jìn)程發(fā)送信號,比如 kill -9 1111 ,表示給 PID 為 1111 的進(jìn)程發(fā)送 SIGKILL 信號,讓其立即結(jié)束。我們來查看一下 Linux 中有哪些信號:
7. Socket
至此,上面介紹的 5 種方法都是用于同一臺主機(jī)上的進(jìn)程之間進(jìn)行通信的,如果想要「跨網(wǎng)絡(luò)與不同主機(jī)上的進(jìn)程進(jìn)行通信」,那該怎么做呢?這就是 Socket 通信做的事情了(「當(dāng)然,Socket 也能完成同主機(jī)上的進(jìn)程通信」)。
Socket 起源于 Unix,原意是「插座」,在計算機(jī)通信領(lǐng)域,Socket 被翻譯為「套接字」,它是計算機(jī)之間進(jìn)行通信的一種約定或一種方式。通過 Socket 這種約定,一臺計算機(jī)可以接收其他計算機(jī)的數(shù)據(jù),也可以向其他計算機(jī)發(fā)送數(shù)據(jù)。
從計算機(jī)網(wǎng)絡(luò)層面來說,「Socket 套接字是網(wǎng)絡(luò)通信的基石」,是支持 TCP/IP 協(xié)議的網(wǎng)絡(luò)通信的基本操作單元。它是網(wǎng)絡(luò)通信過程中端點的抽象表示,包含進(jìn)行網(wǎng)絡(luò)通信必須的五種信息:連接使用的協(xié)議,本地主機(jī)的 IP 地址,本地進(jìn)程的協(xié)議端口,遠(yuǎn)地主機(jī)的 IP 地址,遠(yuǎn)地進(jìn)程的協(xié)議端口。
Socket 的本質(zhì)其實是一個編程接口(API),是應(yīng)用層與 TCP/IP 協(xié)議族通信的中間軟件抽象層,它對 TCP/IP 進(jìn)行了封裝。它「把復(fù)雜的 TCP/IP 協(xié)議族隱藏在 Socket 接口后面」。對用戶來說,只要通過一組簡單的 API 就可以實現(xiàn)網(wǎng)絡(luò)的連接。
8. 總結(jié)
簡單總結(jié)一下上面六種 Linux 內(nèi)核提供的進(jìn)程通信機(jī)制:
1)首先,最簡單的方式就是「管道」,管道的本質(zhì)是存放在內(nèi)存中的特殊的文件。也就是說,內(nèi)核在內(nèi)存中開辟了一個緩沖區(qū),這個緩沖區(qū)與管道文件相關(guān)聯(lián),對管道文件的操作,被內(nèi)核轉(zhuǎn)換成對這塊緩沖區(qū)的操作。管道分為匿名管道和有名管道,匿名管道只能在父子進(jìn)程之間進(jìn)行通信,而有名管道沒有限制。
2)雖然管道使用簡單,但是效率比較低,不適合進(jìn)程間頻繁地交換數(shù)據(jù),并且管道只能傳輸無格式的字節(jié)流。為此「消息隊列」應(yīng)用而生。消息隊列的本質(zhì)就是存放在內(nèi)存中的消息的鏈表,而消息本質(zhì)上是用戶自定義的數(shù)據(jù)結(jié)構(gòu)。如果進(jìn)程從消息隊列中讀取了某個消息,這個消息就會被從消息隊列中刪除。
3)消息隊列的速度比較慢,因為每次數(shù)據(jù)的寫入和讀取都需要經(jīng)過用戶態(tài)與內(nèi)核態(tài)之間數(shù)據(jù)的拷貝過程,「共享內(nèi)存」可以解決這個問題。所謂共享內(nèi)存就是:兩個不同進(jìn)程的邏輯地址通過頁表映射到物理空間的同一區(qū)域,它們所共同指向的這塊區(qū)域就是共享內(nèi)存。如果某個進(jìn)程向共享內(nèi)存寫入數(shù)據(jù),所做的改動將立即影響到可以訪問同一段共享內(nèi)存的任何其他進(jìn)程。
對于共享內(nèi)存機(jī)制來說,僅在建立共享內(nèi)存區(qū)域時需要系統(tǒng)調(diào)用,一旦建立共享內(nèi)存,所有的訪問都可作為常規(guī)內(nèi)存訪問,無需借助內(nèi)核。這樣,數(shù)據(jù)就不需要在進(jìn)程之間來回拷貝,所以這是最快的一種進(jìn)程通信方式。
4)共享內(nèi)存速度雖然非常快,但是存在沖突問題,為此,我們可以使用信號量和 PV 操作來實現(xiàn)對共享內(nèi)存的互斥訪問,并且還可以實現(xiàn)進(jìn)程同步。
5)「信號」和信號量是完全不同的兩個概念!信號是進(jìn)程通信機(jī)制中唯一的異步通信機(jī)制,它可以在任何時候發(fā)送信號給某個進(jìn)程。通過發(fā)送指定信號來通知進(jìn)程某個異步事件的發(fā)送,以迫使進(jìn)程執(zhí)行信號處理程序。信號處理完畢后,被中斷進(jìn)程將恢復(fù)執(zhí)行。用戶、內(nèi)核和進(jìn)程都能生成和發(fā)送信號。
6)上面介紹的 5 種方法都是用于同一臺主機(jī)上的進(jìn)程之間進(jìn)行通信的,如果想要跨網(wǎng)絡(luò)與不同主機(jī)上的進(jìn)程進(jìn)行通信,就需要使用 「Socket」 通信。另外,Socket 也能完成同主機(jī)上的進(jìn)程通信。
總結(jié)完畢!