Linux系統編程—時序競態
##時序競態
什么是時序競態?將同一個程序執行兩次,正常情況下,前后兩次執行得到的結果應該是一樣的。但由于系統資源競爭的原因,前后兩次執行的結果有可能得到不一樣的結果,這個現象就是時序競態。
##pause函數
函數原型:
- int pause(void);
函數作用:
進程調用pause函數時,會造成進程主動掛起(處于阻塞狀態,并主動放棄CPU),并且等待信號將其喚醒。
返回值:
我們知道,信號的處理方式有三種:1. 默認動作;2. 忽略處理;3. 捕捉。進程收到一個信號后,會先處理響應信號,再喚醒pause函數。于是有下面幾種情況:
- 如果信號的默認處理動作是終止進程,則進程將被終止,也就是說一收到信號進程就終止了,pause函數根本就沒有機會返回;
- 如果信號的默認處理動作是忽略,則進程將直接忽略該信號,相當于沒收到這個信號,進程繼續處于掛起狀態,pause函數不返回;
- 如果信號的處理動作是捕捉,則進程調用完信號處理函數之后,pause返回-1,errno設置為EINTR,表示“被信號中斷”。
- pause收到的信號不能被屏蔽,如果被屏蔽,那么pause就不能被喚醒。
因為alarm函數可以在設定的時間之后發送SIGALRM信號,pause函數又可以將進程掛起等待信號,則二者結合可以自己寫一個sleep函數,如下:
- #include <unistd.h>
- #include <signal.h>
- #include <stdio.h>
- void sig_alrm(int signo)
- {
- /* nothing to do */
- }
- unsigned int mysleep(unsigned int nsecs)
- {
- unsigned int unslept;
- signal(SIGALRM, &sig_alrm);
- unslept = alarm(nsecs);
- pause();
- return unslept;
- }
- int main(void)
- {
- while(1){
- mysleep(2);
- printf("Two seconds passed\n");
- }
- return 0;
- }
##時序競態前導例
在講時序競態具體現象之前,我們先來看一個生活中常見的場景:
想午睡10分鐘,于是定了個10分鐘的鬧鐘,希望10分鐘后鬧鐘將自己叫醒。
正常情況:定好鬧鐘,午睡,10分鐘后鬧鐘叫醒自己;
異常情況:定好鬧鐘,躺下睡覺2分鐘,被同學叫醒去打球,打了20分鐘后回來繼續睡覺。但在打球期間,鬧鐘早就響過了,將不會再喚醒自己。
這個例子與之后要講的時序競態有很大的相似之處。
##時序競態問題分析
我們再回過頭來看上面所寫的mysleep程序。這個函數有可能是下面的時序:
- SIGALRM默認動作是終止進程,因此我們要將其捕捉,對SIGALRM注冊信號處理函數;
- 調用alarm(1)函數定時1秒鐘;
- alarm(1)調用結束,定時器開始計時。就在這時,進程失去CPU,進入就緒態等待CPU(相當于被同學叫醒去打球)。失去CPU的方式有可能是內核調度了優先級更高的進程取代了當前進程,使得當前進程無法獲得CPU;
- 我們知道,alarm函數如果采用自然定時法的話,定時器將一直計時,與進程狀態無關。于是,1秒后,鬧鐘定時時間到,內核向當前進程發送SIGALRM信號。高優先級進程尚未執行完畢,當前進程仍然無法獲得CPU,繼續處于就緒態,信號無法處理(處于未決狀態);
- 優先級高的進程執行完畢,當前進程獲得CPU資源,內核調度回當前進程執行。SIGALRM信號遞達,并被進程處理;
- 信號處理完畢后,返回當前主控流程,并調用pause()函數,掛起等待alarm函數發送的SIGALRM信號將自己喚醒;
- 但實際SIGALRM信號已經處理完畢,pause()函數永遠不會等到。
##解決時序競態問題
通過以上時序分析,我們可以看出,造成時序競態的原因就是SIGALRM信號在進程失去CPU的時候就已經發送過來。為了防止這個現象出現,我們可以先將該信號阻塞,將其“抓住”,再在解除阻塞的時候立刻調用pause函數掛起等待。這樣即使在調用alarm就失去CPU,也可以在進程重新獲得CPU時將抓到的SIGALRM信號重新“放出來”,并將之后的pause函數喚醒。
但在解除阻塞與pause等待掛起信號之間,還是有可能失去CPU,除非將這兩個步驟做成一個“原子操作”。Linux系統提供的sigsuspend函數就具備這個功能。所以,在時序要求比較嚴格的場合下都應該使用sigsuspend函數,而非pause函數。
函數原型:
- int sigsuspend(const sigset_t *mask);
函數作用:掛起等待信號;
函數參數:mask,傳入參數,sigsuspend函數調用期間,進程信號屏蔽字由參數mask指定。
具體用法:可將某個信號(如SIGALRM)從臨時信號屏蔽字mask中刪除,也就是在調用sigsuspend函數時對該信號解除屏蔽,然后掛起等待信號。但我們此時已經改變了進程的信號屏蔽字,所以調用完sigsuspend函數之后,應將進程的信號屏蔽字恢復原樣。
- #include <unistd.h>
- #include <signal.h>
- #include <stdio.h>
- void sig_alrm(int signo)
- {
- /* nothing to do */
- }
- unsigned int mysleep(unsigned int nsecs)
- {
- struct sigaction newact, oldact;
- sigset_t newmask, oldmask, suspmask;
- unsigned int unslept;
- //1.為SIGALRM設置捕捉函數,一個空函數
- newact.sa_handler = sig_alrm;
- sigemptyset(&newact.sa_mask);
- newact.sa_flags = 0;
- sigaction(SIGALRM, &newact, &oldact);
- //2.設置阻塞信號集,阻塞SIGALRM信號
- sigemptyset(&newmask);
- sigaddset(&newmask, SIGALRM);
- sigprocmask(SIG_BLOCK, &newmask, &oldmask); //信號屏蔽字 mask
- //3.定時n秒,到時后可以產生SIGALRM信號
- alarm(nsecs);
- /*4.構造一個調用sigsuspend臨時有效的阻塞信號集,
- * 在臨時阻塞信號集里解除SIGALRM的阻塞*/
- suspmask = oldmask;
- sigdelset(&suspmask, SIGALRM);
- /*5.sigsuspend調用期間,采用臨時阻塞信號集suspmask替換原有阻塞信號集
- * 這個信號集中不包含SIGALRM信號,同時掛起等待,
- * 當sigsuspend被信號喚醒返回時,恢復原有的阻塞信號集*/
- sigsuspend(&suspmask);
- unslept = alarm(0);
- //6.恢復SIGALRM原有的處理動作,呼應前面注釋1
- sigaction(SIGALRM, &oldact, NULL);
- //7.解除對SIGALRM的阻塞,呼應前面注釋2
- sigprocmask(SIG_SETMASK, &oldmask, NULL);
- return(unslept);
- }
- int main(void)
- {
- while(1){
- mysleep(2);
- printf("Two seconds passed\n");
- }
- return 0;
- }
##可重入函數/不可重入函數
一個函數在被調用執行期間尚未調用結束的時候,由于某種時序,該函數又被重復調用,這種情況稱為「重入」。如果從信號處理程序返回,則繼續執行進程斷點處的正常指令序列,從重新恢復到斷點重新執行的過程中,函數所依賴的環境沒有發生改變,就說這個函數是可重入的,反之就是不可重入的。
如果要將函數做成可重入函數,則函數內不能含有全局變量及static變量,也不能使用malloc、free。
本文授權轉載自公眾號「良許Linux」。良許,世界500強外企Linux開發工程師,公眾號里分享大量Linux干貨,歡迎關注!