陳皓:一個fork的面試題
前兩天有人問了個關于Unix的fork()系統調用的面試題,這個題正好是我大約十年前找工作時某公司問我的一個題,我覺得比較有趣,寫篇文章與大家分享一下。這個題是這樣的:
題目:請問下面的程序一共輸出多少個“-”?
- #include <stdio.h>
- #include <sys/types.h>
- #include <unistd.h>
- int main(void)
- {
- int i;
- for(i=0; i<2; i++){
- fork();
- printf("-");
- }
- return 0;
- }
如果你對fork()的機制比較熟悉的話,這個題并不難,輸出應該是6個“-”,但是,實際上這個程序會很tricky地輸出8個“-”。
要講清這個題,我們首先需要知道fork()系統調用的特性,
●fork()系統調用是Unix下以自身進程創建子進程的系統調用,一次調用,兩次返回,如果返回是0,則是子進程,如果返回值>0,則是父進程(返回值是子進程的pid),這是眾為周知的。
●還有一個很重要的東西是,在fork()的調用處,整個父進程空間會原模原樣地復制到子進程中,包括指令,變量值,程序調用棧,環境變量,緩沖區,等等。
所以,上面的那個程序為什么會輸入8個“-”,這是因為printf(“-”);語句有buffer,所以,對于上述程序,printf(“-”);把“-”放到了緩存中,并沒有真正的輸出(參看《C語言的迷題》中的第一題),在fork的時候,緩存被復制到了子進程空間,所以,就多了兩個,就成了8個,而不是6個。
另外,多說一下,我們知道,Unix下的設備有“塊設備”和“字符設備”的概念,所謂塊設備,就是以一塊一塊的數據存取的設備,字符設備是一次存取一個字符的設備。磁盤、內存都是塊設備,字符設備如鍵盤和串口。塊設備一般都有緩存,而字符設備一般都沒有緩存。
對于上面的問題,我們如果修改一下上面的printf的那條語句為:
- printf("-\n");
或是
- printf("-");
- fflush(stdout);
就沒有問題了(就是6個“-”了),因為程序遇到“\n”,或是EOF,或是緩中區滿,或是文件描述符關閉,或是主動flush,或是程序退出,就會把數據刷出緩沖區。需要注意的是,標準輸出是行緩沖,所以遇到“\n”的時候會刷出緩沖區,但對于磁盤這個塊設備來說,“\n”并不會引起緩沖區刷出的動作,那是全緩沖,你可以使用setvbuf來設置緩沖區大小,或是用fflush刷緩存。
我估計有些朋友可能對于fork()還不是很了解,那么我們把上面的程序改成下面這樣:
- #include <stdio.h>
- #include <sys/types.h>
- #include <unistd.h>
- int main(void)
- {
- int i;
- for(i=0; i<2; i++){
- fork();
- //注意:下面的printf有“\n”
- printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i);
- }
- sleep(10); //讓進程停留十秒,這樣我們可以用pstree查看一下進程樹
- return 0;
- }
于是,上面這段程序會輸出下面的結果,(注:編譯出的可執行的程序名為fork)
- ppid=8858, pid=8518, i=0
- ppid=8858, pid=8518, i=1
- ppid=8518, pid=8519, i=0
- ppid=8518, pid=8519, i=1
- ppid=8518, pid=8520, i=1
- ppid=8519, pid=8521, i=1
- $ pstree -p | grep fork
- |-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521)
面對這樣的圖你可能還是看不懂,沒事,我好事做到底,畫個圖給你看看:

陳皓:一個 fork 的面試題
注意:上圖中的我用了幾個色彩,相同顏色的是同一個進程。于是,我們的pstree的圖示就可以成為下面這個樣子:(下圖中的顏色與上圖對應)
這樣,對于printf(“-”);這個語句,我們就可以很清楚的知道,哪個子進程復制了父進程標準輸出緩中區里的的內容,而導致了多次輸出了。(如下圖所示,就是我陰影并雙邊框了那兩個子進程)
現在你明白了吧。(另,對于圖中的我本人拙劣的配色,請見諒!)