一個多線程的簡單例子讓你看清線程調度的隨機性
線程調度的幾個基本知識點
多線程并發執行時有很多同學捋不清楚調度的隨機性會導致哪些問題,要知道如果訪問臨界資源不加鎖會導致一些突發情況發生甚至死鎖。
關于線程調度,需要深刻了解以下幾個基礎知識點:
調度的最小單位是輕量級進程【比如我們編寫的hello world最簡單的C程序,執行時就是一個輕量級進程】或者線程;
每個線程都會分配一個時間片,時間片到了就會執行下一個線程;
線程的調度有一定的隨機性,無法確定什么時候會調度;
在同一個進程內,創建的所有線程除了線程內部創建的局部資源,進程創建的其他資源所有線程共享;比如:主線程和子線程都可以訪問全局變量,打開的文件描述符等。
實例
再多的理論不如一個形象的例子來的直接。
預期代碼時序
假定我們要實現一個多線程的實例,預期程序執行時序如下:
期待時序
期待的功能時序:
- 主進程創建子線程,子線程函數function();
- 主線程count自加,并分別賦值給value1,value2;
- 時間片到了后切換到子線程,子線程判斷value1、value2值是否相同,如果不同就打印信息value1,value2,count的值,但是因為主線程將count先后賦值給了value1,value2,所以value1,value2的值應該永遠不相同,所以不應該打印任何內容;
- 重復2、3步驟。
代碼1
好了,現在我們按照這個時序編寫代碼如下:
- 1 #include <stdio.h>
- 2 #include <stdlib.h>
- 3 #include <string.h>
- 4 #include <pthread.h>
- 5 #include <unistd.h>
- 6
- 7 unsigned int value1,value2, count=0;
- 8 void *function(void *arg);
- 9 int main(int argc, char *argv[])
- 10 {
- 11 pthread_t a_thread;
- 12
- 13 if (pthread_create(&a_thread, NULL, function, NULL) < 0)
- 14 {
- 15 perror("fail to pthread_create");
- 16 exit(-1);
- 17 }
- 18 while ( 1 )
- 19 {
- 20 count++;
- 21 value1 = count;
- 22 value2 = count;
- 23 }
- 24 return 0;
- 25 }
- 26
- 27 void *function(void *arg)
- 28 {
- 29 while ( 1 )
- 30 {
- 31 if (value1 != value2)
- 32 {
- 33 printf("count=%d , value1=%d, value2=%d\n", count, value1, value2);
- 34 usleep(100000);
- 35 }
- 36 }
- 37 return NULL;
- 38 }
乍一看,該程序應該可以滿足我們的需要,并且程序運行的時候不應該打印任何內容,但是實際運行結果出乎我們意料。
編譯運行:
- gcc test.c -o run -lpthread
- ./run
代碼1執行結果
執行結果:
可以看到子程序會隨機打印一些信息,為什么還有這個執行結果呢?其實原因很簡單,就是我們文章開頭所說的,線程調度具有䘺隨機性,我們無法規定讓內核何時調度某個線程。有打印信息,那么這說明此時value1和value2的值是不同的,那也說明了調度子線程的時候,是在主線程向value1和value2之間的位置調度的。
代碼1執行的實際時序
實際上代碼的執行時序如下所示:
如上圖,在某一時刻,當程序走到**value2 = count;**這個位置的時候,內核對線程進行了調度,于是子進程在判斷value1和value2的值的時候,發現這兩個變量值不相同,就有了打印信息。
該程序在下面這兩行代碼之間調度的幾率還是很大的。
- value1 = count;
- value2 = count;
解決方法
如何來解決并發導致的程序沒有按預期執行的問題呢?對于線程來說,常用的方法有posix信號量、互斥鎖,條件變量等,下面我們以互斥鎖為例,講解如何避免代碼1的問題的出現。
互斥鎖的定義和初始化:
- pthread_mutex_t mutex;
- pthread_mutex_init(&mutex, NULL)
申請釋放鎖:
- pthread_mutex_lock(&mutex);
- pthread_mutex_unlock(&mutex);
原理:進入臨界區之前先申請鎖,如果能獲得鎖就繼續往下執行, 如果申請不到,就休眠,直到其他線程釋放該鎖為止。
代碼2
- 1 #include <stdio.h>
- 2 #include <stdlib.h>
- 3 #include <string.h>
- 4 #include <pthread.h>
- 5 #include <unistd.h>
- 6 #define _LOCK_
- 7 unsigned int value1,value2, count=0;
- 8 pthread_mutex_t mutex;
- 9 void *function(void *arg);
- 10
- 11 int main(int argc, char *argv[])
- 12 {
- 13 pthread_t a_thread;
- 14
- 15 if (pthread_mutex_init(&mutex, NULL) < 0)
- 16 {
- 17 perror("fail to mutex_init");
- 18 exit(-1);
- 19 }
- 20
- 21 if (pthread_create(&a_thread, NULL, function, NULL) < 0)
- 22 {
- 23 perror("fail to pthread_create");
- 24 exit(-1);
- 25 }
- 26 while ( 1 )
- 27 {
- 28 count++;
- 29 #ifdef _LOCK_
- 30 pthread_mutex_lock(&mutex);
- 31 #endif
- 32 value1 = count;
- 33 value2 = count;
- 34 #ifdef _LOCK_
- 35 pthread_mutex_unlock(&mutex);
- 36 #endif
- 37 }
- 38 return 0;
- 39 }
- 0
- 41 void *function(void *arg)
- 42 {
- 43 while ( 1 )
- 44 {
- 45 #ifdef _LOCK_
- 46 pthread_mutex_lock(&mutex);
- 47 #endif
- 48
- 49 if (value1 != value2)
- 50 {
- 51 printf("count=%d , value1=%d, value2=%d\n", count, value1, value2);
- 52 usleep(100000);
- 53 }
- 54 #ifdef _LOCK_
- 55 pthread_mutex_unlock(&mutex);
- 56 #endif
- 57 }
- 58 return NULL;
- 59 }
如上述代碼所示:主線程和子線程要訪問臨界資源value1,value2時,都必須先申請鎖,獲得鎖之后才可以訪問臨界資源,訪問完畢再釋放互斥鎖。該代碼執行之后就不會打印任何信息。我們來看下,如果程序在下述代碼之間產生調度時,程序的時序圖。
- value1 = count;
- value2 = count;
時序圖如下:
如上圖所示:
- 時刻n,主線程獲得mutex,從而進入臨界區;
- 時刻n+1,時間片到了,切換到子線程;
- n+2時刻子線程申請不到鎖mutex,所以放棄cpu,進入休眠;
- n+3時刻,主線程釋放mutex,離開臨界區,并喚醒阻塞在mutex的子線程,子線程申請到mutex,進入臨界區;
- n+4時刻,子線程離開臨界區,釋放mutex。
可以看到,加鎖之后,即使主線程在value2 =count; 之前產生了調度,子線程由于獲取不到mutex,會進入休眠,只有主線程出了臨界區,子線程才能獲得mutex,訪問value1和value2,就永遠不會打印信息,就實現了我們預期的代碼時序。
總結
實際項目中,可能程序的并發的情況可能會更加復雜,比如多個cpu上運行的任務之間,cpu運行的任務和中斷之間,中斷和中斷之間,都有可能并發。
有些調度的概率雖然很小,但是不代表不發生,而且由于資源同步互斥導致的問題,很難復現,縱觀Linux內核代碼,所有的臨界資源都會對應鎖。
多閱讀Linux內核源碼,學向大神學習,與大神神交。
正所謂代碼讀百遍,其義自見!熟讀代碼千萬行,不會編寫也會抄!
關于內核和應用程序的同步互斥的知識點,可以查看一口君的其他文章。
本文轉載自微信公眾號「一口Linux」,可以通過以下二維碼關注。轉載本文請聯系一口Linux公眾號。