成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一文講透 “進程、線程、協(xié)程”

開發(fā) 前端
本文從操作系統(tǒng)原理出發(fā)結(jié)合代碼實踐講解了以下內(nèi)容:什么是進程,線程和協(xié)程?它們之間的關(guān)系是什么?為什么說Python中的多線程是偽多線程?不同的應(yīng)用場景該如何選擇技術(shù)方案?

 [[336201]]

本文從操作系統(tǒng)原理出發(fā)結(jié)合代碼實踐講解了以下內(nèi)容:

  • 什么是進程,線程和協(xié)程?
  • 它們之間的關(guān)系是什么?
  • 為什么說Python中的多線程是偽多線程?
  • 不同的應(yīng)用場景該如何選擇技術(shù)方案?
  • ...

什么是進程

進程-操作系統(tǒng)提供的抽象概念,是系統(tǒng)進行資源分配和調(diào)度的基本單位,是操作系統(tǒng)結(jié)構(gòu)的基礎(chǔ)。程序是指令、數(shù)據(jù)及其組織形式的描述,進程是程序的實體。程序本身是沒有生命周期的,它只是存在磁盤上的一些指令,程序一旦運行就是進程。

當程序需要運行時,操作系統(tǒng)將代碼和所有靜態(tài)數(shù)據(jù)記載到內(nèi)存和進程的地址空間(每個進程都擁有唯一的地址空間,見下圖所示)中,通過創(chuàng)建和初始化棧(局部變量,函數(shù)參數(shù)和返回地址)、分配堆內(nèi)存以及與IO相關(guān)的任務(wù),當前期準備工作完成,啟動程序,OS將CPU的控制權(quán)轉(zhuǎn)移到新創(chuàng)建的進程,進程開始運行。

 

 

 

操作系統(tǒng)對進程的控制和管理通過PCB(Processing Control Block),PCB通常是系統(tǒng)內(nèi)存占用區(qū)中的一個連續(xù)存區(qū),它存放著操作系統(tǒng)用于描述進程情況及控制進程運行所需的全部信息(進程標識號,進程狀態(tài),進程優(yōu)先級,文件系統(tǒng)指針以及各個寄存器的內(nèi)容等),進程的PCB是系統(tǒng)感知進程的唯一實體。

一個進程至少具有5種基本狀態(tài):初始態(tài)、執(zhí)行狀態(tài)、等待(阻塞)狀態(tài)、就緒狀態(tài)、終止狀態(tài)

  • 初始狀態(tài):進程剛被創(chuàng)建,由于其他進程正占有CPU所以得不到執(zhí)行,只能處于初始狀態(tài)。
  • 執(zhí)行狀態(tài):任意時刻處于執(zhí)行狀態(tài)的進程只能有一個。
  • 就緒狀態(tài):只有處于就緒狀態(tài)的經(jīng)過調(diào)度才能到執(zhí)行狀態(tài)
  • 等待狀態(tài):進程等待某件事件完成
  • 停止狀態(tài):進程結(jié)束

進程間的切換

無論是在多核還是單核系統(tǒng)中,一個CPU看上去都像是在并發(fā)的執(zhí)行多個進程,這是通過處理器在進程間切換來實現(xiàn)的。

操作系統(tǒng)對把CPU控制權(quán)在不同進程之間交換執(zhí)行的機制成為上下文切換(context switch),即保存當前進程的上下文,恢復新進程的上下文,然后將CPU控制權(quán)轉(zhuǎn)移到新進程,新進程就會從上次停止的地方開始。因此,進程是輪流使用CPU的,CPU被若干進程共享,使用某種調(diào)度算法來決定何時停止一個進程,并轉(zhuǎn)而為另一個進程提供服務(wù)。

  • 單核CPU雙進程的情況

 

 

 

進程直接特定的機制和遇到I/O中斷的情況下,進行上下文切換,輪流使用CPU資源

  • 雙核CPU雙進程的情況

 

 

 

每一個進程獨占一個CPU核心資源,在處理I/O請求的時候,CPU處于阻塞狀態(tài)

進程間數(shù)據(jù)共享

系統(tǒng)中的進程與其他進程共享CPU和主存資源,為了更好的管理主存,現(xiàn)在系統(tǒng)提供了一種對主存的抽象概念,即為虛擬存儲器(VM)。它是一個抽象的概念,它為每一個進程提供了一個假象,即每個進程都在獨占地使用主存。

虛擬存儲器主要提供了三個能力:

  • 將主存看成是一個存儲在磁盤上的高速緩存,在主存中只保存活動區(qū)域,并根據(jù)需要在磁盤和主存之間來回傳送數(shù)據(jù),通過這種方式,更高效地使用主存
  • 為每個進程提供了一致的地址空間,從而簡化了存儲器管理
  • 保護了每個進程的地址空間不被其他進程破壞

由于進程擁有自己獨占的虛擬地址空間,CPU通過地址翻譯將虛擬地址轉(zhuǎn)換成真實的物理地址,每個進程只能訪問自己的地址空間。因此,在沒有其他機制(進程間通信)的輔助下,進程之間是無法共享數(shù)據(jù)的

  • 以python中multiprocessing為例

 

  1. import multiprocessing 
  2. import threading 
  3. import time 
  4.  
  5. n = 0 
  6.  
  7.  
  8. def count(num): 
  9.     global n 
  10.     for i in range(100000): 
  11.         n += i 
  12.     print("Process {0}:n={1},id(n)={2}".format(num, n, id(n))) 
  13.  
  14.  
  15. if __name__ == '__main__'
  16.     start_time = time.time() 
  17.      
  18.     process = list() 
  19.     for i in range(5): 
  20.         p = multiprocessing.Process(target=count, args=(i,)) # 測試多進程使用 
  21.         # p = threading.Thread(target=count, args=(i,))  # 測試多線程使用 
  22.         process.append(p) 
  23.  
  24.     for p in process: 
  25.         p.start() 
  26.  
  27.     for p in process: 
  28.         p.join() 
  29.  
  30.     print("Main:n={0},id(n)={1}".format(n, id(n))) 
  31.     end_time = time.time() 
  32.     print("Total time:{0}".format(end_time - start_time)) 
  • 結(jié)果

 

  1. Process 1:n=4999950000,id(n)=139854202072440 
  2. Process 0:n=4999950000,id(n)=139854329146064 
  3. Process 2:n=4999950000,id(n)=139854202072400 
  4. Process 4:n=4999950000,id(n)=139854201618960 
  5. Process 3:n=4999950000,id(n)=139854202069320 
  6. Main:n=0,id(n)=9462720 
  7. Total time:0.03138256072998047 

變量n在進程p{0,1,2,3,4}和主進程(main)中均擁有唯一的地址空間

什么是線程

線程-也是操作系統(tǒng)提供的抽象概念,是程序執(zhí)行中一個單一的順序控制流程,是程序執(zhí)行流的最小單元,是處理器調(diào)度和分派的基本單位。一個進程可以有一個或多個線程,同一進程中的多個線程將共享該進程中的全部系統(tǒng)資源,如虛擬地址空間,文件描述符和信號處理等等。但同一進程中的多個線程有各自的調(diào)用棧和線程本地存儲(如下圖所示)。

 

 

 

系統(tǒng)利用PCB來完成對進程的控制和管理。同樣,系統(tǒng)為線程分配一個線程控制塊TCB(Thread Control Block),將所有用于控制和管理線程的信息記錄在線程的控制塊中,TCB中通常包括:

  • 線程標志符
  • 一組寄存器
  • 線程運行狀態(tài)
  • 優(yōu)先級
  • 線程專有存儲區(qū)
  • 信號屏蔽

和進程一樣,線程同樣有五種狀態(tài):初始態(tài)、執(zhí)行狀態(tài)、等待(阻塞)狀態(tài)、就緒狀態(tài)和終止狀態(tài),線程之間的切換和進程一樣也需要上下文切換,這里不再贅述。

進程和線程之間有許多相似的地方,那它們之間到底有什么區(qū)別呢?

進程 VS 線程

  • 進程是資源的分配和調(diào)度的獨立單元。進程擁有完整的虛擬地址空間,當發(fā)生進程切換時,不同的進程擁有不同的虛擬地址空間。而同一進程的多個線程是可以共享同一地址空間
  • 線程是CPU調(diào)度的基本單元,一個進程包含若干線程。
  • 線程比進程小,基本上不擁有系統(tǒng)資源。線程的創(chuàng)建和銷毀所需要的時間比進程小很多
  • 由于線程之間能夠共享地址空間,因此,需要考慮同步和互斥操作
  • 一個線程的意外終止會影像整個進程的正常運行,但是一個進程的意外終止不會影像其他的進程的運行。因此,多進程程序安全性更高。

總之,多進程程序安全性高,進程切換開銷大,效率低;多線程程序維護成本高,線程切換開銷小,效率高。(python的多線程是偽多線程,下文中將詳細介紹)

什么是協(xié)程

協(xié)程(Coroutine,又稱微線程)是一種比線程更加輕量級的存在,協(xié)程不是被操作系統(tǒng)內(nèi)核所管理,而完全是由程序所控制。協(xié)程與線程以及進程的關(guān)系見下圖所示。

  • 協(xié)程可以比作子程序,但執(zhí)行過程中,子程序內(nèi)部可中斷,然后轉(zhuǎn)而執(zhí)行別的子程序,在適當?shù)臅r候再返回來接著執(zhí)行。協(xié)程之間的切換不需要涉及任何系統(tǒng)調(diào)用或任何阻塞調(diào)用
  • 協(xié)程只在一個線程中執(zhí)行,是子程序之間的切換,發(fā)生在用戶態(tài)上。而且,線程的阻塞狀態(tài)是由操作系統(tǒng)內(nèi)核來完成,發(fā)生在內(nèi)核態(tài)上,因此協(xié)程相比線程節(jié)省線程創(chuàng)建和切換的開銷
  • 協(xié)程中不存在同時寫變量沖突,因此,也就不需要用來守衛(wèi)關(guān)鍵區(qū)塊的同步性原語,比如互斥鎖、信號量等,并且不需要來自操作系統(tǒng)的支持。

協(xié)程適用于IO阻塞且需要大量并發(fā)的場景,當發(fā)生IO阻塞,由協(xié)程的調(diào)度器進行調(diào)度,通過將數(shù)據(jù)流yield掉,并且記錄當前棧上的數(shù)據(jù),阻塞完后立刻再通過線程恢復棧,并把阻塞的結(jié)果放到這個線程上去運行。

 

 

 

 

下面,將針對在不同的應(yīng)用場景中如何選擇使用Python中的進程,線程,協(xié)程進行分析。

如何選擇?

在針對不同的場景對比三者的區(qū)別之前,首先需要介紹一下python的多線程(一直被程序員所詬病,認為是"假的"多線程)。

那為什么認為Python中的多線程是“偽”多線程呢?

更換上面multiprocessing示例中, p=multiprocessing.Process(target=count,args=(i,))為 p=threading.Thread(target=count,args=(i,)),其他照舊,運行結(jié)果如下:

為了減少代碼冗余和文章篇幅,命名和打印不規(guī)則問題請忽略

 

  1. Process 0:n=5756690257,id(n)=140103573185600 
  2. Process 2:n=10819616173,id(n)=140103573185600 
  3. Process 1:n=11829507727,id(n)=140103573185600 
  4. Process 4:n=17812587459,id(n)=140103573072912 
  5. Process 3:n=14424763612,id(n)=140103573185600 
  6. Main:n=17812587459,id(n)=140103573072912 
  7. Total time:0.1056210994720459 
  • n是全局變量,Main的打印結(jié)果與線程相等,證明了線程之間是數(shù)據(jù)共享

但是,為什么多線程運行時間比多進程還要長?這與我們上面所說(線程的開銷<<進程的開銷)的嚴重不相符啊。這就是輪到Cpython(python默認的解釋器)中GIL(Global Interpreter Lock,全局解釋鎖)登場了。

什么是GIL

GIL來源于Python設(shè)計之初的考慮,為了數(shù)據(jù)安全(由于內(nèi)存管理機制中采用引用計數(shù))所做的決定。某個線程想要執(zhí)行,必須先拿到 GIL。因此,可以把 GIL 看作是“通行證”,并且在一個 Python進程中,GIL 只有一個,拿不到通行證的線程,就不允許進入 CPU 執(zhí)行。

Cpython解釋器在內(nèi)存管理中采用引用計數(shù),當對象的引用次數(shù)為0時,會將對象當作垃圾進行回收。設(shè)想這樣一種場景:

一個進程中含有兩個線程,分別為線程0和線程1,兩個線程全都引用對象a。當兩個線程同時對a發(fā)生引用(并未修改,不需要使用同步性原語),就會發(fā)生同時修改對象a的引用計數(shù)器,造成計數(shù)器引用少于實質(zhì)性的引用,當進行垃圾回收時,造成錯誤異常。因此,需要一把全局鎖(即為GIL)來保證對象引用計數(shù)的正確性和安全性。

無論是單核還是多核,一個進程永遠只能同時執(zhí)行一個線程(拿到 GIL 的線程才能執(zhí)行,如下圖所示),這就是為什么在多核CPU上,Python 的多線程效率并不高的根本原因。

 

 

 

 

那是不是在Python中遇到并發(fā)的需求就使用多進程就萬事大吉了呢?其實不然,軟件工程中有一句名言:沒有銀彈!

何時用?

常見的應(yīng)用場景不外乎三種:

  • CPU密集型:程序需要占用CPU進行大量的運算和數(shù)據(jù)處理;
  • I/O密集型:程序中需要頻繁的進行I/O操作;例如網(wǎng)絡(luò)中socket數(shù)據(jù)傳輸和讀取等;
  • CPU密集+I/O密集:以上兩種的結(jié)合

CPU密集型的情況可以對比以上multiprocessing和threading的例子,多進程的性能 > 多線程的性能。

下面主要解釋一下I/O密集型的情況。與I/O設(shè)備交互,目前最常用的解決方案就是DMA。

什么是DMA

DMA(Direct Memory Access)是系統(tǒng)中的一個特殊設(shè)備,它可以協(xié)調(diào)完成內(nèi)存到設(shè)備間的數(shù)據(jù)傳輸,中間過程不需要CPU介入。

以文件寫入為例:

  • 進程p1發(fā)出數(shù)據(jù)寫入磁盤文件的請求
  • CPU處理寫入請求,通過編程告訴DMA引擎數(shù)據(jù)在內(nèi)存的位置,要寫入數(shù)據(jù)的大小以及目標設(shè)備等信息
  • CPU處理其他進程p2的請求,DMA負責將內(nèi)存數(shù)據(jù)寫入到設(shè)備中
  • DMA完成數(shù)據(jù)傳輸,中斷CPU
  • CPU從p2上下文切換到p1,繼續(xù)執(zhí)行p1

 

 

 

 

Python多線程的表現(xiàn)(I/O密集型)

  • 線程Thread0首先執(zhí)行,線程Thread1等待(GIL的存在)
  • Thread0收到I/O請求,將請求轉(zhuǎn)發(fā)給DMA,DMA執(zhí)行請求
  • Thread1占用CPU資源,繼續(xù)執(zhí)行
  • CPU收到DMA的中斷請求,切換到Thread0繼續(xù)執(zhí)行

 

 

 

 

與進程的執(zhí)行模式相似,彌補了GIL帶來的不足,又由于線程的開銷遠遠小于進程的開銷,因此,在IO密集型場景中,多線程的性能更高

實踐是檢驗真理的唯一標準,下面將針對I/O密集型場景進行測試。

測試

  • 執(zhí)行代碼

 

  1. import multiprocessing 
  2. import threading 
  3. import time 
  4.  
  5.  
  6. def count(num): 
  7.     time.sleep(1)  ## 模擬IO操作 
  8.     print("Process {0} End".format(num)) 
  9.  
  10.  
  11. if __name__ == '__main__'
  12.     start_time = time.time() 
  13.     process = list() 
  14.     for i in range(5): 
  15.         p = multiprocessing.Process(target=count, args=(i,)) 
  16.         # p = threading.Thread(target=count, args=(i,)) 
  17.         process.append(p) 
  18.  
  19.     for p in process: 
  20.         p.start() 
  21.  
  22.     for p in process: 
  23.         p.join() 
  24.  
  25.     end_time = time.time() 
  26.     print("Total time:{0}".format(end_time - start_time)) 
  • 結(jié)果

 

  1. ## 多進程 
  2. Process 0 End 
  3. Process 3 End 
  4. Process 4 End 
  5. Process 2 End 
  6. Process 1 End 
  7. Total time:1.383193016052246 
  8. ## 多線程 
  9. Process 0 End 
  10. Process 4 End 
  11. Process 3 End 
  12. Process 1 End 
  13. Process 2 End 
  14. Total time:1.003425121307373 
  • 多線程的執(zhí)行效性能高于多進程

是不是認為這就結(jié)束了?遠還沒有呢。針對I/O密集型的程序,協(xié)程的執(zhí)行效率更高,因為它是程序自身所控制的,這樣將節(jié)省線程創(chuàng)建和切換所帶來的開銷。

以Python中asyncio應(yīng)用為依賴,使用async/await語法進行協(xié)程的創(chuàng)建和使用。

  • 程序代碼

 

  1. import time 
  2. import asyncio 
  3.  
  4.  
  5. async def coroutine(): 
  6.     await asyncio.sleep(1) ## 模擬IO操作 
  7.  
  8.  
  9. if __name__ == "__main__"
  10.     start_time = time.time() 
  11.  
  12.     loop = asyncio.get_event_loop() 
  13.     tasks = [] 
  14.     for i in range(5): 
  15.         task = loop.create_task(coroutine()) 
  16.         tasks.append(task) 
  17.  
  18.     loop.run_until_complete(asyncio.wait(tasks)) 
  19.     loop.close() 
  20.     end_time = time.time() 
  21.     print("total time:", end_time - start_time) 
  • 結(jié)果

 

  1. total time: 1.001854419708252 
  • 協(xié)程的執(zhí)行效性能高于多線程

總結(jié)

本文從操作系統(tǒng)原理出發(fā)結(jié)合代碼實踐講解了進程,線程和協(xié)程以及他們之間的關(guān)系。并且,總結(jié)和整理了Python實踐中針對不同的場景如何選擇對應(yīng)的方案,如下:

  • CPU密集型:多進程
  • IO密集型:多線程(協(xié)程維護成本較高,而且在讀寫文件方面效率沒有顯著提升)
  • CPU密集和IO密集:多進程+協(xié)程

 

責任編輯:華軒 來源: 程序員小灰
相關(guān)推薦

2020-03-26 09:18:54

高薪本質(zhì)因素

2020-07-16 09:02:45

aPaaS云計算aPaaS平臺

2024-08-13 17:09:00

架構(gòu)分庫分表開發(fā)

2025-01-13 12:00:00

反射Java開發(fā)

2020-12-01 11:34:14

Elasticsear

2021-01-18 13:05:52

Serverless Serverfull FaaS

2020-11-29 17:03:08

進程線程協(xié)程

2023-05-04 08:24:52

ChatGPT產(chǎn)品經(jīng)理工業(yè)革命

2023-11-09 08:41:25

DevOpsAIOps軟件

2024-08-07 10:54:59

正則表達式Java RegexJava

2024-05-31 13:23:19

OceanBase單機版架構(gòu)

2024-07-10 12:00:42

2020-05-20 09:55:42

Git底層數(shù)據(jù)

2020-04-07 11:10:30

Python數(shù)據(jù)線程

2021-06-29 12:10:00

CRC校驗碼C語言

2023-10-12 09:46:00

并發(fā)模型線程

2020-07-16 07:30:15

數(shù)據(jù)庫SQL技術(shù)

2024-11-07 22:57:30

2020-01-02 09:06:23

微服務(wù)數(shù)據(jù)框架

2023-05-11 08:16:13

可視化監(jiān)控工具Kafka
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 欧美亚洲一区二区三区 | 一区二区手机在线 | 四季久久免费一区二区三区四区 | wwwxxx日本在线观看 | 91视频在线看 | 国产黄色小视频在线观看 | 免费精品视频 | 久久亚洲一区 | 青青草综合网 | 日韩国产欧美一区 | 国产婷婷综合 | 亚洲一区二区在线视频 | 视频二区国产 | 人人干人人玩 | 久久久久久av | 国产成人a亚洲精品 | 久久综合欧美 | 成人国产在线视频 | gav成人免费播放视频 | 国产精品69av | 99精品久久99久久久久 | 亚洲欧美在线观看 | 欧美精品一区二区三区蜜桃视频 | 日韩精品久久久久 | 黄色片亚洲 | 精品日韩在线 | 欧美中文字幕一区二区三区亚洲 | 91视频a| 中文字幕在线一区二区三区 | 亚洲久久| 成人精品一区二区三区中文字幕 | 久久久久国产 | 一区二区在线不卡 | 亚洲伊人久久综合 | 国产精品精品3d动漫 | 国产一区二区三区四区在线观看 | 久久国| 久久99国产精品 | 欧美日韩视频在线第一区 | 精品亚洲一区二区三区 | 老妇激情毛片免费 |