成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

框架篇:Linux網絡I/O+Reactor模型

系統 Linux
網絡I/O,可以理解為網絡上的數據流。通常我們會基于socket與遠端建立一條TCP或者UDP通道,然后進行讀寫。

[[354886]]

本文轉載自微信公眾號「潛行前行」,作者cscw 。轉載本文請聯系潛行前行公眾號。   

前言

網絡I/O,可以理解為網絡上的數據流。通常我們會基于socket與遠端建立一條TCP或者UDP通道,然后進行讀寫。單個socket時,使用一個線程即可高效處理;然而如果是10K個socket連接,或者更多,我們如何做到高性能處理?

  • 基本概念介紹
  • 網絡I/O的讀寫過程
  • linux下的五種網絡I/O模型
  • 多路復用I/O深入理解一波
  • Reactor模型
  • Proacotr模型

基本概念介紹

  • 進程(線程)切換

所有系統都有調度進程的能力,它可以掛起一個當前正在運行的進程,并恢復之前掛起的進程

  • 進程(線程)的阻塞

運行中的進程,有時會等待其他事件的執行完成,比如等待鎖,請求I/O的讀寫;進程在等待過程會被系統自動執行阻塞,此時進程不占用CPU

  • 文件描述符

在Linux,文件描述符是一個用于表述指向文件引用的抽象化概念,它是一個非負整數。當程序打開一個現有文件或者創建一個新文件時,內核向進程返回一個文件描述符

  • linux信號處理

Linux進程運行中可以接受來自系統或者進程的信號值,然后根據信號值去運行相應捕捉函數;信號相當于是硬件中斷的軟件模擬

在零拷貝機制篇章已介紹過 用戶空間和內核空間和緩沖區,這里就省略了

網絡IO的讀寫過程

  • 當在用戶空間發起對socket套接字的讀操作時,會導致上下文切換,用戶進程阻塞(R1)等待網絡數據流到來,從網卡復制到內核;(R2)然后從內核緩沖區向用戶進程緩沖區復制。此時進程切換恢復,處理拿到的數據
  • 這里我們給socket讀操作的第一階段起個別名R1,第二階段稱為R2
  • 當在用戶空間發起對socket的send操作時,導致上下文切換,用戶進程阻塞等待(1)數據從用戶進程緩沖區復制到內核緩沖區。數據copy完成,此時進程切換恢復

linux五種網絡IO模型

阻塞式I/O (blocking IO)

  1. ssize_t recvfrom(int sockfd,void *buf,size_t len,unsigned int flags, struct sockaddr *from,socket_t *fromlen); 

 

  • 最基礎的I/O模型就是阻塞I/O模型,也是最簡單的模型。所有的操作都是順序執行的
  • 阻塞IO模型中,用戶空間的應用程序執行一個系統調用(recvform),會導致應用程序被阻塞,直到內核緩沖區的數據準備好,并且將數據從內核復制到用戶進程。最后進程才被系統喚醒處理數據
  • 在R1、R2連續兩個階段,整個進程都被阻塞

非阻塞式I/O (nonblocking IO)

 

  • 非阻塞IO也是一種同步IO。它是基于輪詢(polling)機制實現,在這種模型中,套接字是以非阻塞的形式打開的。就是說I/O操作不會立即完成,但是I/O操作會返回一個錯誤代碼(EWOULDBLOCK),提示操作未完成
  • 輪詢檢查內核數據,如果數據未準備好,則返回EWOULDBLOCK。進程再繼續發起recvfrom調用,當然你可以暫停去做其他事
  • 直到內核數據準備好,再拷貝數據到用戶空間,然后進程拿到非錯誤碼數據,接著進行數據處理。需要注意,拷貝數據整個過程,進程仍然是屬于阻塞的狀態
  • 進程在R2階段阻塞,雖然在R1階段沒有被阻塞,但是需要不斷輪詢

多路復用I/O (IO multiplexing)

 

  • 一般后端服務都會存在大量的socket連接,如果一次能查詢多個套接字的讀寫狀態,若有任意一個準備好,那就去處理它,效率會高很多。這就是“I/O多路復用”,多路是指多個socket套接字,復用是指復用同一個進程
  • linux提供了select、poll、epoll等多路復用I/O的實現方式
  • select或poll、epoll是阻塞調用
  • 與阻塞IO不同,select不會等到socket數據全部到達再處理,而是有了一部分socket數據準備好就會恢復用戶進程來處理。怎么知道有一部分數據在內核準備好了呢?答案:交給了系統系統處理吧
  • 進程在R1、R2階段也是阻塞;不過在R1階段有個技巧,在多進程、多線程編程的環境下,我們可以只分配一個進程(線程)去阻塞調用select,其他線程不就可以解放了嗎

信號驅動式I/O (SIGIO)

 

  • 需要提供一個信號捕捉函數,并和socket套接字關聯;發起sigaction調用之后進程就能解放去處理其他事
  • 當數據在內核準備好后,進程會收到一個SIGIO信號,繼而中斷去運行信號捕捉函數,調用recvfrom把數據從內核讀取到用戶空間,再處理數據
  • 可以看出用戶進程是不會阻塞在R1階段,但R2還是會阻塞等待

異步IO (POSIX的aio_系列函數)

 

  • 相對同步IO,異步IO在用戶進程發起異步讀(aio_read)系統調用之后,無論內核緩沖區數據是否準備好,都不會阻塞當前進程;在aio_read系統調用返回后進程就可以處理其他邏輯
  • socket數據在內核就緒時,系統直接把數據從內核復制到用戶空間,然后再使用信號通知用戶進程
  • R1、R2兩階段時進程都是非阻塞的

多路復用IO深入理解一波

select

  1. int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout); 

1)使用copy_from_user從用戶空間拷貝fd_set到內核空間

2)注冊回調函數__pollwait

3)遍歷所有fd,調用其對應的poll方法(對于socket,這個poll方法是sock_poll,sock_poll根據情況會調用到tcp_poll,udp_poll或者datagram_poll)

4)以tcp_poll為例,其核心實現就是__pollwait,也就是上面注冊的回調函數

5)__pollwait的主要工作就是把current(當前進程)掛到設備的等待隊列中,不同的設備有不同的等待隊列,對于tcp_poll來說,其等待隊列是sk->sk_sleep(注意把進程掛到等待隊列中并不代表進程已經睡眠了)。在設備收到一條消息(網絡設備)或填寫完文件數據(磁盤設備)后,會喚醒設備等待隊列上睡眠的進程,這時current便被喚醒了

6)poll方法返回時會返回一個描述讀寫操作是否就緒的mask掩碼,根據這個mask掩碼給fd_set賦值

7)如果遍歷完所有的fd,還沒有返回一個可讀寫的mask掩碼,則會調用schedule_timeout是調用select的進程(也就是current)進入睡眠

8) 當設備驅動發生自身資源可讀寫后,會喚醒其等待隊列上睡眠的進程。如果超過一定的超時時間(timeout指定),還是沒人喚醒,則調用select的進程會重新被喚醒獲得CPU,進而重新遍歷fd,判斷有沒有就緒的fd

9)把fd_set從內核空間拷貝到用戶空間

select的缺點

每次調用select,都需要把fd集合從用戶態拷貝到內核態,這個開銷在fd很多時會很大

同時每次調用select都需要在內核遍歷傳遞進來的所有fd,這個開銷在fd很多時也很大

select支持的文件描述符數量太小了,默認是1024

epoll

  1. int epoll_create(int size);   
  2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);   
  3. int epoll_wait(int epfd, struct epoll_event *events,int maxevents, int timeout);  
  • 調用epoll_create,會在內核cache里建個紅黑樹用于存儲以后epoll_ctl傳來的socket,同時也會再建立一個rdllist雙向鏈表用于存儲準備就緒的事件。當epoll_wait調用時,僅查看這個rdllist雙向鏈表數據即可
  • epoll_ctl在向epoll對象中添加、修改、刪除事件時,是在rbr紅黑樹中操作的,非常快
  • 添加到epoll中的事件會與設備(如網卡)建立回調關系,設備上相應事件的發生時會調用回調方法,把事件加進rdllist雙向鏈表中;這個回調方法在內核中叫做ep_poll_callback

epoll的兩種觸發模式

epoll有EPOLLLT和EPOLLET兩種觸發模式,LT是默認的模式,ET是“高速”模式(只支持no-block socket)

  • LT(水平觸發)模式下,只要這個文件描述符還有數據可讀,每次epoll_wait都會觸發它的讀事件
  • ET(邊緣觸發)模式下,檢測到有I/O事件時,通過 epoll_wait 調用會得到有事件通知的文件描述符,對于文件描述符,如可讀,則必須將該文件描述符一直讀到空(或者返回EWOULDBLOCK),否則下次的epoll_wait不會觸發該事件

epoll相比select的優點

解決select三個缺點

  • 對于第一個缺點:epoll的解決方案在epoll_ctl函數中。每次注冊新的事件到epoll句柄中時(在epoll_ctl中指定EPOLL_CTL_ADD),會把所有的fd拷貝進內核,而不是在epoll_wait的時候重復拷貝。epoll保證了每個fd在整個過程中只會拷貝一次(epoll_wait不需要復制)
  • 對于第二個缺點:epoll為每個fd指定一個回調函數,當設備就緒,喚醒等待隊列上的等待者時,就會調用這個回調函數,而這個回調函數會把就緒的fd加入一個就緒鏈表。epoll_wait的工作實際上就是在這個就緒鏈表中查看有沒有就緒的fd(不需要遍歷)
  • 對于第三個缺點:epoll沒有這個限制,它所支持的FD上限是最大可以打開文件的數目,這個數字一般遠大于2048,舉個例子,在1GB內存的機器上大約是10萬左右,一般來說這個數目和系統內存關系很大

epoll的高性能

  • epoll使用了紅黑樹來保存需要監聽的文件描述符事件,epoll_ctl增刪改操作快速
  • epoll不需要遍歷就能獲取就緒fd,直接返回就緒鏈表即可
  • linux2.6 之后使用了mmap技術,數據不在需要從內核復制到用戶空間,零拷貝

關于epoll的IO模型是同步異步的疑問

概念定義

  • 同步I/O操作:導致請求進程阻塞,直到I/O操作完成
  • 異步I/O操作:不導致請求進程阻塞,異步只用處理I/O操作完成后的通知,并不主動讀寫數據,由系統內核完成數據的讀寫
  • 阻塞,非阻塞:進程/線程要訪問的數據是否就緒,進程/線程是否需要等待

異步IO的概念是要求無阻塞I/O調用。前面有介紹到I/O操作分兩階段:R1等待數據準備好。R2從內核到進程拷貝數據。雖然epoll在2.6內核之后采用mmap機制,使得其在R2階段不需要復制,但是它在R1還是阻塞的。因此歸類到同步IO

Reactor模型

Reactor的中心思想是將所有要處理的I/O事件注冊到一個中心I/O多路復用器上,同時主線程/進程阻塞在多路復用器上;一旦有I/O事件到來或是準備就緒,多路復用器返回,并將事先注冊的相應I/O事件分發到對應的處理器中

相關概念介紹:

  • 事件:就是狀態;比如:讀就緒事件指的是我們可以從內核讀取數據的狀態
  • 事件分離器:一般會把事件的等待發生交給epoll、select;而事件的到來是隨機,異步的,所以需要循環調用epoll,在框架里對應封裝起來的模塊就是事件分離器(簡單理解為對epoll封裝)
  • 事件處理器:事件發生后需要進程或線程去處理,這個處理者就是事件處理器,一般和事件分離器是不同的線程

Reactor的一般流程

  • 1)應用程序在事件分離器注冊讀寫就緒事件和讀寫就緒事件處理器
  • 2)事件分離器等待讀寫就緒事件發生
  • 3)讀寫就緒事件發生,激活事件分離器,分離器調用讀寫就緒事件處理器
  • 4)事件處理器先從內核把數據讀取到用戶空間,然后再處理數據

 

單線程 + Reactor

 

多線程 + Reactor

 

多線程 + 多個Reactor

 

Proactor模型的一般流程

1)應用程序在事件分離器注冊讀完成事件和讀完成事件處理器,并向系統發出異步讀請求

2)事件分離器等待讀事件的完成

3)在分離器等待過程中,系統利用并行的內核線程執行實際的讀操作,并將數據復制進程緩沖區,最后通知事件分離器讀完成到來

4)事件分離器監聽到讀完成事件,激活讀完成事件的處理器

5)讀完成事件處理器直接處理用戶進程緩沖區中的數據

 

Proactor和Reactor的區別

Proactor是基于異步I/O的概念,而Reactor一般則是基于多路復用I/O的概念

Proactor不需要把數據從內核復制到用戶空間,這步由系統完成

歡迎指正文中錯誤

參考文章

聊聊Linux 五種IO模型[1]

網絡io模型[2]

網絡IO[3]

5種網絡IO模型[4]

epoll原理詳解及epoll反應堆模型[5]

參考資料

 

[1]聊聊Linux 五種IO模型: https://www.jianshu.com/p/486b0965c296[2]網絡io模型: https://www.jianshu.com/p/a95bcb116765[3]網絡IO: https://www.cnblogs.com/hesper/p/11547263.html[4]5種網絡IO模型: https://www.cnblogs.com/findumars/p/6361627.html[5]epoll原理詳解及epoll反應堆模型: https://blog.csdn.net/daaikuaichuan/article/details/83862311

 

責任編輯:武曉燕 來源: 潛行前行
相關推薦

2020-06-03 17:30:42

LinuxIO

2010-06-25 09:47:29

Linux系統監控

2022-01-04 11:11:32

Redis單線程Reactor

2021-02-10 08:09:48

Netty網絡多路復用

2014-07-28 16:47:41

linux性能

2021-05-17 11:14:36

網絡請求ajaxpromise

2023-12-05 17:44:24

reactor網絡

2020-10-13 07:51:03

五種IO模型

2011-01-14 09:25:28

LinuxIO機制

2021-01-19 06:43:10

Netty框架網絡技術

2021-10-13 06:49:15

網絡 IO

2021-02-22 17:06:58

Linux改動代碼

2018-10-08 15:22:36

IO模型

2017-01-19 19:14:20

Linux重定向命令

2019-09-12 08:58:26

LinuxUNIX操作系統

2021-11-08 17:03:13

IO模型

2017-01-19 19:24:29

Linux重定向

2019-02-25 08:40:28

Linux磁盤IO

2022-04-23 16:30:22

Linux磁盤性能

2017-03-25 21:33:33

Linux調度器
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人网在线看 | av在线一区二区 | 狠狠涩 | 日韩中文字幕视频 | 国产aa | 一区二区精品视频 | 欧美在线观看一区二区 | 国产成人综合网 | 美女国产精品 | 精品欧美一区二区在线观看视频 | 四虎影院在线免费观看 | 亚洲第一网站 | 黄色一级特级片 | 国产精品99久久久久久宅男 | 国产一区二区在线视频 | 秋霞电影院午夜伦 | 精品国产一二三区 | 欧美一级淫片免费视频黄 | 中文字幕免费在线观看 | 91精品国产91久久久久游泳池 | 国产成人综合在线 | 色狠狠一区 | 国产午夜精品视频 | 日韩欧美高清dvd碟片 | 国产精品a一区二区三区网址 | 亚洲成人精品影院 | 国产免费一区二区 | 91爱爱·com| 久久久久久久久久一区二区 | 超碰精品在线 | 成人网av | 黄色精品| 日韩av在线免费 | 日韩a视频 | 国产精品亚洲精品 | 全免费a级毛片免费看视频免费下 | 国产在线二区 | 精品久久久久久久 | 日韩电影免费在线观看中文字幕 | 欧美精品久久 | 欧美在线观看免费观看视频 |