成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

字節二面:為何還執著傳統數據復制,零拷貝它不香嗎?

存儲 數據管理
在多媒體流傳輸領域,零拷貝技術是實現流暢播放體驗的關鍵。以在線視頻播放為例,視頻數據需要從服務器快速傳輸到客戶端,并且要求低延遲。

在當今這個數據爆炸的時代,無論是互聯網巨頭的海量數據處理,還是新興創業公司對高效性能的追求,數據傳輸效率都成了決定系統成敗的關鍵因素。技術面試作為篩選人才的重要關卡,也越發關注候選人對前沿技術的掌握程度。字節跳動,作為行業內的技術先鋒,在面試中更是不斷拋出極具挑戰性的問題,以選拔出真正的技術高手。

“字節二面:還要使用傳統數據復制,為什么不用零拷貝?” 當這個問題擺在面試者面前時,看似簡單的詢問背后,實則隱藏著對候選人技術深度和廣度的全方位考察。它不僅要求你對零拷貝技術的原理了如指掌,更需要你能清晰洞察傳統數據復制在現代技術體系中的位置,以及在不同場景下二者的優劣抉擇。

對于每一位渴望在技術領域嶄露頭角的開發者而言,理解這個問題,就如同掌握了一把通往高效數據處理世界的鑰匙。接下來,就讓我們一同深入剖析傳統數據復制與零拷貝技術的本質區別,探尋在字節跳動這樣的技術驅動型企業中,如何通過技術選型實現系統性能的飛躍 。

一、傳統 I/O 的困境

在深入了解零拷貝之前,讓我們先來看一下傳統的 I/O 數據傳輸方式。想象一下,你正在從服務器上下載一個文件,這個看似簡單的操作背后,其實涉及到了一系列復雜的數據傳輸過程。

當你發起下載請求時,操作系統會先從磁盤中讀取文件數據。這個過程中,數據首先會被讀取到內核緩沖區,然后再被拷貝到用戶空間的應用程序緩沖區。接著,應用程序將數據發送到網絡,數據又會從用戶空間緩沖區拷貝到內核空間的 socket 緩沖區,最后通過網卡發送出去。

具體來說,傳統 I/O 的數據傳輸過程如下:

  • 用戶態到內核態切換:應用程序調用 read 系統調用,請求讀取文件數據。此時,CPU 從用戶態切換到內核態,開始執行內核中的代碼。
  • 磁盤數據讀取到內核緩沖區:內核通過 DMA(直接內存訪問)技術,將磁盤數據直接拷貝到內核緩沖區。DMA 技術可以讓硬件設備(如磁盤控制器)直接訪問內存,而不需要 CPU 的干預,從而減輕 CPU 的負擔。
  • 內核緩沖區數據拷貝到用戶緩沖區:數據從內核緩沖區拷貝到用戶空間的應用程序緩沖區。這一步需要 CPU 的參與,因為用戶空間和內核空間是相互隔離的,數據不能直接在兩者之間傳遞。
  • 內核態到用戶態切換:read 系統調用返回,CPU 從內核態切換回用戶態,應用程序可以處理用戶緩沖區中的數據。
  • 用戶態到內核態切換:應用程序調用 write 系統調用,請求將數據發送到網絡。CPU 再次從用戶態切換到內核態。
  • 用戶緩沖區數據拷貝到 socket 緩沖區:數據從用戶緩沖區拷貝到內核空間的 socket 緩沖區,準備通過網絡發送出去。這一步同樣需要 CPU 的參與。
  • socket 緩沖區數據發送到網卡:內核通過 DMA 技術,將 socket 緩沖區中的數據拷貝到網卡緩沖區,然后通過網絡發送出去。
  • 內核態到用戶態切換:write 系統調用返回,CPU 從內核態切換回用戶態,數據傳輸完成。

從上述過程可以看出,傳統 I/O 在一次簡單的文件傳輸中,就涉及了 4 次用戶態與內核態的上下文切換,以及 4 次數據拷貝(其中 2 次是 DMA 拷貝,2 次是 CPU 拷貝)。上下文切換和數據拷貝都會消耗 CPU 資源和時間,在高并發的場景下,這些開銷會嚴重影響系統的性能。

例如,在一個高并發的文件服務器中,如果每一次文件傳輸都要經歷如此繁瑣的過程,那么服務器的吞吐量將會受到極大的限制,響應速度也會變慢,用戶體驗也會大打折扣。因此,為了提高系統的性能,我們需要尋找一種更高效的數據傳輸方式,這就是零拷貝技術應運而生的背景。

二、零拷貝技術閃亮登場

零拷貝(zero-copy)基本思想是:數據報從網絡設備到用戶程序空間傳遞的過程中,減少數據拷貝次數,減少系統調用,實現CPU的零參與,徹底消除 CPU在這方面的負載。實現零拷貝用到的最主要技術是DMA數據傳輸技術和內存區域映射技術。如圖1所示,傳統的網絡數據報處理,需要經過網絡設備到操作系統內存空間,系統內存空間到用戶應用程序空間這兩次拷貝,同時還需要經歷用戶向系統發出的系統調用。

而零拷貝技術則首先利用DMA技術將網絡數據報直接傳遞到系統內核預先分配的地址空間中,避免CPU的參與;同時,將系統內核中存儲數據報的內存區域映射到檢測程序的應用程序空間(還有一種方式是在用戶空間建立一緩存,并將其映射到內核空間,類似于linux系統下的kiobuf技術),檢測程序直接對這塊內存進行訪問,從而減少了系統內核向用戶空間的內存拷貝,同時減少了系統調用的開銷,實現了真正的“零拷貝”。

圖片圖片

2.1什么是零拷貝?

簡單一點來說,零拷貝就是一種避免 CPU 將數據從一塊存儲拷貝到另外一塊存儲的技術。針對操作系統中的設備驅動程序、文件系統以及網絡協議堆棧而出現的各種零拷貝技術極大地提升了特定應用程序的性能,并且使得這些應用程序可以更加有效地利用系統資源。這種性能的提升就是通過在數據拷貝進行的同時,允許 CPU 執行其他的任務來實現的。

零拷貝技術可以減少數據拷貝和共享總線操作的次數,消除傳輸數據在存儲器之間不必要的中間拷貝次數,從而有效地提高數據傳輸效率。而且,零拷貝技術減少了用戶應用程序地址空間和操作系統內核地址空間之間因為上下文切換而帶來的開銷。進行大量的數據拷貝操作其實是一件簡單的任務,從操作系統的角度來說,如果 CPU 一直被占用著去執行這項簡單的任務,那么這將會是很浪費資源的;如果有其他比較簡單的系統部件可以代勞這件事情,從而使得 CPU 解脫出來可以做別的事情,那么系統資源的利用則會更加有效。

零拷貝技術,就是為了解決傳統 I/O 的性能瓶頸而誕生的。簡單來說,零拷貝技術的核心就是減少數據在內存之間的拷貝次數,從而提高數據傳輸的效率。這里的 “零拷貝” 并不是指完全沒有數據拷貝,而是盡可能地減少不必要的拷貝操作。

在零拷貝技術中,數據可以直接在內核空間中進行傳輸,而不需要經過用戶空間的緩沖區。這樣就避免了傳統 I/O 中數據在用戶空間和內核空間之間的多次拷貝,減少了 CPU 的上下文切換和數據拷貝的開銷,提高了系統的性能和吞吐量。

以 Linux 系統中的sendfile系統調用為例,這是一種常見的零拷貝實現方式。在使用sendfile時,數據可以直接從內核緩沖區傳輸到 socket 緩沖區,而不需要經過用戶空間。具體過程如下:

  • 用戶態到內核態切換:應用程序調用sendfile系統調用,請求將文件數據發送到網絡。CPU 從用戶態切換到內核態。
  • 磁盤數據讀取到內核緩沖區:內核通過 DMA 技術,將磁盤數據直接拷貝到內核緩沖區。
  • 內核緩沖區數據直接傳輸到 socket 緩沖區:內核直接將內核緩沖區中的數據傳輸到 socket 緩沖區,而不需要經過用戶空間。這一步利用了內核的特殊機制,直接在內核空間中完成數據的傳輸,避免了數據在用戶空間和內核空間之間的拷貝。
  • socket 緩沖區數據發送到網卡:內核通過 DMA 技術,將 socket 緩沖區中的數據拷貝到網卡緩沖區,然后通過網絡發送出去。
  • 內核態到用戶態切換:sendfile系統調用返回,CPU 從內核態切換回用戶態,數據傳輸完成。

對比傳統 I/O 和零拷貝技術的數據傳輸路徑,可以明顯看出零拷貝技術的優勢。在傳統 I/O 中,數據需要在用戶空間和內核空間之間多次拷貝,而在零拷貝技術中,數據可以直接在內核空間中傳輸,減少了數據拷貝的次數和上下文切換的開銷。這就好比在物流運輸中,傳統 I/O 就像是貨物需要多次裝卸、轉運,而零拷貝技術則像是貨物可以直接從起點運輸到終點,中間不需要多次中轉,大大提高了運輸的效率。

避免數據拷貝:

  • 避免操作系統內核緩沖區之間進行數據拷貝操作。
  • 避免操作系統內核和用戶應用程序地址空間這兩者之間進行數據拷貝操作。
  • 用戶應用程序可以避開操作系統直接訪問硬件存儲。
  • 數據傳輸盡量讓 DMA 來做。

將多種操作結合在一起

  • 避免不必要的系統調用和上下文切換。
  • 需要拷貝的數據可以先被緩存起來。
  • 對數據進行處理盡量讓硬件來做。

對于高速網絡來說,零拷貝技術是非常重要的。這是因為高速網絡的網絡鏈接能力與 CPU 的處理能力接近,甚至會超過 CPU 的處理能力。

如果是這樣的話,那么 CPU 就有可能需要花費幾乎所有的時間去拷貝要傳輸的數據,而沒有能力再去做別的事情,這就產生了性能瓶頸,限制了通訊速率,從而降低了網絡連接的能力。一般來說,一個 CPU 時鐘周期可以處理一位的數據。舉例來說,一個 1 GHz 的處理器可以對 1Gbit/s 的網絡鏈接進行傳統的數據拷貝操作,但是如果是 10 Gbit/s 的網絡,那么對于相同的處理器來說,零拷貝技術就變得非常重要了。

對于超過 1 Gbit/s 的網絡鏈接來說,零拷貝技術在超級計算機集群以及大型的商業數據中心中都有所應用。然而,隨著信息技術的發展,1 Gbit/s,10 Gbit/s 以及 100 Gbit/s 的網絡會越來越普及,那么零拷貝技術也會變得越來越普及,這是因為網絡鏈接的處理能力比 CPU 的處理能力的增長要快得多。傳統的數據拷貝受限于傳統的操作系統或者通信協議,這就限制了數據傳輸性能。零拷貝技術通過減少數據拷貝次數,簡化協議處理的層次,在應用程序和網絡之間提供更快的數據傳輸方法,從而可以有效地降低通信延遲,提高網絡吞吐率。零拷貝技術是實現主機或者路由器等設備高速網絡接口的主要技術之一。

現代的 CPU 和存儲體系結構提供了很多相關的功能來減少或避免 I/O 操作過程中產生的不必要的 CPU 數據拷貝操作,但是,CPU 和存儲體系結構的這種優勢經常被過高估計。存儲體系結構的復雜性以及網絡協議中必需的數據傳輸可能會產生問題,有時甚至會導致零拷貝這種技術的優點完全喪失。在下一章中,我們會介紹幾種 Linux 操作系統中出現的零拷貝技術,簡單描述一下它們的實現方法,并對它們的弱點進行分析。

2.2零拷貝技術分類

零拷貝技術的發展很多樣化,現有的零拷貝技術種類也非常多,而當前并沒有一個適合于所有場景的零拷貝技術的出現。對于 Linux 來說,現存的零拷貝技術也比較多,這些零拷貝技術大部分存在于不同的 Linux 內核版本,有些舊的技術在不同的 Linux 內核版本間得到了很大的發展或者已經漸漸被新的技術所代替。本文針對這些零拷貝技術所適用的不同場景對它們進行了劃分。概括起來,Linux 中的零拷貝技術主要有下面這幾種:

直接 I/O:對于這種數據傳輸方式來說,應用程序可以直接訪問硬件存儲,操作系統內核只是輔助數據傳輸:這類零拷貝技術針對的是操作系統內核并不需要對數據進行直接處理的情況,數據可以在應用程序地址空間的緩沖區和磁盤之間直接進行傳輸,完全不需要 Linux 操作系統內核提供的頁緩存的支持。

在數據傳輸的過程中,避免數據在操作系統內核地址空間的緩沖區和用戶應用程序地址空間的緩沖區之間進行拷貝。有的時候,應用程序在數據進行傳輸的過程中不需要對數據進行訪問,那么,將數據從 Linux 的頁緩存拷貝到用戶進程的緩沖區中就可以完全避免,傳輸的數據在頁緩存中就可以得到處理。在某些特殊的情況下,這種零拷貝技術可以獲得較好的性能。Linux 中提供類似的系統調用主要有 mmap(),sendfile() 以及 splice()。

對數據在 Linux 的頁緩存和用戶進程的緩沖區之間的傳輸過程進行優化。該零拷貝技術側重于靈活地處理數據在用戶進程的緩沖區和操作系統的頁緩存之間的拷貝操作。這種方法延續了傳統的通信方式,但是更加靈活。在  Linux 中,該方法主要利用了寫時復制技術。

前兩類方法的目的主要是為了避免應用程序地址空間和操作系統內核地址空間這兩者之間的緩沖區拷貝操作。這兩類零拷貝技術通常適用在某些特殊的情況下,比如要傳送的數據不需要經過操作系統內核的處理或者不需要經過應用程序的處理。第三類方法則繼承了傳統的應用程序地址空間和操作系統內核地址空間之間數據傳輸的概念,進而針對數據傳輸本身進行優化。

我們知道,硬件和軟件之間的數據傳輸可以通過使用 DMA 來進行,DMA進行數據傳輸的過程中幾乎不需要CPU參與,這樣就可以把 CPU 解放出來去做更多其他的事情,但是當數據需要在用戶地址空間的緩沖區和Linux操作系統內核的頁緩存之間進行傳輸的時候,并沒有類似DMA這種工具可以使用,CPU 需要全程參與到這種數據拷貝操作中,所以這第三類方法的目的是可以有效地改善數據在用戶地址空間和操作系統內核地址空間之間傳遞的效率。

三、零拷貝的定義

Zero-copy, 就是在操作數據時, 不需要將數據 buffer 從一個內存區域拷貝到另一個內存區域. 因為少了一次內存的拷貝, 因此 CPU 的效率就得到的提升;在OS層面上的 Zero-copy 通常指避免在 用戶態(User-space) 與 內核態(Kernel-space) 之間來回拷貝數據。

Netty 中的 Zero-copy 與 OS 的 Zero-copy 不太一樣, Netty的 Zero-coyp 完全是在用戶態(Java 層面)的, 它的 Zero-copy 的更多的是偏向于優化數據操作。

3.1Netty的“零拷貝”

主要體現在如下三個方面:

  1. Netty的接收和發送ByteBuffer采用DIRECT BUFFERS,使用堆外直接內存進行Socket讀寫,不需要進行字節緩沖區的二次拷貝。如果使用傳統的堆內存(HEAP BUFFERS)進行Socket讀寫,JVM會將堆內存Buffer拷貝一份到直接內存中,然后才寫入Socket中。相比于堆外直接內存,消息在發送過程中多了一次緩沖區的內存拷貝。
  2. Netty提供了組合Buffer對象,可以聚合多個ByteBuffer對象,用戶可以像操作一個Buffer那樣方便得對組合Buffer進行操作,避免了傳統通過內存拷貝的方式將幾個小Buffer合并成一個大的Buffer。
  3. Netty的文件傳輸采用了transferTo方法,它可以直接將文件緩沖區的數據發送到目標Channel,避免了傳統通過循環write方式導致的內存拷貝問題。

3.2傳統IO方式

在 java 開發中,從某臺機器將一份數據通過網絡傳輸到另外一臺機器,大致的代碼如下:

Socket socket = new Socket(HOST, PORT);
InputStream inputStream = new FileInputStream(FILE_PATH);
OutputStream outputStream = new DataOutputStream(socket.getOutputStream());

byte[] buffer = new byte[4096];
while (inputStream.read(buffer) >= 0) {
    outputStream.write(buffer);
}

outputStream.close();
socket.close();
inputStream.close();

看起來代碼很簡單,但如果我們深入到操作系統層面,就會發現實際的微觀操作更復雜。具體操作如下圖:

圖片圖片

1.用戶進程向OS發出read()系統調用,觸發上下文切換,從用戶態轉換到內核態。

2.CPU發起IO請求,通過直接內存訪問(DMA)從磁盤讀取文件內容,復制到內核緩沖區PageCache中

3.將內核緩沖區數據,拷貝到用戶空間緩沖區,觸發上下文切換,從內核態轉換到用戶態。

4.用戶進程向OS發起write系統調用,觸發上下文切換,從用戶態切換到內核態。

5.將數據從用戶緩沖區拷貝到內核中與目的地Socket關聯的緩沖區。

6.數據最終經由Socket通過DMA傳送到硬件(網卡)緩沖區,write()系統調用返回,并從內核態切換回用戶態。

圖片圖片

四、零拷貝(Zero-copy)

4.1數據拷貝基礎過程

在Linux系統內部緩存和內存容量都是有限的,更多的數據都是存儲在磁盤中。對于Web服務器來說,經常需要從磁盤中讀取數據到內存,然后再通過網卡傳輸給用戶:

圖片圖片

上述數據流轉只是大框,接下來看看幾種模式。

(1)僅CPU方式

  • 當應用程序需要讀取磁盤數據時,調用read()從用戶態陷入內核態,read()這個系統調用最終由CPU來完成;
  • CPU向磁盤發起I/O請求,磁盤收到之后開始準備數據;
  • 磁盤將數據放到磁盤緩沖區之后,向CPU發起I/O中斷,報告CPU數據已經Ready了;
  • CPU收到磁盤控制器的I/O中斷之后,開始拷貝數據,完成之后read()返回,再從內核態切換到用戶態;

圖片圖片

(2)CPU&DMA方式

CPU的時間寶貴,讓它做雜活就是浪費資源。

直接內存訪問(Direct Memory Access),是一種硬件設備繞開CPU獨立直接訪問內存的機制。所以DMA在一定程度上解放了CPU,把之前CPU的雜活讓硬件直接自己做了,提高了CPU效率。

目前支持DMA的硬件包括:網卡、聲卡、顯卡、磁盤控制器等。

有了DMA的參與之后的流程發生了一些變化:

圖片圖片

主要的變化是,CPU不再和磁盤直接交互,而是DMA和磁盤交互并且將數據從磁盤緩沖區拷貝到內核緩沖區,之后的過程類似。

“【敲黑板】無論從僅CPU方式和DMA&CPU方式,都存在多次冗余數據拷貝和內核態&用戶態的切換。”

我們繼續思考Web服務器讀取本地磁盤文件數據再通過網絡傳輸給用戶的詳細過程。

4.2普通模式數據交互

一次完成的數據交互包括幾個部分:系統調用syscall、CPU、DMA、網卡、磁盤等。

圖片圖片

系統調用syscall是應用程序和內核交互的橋梁,每次進行調用/返回就會產生兩次切換:

  • 調用syscall 從用戶態切換到內核態
  • syscall返回 從內核態切換到用戶態

圖片圖片

來看下完整的數據拷貝過程簡圖:

圖片圖片

讀數據過程:

  1. 應用程序要讀取磁盤數據,調用read()函數從而實現用戶態切換內核態,這是第1次狀態切換;
  2. DMA控制器將數據從磁盤拷貝到內核緩沖區,這是第1次DMA拷貝;
  3. CPU將數據從內核緩沖區復制到用戶緩沖區,這是第1次CPU拷貝;
  4. CPU完成拷貝之后,read()函數返回實現用戶態切換用戶態,這是第2次狀態切換;

寫數據過程:

  1. 應用程序要向網卡寫數據,調用write()函數實現用戶態切換內核態,這是第1次切換;
  2. CPU將用戶緩沖區數據拷貝到內核緩沖區,這是第1次CPU拷貝;
  3. DMA控制器將數據從內核緩沖區復制到socket緩沖區,這是第1次DMA拷貝;
  4. 完成拷貝之后,write()函數返回實現內核態切換用戶態,這是第2次切換;

綜上所述:

  • 讀過程涉及2次空間切換、1次DMA拷貝、1次CPU拷貝;
  • 寫過程涉及2次空間切換、1次DMA拷貝、1次CPU拷貝;

可見傳統模式下,涉及多次空間切換和數據冗余拷貝,效率并不高,接下來就該零拷貝技術出場了。

4.3零拷貝技術

(1)出現原因

我們可以看到,如果應用程序不對數據做修改,從內核緩沖區到用戶緩沖區,再從用戶緩沖區到內核緩沖區。兩次數據拷貝都需要CPU的參與,并且涉及用戶態與內核態的多次切換,加重了CPU負擔。

我們需要降低冗余數據拷貝、解放CPU,這也就是零拷貝Zero-Copy技術。

(2)解決思路

目前來看,零拷貝技術的幾個實現手段包括:mmap+write、sendfile、sendfile+DMA收集、splice等。

圖片圖片

(3)mmap方式

mmap是Linux提供的一種內存映射文件的機制,它實現了將內核中讀緩沖區地址與用戶空間緩沖區地址進行映射,從而實現內核緩沖區與用戶緩沖區的共享。這樣就減少了一次用戶態和內核態的CPU拷貝,但是在內核空間內仍然有一次CPU拷貝。

圖片圖片

mmap對大文件傳輸有一定優勢,但是小文件可能出現碎片,并且在多個進程同時操作文件時可能產生引發coredump的signal。

(4)sendfile方式

mmap+write方式有一定改進,但是由系統調用引起的狀態切換并沒有減少。

sendfile系統調用是在 Linux 內核2.1版本中被引入,它建立了兩個文件之間的傳輸通道。

sendfile方式只使用一個函數就可以完成之前的read+write 和 mmap+write的功能,這樣就少了2次狀態切換,由于數據不經過用戶緩沖區,因此該數據無法被修改。

圖片圖片

splice 系統調用可以在內核緩沖區和socket緩沖區之間建立管道來傳輸數據,避免了兩者之間的 CPU 拷貝操作。

圖片圖片

splice也有一些局限,它的兩個文件描述符參數中有一個必須是管道設備。

以下使用 FileChannel.transferTo 方法,實現 zero-copy:

SocketAddress socketAddress = new InetSocketAddress(HOST, PORT);
SocketChannel socketChannel = SocketChannel.open();
socketChannel.connect(socketAddress);

File file = new File(FILE_PATH);
FileChannel fileChannel = new FileInputStream(file).getChannel();
fileChannel.transferTo(0, file.length(), socketChannel);

fileChannel.close();
socketChannel.close();

相比傳統方式,零拷貝的執行流程如下圖:

圖片圖片

可以看到,相比傳統方式,零拷貝不走數據緩沖區減少了一些不必要的操作。

4.4零拷貝的應用

零拷貝在很多框架中得到了廣泛使用,常見的比如 Netty、Kafka 等等。

在 kafka 中使用了很多設計思想,比如分區并行、順序寫入、頁緩存、高效序列化、零拷貝等等。

上邊博客分析了 Kafka 的大概架構,知道了 kafka 中的文件都是以.log 文件存儲,每個日志文件對應兩個索引文件.index 與.timeindex。

kafka 在傳輸數據時利用索引,使用 fileChannel.transferTo (position, count, socketChannel) 指定數據位置與大小實現零拷貝。

kafka 底層傳輸源碼:(TransportLayer)

/**
     * Transfers bytes from `fileChannel` to this `TransportLayer`.
     *
     * This method will delegate to {@link FileChannel#transferTo(long, long, java.nio.channels.WritableByteChannel)},
     * but it will unwrap the destination channel, if possible, in order to benefit from zero copy. This is required
     * because the fast path of `transferTo` is only executed if the destination buffer inherits from an internal JDK
     * class.
     *
     * @param fileChannel The source channel
     * @param position The position within the file at which the transfer is to begin; must be non-negative
     * @param count The maximum number of bytes to be transferred; must be non-negative
     * @return The number of bytes, possibly zero, that were actually transferred
     * @see FileChannel#transferTo(long, long, java.nio.channels.WritableByteChannel)
     */
    long transferFrom(FileChannel fileChannel, long position, long count) throws IOException;

實現類(PlaintextTransportLayer):

@OverRide 
 public long transferFrom(FileChannel fileChannel, long position, long count) throws IOException {
      return fileChannel.transferTo(position, count, socketChannel);
 }

該方法的功能是將 FileChannel 中的數據傳輸到 TransportLayer,也就是 SocketChannel。在實現類 PlaintextTransportLayer 的對應方法中,就是直接調用了 FileChannel.transferTo () 方法。

五、零拷貝在Java世界的奇妙冒險

5.1NIO 的零拷貝絕技

在 Java 的世界里,NIO(New I/O)為我們提供了實現零拷貝的強大工具。其中,FileChannel類的transferTo和transferFrom方法就是實現零拷貝的關鍵。

transferTo方法可以將當前通道中的數據直接傳輸到目標通道,而transferFrom方法則是從源通道讀取數據并傳輸到當前通道。這兩個方法的實現依賴于底層操作系統的支持,在支持零拷貝的操作系統上,它們可以直接利用操作系統的零拷貝機制,避免數據在用戶空間和內核空間之間的拷貝,從而大大提高數據傳輸的效率。

下面通過一個簡單的代碼示例來展示如何使用transferTo方法實現文件到網絡通道的零拷貝傳輸:

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.nio.channels.FileChannel;

public class ZeroCopyExample {
    public static void main(String[] args) {
        try (FileInputStream fis = new FileInputStream("source.txt");
             FileOutputStream fos = new FileOutputStream("destination.txt");
             FileChannel sourceChannel = fis.getChannel();
             FileChannel destChannel = fos.getChannel()) {
            long position = 0;
            long count = sourceChannel.size();
            // 使用transferTo方法實現零拷貝
            sourceChannel.transferTo(position, count, destChannel);
            System.out.println("File copied successfully using zero copy!");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

在這個示例中,我們首先創建了兩個FileChannel,一個用于讀取源文件,另一個用于寫入目標文件。然后,通過transferTo方法將源文件通道中的數據直接傳輸到目標文件通道,整個過程中數據沒有經過用戶空間的緩沖區,實現了零拷貝。

5.2Netty框架的零拷貝奧秘

Netty 是一個高性能的 Java 網絡框架,它在設計中充分利用了零拷貝技術,以提升數據傳輸的效率。在 Netty 中,零拷貝主要體現在以下幾個方面:

首先,Netty 接收和發送ByteBuffer采用的都是堆外直接內存。使用堆外直接內存進行 Socket 的讀 / 寫,無須進行字節緩沖區的二次拷貝。如果使用傳統的堆內存進行 Socket 的讀 / 寫,則 JVM 會將堆內存 Buffer 數據拷貝到堆外直接內存中,然后才寫入 Socket 中。與堆外直接內存相比,使用傳統的堆內存,在消息的發送過程中多了一次緩沖區的內存拷貝 。

其次,Netty 的ByteBuf提供了強大的零拷貝功能。ByteBuf是 Netty 的數據容器,它通過切片(slice)和組合(CompositeByteBuf)等操作實現了零拷貝。例如,slice方法可以將一個ByteBuf分解為多個共享同一個存儲區域的ByteBuf,避免了內存的拷貝。假設有一個ByteBuf包含了消息的頭部和消息體,我們可以通過slice方法分別獲取頭部和消息體的ByteBuf,而不需要進行數據的拷貝:

ByteBuf buffer = Unpooled.wrappedBuffer(new byte[]{1, 2, 3, 4, 5, 6, 7, 8, 9, 10});
ByteBuf header = buffer.slice(0, 5);
ByteBuf body = buffer.slice(5, 5);

在這個例子中,header和body共享了buffer的底層存儲區域,對buffer的修改會反映在header和body上,反之亦然。

另外,CompositeByteBuf可以將多個ByteBuf合并為一個邏輯上的ByteBuf,避免了各個ByteBuf之間的拷貝。比如,在處理協議數據時,協議數據可能由頭部和消息體組成,而頭部和消息體分別存放在兩個ByteBuf中,我們可以使用CompositeByteBuf將它們合并為一個邏輯上的整體:

ByteBuf header = Unpooled.wrappedBuffer(new byte[]{1, 2, 3, 4, 5});
ByteBuf body = Unpooled.wrappedBuffer(new byte[]{6, 7, 8, 9, 10});
CompositeByteBuf compositeByteBuf = Unpooled.compositeBuffer();
compositeByteBuf.addComponents(true, header, body);

這樣,compositeByteBuf就將header和body組合在了一起,在后續的處理中可以像操作一個ByteBuf一樣操作它,而不需要進行數據的拷貝。

最后,Netty 使用FileRegion實現文件傳輸的零拷貝。FileRegion底層封裝了FileChannel的transferTo方法,可以將文件緩沖區的數據直接傳輸到目標通道,避免內核緩沖區和用戶態緩沖區之間的數據拷貝,這屬于操作系統級別的零拷貝。例如,在一個文件服務器中,當客戶端請求下載文件時,服務器可以使用FileRegion將文件數據直接傳輸給客戶端,而不需要將文件數據先讀取到用戶空間再發送出去,從而提高了文件傳輸的效率。

六、零拷貝的應用舞臺

6.1網絡服務器:高效傳輸的基石

在網絡服務器領域,零拷貝技術是提升性能的關鍵。以 Nginx 為例,它作為一款高性能的 Web 服務器,廣泛應用零拷貝技術來提高靜態文件的傳輸效率。當客戶端請求一個靜態文件時,傳統的服務器可能需要先將文件數據從磁盤讀取到內核緩沖區,再拷貝到用戶空間的應用程序緩沖區,最后再發送到網絡。而 Nginx 利用sendfile系統調用實現零拷貝,數據可以直接從磁盤內核緩沖區傳輸到網絡 socket 緩沖區,避免了用戶空間的拷貝操作,大大提高了文件傳輸的速度,減少了 CPU 的開銷。

在處理大量并發請求時,零拷貝技術的優勢更加明顯。假設一個高并發的文件下載服務器,每秒要處理數千個文件下載請求,如果每個請求都采用傳統的 I/O 方式,那么 CPU 將忙于數據拷貝和上下文切換,很快就會達到性能瓶頸。而采用零拷貝技術,CPU 可以將更多的資源用于處理其他任務,服務器的吞吐量會大幅提升,能夠輕松應對高并發的場景,為用戶提供更快的響應速度。

6.2文件系統:快速操作的秘訣

在文件系統中,零拷貝技術也發揮著重要作用。當我們進行文件復制操作時,傳統方式是將源文件的數據從磁盤讀取到內核緩沖區,再拷貝到用戶空間緩沖區,然后寫入目標文件,這個過程涉及多次數據拷貝和上下文切換。而利用零拷貝技術,如通過mmap將文件映射到內存,數據可以直接在內核空間中進行傳輸和處理,減少了 I/O 開銷。

例如,在一個大數據存儲系統中,經常需要進行大規模的數據文件遷移操作。如果使用傳統的文件復制方式,在遷移大量文件時,不僅會消耗大量的時間,還會占用大量的系統資源,導致系統性能下降。而采用零拷貝技術,通過mmap和sendfile等機制,可以大大減少數據拷貝的次數,提高文件遷移的速度,同時降低系統的負載,讓系統能夠更高效地運行。

6.3多媒體流傳輸:流暢體驗的保障

在多媒體流傳輸領域,零拷貝技術是實現流暢播放體驗的關鍵。以在線視頻播放為例,視頻數據需要從服務器快速傳輸到客戶端,并且要求低延遲。傳統的數據傳輸方式在多次數據拷貝過程中會增加延遲,導致視頻播放卡頓。而利用零拷貝技術,視頻數據可以直接從磁盤通過內核空間傳輸到網絡,減少了數據處理的時間,降低了延遲。

在音頻直播場景中,零拷貝技術同樣重要。音頻數據需要實時傳輸到聽眾的設備上,對延遲要求極高。通過零拷貝技術,音頻數據能夠快速地從服務器發送到網絡,保證了音頻直播的實時性和流暢性,讓聽眾能夠獲得更好的收聽體驗。

責任編輯:武曉燕 來源: 深度Linux
相關推薦

2020-04-29 08:04:11

NoSQLMySQLSQL

2020-10-23 15:18:39

戴爾

2024-06-24 00:09:00

零拷貝技術MMapsendFile

2025-01-03 08:42:59

數據庫三范式架構

2021-11-11 11:30:11

GET圖片Java

2025-01-15 07:54:02

2017-02-08 10:56:32

光纖產能技術

2021-06-30 17:38:03

Trie 樹字符Java

2025-03-28 10:47:05

開發注解Java

2021-03-01 11:53:15

面試偽共享CPU

2024-08-30 08:59:15

2025-04-08 09:20:00

Sentinel限流微服務

2023-12-01 08:18:24

Redis網絡

2020-09-23 13:37:25

Redis6.0

2022-08-13 12:07:14

URLHTTP加密

2021-01-26 01:55:24

HTTPS網絡協議加密

2021-03-15 11:20:46

HTTPS優化前端

2015-06-03 14:45:06

大數據媒體服務模式

2023-07-29 13:45:30

了不起 Java極

2023-02-15 08:00:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线播放国产一区二区三区 | 国产精品久久久久久久久久 | 欧美一级网站 | 日本久久精| 超碰日本| 婷婷久| 精品国产欧美一区二区 | 久草免费电影 | 日本一区二区高清不卡 | 日本aa毛片a级毛片免费观看 | 精品国产乱码久久久久久蜜柚 | 久草新在线 | 国产真实乱对白精彩久久小说 | 一区二区三区视频在线 | 欧美激情一区二区三级高清视频 | 午夜看片网站 | 精品视频在线观看 | 伊人伊人网 | 精品国产一区二区三区日日嗨 | h片免费在线观看 | 夜夜干夜夜操 | 国产免费看 | 97国产超碰| 伊人伊人伊人 | 久久国产精彩视频 | 国产一区不卡 | 国产免费又色又爽又黄在线观看 | 成人毛片视频在线播放 | 国产精品久久久久久久久免费 | 福利久久 | 中文字幕在线免费观看 | 日韩免费高清视频 | 欧美一区二区三区久久精品 | 91久久久久久久久久久 | 国产在线中文字幕 | 99福利视频| 国产日韩欧美在线 | 国产美女免费视频 | 亚洲天堂成人在线视频 | 日韩国产在线观看 | 九九亚洲 |