一篇文章,只用看三遍,終生不忘網絡分層!
本文轉載自微信公眾號「程序新視界」,作者二師兄。轉載本文請聯系程序新視界公眾號。
前言
如果你對網絡分層不太了解,當聽到三層協議、五層協議時是不是一頭霧水?不知道所謂的層是什么,所謂的協議是什么?甚至對網絡通信都知之甚少,那么這篇文章一定能夠讓你快速學到,如果沒有收獲就別點贊。
網絡、通信、協議
在深入學習之前,先了解一些基本的概念。
網絡是什么?網絡是用物理鏈路將工作站或主機相連在一起,組成數據鏈路,從而達到資源共享和通信的目的。這里的物理鏈路不僅僅指的是我們能夠看得到的雙絞線、光纖,也可能是無線電波。
網絡通信,狹義的講,可以理解為計算機與計算機之間基于網絡進行的數據交換。當然,這個過程中也有人與計算機的交互。
就像人與人溝通一樣,既然想“聊天”,最起碼得有一個基本條件,比如都使用漢語或英語,這算是一個比較寬泛的協議了。而在計算機通信當中,也差不多,就是約定好咱們交互時的數據格式是什么,每個數據項什么意思,然后你收到之后應該怎么處理或怎么回應。
暫且不管官方的定義,簡單來說,互聯網協議就是在互聯網上傳輸數據的規則。當然,協議是非常多的,比如TCP、UDP、IP協議、FTP協議等等。而使用這些協議最基本的要求就是發送方和接收方所使用的協議必須一致,否則不就雞同鴨講了嘛。
當我們說幾層協議時,一般來說:一臺設備上的第X層與另一臺設備上的第X層進行通信的規則就是第X層協議。
網絡分層模型
就像一家公司,有老板、經理、組長、成員,不同層面的人有不同的溝通方式,但最終還是從上而下的進行實施。老板與老板的溝通就相當于應用層之間的溝通,而老板的目標又需要下面經理的支持,就像應用層需要傳輸層的支持一樣。
理解了網絡分層的基本作用,來看看網絡分層的幾種方式。標準的七層網絡分層,也就是OSI七層模型。TCP/IP五層模型和TCP/IP四層模型是從OSI七層優化而來。
通常,作為用戶來講,使用最多的就是應用層了,大多數情況下可能都感知不到其他層的存在。
那么,為什么要分層呢?這樣與我們設計軟件架構的思想差不多,就是要具有高內聚、低耦合、復用、擴展性等特性。試想一下,如果沒有分層,當一個業務或協議需要改變時,我們只能針對整個系統做修改或擴展。而分層之后,便可以很方便的把不同功能的模塊抽離出來,修改對應的模塊即可。而且不同層還可以被復用,只要確保按照這個層的協議來處理就可以了。
后面呢,我們就主要針對TCP/IP五層模型來進行逐個講解。
網絡分層與協議
上面了解了協議和網絡分層,這里通過一張圖來對照一下常見的協議都位于哪個層。
網絡分層與物理設備
通過一張圖,看一下不同網絡分層通常對應的硬件設備:
物理層
了解了上面的基礎知識,我們下面就來看看每層的作用,而通過功能的關聯性來記憶網絡的分層是一個非常好的記憶方法。我們首先來看物理層。
這一層就是把各個網絡設備連接起來,讓其可以傳輸0 1 0 1的電信號
物理層,顧名思義,用物理手段將電腦連接起來,基本上是用雙絞線、光纖、無線電波的方式來實現物理層。網絡設備連接起來之后,就可以基于它來發送高低電壓(電信號)進行通信,高電壓對應數字1,低電壓對應數字0。0、1信號本身沒有任何的現實意義,所有需要用另一層用來規定不同0、1組合的意義。
數據鏈路層
單純的電信號0和1沒有任何意義,必須規定電信號多少位一組,每組什么意思。數據鏈路層的功能就是通過規定一套協議來定義電信號的分組方式,以及規定不同的組代表什么意思,從而雙方計算機都能夠進行識別,這個協議就是“以太網協議”。
以太網協議規定,一組電信號構成一個數據包,我們把這個數據包稱之為幀。每一個楨由包頭(Head)和數據(Data)兩部分組成。
其中Head包含數據包的一些說明信息,包括發送者、接收者、數據類型;Data則是數據包的具體內容。
Head部分包含固定的18個字節:
- 發送者/源地址,6個字節;
- 接收者/目標地址,6個字節;
- 數據類型,6個字節。
Data部分的長度,最短為46字節,最長為1500字節。因此,整個”幀”最短為64字節,最長為1518字節。如果數據很長,就必須分割成多個幀進行發送。
有了數據包的定義,那么計算機是如何標識誰是誰?以及如何知道對方的地址呢?這就涉及到MAC地址和廣播。
MAC地址
以太網規定,連入網絡的所有設備都必須具有網卡。數據包的發送地址和接收地址指的就是網卡地址,也就是MAC地址。
MAC地址作為網絡中計算機設備的唯一標識,從計算機在廠商生產出來就被十六進制的數標識為MAC地址,MAC地址理論上是獨一無二的。這也是為什么很多軟件校驗設備唯一性時,會用到MAC地址。
MAC地址長度為48位2進制,通常由12位16進制數表示(前六位是廠商編號,后六位是流水線號)。
有了MAC地址,那么兩臺機器之間是找到對方進行通信的呢?
廣播
有了MAC地址,在同一網絡內的兩臺主機就可以通信了。
在同一個子網中,計算機1要向計算機4發送一個數據包,數據包中包含接收方的MAC地址。計算機1向本網絡內所有計算機都發送(以廣播的方式),這時同一子網中的每臺計算機 (包括2、3)都會收到這個數據包的。然后每臺計算機都會把數據包的MAC地址取出來,與自身的MAC地址進行對比,如果兩者相同,則接受這個數據包,否則就丟棄這個數據包。計算機4發現包含自己的MAC地址,于是就進行響應。
網絡層
以太網通過廣播這種很原始的形式,解決了兩臺計算機之間的通信問題。但很明顯,它不是把數據包準確的送達接收方,而是向網絡中所有的計算機發送數據包。
而我們所處的網絡是由無數個子網絡構成的。即便忽略掉子網的存在,如果所有的通信都采用以太網的廣播方式,那么一臺機器發送的包全世界都會收到,整個網絡是會奔潰的。
而實現的網絡又是由無數個子網絡構成的,以太網采用廣播方式發送數據包,效率低且發送的數據只能局限在發送者所在的子網絡。
此時就需要另想辦法,如果是同一個子網絡,就采用廣播方式發送,如果不是在同一個子網 , 那就通過網關和路由向不同廣播域/子網分發數據包。所以就有了網絡層,它是處理分組在網絡中的活動,比如分組的選路。
網絡層引入一套新的協議用來區分不同的廣播域/子網,于是就有了IP 協議。
IP 協議
網絡地址協議,叫做IP協議。相對于上面講到的MAC地址, IP 地址可以理解成邏輯地址,也就是說 MAC 地址是物理上的地址,是固定的。IP 地址是動態分配的,是不固定的。現在廣泛采用的IPv4地址,同時IPv6也在不斷的發展壯大。
通過IP協議發送的數據,就叫做IP數據包,也分為“包頭”和“數據”兩個部分:“包頭”部分主要包括版本、長度、IP地址等信息;“數據”部分則是IP數據包的具體內容。IP數據包的”包頭”部分的長度為20到60字節,整個數據包的總長度最大為65535字節。
IPv4地址是由32位的二進制數組成,一般把它分成4段的十進制表示,地址范圍為0.0.0.0~255.255.255.255。
IP地址分成兩部分:網絡部分(標識子網)和主機部分(標識主機)。網絡部分和主機部分所占用的二進制位數是不固定的。
IP地址段只是標識了IP地址的種類,從網絡部分或主機部分都無法辨識一個IP所處的子網。如果兩個IP的網絡部分相同,則說明它們處于同一個子網中。例如192.168.33.1和192.168.33.2,如果它們的網絡部分為24位,主機部分為8位,網絡部分都為 192.168.33,處于同一個子網中。
但如果像192.16.10.1與192.16.10.2,并不知道網絡部分和主機部分各幾位,就不能確定是否處于同一子網。于是就有了子網掩碼。
子網掩碼
子網掩碼就是用來標識同一局域網中的 IP 地址的信息的。子網掩碼也是由 32 個二進制位組成的,但是只能用 0 或 1 來表示,如11111111.11111111.11111111.00000000。
子網掩碼的網絡部分全部為1,主機部分全部為0。兩臺計算機的 IP 地址分別和子網掩碼進行一種AND 運算(兩個數位都為1,運算結果為1,否則為0),如果結果相同,兩臺計算機就在同一局域網中,否則就不在同一局域網中。
比如IP地址為192.16.10.1,如果已知網絡部分是前24位,主機部分是后8位,那么子網絡掩碼就是11111111.11111111.11111111.00000000,寫成十進制就是255.255.255.0。
假設192.168.33.1和192.168.33.2的子碼掩碼都為255.255.255.0,把IP與子碼掩碼相與,結果都為192.168.33.0,那么它們說明處于同一個子網中。
ARP協議
有了IP協議,可以判斷計算機屬于哪個子網了。在鏈路層時我們通過MAC地址進行通信的,現在只有目標的IP地址,如何才能拿到它的MAC地址呢?這就又要用到ARP協議。
ARP協議可以通過廣播的方式發送數據包,獲取目標主機的MAC地址。具體實現為:發送端主機通過廣播的方式發送數據包,所有主機接收后拆開包,如果發現目標IP為自己就響應,返回MAC地址。
數據包格式:(發送端的MAC地址,目標MAC地址,發送端IP地址,目標IP地址,數據)。
傳輸層
經過數據鏈路層和網絡層的支持,我們已經可以正常在兩臺計算機之間進行通訊了,但是計算機會同時運行著許多程序,比如同時開著QQ與WX,那么怎么區分消息是QQ的還是WX的呢?
通常我們會看到計算機上運行的不同程序都會分配不同的端口,而傳輸層的功能就是建立端口到端口的通信,使得數據能夠正確的傳送給不同的應用程序。
端口是每一個使用網卡的程序的編號,每一個端口號標志一個可執行程序。端口號是0到65535之間的一個整數,正好16個二進制位,0-1023為系統占用端口,其他應用程序只能選用大于1023的端口。
至此,用IP + 端口,已經能實現唯一確定互聯網上一個程序,進而實現網絡間的程序通信了。
傳輸層最常見的兩大協議是 TCP(Transmission Control Protocol,傳輸控制協議) 協議和 UDP(User Data Protocol,用戶數據報協議) 協議。
UDP協議就是在數據前面加上端口號,“包頭”部分主要定義了發出端口和接收端口,一共只有8個字節。“數據”部分就是具體的內容。總長度不超過65,535字節,正好放進一個IP數據包。
UDP協議簡單且容易實現,這是它的優點。但同樣也有缺點,就是進行通信時不知道對方是否接收到數據了。此時需要再定義一套規則,讓其可以和對方進行確認,那么TCP出現了。
TCP數據包沒有長度限制,理論上可以無限長,可是為了保證網絡的效率,通常TCP數據包的長度不會超過IP數據包的長度,也就是小于65,535字節,這也確保單個TCP數據包不必再分割。像我們通常說 TCP 三次握手和四次揮手,就是傳輸層完成的。關于TCP實現部分的內容比較多,我們這里就不再拓展了。
TCP的優點是能夠確保數據不會遺失,安全可靠的傳輸。缺點是過程復雜、實現困難、消耗較多的資源。
應用層
終于說到應用層了,應用層算是我們最經常看到的一層了。應用層的功能就是規定了應用程序的數據格式。我們經常用的電子郵件、HTTP協議以及FTP數據的格式,就是在應用層定義的。
應用層的主要協議有:FTP(文件傳送協議、21端口)、Telnet(遠程登錄協議)、DNS(域名解析協議)、SMTP(郵件傳送協議、25端口),POP3協議(郵局協議),HTTP協議(Hyper Text Transfer Protocol、80端口)。
正反俄羅斯套娃
最后,我們以HTTP請求為例,來梳理一下整個網絡分層中各種的職責與處理流程。在整個通信過程中,就像俄羅斯套娃一樣,一層層的包裝起來,然后再一層層的打開。
小結
經過這篇文章,我們從最下方的物理層到最上方的應用層,按照故事性的形式進行了講解,想必你已經有一個感性的認識了,是不是發現再也不用死記硬背網絡分層了?你就說值不值得來個贊?