BitTorrent協議的精簡介紹
BT,電驢,迅雷。這樣的下載軟件大家肯定都知道。那么它們是如何進行下載的呢?這里面是有一個協議支持來進行的。那么今天我們就介紹一下BitTorrent協議。也就是BT下載所使用的下載協議。
Bittorrent簡介
Bittorrent已經成為最為流行的P2P軟件,在2004年6月的Cachelogic的一份測試是報告中提到Bittorrent的數據流量已經占到整個P2P數據流量的52%。與其他傳統P2P軟件如Gnutella,Fasttrack不同,Bittorrent只是一個純粹的文件下載協議,并提供搜索功能,所以往往資源的獲取要跟其他一些應用結合起來,比如說發布Bittorrent種子信息的網站如5Q、或者是網絡搜索引擎如百度、google等。
Bittorrent工作原理
Bittorrent的工作原理其實很簡單,他就是將一份數據分隔成256K大小的數據分組,并在Bittorrent 網絡中一群用戶相互協作完成這些數據的分發,用戶參與數據分發的信息已文件的形式存儲,一般可以通過web網站獲取這些信息。但是實際數據傳輸依靠的不是Http協議,而是由專門的P2P協議來完成,這些對于用戶都是透明的。
普通的HTTP/FTP下載使用TCP/IP協議,BitTorrent協議是架構于TCP/IP協議之上的一個P2P文件傳輸協議,處于TCP/IP結構的應用層。 BitTorrent協議本身也包含了很多具體的內容協議和擴展協議,并在不斷擴充中。
根據BitTorrent協議,文件發布者會根據要發布的文件生成提供一個.torrent文件,即種子文件,也簡稱為“種子"。 .torrent文件本質上是文本文件,包含Tracker信息和文件信息兩部分。Tracker信息主要是BT下載中需要用到的Tracker服務器的地址和針對Tracker服務器的設置,文件信息是根據對目標文件的計算生成的計算結果根據BitTorrent協議內的B編碼規則進行編碼。它的主要原理是需要把提供下載的文件虛擬分成大小相等的塊,塊大小必須為2k的整數次方(由于是虛擬分塊,硬盤上并不產生各個塊文件),并把每個塊的索引信息和Hash驗證碼寫入.torrent文件中;所以,.torrent文件就是被下載文件的“索引"。
下載者要下載文件內容,需要先得到相應的.torrent文件,然后使用BT客戶端軟件進行下載。
下載時,BT客戶端首先解析.torrent文件得到Tracker地址,然后連接Tracker服務器。Tracker服務器回應下載者的請求,提供下載者其他下載者(包括發布者)的IP。下載者再連接其他下載者,根據.torrent文件,兩者分別對方告知自己已經有的塊,然后交換對方沒有的數據。此時不需要其他服務器參與,分散了單個線路上的數據流量,因此減輕了服務器負擔。
下載者每得到一個塊,需要算出下載塊的Hash驗證碼與.torrent文件中的對比,如果一樣則說明塊正確,不一樣則需要重新下載這個塊。這種規定是為了解決下載內容準確性的問題。
一般的HTTP/FTP下載,發布文件僅在某個或某幾個服務器,下載的人太多,服務器的帶寬很易不勝負荷,變得很慢。而BitTorrent協議下載的特點是,下載的人越多,提供的帶寬也越多,種子也會越來越多,下載速度就越快。而有些人下載完成后關掉下載任務,提供較少量數據給其他用戶,為盡量避免這種行為,在非官方BitTorrent協議中存在超級種子的算法。這種算法允許文件發布者分幾步發布文件,發布者不需要一次提供文件所有內容,而是慢慢開放的下載內容的比例,延長下載時間。此時,速度快的人由于未下載完必須提供給他人數據,速度慢的人有更多機會得到數據。