五種常用的負載均衡算法
大家好,我是猿java。
我們介紹過,網關最重要的功能之一就是負載均衡,那么,什么是負載均衡?負載均衡有哪些方式?今天我們就來聊一聊。
一、定義
負載均衡(Load Balancing)是一種計算機網絡和服務器管理技術,旨在分配網絡流量、請求或工作負載到多個服務器或資源,以確保這些服務器能夠高效、均勻地處理負載,并且能夠提供更高的性能、可用性和可擴展性。
二、負載均衡算法
1.Round Robin-輪詢
輪詢,顧名思義,把請求按順序分配給每個服務器,然后重復執行這個順序,進行請求分配。如下圖:
如上圖,有3臺服務器,分別為服務器A、服務器B和服務器C,當客戶端有請求過來時,請求會按照 A->B->C->A->B->C->… 這種輪詢的順序分配給各個服務器。
(1) 原理:
- 服務器列表:維護一個服務器列表,有服務器加入/剔除時,相應的更新服務器列表;
- 服務器游標:記錄需要處理下一個請求的服務器;
- 請求分發:新請求到達,選擇當前服務器來處理該請求,然后服務器游標+1;
- 循環:不斷重復步驟3,以確保每個服務器都有機會處理請求;
(2) 算法實現
方法1:
輪詢算法的實現非常簡單,可以定義一個服務器的列表和當前服務器指針,如下偽代碼:
# 服務器列表
servers = ["ServerA", "ServerB", "ServerC"]
# 當前服務器
current_server = 0
# 輪詢算法
if(req):
# 選擇當前服務器來處理請求
process_request(servers[current_server])
# 將當前服務器移到服務器列表的末尾
if current_server == length(servers):
current_server = 0
else:
# 指針+1
current_server += 1
當客戶端有新的請求到達時,負載均衡器會選擇服務器指針(current_server)指向的服務器來處理請求,然后將當前服務器指針移到下一個服務器(current_server += 1), 如果 current_server=服務器總數,則把current_server設置為0,進行下一場輪詢。
方法2: 循環列表
循環列表是一個環形數據結構,用于按照順序循環遍歷服務器列表。當指針指向列表的末尾時,指針會回到列表的開頭,從而實現循環。如下偽代碼:
servers = ["Server1", "Server2", "Server3"] # 服務器列表
current_index = 0 # 當前服務器的索引
def get_next_server(self):
if not self.servers:
return None
# 獲取當前服務器
current_server = self.servers[self.current_index]
# 更新索引,移到下一個服務器
self.current_index = (self.current_index + 1) % len(self.servers)
return current_server
# 創建一個包含服務器的列表
servers_list = ["ServerA", "ServerB", "ServerC"]
# 模擬請求的處理過程
if(req): # 假設有5個請
next_server = get_next_server()
if next_server is not None:
process_request(next_server)
else:
print("No available servers.")
(3) 優缺點
優點:簡單,實現成本低;
缺點:
- 無法根據服務器的負載情況來分配請求,當服務器的負載不均衡時,輪詢算法無法自動調整。
- 當服務器down機了,輪詢算法無法自動剔除該服務器,導致請求會被轉發到down機的服務器上。
servers = ["Server1", "Server2", "Server3"] # 服務器列表
current_index = 0 # 當前服務器的索引
def get_next_server(self):
if not self.servers:
return None
# 獲取當前服務器
current_server = self.servers[self.current_index]
# 更新索引,移到下一個服務器
self.current_index = (self.current_index + 1) % len(self.servers)
return current_server
# 創建一個包含服務器的列表
servers_list = ["ServerA", "ServerB", "ServerC"]
# 模擬請求的處理過程
if(req): # 假設有5個請
next_server = get_next_server()
if next_server is not None:
process_request(next_server)
else:
print("No available servers.")
(4) 適用場景
對服務器沒有什么特別的要求,就可以采用輪詢算法,比如:Nginx 默認適用的就是輪詢算法。
2.Weighted Round Robin - 加權輪詢
加權輪詢算法是輪詢算法的一種改進,只不過在負載時會根據服務器的權重來分配請求,權重越大,分配的請求就會越多。如下圖:
(1) 算法實現
實現算法和輪詢很類似,只不過會根據權重在列表中放置不同比例的服務器,同時定義一個服務器的列表和當前服務器指針,如下偽代碼:
# 服務器列表
servers = ["ServerA", "ServerA", "ServerA", "ServerB","ServerB", "ServerC"]
# 當前服務器
current_server = 0
# 輪詢算法
if(req):
# 選擇當前服務器來處理請求
process_request(servers[current_server])
# 將當前服務器移到服務器列表的末尾
if current_server == length(servers):
current_server = 0
else:
# 指針+1
current_server += 1
當客戶端有新的請求到達時,負載均衡器會選擇服務器指針(current_server)指向的服務器來處理請求,然后將當前服務器指針移到下一個服務器(current_server += 1), 如果 current_server=服務器總數,則把current_server設置為0,進行下一場輪詢。
(2) 優缺點
優點:可以人為配置權重,為處理能力強的服務器配置高的權重,處理能力弱的配置低的權重,從而實現負載均衡。
缺點:無法應對服務器動態變化的情況,比如:服務器down機了,無法自動剔除該服務器,導致請求會被轉發到down機的服務器上。
(3) 適用場景
服務器的處理能力不一致,可以采用加權輪詢算法。
比如:有3臺服務器,服務器A(4C8G,4個CPU,8G內存),服務器B(2C4G,2個CPU,4G內存),服務器C(1C2G,1個CPU,2G內存),那么可以配置服務器A的權重為4,服務器B的權重為2,服務器C的權重為1。
3.Least Connections - 最小連接數
最小連接數,是指把請求分配給當前連接數最少的服務器,以確保負載更均勻。如下圖:
上圖中有 3臺服務器,服務器A(連接數10)、服務器B(連接數100)和服務器C(連接數1000),連接數最少的服務器A分配的Req比其他服務器多。
(1) 原理
- 維護一個所有服務器和連接數的字典(Map);
- 當新的請求到達時,負載均衡器會檢查服務器列表中當前連接數最少的服務器;
- 請求將被分配給具有最少連接數的服務器,處理請求后該服務器的連接數+1;
- 如果有多臺服務器具有相同的最小連接數,算法可以使用其他標準來選擇其中一臺,如加權等。
(2) 算法實現
如下偽代碼:
# 創建一個包含服務器及其連接數的字典
servers = {"Server A": 5, "Server B": 3, "Server C": 4}
def get_server_with_least_connections():
# 找到當前連接數最少的服務器
min_connections = min(servers.values())
# 找到具有最小連接數的服務器
for server, connections in servers.items():
if connections == min_connections:
return server
# 選擇連接數最少的服務器
def assign_request(self):
# 獲取具有最小連接數的服務器
server = get_server_with_least_connections()
if server is not None:
# 模擬分配請求給服務器,增加連接數
self.servers[server] += 1
return server
else:
return "No available servers."
# 模擬請求的處理過程
if req: # 假設有請求
assigned_server = load_balancer.assign_request()
(3) 優缺點
優點:
- 動態負載均衡:它根據服務器的當前負載情況來做出決策,這使得它能夠有效地分配請求給當前連接數最少的服務器,從而確保了服務器資源的最佳利用。
- 適應性強:這個算法適用于服務器性能不均勻的情況,因為它關注的是連接數,而不是服務器的硬件配置或性能評估。
- 避免過載:通過將新請求分配給連接數最少的服務器,”最小連接數”算法有助于防止某些服務器被過度加載,從而提高了系統的穩定性和性能。
- 自動恢復:如果某臺服務器由于故障或重啟而導致連接數清零,該算法會自動開始將新請求分配給該服務器,以實現自動恢復。
缺點:
- 連接數不一定代表負載:”最小連接數”算法假設連接數與服務器的負載成正比,但這并不總是準確。有時候,某臺服務器的連接數可能很高,但仍然能夠處理更多的請求,而另一臺連接數較低的服務器可能已經達到了其性能極限。
- 不適用于長連接:如果服務器上有大量長期活躍的連接,例如WebSocket連接,該算法可能不太適用,因為長連接不同于短暫的HTTP請求,連接數的統計可能會產生誤導。
- 無法解決服務器性能差異:雖然”最小連接數”算法可以平衡連接數,但它無法解決服務器硬件性能差異的問題。在這種情況下,可能需要其他負載均衡算法,如加權輪詢,來更好地適應性能差異。
(4) 適用場景
通過服務器連接數來做負載均衡的場景。到目前為止,還沒有遇到生產上使用這種算法的場景。
4.IP/URL Hash - IP/URL 散列
IP/URL 散列算法是一種根據客戶端 IP 地址或 URL 來分配請求的負載均衡算法,這樣相同的IP或者URL就會負載到相同的服務器上。
(1) 原理
- 將客戶端 IP 地址或 URL 散列到服務器列表中,
- 然后將請求分配給散列值對應的服務器。
如下圖:有3臺服務器,分別為服務器A、服務器B和服務器C,當相同IP的客戶端請求會被負載到形同的服務器列中。
(2) 優缺點
優點:
- 穩定性:IP/URL Hash 算法可以確保相同的客戶端請求總是被分發到相同的服務器上。這可以提高應用程序的穩定性,因為客戶端的會話數據在同一服務器上保持一致。
- 適用于會話保持:當應用程序需要在多次請求之間保持會話狀態時,IP/URL Hash 算法非常有用??蛻舳嗽谝淮握埱笾羞x擇的服務器會在后續請求中保持一致,確保會話數據不會丟失。
- 負載均衡:IP/URL Hash 算法可以將特定的客戶端請求均勻地分配到多個服務器上,從而實現基本的負載均衡,避免了某些服務器被過度請求。
缺點:
- 不適用于動態環境:IP/URL Hash 算法基于客戶端的 IP 地址或 URL,一旦客戶端 IP 或請求的 URL 發生變化,請求可能會被分配到不同的服務器上,導致會話數據丟失或不一致。
- 不考慮服務器負載:IP/URL Hash 算法不考慮服務器的當前負載情況。如果某個服務器的負載過高,IP/URL Hash 無法動態地將請求分發到負載較低的服務器上。
(3) 適用場景
靜態環境:在靜態環境中,即客戶端的 IP 地址或請求的 URL 不經常變化的情況下,IP/URL Hash 算法可以提供穩定的負載均衡。
少數服務器的負載均衡:當服務器數量相對較少且不太容易動態擴展時,IP/URL Hash 算法可以用于基本的負載均衡。
5.Least Response Time - 最短響應時間
最短響應時間就是指:處理請求的響應時間最少的服務器,獲取的請求就越多。直白講就是隨速度快,隨就干的多。如下圖:
(1) 適用場景
負載均衡的所有服務器,處理能力相差比較大。比如:有3臺服務器,服務器A(4C8G,4個CPU,8G內存),服務器B(2C4G,2個CPU,4G內存),服務器C(1C2G,1個CPU,2G內存), 那么就可以采用這種算法,這樣可以根據服務器的處理來實現動態負載。
(2) 優缺點
優點:可以充分發揮各個服務器的性能,提高服務器的利用率。
缺點:饑餓問題。比如,服務器A的性能最好,處理速度最快,那么所有的請求都會被分配到服務器A,這樣服務器B和服務器C就會一直處于饑餓狀態,無法處理請求。這樣也就會產生不公平。
(3) 算法實現
如下偽代碼:記錄每臺服務器以及響應時間,然后找到響應時間最短的服務器,將請求分配到該服務器上。
# 服務器列表,每個服務器表示為一個字典,包含服務器的唯一標識符和響應時間
servers = [
{"id": "serverA", "response_time": 10},
{"id": "serverB", "response_time": 30},
{"id": "serverC", "response_time": 100},
# 添加更多服務器
]
# 找到響應時間最短的服務器
def find_least_response_time_server(servers):
# 初始選擇第一個服務器為最短響應時間服務器
least_response_time_server = servers[0]
# 遍歷服務器列表,找到最短響應時間的服務器
for server in servers:
if server["response_time"] < least_response_time_server["response_time"]:
least_response_time_server = server
return least_response_time_server
# 客戶端請求到來時,選擇最短響應時間的服務器
def handle_client_request():
least_response_time_server = find_least_response_time_server(servers)
if req:
least_response_time_server.handle_client_request()
需要說明的是:這只是一個簡單的示例,實際的負載均衡系統可能需要更復雜的邏輯,包括定期更新服務器的響應時間、處理服務器故障等。此外,要將這種算法應用于實際生產環境,可能需要使用專門的負載均衡軟件或硬件,這些工具可以自動管理服務器并提供更多功能。
(4) 適用場景
交通控制系統:在城市交通控制系統中,需要及時響應交通信號、路況和車輛檢測等信息。最短響應時間算法可以幫助確保交通信號及時適應交通流量的變化。
三、總結
本文分析了五種常見的負載均衡算法,算法的實現都比較簡單,在實際的生產環境中,我們可以根據自己的業務場景來選擇合適的負載均衡算法。
另外,除了上面 5種算法外,還有一種其他的負載均衡算法,比如:
- 一致性哈希:Consistent Hashing,可以參考文章:hash & 一致性hash,如何選擇?
- 加權最少連接:Weighted Least Connections,在Weighted Least Connections基礎上再加權重。
在實際生產中,我們可能并不需要自己去實現這些算法,而會選擇使用一些現有的框架,比如:nginx、lvs、haproxy等, 但是萬變不離其宗,了解這些負載均衡算法可以幫組我們更好的去理解框架。