關于負載均衡的一切
什么是負載均衡?
負載均衡(Load Balance)是分布式系統架構設計中必須考慮的因素之一,它通常是指,將請求/數據均勻分攤到多個操作單元上執行,負載均衡的關鍵在于均勻。
常見的負載均衡方案有哪些?
常見互聯網分布式架構如上,分為:
- 客戶端層
- 反向代理層
- 站點層
- 服務層
- 數據層
可以看到,每一個下游都有多個上游調用,只需要做到,每一個上游都均勻訪問每一個下游,就能實現整體的均勻分攤。
***層:客戶端層到反向代理層
客戶端層到反向代理層的負載均衡,是通過“DNS輪詢”實現的。
DNS-server對于一個域名配置了多個解析ip,每次DNS解析請求來訪問DNS-server,會輪詢返回這些ip,保證每個ip的解析概率是相同的。這些ip就是nginx的外網ip,以做到每臺nginx的請求分配也是均衡的。
第二層:反向代理層到站點層
反向代理層到站點層的負載均衡,是通過“nginx”實現的。
畫外音:nginx是反向代理的泛指。
修改nginx.conf,可以實現多種均衡策略:
(1) 請求輪詢:和DNS輪詢類似,請求依次路由到各個web-server;
(2) 最少連接路由:哪個web-server的連接少,路由到哪個web-server;
(3) ip哈希:按照訪問用戶的ip哈希值來路由web-server,只要用戶的ip分布是均勻的,請求理論上也是均勻的,ip哈希均衡方法可以做到,同一個用戶的請求固定落到同一臺web-server上,此策略適合有狀態服務,例如session;
畫外音:站點層可以存儲session,但強烈不建議這么做,站點層無狀態是分布式架構設計的基本原則之一,session***放到數據層存儲。
(4) …
第三層:站點層到服務層
站點層到服務層的負載均衡,是通過“服務連接池”實現的。
上游連接池會建立與下游服務多個連接,每次請求會“隨機”選取連接來訪問下游服務。除了負載均衡,服務連接池還能夠實現故障轉移、超時處理、限流限速、ID串行化等諸多功能。
第四層:訪問數據層
在數據量很大的情況下,由于數據層(db/cache)涉及數據的水平切分,所以數據層的負載均衡更為復雜一些,它分為“數據的均衡”,與“請求的均衡”。
- 數據的均衡是指:水平切分后的每個服務(db/cache),數據量是均勻的。
- 請求的均衡是指:水平切分后的每個服務(db/cache),請求量是均勻的。
業內常見的水平切分方式有這么幾種:
一、按照range水平切分
每一個數據服務,存儲一定范圍的數據:
- user0服務:存儲uid范圍1-1kw
- user1服務:存儲uid范圍1kw-2kw
這個方案的好處是:
- 規則簡單,service只需判斷一下uid范圍就能路由到對應的存儲服務
- 數據均衡性較好
- 比較容易擴展,可以隨時加一個uid[2kw,3kw]的數據服務
不足是:
- 請求的負載不一定均衡,一般來說,新注冊的用戶會比老用戶更活躍,大range的服務請求壓力會更大
二、按照id哈希水平切分
每一個數據服務,存儲某個key值hash后的部分數據:
- user0服務:存儲偶數uid數據
- user1服務:存儲奇數uid數據
這個方案的好處是:
- 規則簡單,service只需對uid進行hash能路由到對應的存儲服務
- 數據均衡性較好
- 請求均勻性較好
不足是:
- 不容易擴展,擴展一個數據服務,hash方法改變時候,可能需要進行數據遷移
總結
負載均衡(Load Balance)是分布式系統架構設計中必須考慮的因素之一,它通常是指,將請求/數據均勻分攤到多個操作單元上執行,其的關鍵在于均勻:
- 反向代理層的負載均衡,是通過“DNS輪詢”實現的
- 站點層的負載均衡,是通過“nginx”實現的
- 服務層的負載均衡,是通過“服務連接池”實現的
- 數據層的負載均衡,要考慮“數據的均衡”與“請求的均衡”兩個點,常見的方式有“按照范圍水平切分”與“hash水平切分”
希望大家有收獲。
【本文為51CTO專欄作者“58沈劍”原創稿件,轉載請聯系原作者】