關于Java應用相關不同產(chǎn)品的架構
當我們架設一個系統(tǒng)的時候通常需要考慮到如何與其他系統(tǒng)交互,所以我們首先需要知道各種系統(tǒng)之間是如何交互的,使用何種技術實現(xiàn)。
1. 不同系統(tǒng)不同語言之間的交互
現(xiàn)在我們常見的不同系統(tǒng)不同語言之間的交互使用WebService,Http請求。WebService,即“Web 服務”,簡寫為 WS。從字面上理解,它其實就是“基于 Web 的服務”。而服務卻是雙方的,有服務需求方,就有服務提供方。服務提供方對外發(fā)布服務,服務需求方調用服務提供方所發(fā)布的服務。如果說得再專業(yè)一點,WS 其實就是建立在 HTTP 協(xié)議上實現(xiàn)異構系統(tǒng)通訊的工具。沒錯!WS 說白了還是基于 HTTP 協(xié)議的,也就是說,數(shù)據(jù)是通過 HTTP 進行傳輸?shù)摹W钤缥覀兪怯肅XF開發(fā)SOAP服務實現(xiàn)WS,后面我們是用REST服務實現(xiàn)WS(這個目前使用比較多,也最我用得最多的這一種)。基于 CXF也可以開發(fā)REST服務,不過我們一般直接使用springMVC或者其他MVC框架實現(xiàn)REST服務。
但是在很多人的印象中Web service的話一般指十來年前IBM主導的基于XML的各種交互技術,現(xiàn)在除了一些公司在用之外用得人也很少了。廣義的話Webservice就是Web 服務了,一切皆服務。
2. 不同系統(tǒng)相同語言之間的交互
常見的不同系統(tǒng)相同語言之間的交互用RPC(遠程過程調用),或者RMI(遠程方法調用)實現(xiàn),不用對外部提供服務,當然上面說的也可以使用在相同語言之間的交互,只是我常用的是RPC。
不同產(chǎn)品的架構
3. 單個產(chǎn)品的架構演進
一般我們只是一個產(chǎn)品的情況下的架構演進歷程,如果需要對外提供webService,通常使用REST服務實現(xiàn)。
以下一段內(nèi)容來源于知乎
1)分布式架構的演進系統(tǒng)架構演化歷程-初始階段架構
初始階段 的小型系統(tǒng) 應用程序、數(shù)據(jù)庫、文件等所有的資源都在一臺服務器上通俗稱為LAMP
特征:應用程序、數(shù)據(jù)庫、文件等所有的資源都在一臺服務器上。
描述:通常服務器操作系統(tǒng)使用linux,應用程序使用PHP開發(fā),然后部署在Apache上,數(shù)據(jù)庫使用Mysql,匯集各種免費開源軟件以及一臺廉價服務器就可以開始系統(tǒng)的發(fā)展之路了。
2)系統(tǒng)架構演化歷程-應用服務和數(shù)據(jù)服務分離
好景不長,發(fā)現(xiàn)隨著系統(tǒng)訪問量的再度增加,webserver機器的壓力在高峰期會上升到比較高,這個時候開始考慮增加一臺webserver
特征:應用程序、數(shù)據(jù)庫、文件分別部署在獨立的資源上。
描述:數(shù)據(jù)量增加,單臺服務器性能及存儲空間不足,需要將應用和數(shù)據(jù)分離,并發(fā)處理能力和數(shù)據(jù)存儲空間得到了很大改善。
3)系統(tǒng)架構演化歷程-使用緩存改善性能
特征:數(shù)據(jù)庫中訪問較集中的一小部分數(shù)據(jù)存儲在緩存服務器中,減少數(shù)據(jù)庫的訪問次數(shù),降低數(shù)據(jù)庫的訪問壓力。
描述:系統(tǒng)訪問特點遵循二八定律,即80%的業(yè)務訪問集中在20%的數(shù)據(jù)上。緩存分為本地緩存和遠程分布式緩存,本地緩存訪問速度更快但緩存數(shù)據(jù)量有限,同時存在與應用程序爭用內(nèi)存的情況。
4)系統(tǒng)架構演化歷程-使用應用服務器集群
在做完分庫分表這些工作后,數(shù)據(jù)庫上的壓力已經(jīng)降到比較低了,又開始過著每天看著訪問量暴增的幸福生活了,突然有一天,發(fā)現(xiàn)系統(tǒng)的訪問又開始有變 慢的趨勢了,這個時候首先查看數(shù)據(jù)庫,壓力一切正常,之后查看webserver,發(fā)現(xiàn)apache阻塞了很多的請求,而應用服務器對每個請求也是比較快 的,看來 是請求數(shù)太高導致需要排隊等待,響應速度變慢
特征:多臺服務器通過負載均衡同時向外部提供服務,解決單臺服務器處理能力和存儲空間上限的問題。
描述:使用集群是系統(tǒng)解決高并發(fā)、海量數(shù)據(jù)問題的常用手段。通過向集群中追加資源,提升系統(tǒng)的并發(fā)處理能力,使得服務器的負載壓力不再成為整個系統(tǒng)的瓶頸。
#p#
5)系統(tǒng)架構演化歷程-數(shù)據(jù)庫讀寫分離
享受了一段時間的系統(tǒng)訪問量高速增長的幸福后,發(fā)現(xiàn)系統(tǒng)又開始變慢了,這次又是什么狀況呢,經(jīng)過查找,發(fā)現(xiàn)數(shù)據(jù)庫寫入、更新的這些操作的部分數(shù)據(jù)庫連接的資源競爭非常激烈,導致了系統(tǒng)變慢
特征:多臺服務器通過負載均衡同時向外部提供服務,解決單臺服務器處理能力和存儲空間上限的問題。
描述:使用集群是系統(tǒng)解決高并發(fā)、海量數(shù)據(jù)問題的常用手段。通過向集群中追加資源,使得服務器的負載壓力不在成為整個系統(tǒng)的瓶頸。
6)系統(tǒng)架構演化歷程-反向代理和CDN加速
特征:采用CDN和反向代理加快系統(tǒng)的 訪問速度。
描述:為了應付復雜的網(wǎng)絡環(huán)境和不同地區(qū)用戶的訪問,通過CDN和反向代理加快用戶訪問的速度,同時減輕后端服務器的負載壓力。CDN與反向代理的基本原理都是緩存。
7)系統(tǒng)架構演化歷程-分布式文件系統(tǒng)和分布式數(shù)據(jù)庫
隨著系統(tǒng)的不斷運行,數(shù)據(jù)量開始大幅度增長,這個時候發(fā)現(xiàn)分庫后查詢?nèi)匀粫行┞谑前凑辗謳斓乃枷腴_始做分表的工作
特征:數(shù)據(jù)庫采用分布式數(shù)據(jù)庫,文件系統(tǒng)采用分布式文件系統(tǒng)。
描述:任何強大的單一服務器都滿足不了大型系統(tǒng)持續(xù)增長的業(yè)務需求,數(shù)據(jù)庫讀寫分離隨著業(yè)務的發(fā)展最終也將無法滿足需求,需要使用分布式數(shù)據(jù)庫及 分布式文件系統(tǒng)來支撐。分布式數(shù)據(jù)庫是系統(tǒng)數(shù)據(jù)庫拆分的***方法,只有在單表數(shù)據(jù)規(guī)模非常龐大的時候才使用,更常用的數(shù)據(jù)庫拆分手段是業(yè)務分庫,將不同的 業(yè)務數(shù)據(jù)庫部署在不同的物理服務器上。
8)系統(tǒng)架構演化歷程-使用NoSQL和搜索引擎
特征:系統(tǒng)引入NoSQL數(shù)據(jù)庫及搜索引擎。
描述:隨著業(yè)務越來越復雜,對數(shù)據(jù)存儲和檢索的需求也越來越復雜,系統(tǒng)需要采用一些非關系型數(shù)據(jù)庫如NoSQL和分數(shù)據(jù)庫查詢技術如搜索引擎。應用服務器通過統(tǒng)一數(shù)據(jù)訪問模塊訪問各種數(shù)據(jù),減輕應用程序管理諸多數(shù)據(jù)源的麻煩。
9)系統(tǒng)架構演化歷程-業(yè)務拆分
特征:系統(tǒng)上按照業(yè)務進行拆分改造,應用服務器按照業(yè)務區(qū)分進行分別部署。
描述:為了應對日益復雜的業(yè)務場景,通常使用分而治之的手段將整個系統(tǒng)業(yè)務分成不同的產(chǎn)品線,應用之間通過超鏈接建立關系,也可以通過消息隊列進 行數(shù)據(jù)分發(fā),當然更多的還是通過訪問同一個數(shù)據(jù)存儲系統(tǒng)來構成一個關聯(lián)的完整系統(tǒng)。縱向拆分:將一個大應用拆分為多個小應用,如果新業(yè)務較為獨立,那么就 直接將其設計部署為一個獨立的Web應用系統(tǒng)縱向拆分相對較為簡單,通過梳理業(yè)務,將較少相關的業(yè)務剝離即可。橫向拆分:將復用的業(yè)務拆分出來,獨立部署 為分布式服務,新增業(yè)務只需要調用這些分布式服務橫向拆分需要識別可復用的業(yè)務,設計服務接口,規(guī)范服務依賴關系。
10)系統(tǒng)架構演化歷程-分布式服務
Q:分布式服務應用會面臨哪些問題?
(1) 當服務越來越多時,服務URL配置管理變得非常困難,F(xiàn)5硬件負載均衡器的單點壓力也越來越大。
(2) 當進一步發(fā)展,服務間依賴關系變得錯蹤復雜,甚至分不清哪個應用要在哪個應用之前啟動,架構師都不能完整的描述應用的架構關系。
(3) 接著,服務的調用量越來越大,服務的容量問題就暴露出來,這個服務需要多少機器支撐?什么時候該加機器?
(4) 服務多了,溝通成本也開始上升,調某個服務失敗該找誰?服務的參數(shù)都有什么約定?
(5) 一個服務有多個業(yè)務消費者,如何確保服務質量?
(6) 隨著服務的不停升級,總有些意想不到的事發(fā)生,比如cache寫錯了導致內(nèi)存溢出,故障不可避免,每次核心服務一掛,影響一大片,人心慌慌,如何控制故障的影響面?服務是否可以功能降級?或者資源劣化?
這個好像是大型網(wǎng)站技術架構核心原理與案例分析開篇的內(nèi)容,不過作者總結得不錯,我就轉載一下吧。
4. 產(chǎn)品線的架構
還有一種就是上面也有提到的業(yè)務拆分。現(xiàn)在我們需要做一個產(chǎn)品線,我們只需要一個數(shù)據(jù)層,一個通用業(yè)務邏輯層,前面還有各種應用和界面層,不需要 對外部系統(tǒng)(外部公司的系統(tǒng))提供服務的情況以前我們一般會選擇用EJB等來構建分布式應用,但是現(xiàn)在我們可以使用dobbo、thrift、avro、 hessian這類RPC框架來構建分布式應用實現(xiàn)不同應用和數(shù)據(jù)來源的交互。這種結構模式下我們需要對其他公司提供服務,可以專門寫一個應用對外部系統(tǒng) 提供rest服務。一般大多數(shù)互聯(lián)網(wǎng)服務背后都要訪問十幾個甚至幾百個內(nèi)部服務,它們之間的通信方式一般都是RPC:就像訪問一個遠程方法那樣,輸入?yún)?shù) 后等待返回結果。這對于構建復雜系統(tǒng)是最容易理解的方式。
如下圖的模型,文件系統(tǒng),緩存那些沒有畫出來,大家理解就行。
結語:
-
不管哪種架構我們都需要做好模塊化(盡量做到模塊復用)。
-
不要為了架構而架構導致過度設計。
-
不管何種架構都是為了更好滿足業(yè)務需求,架構應該跟隨業(yè)務的發(fā)展而發(fā)展。
-
當前的架構如果可以滿足當前的業(yè)務發(fā)展,就可以考慮下一步的擴展了,不用一下子考慮3步4步甚至更多。