阿里技術(shù)大牛:一份架構(gòu)師成神路線圖!
架構(gòu)師是一個既能掌控整體又能洞悉局部瓶頸并依據(jù)具體的業(yè)務(wù)場景給出解決方案的團隊領(lǐng)導(dǎo)型人物??此仆昝赖?ldquo;人格模型”背后,是艱辛的探索。
圖片來自包圖網(wǎng)
今天,阿里巴巴技術(shù)專家九摩將多年經(jīng)驗,進行系統(tǒng)性地總結(jié),幫助更多架構(gòu)師在進階這條路上走得更“順暢”,姿態(tài)更“優(yōu)雅”。
架構(gòu)師職責(zé)
架構(gòu)師不是一個人,他需要建立高效卓越的體系,帶領(lǐng)團隊去攻城略地,在規(guī)定的時間內(nèi)完成項目。
架構(gòu)師需要能夠識別定義并確認(rèn)需求,能夠進行系統(tǒng)分解形成整體架構(gòu),能夠正確地技術(shù)選型,能夠制定技術(shù)規(guī)格說明并有效推動實施落地。
按 TOGAF 的定義,架構(gòu)師的職責(zé)是了解并關(guān)注實際上關(guān)系重大但未變得過載的一些關(guān)鍵細(xì)節(jié)和界面。
架構(gòu)師的角色有:
- 理解并解析需求
- 創(chuàng)建有用的模型
- 確認(rèn)、細(xì)化并擴展模型
- 管理架構(gòu)
從業(yè)界來看對于架構(gòu)師的理解可以大概區(qū)分為:
- 企業(yè)架構(gòu)師:專注于企業(yè)總體 IT 架構(gòu)的設(shè)計。
- IT 架構(gòu)師-軟件產(chǎn)品架構(gòu)師:專注于軟件產(chǎn)品的研發(fā)。
- IT 架構(gòu)師-應(yīng)用架構(gòu)師:專注于結(jié)合企業(yè)需求,定制化 IT 解決方案;大部分需要交付的工作包括總體架構(gòu)、應(yīng)用架構(gòu)、數(shù)據(jù)架構(gòu),甚至部署架構(gòu)。
- IT 架構(gòu)師-技術(shù)架構(gòu)師:專注于基礎(chǔ)設(shè)施,某種軟硬件體系,甚至云平臺,提交:產(chǎn)品建議、產(chǎn)品選型、部署架構(gòu)、網(wǎng)絡(luò)方案,甚至數(shù)據(jù)中心建設(shè)方案等。
阿里內(nèi)部沒有在職位 Title 上專門設(shè)置架構(gòu)師了,架構(gòu)師更多是以角色而存在,現(xiàn)在還留下可見的 Title 有兩個:首席架構(gòu)師和解決方案架構(gòu)師。
其中解決方案架構(gòu)師目前在大部分 BU 都有設(shè)置,特別是在阿里云和電商體系。
解決方案架構(gòu)師
①工作方式
工作方式理解:
- 了解和挖掘客戶痛點,項目定義,現(xiàn)有環(huán)境管理。
- 梳理明確高階需求和非功能性需求。
- 客戶有什么資產(chǎn),星環(huán)(阿里電商操作系統(tǒng))/阿里云等有什么解決方案。
- 溝通,方案建議,多次迭代,交付總體架構(gòu)。
- 架構(gòu)決策。
②工作職責(zé)
從客戶視圖來看:
- 堅定客戶高層信心:利用架構(gòu)和解決方案能力,幫忙客戶選擇星環(huán)/阿里云平臺的信心。
- 解決客戶中層問題:利用星環(huán)/阿里云平臺服務(wù)+結(jié)合應(yīng)用架構(gòu)設(shè)計/解決方案能力,幫忙客戶解決業(yè)務(wù)問題,獲得業(yè)務(wù)價值。
- 引領(lǐng)客戶 IT 員工和阿里生態(tài)同學(xué):技術(shù)引領(lǐng)、方法引領(lǐng)、產(chǎn)品引領(lǐng)。
從項目視圖看:
- 對接管理部門:匯報技術(shù)方案,進度;技術(shù)溝通。
- 對接客戶 PM,項目 PM:協(xié)助項目計劃,人員管理等。負(fù)責(zé)所有技術(shù)交付物的指導(dǎo)。
- 對接業(yè)務(wù)部門和需求人員:了解和挖掘痛點,幫忙梳理高級業(yè)務(wù)需求,指導(dǎo)需求工藝。
- 對接開發(fā):產(chǎn)品支持、技術(shù)指導(dǎo)、架構(gòu)指導(dǎo)。
- 對接測試:配合測試計劃和工藝制定。配合性能測試或者非功能性測試。
- 對接運維:產(chǎn)品支持,運維支持。
- 對接配置&環(huán)境:產(chǎn)品支持。
- 其他:阿里技術(shù)資源聚合。
從阿里內(nèi)部看:
- 銷售方案支持。
- 市場宣貫。
- 客戶需求 Facade。
- 解決方案沉淀。
架構(gòu)師職責(zé)明確了,那么有什么架構(gòu)思維可以指導(dǎo)架構(gòu)設(shè)計呢?請看下述的架構(gòu)思維。
架構(gòu)思維
自頂向下構(gòu)建架構(gòu)
要點主要如下:
- 首先定義問題,而定義問題中最重要的是定義客戶的問題。定義問題,特別是識別出關(guān)鍵問題。
關(guān)鍵問題是對客戶有體感,能夠解決客戶痛點,通過一定的數(shù)據(jù)化來衡量識別出來,關(guān)鍵問題要優(yōu)先給出解決方案。
- 問題定義務(wù)必加入時間維度,把手段/方案和問題定義區(qū)分開來。
- 問題定義中,需要對問題進行升層思考后再進行升維思考,從而真正抓到問題的本質(zhì),理清和挖掘清楚需求;要善用第一性原理思維進行分析思考問題。
- 問題解決原則:先解決客戶的問題(使命),然后才能解決自己的問題(愿景);務(wù)必記住不是強調(diào)我們怎么樣,而是我們能為客戶具體解決什么問題,然后才是我們變成什么,從而怎么樣去更好得服務(wù)客戶。
- 善用多種方法對客戶問題進行分析,轉(zhuǎn)換成我們產(chǎn)品或者平臺需要提供的能力,比如倉儲系統(tǒng) WMS 可以提供哪些商業(yè)能力。
- 對我們現(xiàn)有的流程和能力模型進行梳理,找到需要提升的地方,升層思考和升維思考真正明確提升部分。
- 定義指標(biāo),并能夠?qū)χ笜?biāo)進行拆解,然后進行數(shù)學(xué)建模。
- 將抽象出來的能力訴求轉(zhuǎn)換成技術(shù)挑戰(zhàn),此步對于技術(shù)人員來說相當(dāng)于找到了靶子,可以進行方案的設(shè)計了,需要結(jié)合自底向上的架構(gòu)推導(dǎo)方式。
- 創(chuàng)新可以是業(yè)務(wù)創(chuàng)新,也可以是產(chǎn)品創(chuàng)新,也可以是技術(shù)創(chuàng)新,也可以是運營創(chuàng)新,升層思考、升維思考,使用第一性原理思維、生物學(xué)(進化論--進化=變異+選擇+隔離、熵增定律、分形和涌現(xiàn))思維等哲科思維可以幫助我們在業(yè)務(wù),產(chǎn)品,技術(shù)上發(fā)現(xiàn)不同的創(chuàng)新可能??梢哉f哲科思維是架構(gòu)師的靈魂思維。
自底向上推導(dǎo)應(yīng)用架構(gòu)
先根據(jù)業(yè)務(wù)流程,分解出系統(tǒng)時序圖,根據(jù)時序圖開始對模塊進行歸納,從而得到粒度更大的模塊,模塊的組合/聚合構(gòu)建整個系統(tǒng)架構(gòu)。
基本上應(yīng)用邏輯架構(gòu)的推導(dǎo)有 4 個子路徑,他們分別是:
- 業(yè)務(wù)概念架構(gòu):業(yè)務(wù)概念架構(gòu)來自于業(yè)務(wù)概念模型和業(yè)務(wù)流程。
- 系統(tǒng)模型:來自于業(yè)務(wù)概念模型。
- 系統(tǒng)流程:來自業(yè)務(wù)流程。
- 非功能性的系統(tǒng)支撐:來自對性能、穩(wěn)定性、成本的需要。
效率、穩(wěn)定性、性能是最影響邏輯架構(gòu)落地成物理架構(gòu)的三大主要因素,所以從邏輯架構(gòu)到物理架構(gòu),一定需要先對效率、穩(wěn)定性和性能做出明確的量化要求。
自底向上重度依賴于演繹和歸納。如果是產(chǎn)品方案已經(jīng)明確,程序員需要理解這個業(yè)務(wù)需求,并根據(jù)產(chǎn)品方案推導(dǎo)出架構(gòu),此時一般使用自底向上的方法,而領(lǐng)域建模就是這種自底向上的分析方法。
對于自底向上的分析方法,如果提煉一下關(guān)鍵詞,會得到如下兩個關(guān)鍵詞:
- 演繹
- 歸納
演繹就是邏輯推導(dǎo),越是底層的,越需要演繹:
- 從用例到業(yè)務(wù)模型就屬于演繹。
- 從業(yè)務(wù)模型到系統(tǒng)模型也屬于演繹。
- 根據(jù)目前的問題,推導(dǎo)出要實施某種穩(wěn)定性措施,這也是演繹。
這里的歸納是根據(jù)事物的某個維度來進行歸類,越是高層的,越需要歸納:
領(lǐng)域驅(qū)動設(shè)計架構(gòu)
大部分傳統(tǒng)架構(gòu)都是基于領(lǐng)域模型分析架構(gòu),典型的領(lǐng)域?qū)崿F(xiàn)模型設(shè)計可以參考 DDD(領(lǐng)域驅(qū)動設(shè)計),詳細(xì)可以參考《實現(xiàn)領(lǐng)域驅(qū)動設(shè)計》這本書。
另外《UML 和模式應(yīng)用》在領(lǐng)域建模實操方面比較好,前者偏理論了解,后者便于落地實踐。
領(lǐng)域劃分設(shè)計步驟:
①對用戶需求場景分析,識別出業(yè)務(wù)全維度 Use Case。
②分析模型魯棒圖,識別出業(yè)務(wù)場景中所有的實體對象。魯棒圖是需求設(shè)計過程中使用的一種方法(魯棒性分析),通過魯棒分析法可以讓設(shè)計人員更清晰,更全面地了解需求。
它通常使用在需求分析后及需求設(shè)計前做軟件架構(gòu)分析之用,它主要注重于功能需求的設(shè)計分析工作。
需求規(guī)格說明書為其輸入信息,設(shè)計模型為其輸出信息。它是從功能需求向設(shè)計方案過渡的第一步,重點是識別組成軟件系統(tǒng)的高級職責(zé)模塊、規(guī)劃模塊之間的關(guān)系。
魯棒圖包含三種圖形:邊界、控制、實體,三個圖形如下:
③領(lǐng)域劃分,將所有識別出的實體對象進行分類。
④評估域劃分合理性,并進行優(yōu)化。
基于數(shù)據(jù)驅(qū)動設(shè)計架構(gòu)
隨著 IoT、大數(shù)據(jù)和人工智能的發(fā)展,以領(lǐng)域驅(qū)動的方式進行架構(gòu)往往滿足不了需求或者達不到預(yù)期的效果。
在大數(shù)據(jù)時代,在大數(shù)據(jù)應(yīng)用場景,我們需要轉(zhuǎn)變思維,從領(lǐng)域分析升維到基于大數(shù)據(jù)統(tǒng)計分析結(jié)果來進行業(yè)務(wù)架構(gòu)、應(yīng)用架構(gòu)、數(shù)據(jù)架構(gòu)和技術(shù)架構(gòu)。
這里需要架構(gòu)師具備數(shù)理統(tǒng)計分析的基礎(chǔ)和 BI 的能力,以數(shù)據(jù)思維來架構(gòu)系統(tǒng),典型的系統(tǒng)像阿里的數(shù)據(jù)分析平臺采云間和菜鳥的數(shù)據(jù)分析平臺 FBI。
上述四種思維,往往在架構(gòu)設(shè)計中是融合使用的,需要根據(jù)業(yè)務(wù)或者系統(tǒng)的需求來選擇側(cè)重思維方式。
有了架構(gòu)思維的指導(dǎo),具體有沒有通用/標(biāo)準(zhǔn)化的架構(gòu)框架以更好的執(zhí)行架構(gòu)設(shè)計?請看常見的架構(gòu)框架。下述的架構(gòu)框架其實本身也包含了重要的一些架構(gòu)思維。
常見架構(gòu)框架
TOGAF
TOGAF 是 The Open Group Architecture Framework 的縮寫,它由 The Open Group 開發(fā),The Open Group 是一個非盈利的技術(shù)行業(yè)聯(lián)盟,它不斷更新和重申 TOGAF。
TOGAF 強調(diào)商業(yè)目標(biāo)作為架構(gòu)的驅(qū)動力,并提供了一個實踐的儲藏庫,其中包括 TOGAF 架構(gòu)開發(fā)方法(ADM)、TOGAF 架構(gòu)內(nèi)容框架、TOGAF 參考模型、架構(gòu)開發(fā)方法(ADM)指引和技術(shù)、企業(yè)連續(xù)統(tǒng)一體和 TOGAF 能力框架。
①ADM
ADM 是一個迭代的步驟順序以發(fā)展企業(yè)范圍的架構(gòu)的方法。
②架構(gòu)內(nèi)容框架
③參考模型
④ADM 指引和技術(shù)
架構(gòu)迭代階段:
在不同水平運用 ADM:
利益相關(guān)者分類:
⑤企業(yè)連續(xù)統(tǒng)一體
架構(gòu)指導(dǎo)及支持解決方案:基礎(chǔ) ➝通用系統(tǒng) ➝行業(yè)➝組織特定。
⑥能力框架
更多內(nèi)容可以參考《TOGAF標(biāo)準(zhǔn)9.1版本》或者https://www.opengroup.org/togaf。
Zachman
第一個具有影響力的框架方法論就是 Zachman 框架,它是 John Zachman 首次在 1987 年提出的。
Zachman 框架模型分兩個維度:
- 橫向維度采用6W(what、how、where、who、when、why)進行組織。
- 縱向維度反映了 IT 架構(gòu)層次,從上到下(Top-Down),分別為范圍模型、企業(yè)模型、系統(tǒng)模型、技術(shù)模型、詳細(xì)模型、功能模型。
橫向結(jié)合 6W,Zachman 框架分別由數(shù)據(jù)、功能、網(wǎng)絡(luò)、人員、時間、動機分別對應(yīng)回答 What、How、Where、Who、When 與 Why 這六個問題。
ITSA
ITSA 誕生于 1986 年的惠普,是世界最早的企業(yè)架構(gòu)框架(IT戰(zhàn)略與架構(gòu))。建模原則就是“Everything you need, and nothing you don’t”,只放你要的東西。
DODAF
DODAF 是美國國防部架構(gòu)框架,是一個控制“EA開發(fā)、維護和決策生成”的組織機制,是統(tǒng)一組織“團隊資源、描述和控制EA活動”的總體結(jié)構(gòu)。
DODAF 涵蓋 DoD 的所有業(yè)務(wù)領(lǐng)域,定義了表示、描述、集成 DoD 范圍內(nèi)眾多架構(gòu)的標(biāo)準(zhǔn)方法。
確保架構(gòu)描述可比較、評估,提供了對 FoS (系統(tǒng)族)和 SoS (體系)進行理解、比較、集成和互操作共同的架構(gòu)基礎(chǔ),提供開發(fā)和表達架構(gòu)描述的規(guī)則和指南,但不指導(dǎo)如何實現(xiàn)。
DODAF 核心是 8 個視點和 52 個模型:
①全景視點 AV
與所有視點相關(guān)的體系結(jié)構(gòu)描述的頂層概貌。它提供有關(guān)體系結(jié)構(gòu)描述的總體信息,諸如體系結(jié)構(gòu)描述的范圍和背景。范圍包括體系結(jié)構(gòu)描述的專業(yè)領(lǐng)域和時間框架。
背景由構(gòu)成體系結(jié)構(gòu)描述背景的相互關(guān)聯(lián)各種條件組成,包括條令,戰(zhàn)術(shù)、技術(shù)和程序,相關(guān)目標(biāo)和構(gòu)想的描述,作戰(zhàn)概念(CONOPS),想定和環(huán)境條件。
②能力視點 CV
能力視點(CV)集中反映了與整體愿景相關(guān)的組織目標(biāo),這些愿景指在特定標(biāo)準(zhǔn)和條件下進行特定行動過程或是達成期望效果的能力,它們綜合使用各種手段和方式來完成一組任務(wù)。
CV 為體系結(jié)構(gòu)描述中闡述的能力提供了戰(zhàn)略背景和相應(yīng)的高層范圍,比作戰(zhàn)概念圖中定義的基于想定的范圍更全面。
這些模型是高層的,用決策者易于理解的術(shù)語來描述能力,以便溝通能力演進方面戰(zhàn)略構(gòu)想。
③作戰(zhàn)視點 OV
作戰(zhàn)視點(OV)集中反映了完成 DoD 使命的機構(gòu)、任務(wù)或執(zhí)行的行動以及彼此間必須交換的信息。描述信息交換的種類、頻度、性質(zhì),信息交換支持哪些任務(wù)和活動。
④服務(wù)視點 SvcV
服務(wù)視點(SvcV)集中反映了為作戰(zhàn)行動提供支撐的系統(tǒng)、服務(wù)和相互交織的功能。DoD 流程包括作戰(zhàn)、業(yè)務(wù)、情報和基礎(chǔ)設(shè)施功能。
SvcV 功能和服務(wù)資源及要素可以鏈接到 0V 中的體系結(jié)構(gòu)數(shù)據(jù)。這些系統(tǒng)功能和服務(wù)資源支撐作戰(zhàn)行動,促進信息交換。
⑤系統(tǒng)視點 SV
系統(tǒng)視點(SV)集中反映支持作戰(zhàn)行動中的自動化系統(tǒng)、相互交聯(lián)和其他系統(tǒng)功能的信息。
隨著對面向服務(wù)環(huán)境和云計算的重視,在 DoDAF 的未來版本中也許不會有系統(tǒng)視點。
⑥數(shù)信視點 DIV
數(shù)據(jù)和信息視點(DIV),簡稱數(shù)信視點,反映了體系結(jié)構(gòu)描述中的業(yè)務(wù)信息需求和結(jié)構(gòu)化的業(yè)務(wù)流程規(guī)則。
描述體系結(jié)構(gòu)描述中與信息交換相關(guān)的信息,諸如屬性、特征和相互關(guān)系。
必要時,本視點模型中用到的數(shù)據(jù)需要由多個架構(gòu)團隊來共同考慮。
⑦標(biāo)準(zhǔn)視點 StdV
標(biāo)準(zhǔn)視點(StdV)是用來管控系統(tǒng)各組成部分或要素的編排、交互和相互依賴的規(guī)則的最小集。其目的是確保系統(tǒng)能滿足特定的一組操作需求。
標(biāo)準(zhǔn)視點提供技術(shù)系統(tǒng)的實施指南,以工程規(guī)范為基礎(chǔ),確立通用的積木塊,開發(fā)產(chǎn)品線。
包括一系列技術(shù)標(biāo)準(zhǔn)、執(zhí)行慣例、標(biāo)準(zhǔn)選項、規(guī)則和規(guī)范,這些標(biāo)準(zhǔn)在特定體系結(jié)構(gòu)描述中可以組成管控系統(tǒng)和系統(tǒng)/服務(wù)要素的文件(profile)。
⑧項目視點 PV
項目視點(PV)集中反映了項目是如何有機地組織成一個釆辦項目的有序組合。
描述多個采辦項目之間關(guān)聯(lián)關(guān)系,每個采辦項目都負(fù)責(zé)交付特定系統(tǒng)或能力。
TOGAF,Zachman,ITSA 和 DODAF 是非常不錯的架構(gòu)框架,尤其前兩者應(yīng)用很廣泛,TOGAF 還有專門的架構(gòu)認(rèn)證。
當(dāng)我們掌握了這些框架,我們是不是需要一些架構(gòu)原則來指導(dǎo)更具體的設(shè)計?請看下文。
架構(gòu)原則
設(shè)計原則就是架構(gòu)設(shè)計的指導(dǎo)思想,它指導(dǎo)我們?nèi)绾螌?shù)據(jù)和函數(shù)組織成類,如何將類鏈接起來成為組件和程序。
反向來說,架構(gòu)的主要工作就是將軟件拆解為組件,設(shè)計原則指導(dǎo)我們?nèi)绾尾鸾狻⒉鸾獾牧6?、組件間依賴的方向、組件解耦的方式等。
設(shè)計原則有很多,我們進行架構(gòu)設(shè)計的主導(dǎo)原則是 OCP(開閉原則),在類和代碼的層級上有:SRP(單一職責(zé)原則)、LSP(里氏替換原則)、ISP(接口隔離原則)、DIP(依賴反轉(zhuǎn)原則)。
在組件的層級上有:REP(復(fù)用、發(fā)布等同原則)、CCP(共同閉包原則)、CRP(共同復(fù)用原則),處理組件依賴問題的三原則:無依賴環(huán)原則、穩(wěn)定依賴原則、穩(wěn)定抽象原則。
①OCP(開閉原則):設(shè)計良好的軟件應(yīng)該易于擴展,同時抗拒修改。這是我們進行架構(gòu)設(shè)計的主導(dǎo)原則,其他的原則都為這條原則服務(wù)。
②SRP(單一職責(zé)原則):任何一個軟件模塊,都應(yīng)該有且只有一個被修改的原因,“被修改的原因“指系統(tǒng)的用戶或所有者,翻譯一下就是,任何模塊只對一個用戶的價值負(fù)責(zé),該原則指導(dǎo)我們?nèi)绾尾鸱纸M件。
舉個例子,CTO 和 COO 都要統(tǒng)計員工的工時,當(dāng)前他們要求的統(tǒng)計方式可能是相同的,我們復(fù)用一套代碼,這時 COO 說周末的工時統(tǒng)計要乘以二,按照這個需求修改完代碼,CTO 可能就要過來罵街了。
當(dāng)然這是個非常淺顯的例子,實際項目中也有很多代碼服務(wù)于多個價值主體,這帶來很大的探秘成本和修改風(fēng)險,另外,當(dāng)一份代碼有多個所有者時,就會產(chǎn)生代碼合并沖突的問題。
③LSP(里氏替換原則):當(dāng)用同一接口的不同實現(xiàn)互相替換時,系統(tǒng)的行為應(yīng)該保持不變。該原則指導(dǎo)的是接口與其實現(xiàn)方式。
你一定很疑惑,實現(xiàn)了同一個接口,他們的行為也肯定是一致的呀,還真不一定。
假設(shè)認(rèn)為矩形的系統(tǒng)行為是:面積=寬*高,讓正方形實現(xiàn)矩形的接口,在調(diào)用 setW 和 setH 時,正方形做的其實是同一個事情,設(shè)置它的邊長。
這時下邊的單元測試用矩形能通過,用正方形就不行,實現(xiàn)同樣的接口,但是系統(tǒng)行為變了,這是違反 LSP 的經(jīng)典案例。
- Rectangle r = ... r.setW(5); r.setH(2); assert(r.area() == 10);
④ISP(接口隔離原則):不依賴任何不需要的方法、類或組件。該原則指導(dǎo)我們的接口設(shè)計。
當(dāng)我們依賴一個接口但只用到了其中的部分方法時,其實我們已經(jīng)依賴了不需要的方法或類,當(dāng)這些方法或類有變更時,會引起我們類的重新編譯,或者引起我們組件的重新部署,這些都是不必要的。所以我們最好定義個小接口,把用到的方法拆出來。
⑤DIP(依賴反轉(zhuǎn)原則):指一種特定的解耦(傳統(tǒng)的依賴關(guān)系創(chuàng)建在高層次上。而具體的策略設(shè)置則應(yīng)用在低層次的模塊上)形式,使得高層次的模塊不依賴于低層次的模塊的實現(xiàn)細(xì)節(jié),依賴關(guān)系被顛倒(反轉(zhuǎn)),從而使得低層次模塊依賴于高層次模塊的需求抽象。
跨越組建邊界的依賴方向永遠與控制流的方向相反。該原則指導(dǎo)我們設(shè)計組件間依賴的方向。
依賴反轉(zhuǎn)原則是個可操作性非常強的原則,當(dāng)你要修改組件間的依賴方向時,將需要進行組件間通信的類抽象為接口,接口放在邊界的哪邊,依賴就指向哪邊。
⑥REP(復(fù)用、發(fā)布等同原則):軟件復(fù)用的最小粒度應(yīng)等同于其發(fā)布的最小粒度。
直白地說,就是要復(fù)用一段代碼就把它抽成組件,該原則指導(dǎo)我們組件拆分的粒度。
⑦CCP(共同閉包原則):為了相同目的而同時修改的類,應(yīng)該放在同一個組件中。
CCP 原則是 SRP 原則在組件層面的描述。該原則指導(dǎo)我們組件拆分的粒度。
對大部分應(yīng)用程序而言,可維護性的重要性遠遠大于可復(fù)用性,由同一個原因引起的代碼修改,最好在同一個組件中,如果分散在多個組件中,那么開發(fā)、提交、部署的成本都會上升。
⑧CRP(共同復(fù)用原則):不要強迫一個組件依賴它不需要的東西。CRP 原則是 ISP原則在組件層面的描述。該原則指導(dǎo)我們組件拆分的粒度。
相信你一定有這種經(jīng)歷,集成了組件 A,但組件 A 依賴了組件 B、C。即使組件 B、C 你完全用不到,也不得不集成進來。
這是因為你只用到了組件 A 的部分能力,組件 A 中額外的能力帶來了額外的依賴。如果遵循共同復(fù)用原則,你需要把 A 拆分,只保留你要用的部分。
REP、CCP、CRP 三個原則之間存在彼此競爭的關(guān)系,REP 和 CCP 是黏合性原則,它們會讓組件變得更大,而 CRP 原則是排除性原則,它會讓組件變小。
遵守REP、CCP 而忽略 CRP,就會依賴了太多沒有用到的組件和類,而這些組件或類的變動會導(dǎo)致你自己的組件進行太多不必要的發(fā)布。
遵守 REP、CRP 而忽略 CCP,因為組件拆分的太細(xì)了,一個需求變更可能要改 n 個組件,帶來的成本也是巨大的。
除了上述設(shè)計原則,還有一些重要的指導(dǎo)原則如下:
- N+1 設(shè)計:系統(tǒng)中的每個組件都應(yīng)做到?jīng)]有單點故障。
- 回滾設(shè)計:確保系統(tǒng)可以向前兼容,在系統(tǒng)升級時應(yīng)能有辦法回滾版本。
- 禁用設(shè)計:應(yīng)該提供控制具體功能是否可用的配置,在系統(tǒng)出現(xiàn)故障時能夠快速下線功能。
- 監(jiān)控設(shè)計:在設(shè)計階段就要考慮監(jiān)控的手段,便于有效的排查問題,比如引入 traceId、業(yè)務(wù)身份 Id 便于排查監(jiān)控問題。
- 多活數(shù)據(jù)中心設(shè)計:若系統(tǒng)需要極高的高可用,應(yīng)考慮在多地實施數(shù)據(jù)中心進行多活,至少在一個機房斷電的情況下系統(tǒng)依然可用。
- 采用成熟的技術(shù):剛開發(fā)的或開源的技術(shù)往往存在很多隱藏的 Bug,出了問題沒有很好的商業(yè)支持可能會是一個災(zāi)難。
- 資源隔離設(shè)計:應(yīng)避免單一業(yè)務(wù)占用全部資源。
- 架構(gòu)水平擴展設(shè)計:系統(tǒng)只有做到能水平擴展,才能有效避免瓶頸問題。
- 非核心則購買的原則:非核心功能若需要占用大量的研發(fā)資源才能解決,則考慮購買成熟的產(chǎn)品。
- 使用商用硬件:商用硬件能有效降低硬件故障的機率。
- 快速迭代:系統(tǒng)應(yīng)該快速開發(fā)小功能模塊,盡快上線進行驗證,早日發(fā)現(xiàn)問題大大降低系統(tǒng)交付的風(fēng)險。
- 無狀態(tài)設(shè)計:服務(wù)接口應(yīng)該做成無狀態(tài)的,當(dāng)前接口的訪問不依賴于接口上次訪問的狀態(tài)。
架構(gòu)師知道了職責(zé),具備很好的架構(gòu)思維,掌握了通用的架構(gòu)框架和方法論,使用架構(gòu)原則進行架構(gòu)設(shè)計,不同的業(yè)務(wù)和系統(tǒng)要求不一樣,那么有沒有針對不同場景的系統(tǒng)架構(gòu)設(shè)計?
下文就針對分布式架構(gòu)演進、單元化架構(gòu)、面向服務(wù) SOA 架構(gòu)、微服務(wù)架構(gòu)、Serverless 架構(gòu)進行介紹,以便于我們在實際運用中進行參考使用。
常見架構(gòu)
分布式架構(gòu)演進
①初始階段架構(gòu)
特征:應(yīng)用程序,數(shù)據(jù)庫,文件等所有資源都放在一臺服務(wù)器上。
②應(yīng)用服務(wù)和數(shù)據(jù)服務(wù)以及文件服務(wù)分離
說明:好景不長,發(fā)現(xiàn)隨著系統(tǒng)訪問量的再度增加,Web Server 機器的壓力在高峰期會上升到比較高,這個時候開始考慮增加一臺 Web Server。
特征:應(yīng)用程序、數(shù)據(jù)庫、文件分別部署在獨立的資源上。
③使用緩存改善性能
說明:系統(tǒng)訪問特點遵循二八定律,即 80% 的業(yè)務(wù)訪問集中在 20% 的數(shù)據(jù)上。
緩存分為本地緩存和遠程分布式緩存,本地緩存訪問速度更快但緩存數(shù)據(jù)量有限,同時存在與應(yīng)用程序爭用內(nèi)存的情況。
特征:數(shù)據(jù)庫中訪問較集中的一小部分?jǐn)?shù)據(jù)存儲在緩存服務(wù)器中,減少數(shù)據(jù)庫的訪問次數(shù),降低數(shù)據(jù)庫的訪問壓力。
③使用“應(yīng)用服務(wù)器”集群
說明:在做完分庫分表這些工作后,數(shù)據(jù)庫上的壓力已經(jīng)降到比較低了,又開始過著每天看著訪問量暴增的幸福生活了。
突然有一天,發(fā)現(xiàn)系統(tǒng)的訪問又開始有變慢的趨勢了,這個時候首先查看數(shù)據(jù)庫,壓力一切正常。
之后查看 Web Server,發(fā)現(xiàn) Apache 阻塞了很多的請求, 而應(yīng)用服務(wù)器對每個請求也是比較快的,看來是請求數(shù)太高導(dǎo)致需要排隊等待,響應(yīng)速度變慢。
特征:多臺服務(wù)器通過負(fù)載均衡同時向外部提供服務(wù),解決單臺服務(wù)器處理能力和存儲空間上限的問題。
描述:使用集群是系統(tǒng)解決高并發(fā)、海量數(shù)據(jù)問題的常用手段。通過向集群中追加資源,提升系統(tǒng)的并發(fā)處理能力,使得服務(wù)器的負(fù)載壓力不再成為整個系統(tǒng)的瓶頸。
④數(shù)據(jù)庫讀寫分離
說明:享受了一段時間的系統(tǒng)訪問量高速增長的幸福后,發(fā)現(xiàn)系統(tǒng)又開始變慢了,這次又是什么狀況呢?經(jīng)過查找,發(fā)現(xiàn)數(shù)據(jù)庫寫入、更新的這些操作的部分?jǐn)?shù)據(jù)庫連接的資源競爭非常激烈,導(dǎo)致了系統(tǒng)變慢。
特征:數(shù)據(jù)庫引入主備部署。
描述:把數(shù)據(jù)庫劃分為讀庫和寫庫,通過引入主從數(shù)據(jù)庫服務(wù),讀和寫操作在不同的數(shù)據(jù)庫服務(wù)處理。
讀庫可以有多個,通過同步機制把寫庫的數(shù)據(jù)同步到讀庫,對于需要查詢最新寫入數(shù)據(jù)場景,可以通過在緩存中多寫一份,通過緩存獲得最新數(shù)據(jù)。
⑤反向代理和 CDN 加速
特征:采用 CDN 和反向代理加快系統(tǒng)的訪問速度。
描述:為了應(yīng)付復(fù)雜的網(wǎng)絡(luò)環(huán)境和不同地區(qū)用戶的訪問,通過 CDN 和反向代理加快用戶訪問的速度,同時減輕后端服務(wù)器的負(fù)載壓力。CDN 與反向代理的基本原理都是緩存。
⑥“分布式文件”系統(tǒng) 和 “分布式數(shù)據(jù)庫”
說明:隨著系統(tǒng)的不斷運行,數(shù)據(jù)量開始大幅度增長,這個時候發(fā)現(xiàn)分庫后查詢?nèi)匀粫行┞?,于是按照分庫的思想開始做分表的工作。
特征:數(shù)據(jù)庫采用分布式數(shù)據(jù)庫,文件系統(tǒng)采用分布式文件系統(tǒng)。
描述:任何強大的單一服務(wù)器都滿足不了大型系統(tǒng)持續(xù)增長的業(yè)務(wù)需求,數(shù)據(jù)庫讀寫分離隨著業(yè)務(wù)的發(fā)展最終也將無法滿足需求,需要使用分布式數(shù)據(jù)庫及分布式文件系統(tǒng)來支撐。
分布式數(shù)據(jù)庫是系統(tǒng)數(shù)據(jù)庫拆分的最后方法,只有在單表數(shù)據(jù)規(guī)模非常龐大的時候才使用,更常用的數(shù)據(jù)庫拆分手段是業(yè)務(wù)分庫,將不同的業(yè)務(wù)數(shù)據(jù)庫部署在不同的物理服務(wù)器上。
⑦使用 NoSQL 和搜索引擎
特征:系統(tǒng)引入 NoSQL 數(shù)據(jù)庫及搜索引擎。
描述:隨著業(yè)務(wù)越來越復(fù)雜,對數(shù)據(jù)存儲和檢索的需求也越來越復(fù)雜,系統(tǒng)需要采用一些非關(guān)系型數(shù)據(jù)庫如 NoSQL 和分?jǐn)?shù)據(jù)庫查詢技術(shù)如搜索引擎。
應(yīng)用服務(wù)器通過統(tǒng)一數(shù)據(jù)訪問模塊訪問各種數(shù)據(jù),減輕應(yīng)用程序管理諸多數(shù)據(jù)源的麻煩。
⑧業(yè)務(wù)拆分
特征:系統(tǒng)上按照業(yè)務(wù)進行拆分改造,應(yīng)用服務(wù)器按照業(yè)務(wù)區(qū)分進行分別部署。
描述:為了應(yīng)對日益復(fù)雜的業(yè)務(wù)場景,通常使用分而治之的手段將整個系統(tǒng)業(yè)務(wù)分成不同的產(chǎn)品線,應(yīng)用之間通過超鏈接建立關(guān)系,也可以通過消息隊列進行數(shù)據(jù)分發(fā),當(dāng)然更多的還是通過訪問同一個數(shù)據(jù)存儲系統(tǒng)來構(gòu)成一個關(guān)聯(lián)的完整系統(tǒng)。
縱向拆分:將一個大應(yīng)用拆分為多個小應(yīng)用,如果新業(yè)務(wù)較為獨立,那么就直接將其設(shè)計部署為一個獨立的 Web 應(yīng)用系統(tǒng),縱向拆分相對較為簡單,通過梳理業(yè)務(wù),將較少相關(guān)的業(yè)務(wù)剝離即可。
橫向拆分:將復(fù)用的業(yè)務(wù)拆分出來,獨立部署為分布式服務(wù),新增業(yè)務(wù)只需要調(diào)用這些分布式服務(wù)橫向拆分需要識別可復(fù)用的業(yè)務(wù),設(shè)計服務(wù)接口,規(guī)范服務(wù)依賴關(guān)系。
⑨分布式服務(wù)
特征:公共的應(yīng)用模塊被提取出來,部署在分布式服務(wù)器上供應(yīng)用服務(wù)器調(diào)用。
描述:隨著業(yè)務(wù)越拆越小,應(yīng)用系統(tǒng)整體復(fù)雜程度呈指數(shù)級上升,由于所有應(yīng)用要和所有數(shù)據(jù)庫系統(tǒng)連接,最終導(dǎo)致數(shù)據(jù)庫連接資源不足,拒絕服務(wù)。
⑩分布式服務(wù)的問題和挑戰(zhàn):
- 當(dāng)服務(wù)越來越多時,服務(wù) URL 配置管理變得非常困難,F(xiàn)5 硬件負(fù)載均衡器的單點壓力也越來越大。
- 當(dāng)進一步發(fā)展,服務(wù)間依賴關(guān)系變得錯蹤復(fù)雜,甚至分不清哪個應(yīng)用要在哪個應(yīng)用之前啟動,架構(gòu)師都不能完整的描述應(yīng)用的架構(gòu)關(guān)系。
- 服務(wù)的調(diào)用量越來越大,服務(wù)的容量問題就暴露出來,這個服務(wù)需要多少機器支撐?什么時候該加機器?
- 服務(wù)多了,溝通成本也開始上升,調(diào)某個服務(wù)失敗該找誰?服務(wù)的參數(shù)都有什么約定?
- 一個服務(wù)有多個業(yè)務(wù)消費者,如何確保服務(wù)質(zhì)量?
- 隨著服務(wù)的不停升級,總有些意想不到的事發(fā)生,比如 Cache 寫錯了導(dǎo)致內(nèi)存溢出,故障不可避免,每次核心服務(wù)一掛,影響一大片,人心慌慌,如何控制故障的影響面?服務(wù)是否可以功能降級?或者資源劣化?
針對這些問題,下述的單元化架構(gòu),微服務(wù)架構(gòu)以及 Serveless 架構(gòu)可以一定程度解決,另外針對業(yè)務(wù)系統(tǒng),需要做到業(yè)務(wù)與業(yè)務(wù)隔離、管理域和運行域分開、業(yè)務(wù)與平臺隔離方可解決上述問題。
單元化架構(gòu)
①什么是單元化:單元化架構(gòu)是從并行計算領(lǐng)域發(fā)展而來。在分布式服務(wù)設(shè)計領(lǐng)域,一個單元(Cell)就是滿足某個分區(qū)所有業(yè)務(wù)操作的自包含的安裝。
而一個分區(qū)(Shard),則是整體數(shù)據(jù)集的一個子集,如果你用尾號來劃分用戶,那同樣尾號的那部分用戶就可以認(rèn)為是一個分區(qū)。單元化就是將一個服務(wù)設(shè)計改造讓其符合單元特征的過程。
②單元化的必要性:隨著硬件的不斷升級,計算機硬件能力已經(jīng)越來越強,CPU 越來越快,內(nèi)存越來越大,網(wǎng)絡(luò)越來越寬。這讓我們看到了在單臺機器上垂直擴展的機會。
尤其是當(dāng)你遇到一個性能要求和容量增長可以預(yù)期的業(yè)務(wù),單元化給我們提供另外的機會,讓我們可以有效降低資源的使用,提供更高性能的服務(wù)。
更高性能更低成本是我們的主要目標(biāo),經(jīng)過單元化改造,我們得以用更少(約二分之一)的機器,獲得了比原來更高(接近百倍)的性能。
性能的提升很大部分原因在于服務(wù)的本地化,而服務(wù)的集成部署又進一步降低了資源的使用。
除了性能收益,還有很多收益,比如更好的隔離性,包括請求隔離和資源隔離,比如更友好的升級,產(chǎn)品可以灰度發(fā)布等。單元化改造后對高峰的應(yīng)對以及擴容方式等問題的解決。
③如何做到單元化:先看下圖傳統(tǒng)的服務(wù)架構(gòu),服務(wù)是分層的,每一層使用不同的分區(qū)算法,每一層都有不同數(shù)量的節(jié)點,上層節(jié)點隨機選擇下層節(jié)點。
再看下圖單元化架構(gòu),其為性能和隔離性而設(shè)計,上層節(jié)點訪問指定下層節(jié)點。
在單元化架構(gòu)下,服務(wù)雖然分層劃分,但每個單元自成一體。按照層次來講的話,所有層使用相同的分區(qū)算法,每一層都有相同數(shù)量的節(jié)點,上層節(jié)點也會訪問指定的下層節(jié)點。
SOA 架構(gòu)
SOA(Service-Oriented Architecture,面向服務(wù)的架構(gòu))是一個組件模型,它將應(yīng)用程序的不同功能單元(稱為服務(wù))通過這些服務(wù)之間定義良好的接口和契約聯(lián)系起來。
接口是采用中立的方式進行定義的,它應(yīng)該獨立于實現(xiàn)服務(wù)的硬件平臺、操作系統(tǒng)和編程語言。
這使得構(gòu)建在各種各樣的系統(tǒng)中的服務(wù)可以以一種統(tǒng)一和通用的方式進行交互。
面向服務(wù)架構(gòu),它可以根據(jù)需求通過網(wǎng)絡(luò)對松散耦合的粗粒度應(yīng)用組件進行分布式部署、組合和使用。
服務(wù)層是 SOA 的基礎(chǔ),可以直接被應(yīng)用調(diào)用,從而有效控制系統(tǒng)中與軟件代理交互的人為依賴性。
SOA 的實施具有幾個鮮明的基本特征。實施 SOA 的關(guān)鍵目標(biāo)是實現(xiàn)企業(yè) IT 資產(chǎn)的最大化作用。
要實現(xiàn)這一目標(biāo),就要在實施 SOA 的過程中牢記以下特征:
- 可從企業(yè)外部訪問
- 隨時可用
- 粗粒度的服務(wù)接口分級
- 松散耦合
- 可重用的服務(wù)
- 服務(wù)接口設(shè)計管理
- 標(biāo)準(zhǔn)化的服務(wù)接口
- 支持各種消息模式
- 精確定義的服務(wù)契約
為了實現(xiàn) SOA,企業(yè)需要一個服務(wù)架構(gòu),下圖顯示了一個例子:
在上圖中, 服務(wù)消費者(service consumer)可以通過發(fā)送消息來調(diào)用服務(wù)。這些消息由一個服務(wù)總線(service bus)轉(zhuǎn)換后發(fā)送給適當(dāng)?shù)姆?wù)實現(xiàn)。
這種服務(wù)架構(gòu)可以提供一個業(yè)務(wù)規(guī)則引擎(business rules engine),該引擎容許業(yè)務(wù)規(guī)則被合并在一個服務(wù)里或多個服務(wù)里。
這種架構(gòu)也提供了一個服務(wù)管理基礎(chǔ)(service management infrastructure),用來管理服務(wù),類似審核,列表(billing),日志等功能。
此外,該架構(gòu)給企業(yè)提供了靈活的業(yè)務(wù)流程,更好地處理控制請求(regulatory requirement),例如 Sarbanes Oxley(SOX),并且可以在不影響其他服務(wù)的情況下更改某項服務(wù)。
微服務(wù)架構(gòu)
先來看看傳統(tǒng)的 Web 開發(fā)方式,通過對比比較容易理解什么是 Microservice Architecture。
和 Microservice 相對應(yīng)的,這種方式一般被稱為 Monolithic(單體式開發(fā))。
所有的功能打包在一個 WAR 包里,基本沒有外部依賴(除了容器),部署在一個 JEE 容器(Tomcat,JBoss,WebLogic)里,包含了 DO/DAO,Service,UI 等所有邏輯。
優(yōu)點:
- 開發(fā)簡單,集中式管理。
- 基本不會重復(fù)開發(fā)。
- 功能都在本地,沒有分布式的管理和調(diào)用消耗。
缺點:
- 效率低:開發(fā)都在同一個項目改代碼,相互等待,沖突不斷。
- 維護難:代碼功能耦合在一起,新人不知道從何下手。
- 不靈活:構(gòu)建時間長,任何小修改都要重構(gòu)整個項目,耗時。
- 穩(wěn)定性差:一個微小的問題,都可能導(dǎo)致整個應(yīng)用掛掉。
- 擴展性不夠:無法滿足高并發(fā)下的業(yè)務(wù)需求。
常見的系統(tǒng)架構(gòu)遵循的三個標(biāo)準(zhǔn)和業(yè)務(wù)驅(qū)動力:
- 提高敏捷性:及時響應(yīng)業(yè)務(wù)需求,促進企業(yè)發(fā)展。
- 提升用戶體驗:提升用戶體驗,減少用戶流失。
- 降低成本:降低增加產(chǎn)品、客戶或業(yè)務(wù)方案的成本。
基于微服務(wù)架構(gòu)的設(shè)計:
- 目的:有效的拆分應(yīng)用,實現(xiàn)敏捷開發(fā)和部署。
關(guān)于微服務(wù)的一個形象表達:
- X 軸:運行多個負(fù)載均衡器之后的運行實例。
- Y 軸:將應(yīng)用進一步分解為微服務(wù)(分庫)。
- Z 軸:大數(shù)據(jù)量時,將服務(wù)分區(qū)(分表)。
SOA 和微服務(wù)的區(qū)別:
- SOA 喜歡重用,微服務(wù)喜歡重寫。
- SOA 喜歡水平服務(wù),微服務(wù)喜歡垂直服務(wù)。
- SOA 喜歡自上而下,微服務(wù)喜歡自下而上。
Serverless 架構(gòu)
①思想:無服務(wù)器是一種架構(gòu)理念,其核心思想是將提供服務(wù)資源的基礎(chǔ)設(shè)施抽象成各種服務(wù),以 API 接口的方式供給用戶按需調(diào)用,真正做到按需伸縮、按使用收費。
②優(yōu)勢:消除了對傳統(tǒng)的海量持續(xù)在線服務(wù)器組件的需求,降低了開發(fā)和運維的復(fù)雜性,降低運營成本并縮短了業(yè)務(wù)系統(tǒng)的交付周期,使得用戶能夠?qū)W⒃趦r值密度更高的業(yè)務(wù)邏輯的開發(fā)上。
③內(nèi)容:目前業(yè)界較為公認(rèn)的無服務(wù)器架構(gòu)主要包括兩個方面,即提供計算資源的函數(shù)服務(wù)平臺 FaaS,以及提供托管云服務(wù)的后端服務(wù) BaaS。
函數(shù)即服務(wù)(Function as a Service):是一項基于事件驅(qū)動的函數(shù)托管計算服務(wù)。
通過函數(shù)服務(wù),開發(fā)者只需要編寫業(yè)務(wù)函數(shù)代碼并設(shè)置運行的條件,無需配置和管理服務(wù)器等基礎(chǔ)設(shè)施,函數(shù)代碼運行在無狀態(tài)的容器中,由事件觸發(fā)且短暫易失,并完全由第三方管理,基礎(chǔ)設(shè)施對應(yīng)用開發(fā)者完全透明。
函數(shù)以彈性、高可靠的方式運行,并且按實際執(zhí)行資源計費,不執(zhí)行不產(chǎn)生費用。
后端即服務(wù)(Backend as a Service):BaaS 覆蓋了應(yīng)用可能依賴的所有第三方服務(wù),如云數(shù)據(jù)庫、身份驗證、對象存儲等服務(wù)。
開發(fā)人員通過 API 和由 BaaS 服務(wù)商提供的 SDK,能夠集成所需的所有后端功能,而無需構(gòu)建后端應(yīng)用,更不必管理虛擬機或容器等基礎(chǔ)設(shè)施,就能保證應(yīng)用的正常運行。

三個 less 感覺很好:
- Codeless 對應(yīng)的是服務(wù)開發(fā),實現(xiàn)了源代碼托管,你只需要關(guān)注你的代碼實現(xiàn),而不需要關(guān)心你的代碼在哪,因為在整個開發(fā)過程中你都不會感受到代碼庫和代碼分支的存在。
- Applicationless 對應(yīng)的是服務(wù)發(fā)布,在服務(wù)化框架下,你的服務(wù)發(fā)布不再需要申請應(yīng)用,也不需要關(guān)注你的應(yīng)用在哪。
- Serverless 對應(yīng)的則是服務(wù)運維,有了 Serverless 化能力,你不再需要關(guān)注你的機器資源,Servlerless 會幫你搞定機器資源的彈性擴縮容。
架構(gòu)師在完成上述架構(gòu)設(shè)計后,最終是需要協(xié)同利益相關(guān)方一起按項目化運作落地拿結(jié)果。
那么應(yīng)該如何保證利益相關(guān)方在項目落地的滿意度,如何保證按照架構(gòu)很好的拿到項目成功的結(jié)果呢?架構(gòu)管理能力是架構(gòu)師非常重要的能力。
架構(gòu)管理
架構(gòu)共贏模型:
架構(gòu)結(jié)果管理:

參考資料:
https://developer.alipay.com/article/8538
https://www.cnblogs.com/wintersun/p/8972949.html
https://www.atatech.org/articles/95466
https://www.atatech.org/articles/104688
https://yuque.antfin-inc.com/tmf/documents/how-to-desigin-domain
聲明:本文部分內(nèi)容參考阿里內(nèi)部和外部一些文章,詳情見上述參考資料;撰寫本文的重點是系統(tǒng)體系化地總結(jié)認(rèn)識架構(gòu)師的工作,以便于更好的互動學(xué)習(xí)和成長,部分觀點是個人觀點。