游戲服務(wù)器架構(gòu)演進(jìn)(完整版)
一、游戲服務(wù)器特征
游戲服務(wù)器,是一個會長期運(yùn)行程序,并且它還要服務(wù)于多個不定時,不定點(diǎn)的網(wǎng)絡(luò)請求。所以這類服務(wù)的特點(diǎn)是要特別關(guān)注穩(wěn)定性和性能。這類程序如果需要多個協(xié)作來提高承載能力,則還要關(guān)注部署和擴(kuò)容的便利性;同時,還需要考慮如何實(shí)現(xiàn)某種程度容災(zāi)需求。由于多進(jìn)程協(xié)同工作,也帶來了開發(fā)的復(fù)雜度,這也是需要關(guān)注的問題。
功能約束,是架構(gòu)設(shè)計決定性因素。基于游戲業(yè)務(wù)的功能特征,對服務(wù)器端系統(tǒng)來說,有以下幾個特殊的需求:
- 游戲和玩家的數(shù)據(jù)存儲落地
- 對玩家交互數(shù)據(jù)進(jìn)行廣播和同步
- 重要邏輯要在服務(wù)器上運(yùn)算,做好驗證,防止外掛。
針對以上的需求特征,在服務(wù)器端,我們往往會關(guān)注對電腦內(nèi)存和CPU的使用,以求在特定業(yè)務(wù)代碼下,能盡量滿足高承載低響應(yīng)延遲的需求。最基本的做法就是“空間換時間”,用各種緩存的方式來以求得CPU和內(nèi)存空間上的平衡。另外還有一個約束:帶寬。網(wǎng)絡(luò)帶寬直接限制了服務(wù)器的處理能力,所以游戲服務(wù)器架構(gòu)也必定要考慮這個因素。
二、游戲服務(wù)器架構(gòu)要素
對于游戲服務(wù)端架構(gòu),最重要的三個部分就是,如何使用CPU、內(nèi)存、網(wǎng)卡的設(shè)計:
- 內(nèi)存架構(gòu):主要決定服務(wù)器如何使用內(nèi)存,以***化利用服務(wù)器端內(nèi)存來提高承載量,降低服務(wù)延遲。
- 邏輯架構(gòu):設(shè)計如何使用進(jìn)程、線程、協(xié)程這些對于CPU調(diào)度的方案。選擇同步、異步等不同的編程模型,以提高服務(wù)器的穩(wěn)定性和承載量??梢苑謪^(qū)分服,也可以采用世界服的方式,將相同功能模塊劃分到不同的服務(wù)器來處理。
- 通信模式:決定使用何種方式通訊?;谟螒蝾愋筒煌捎貌煌耐ㄐ拍J剑热鏷ttp,tcp,udp等。
三、服務(wù)器演化進(jìn)程
1、卡牌等休閑游戲弱交互游戲
服務(wù)器基于游戲類型不同,所采用的架構(gòu)也有所不同,我們先講一下簡單的模型,采用http通信模式架構(gòu)的服務(wù)器:
這種服務(wù)器架構(gòu)和我們常用的web服務(wù)器架構(gòu)差不多,也是采用nginx負(fù)載集群支持服務(wù)器的水平擴(kuò)展,memcache做緩存。唯一不同的地點(diǎn)不同的在于通信層需要對協(xié)議再加工和加密,一般每個公司都有自己的一套基于http的協(xié)議層框架,很少采用開源框架。
2、長鏈接游戲服務(wù)器
長連接游戲和弱聯(lián)網(wǎng)游戲不同的地方在于,長連接中,玩家是有狀態(tài)的,服務(wù)器可以時時和client交互,數(shù)據(jù)的傳送,不像弱聯(lián)網(wǎng)一般每次都需要重新創(chuàng)建一個連接,消息傳送的頻率以及速度上都快于弱聯(lián)網(wǎng)游戲。長鏈接網(wǎng)游的架構(gòu)經(jīng)過幾代的迭代,類型也變得日益豐富,以下為每一代服務(wù)器的特點(diǎn)以及架構(gòu)模式。
1)、***代網(wǎng)游服務(wù)器(單線程無阻塞)
最早的游戲服務(wù)器是1978年,英國著名的財經(jīng)學(xué)校University of Essex的學(xué)生 Roy Trubshaw編寫了世界上***個MUD程序,叫做《MUD1》。
MUD1 是一款純文字的世界,沒有任何圖片,但是不同計算機(jī)前的玩家可以在游戲里共同冒險、交流。與以往具有網(wǎng)絡(luò)聯(lián)機(jī)功能的游戲相比, MUD1是***款真正意義上的實(shí)時多人交互的網(wǎng)絡(luò)游戲,它***的特色是能夠保證整個虛擬世界和玩家角色的持續(xù)發(fā)展——無論是玩家退出后重新登錄還是服務(wù)器重啟,游戲中的場景、寶箱、怪物和謎題仍保持不變,玩家的角色也依然是上次的狀態(tài)。
MUD中文版
MUDOS使用單線程無阻塞套接字來服務(wù)所有玩家,所有玩家的請求都發(fā)到同一個線程去處理,主線程每隔1秒鐘更新一次所有對象(網(wǎng)絡(luò)收發(fā),對象狀態(tài),刷新地圖,刷新NPC)。用戶使用 Telnet之類的客戶端用 Tcp協(xié)議連接到 MUDOS上,使用純文字進(jìn)行游戲,每條指令用回車進(jìn)行分割。這樣的系統(tǒng)在當(dāng)時每臺服務(wù)器承載個4000人同時游戲。從1991年的 MUDOS發(fā)布后,全球各地都在為他改進(jìn),擴(kuò)充,推出新版本。
MUDOS中游戲內(nèi)容通過 LPC腳本進(jìn)行定制,邏輯處理采用單線程tick輪詢,這也是***款服務(wù)端架構(gòu)模型,后來被應(yīng)用到不同游戲上。后續(xù)很多游戲都是跟《UO》一樣,直接在 MUDOS上進(jìn)行二次開發(fā),直到 如今,一些回合制游戲,以及對運(yùn)算量小的游戲,依然采用這種服務(wù)器架構(gòu)。
***代服務(wù)器架構(gòu)圖:
線程模型
2) 、第二代網(wǎng)游服務(wù)器(分區(qū)分服)
2000年左右,隨著圖形界面的出現(xiàn),游戲更多的采用圖形界面與用戶交互。此時隨著在線人數(shù)的增加和游戲數(shù)據(jù)的增加,服務(wù)器變得不抗重負(fù)。于是就有了分服模型。分服模型結(jié)構(gòu)如下:
分服模型是游戲服務(wù)器中最典型,也是歷久最悠久的模型。在早期服務(wù)器的承載量達(dá)到上限的時候,游戲開發(fā)者就通過架設(shè)更多的服務(wù)器來解決。這樣提供了很多個游戲的“平行世界”,讓游戲中的人人之間的比較,產(chǎn)生了更多的空間。其特征是游戲服務(wù)器是一個個單獨(dú)的世界。每個服務(wù)器的帳號是獨(dú)立的,每臺服務(wù)器用戶的狀態(tài)都是不一樣的,一個服就是一個世界,大家各不牽扯。
后來游戲玩家呼吁要跨服打架,于是就出現(xiàn)了跨服戰(zhàn),再加上隨著游戲的運(yùn)行,單個服務(wù)器的游戲活躍玩家越來越少,所以后期就有了服務(wù)器的合并以及遷移,慢慢的以服務(wù)器的開放、合并形成了一套成熟的運(yùn)營手段。目前多數(shù)游戲還采用分服的結(jié)構(gòu)來架設(shè)服務(wù)器,多數(shù)頁游還是采用這種模式。
線程調(diào)度
分服雖然可以解決服務(wù)器擴(kuò)展的瓶頸,但單臺服務(wù)器在以前單線程的方式來運(yùn)行,沒辦法充分利用服務(wù)器資源,于是又演變出了以下2種線程模型。
- 異步-多線程,基于每個場景(或者房間),分配一個線程。每個場景的玩家同屬于一個線程。游戲的場景是固定的,不會很多,如此線程的數(shù)量可以保證不會不斷增大。每個場景線程,同樣采用tick輪詢的方式,來定時更新該場景內(nèi)的(對象狀態(tài),刷新地圖,刷新NPC)數(shù)據(jù)狀態(tài)。玩家如果跨場景的話,就采用投遞和通知的方式,告知兩個場景線程,以此更新兩個場景的玩家數(shù)據(jù)。
- 多進(jìn)程。由于單進(jìn)程架構(gòu)下,總會存在承載量的極限,越是復(fù)雜的游戲,其單進(jìn)程承載量就越低,因此一定要突破進(jìn)程的限制,才能支撐更復(fù)雜的游戲。多進(jìn)程系統(tǒng)的其他一些好處:能夠利用上多核CPU能力、更容易進(jìn)行容災(zāi)處理。
多進(jìn)程系統(tǒng)比較經(jīng)典的模型是“三層架構(gòu)”,比如,基于之前的場景線程再做改進(jìn),把網(wǎng)絡(luò)部分和數(shù)據(jù)庫部分分離為單獨(dú)的進(jìn)程來處理,邏輯進(jìn)程專心處理邏輯任務(wù),不合IO打交道,網(wǎng)絡(luò)IO和磁盤IO分別交由網(wǎng)路進(jìn)程和DB進(jìn)程處理。
3)、第三代網(wǎng)游服務(wù)器
之前的網(wǎng)游服務(wù)器都是分區(qū)分服,玩家都被劃分在不同的服務(wù)器上,每臺服務(wù)器運(yùn)行的邏輯相同,玩家不能在不同服務(wù)器之間交互。想要更多的玩家在同一世界,保持玩家的活躍度,于是就有了世界服模型了。世界服類型也有以下3種演化:
一類型(三層架構(gòu))
網(wǎng)關(guān)部分分離成單端的gate服務(wù)器,DB部分分離為DB服務(wù)器,把網(wǎng)絡(luò)功能單獨(dú)提取出來,讓用戶統(tǒng)一去連接一個網(wǎng)關(guān)服務(wù)器,再有網(wǎng)關(guān)服務(wù)器轉(zhuǎn)發(fā)數(shù)據(jù)到后端游戲服務(wù)器。而游戲服務(wù)器之間數(shù)據(jù)交換也統(tǒng)一連接到網(wǎng)管進(jìn)行交換。所有有DB交互的,都連接到DB服務(wù)器來代理處理。
二類型(cluster)
有了一類型的經(jīng)驗,后續(xù)肯定是拆分的越細(xì),性能越好,就類似現(xiàn)在微服務(wù),每個相同的模塊分布到一臺服務(wù)器處理,多組服務(wù)器集群共同組成一個游戲服務(wù)端。一般地,我們可以將一個組內(nèi)的服務(wù)器簡單地分成兩類:場景相關(guān)的(如:行走、戰(zhàn)斗等)以及場景不相關(guān)的(如:公會聊天、不受區(qū)域限制的貿(mào)易等)。經(jīng)常可以見到的一種方案是:gate服務(wù)器、場景服務(wù)器、非場景服務(wù)器、聊天管理器、AI服務(wù)器以及數(shù)據(jù)庫代理服務(wù)器。如下模型:
以上中我們簡單的講下常見服務(wù)器的三種類型功能:
- 場景服務(wù)器:它負(fù)責(zé)完成主要的游戲邏輯,這些邏輯包括:角色在游戲場景中的進(jìn)入與退出、角色的行走與跑動、角色戰(zhàn)斗(包括打怪)、任務(wù)的認(rèn)領(lǐng)等。場景服務(wù)器設(shè)計的好壞是整個游戲世界服務(wù)器性能差異的主要體現(xiàn),它的設(shè)計難度不僅僅在于通信模型方面,更主要的是整個服務(wù)器的體系架構(gòu)和同步機(jī)制的設(shè)計。
- 非場景服務(wù)器:它主要負(fù)責(zé)完成與游戲場景不相關(guān)的游戲邏輯,這些邏輯不依靠游戲的地圖系統(tǒng)也能正常進(jìn)行,比如公會聊天或世界聊天,之所以把它從場景服務(wù)器中獨(dú)立出來,是為了節(jié)省場景服務(wù)器的CPU和帶寬資源,讓場景服務(wù)器能夠盡可能快地處理那些對游戲流暢性影響較大的游戲邏輯。
- 網(wǎng)關(guān)服務(wù)器: 在類型一種的架構(gòu)中,玩家在多個地圖跳轉(zhuǎn)或者場景切換的時候采用跳轉(zhuǎn)的模式,以此進(jìn)行跳轉(zhuǎn)不同的服務(wù)器。還有一種方式是把這些服務(wù)器的節(jié)點(diǎn)都通過網(wǎng)關(guān)服務(wù)器管理,玩家和網(wǎng)關(guān)服務(wù)器交互,每個場景或者服務(wù)器切換的時候,也有網(wǎng)關(guān)服務(wù)器統(tǒng)一來交換數(shù)據(jù),如此玩家操作會比較流暢。
通過這種類型服務(wù)器架構(gòu),因為壓力分散了,性能會有明顯提升,負(fù)載也更大了,包括目前一些大型的 MMORPG游戲就是采用此架構(gòu)。不過每增加一級服務(wù)器,狀態(tài)機(jī)復(fù)雜度可能會翻倍,導(dǎo)致研發(fā)和找bug的成本上升,這個對開發(fā)組挑戰(zhàn)比較大,沒有經(jīng)驗,很容出錯。
三類型(無縫地圖)
魔獸世界的中無縫地圖,想必大家印象深刻,整個世界的移動沒有像以往的游戲一樣,在切換場景的時候需要loading等待,而是直接行走過去,體驗流暢。
現(xiàn)在的游戲大地圖采用無縫地圖多數(shù)采用的是9宮格的樣式來處理,由于地圖沒有魔獸世紀(jì)那么大,所以采用單臺服務(wù)器多進(jìn)程處理即可,不過類似魔獸世界這種大世界地圖,必須考慮2個問題:
- 多個地圖節(jié)點(diǎn)如何無縫拼接,特別是當(dāng)?shù)貓D節(jié)點(diǎn)比較多的時候,如何保證無縫拼接
- 如何支持動態(tài)分布,有些區(qū)域人多,有些區(qū)域人少,保證服務(wù)器資源利用的***化
為了解決這個問題,比較以往按照地圖來切割游戲而言,無縫世界并不存在一塊地圖上面的人有且只由一臺服務(wù)器處理了,此時需要一組服務(wù)器來處理,每臺 Node服務(wù)器用來管理一塊地圖區(qū)域,由 NodeMaster(NM)來為他們提供總體管理。更高層次的 World則提供大陸級別的管理服務(wù)。
一個 Node所負(fù)責(zé)的區(qū)域,地理上沒必要連接在一起,可以統(tǒng)一交給一個Node去管理,而這些區(qū)塊在地理上并沒有聯(lián)系在一起的必要性。一個 Node到底管理哪些區(qū)塊,可以根據(jù)游戲?qū)崟r運(yùn)行的負(fù)載情況,定時維護(hù)的時候進(jìn)行更改 NodeMaster 上面的配置。
對象的無縫遷移
玩家A、B、C分別代表3種不同的狀態(tài),以及不同的遷移方式,我們分別來看。
- 玩家A: 玩家A在node1地圖服務(wù)器上,由node1控制,如果遷移到node2上,需要將其數(shù)據(jù)復(fù)制到node2上,然后從node1移除。
- 玩家B: 玩家B在node1和node2中間,此時由node1和node2維護(hù),若是從node1行走到node2的過程中,會向1請求,同時向2請求,待全部移動過去了再移除。
- 玩家C:玩家C在node2地圖服務(wù)器上,由node2控制,如果遷移到node1上,需要將其數(shù)據(jù)復(fù)制到node1上,然后從node2移除。
具體魔獸世界服務(wù)器的分析,篇幅過多,我們以后再聊。
3、房間服務(wù)器(游戲大廳)
房間類玩法和MMORPG有很大的不同,在于其在線廣播單元的不確定性和廣播數(shù)量很小。而且需要匹配一臺房間服務(wù)器讓少數(shù)人進(jìn)入一個服務(wù)器。
這一類游戲最重要的是其“游戲大廳”的承載量,每個“游戲房間”受邏輯所限,需要維持和廣播的玩家數(shù)據(jù)是有限的,但是“游戲大廳”需要維持相當(dāng)高的在線用戶數(shù),所以一般來說,這種游戲還是需要做“分服”的。典型的游戲就是《英雄聯(lián)盟》這一類游戲了。而“游戲大廳”里面最有挑戰(zhàn)性的任務(wù),就是“自動匹配”玩家進(jìn)入一個“游戲房間”,這需要對所有在線玩家做搜索和過濾。
玩家先登錄“大廳服務(wù)器”,然后選擇組隊游戲的功能,服務(wù)器會通知參與的所有游戲客戶端,新開一條連接到房間服務(wù)器上,這樣所有參與的用戶就能在房間服務(wù)器里進(jìn)行游戲交互了。
四、***
游戲行業(yè)相對于互聯(lián)網(wǎng)應(yīng)用來說,其開放性和標(biāo)準(zhǔn)化并不完善,這就導(dǎo)致了很其他行業(yè)看游戲有一種神秘面紗,隱秘而封閉。
造成這個原因有很多,游戲業(yè)務(wù)的復(fù)雜性以及受眾群體小是主要原因,它不像web應(yīng)用天生有開源組織和社區(qū)基因的支持,也沒有互聯(lián)網(wǎng)行業(yè)的如此大的受眾面和影響力,除了一些比較出名的游戲引擎以外其他的功能組建都是有各個游戲公司基于自己業(yè)務(wù)邏輯自己搭建,每個公司業(yè)務(wù)方向不同又加大了知識的流通以及標(biāo)準(zhǔn)的建立,這對整個生態(tài)的發(fā)展已經(jīng)產(chǎn)生了制約,特別是那些想加入游戲行業(yè)的新人來說,準(zhǔn)入門檻較高,網(wǎng)上可找到的學(xué)習(xí)資料也很少。
這種現(xiàn)象目前正在發(fā)生改變,除了受眾群體越來越大和豐富以外,還有一些技術(shù)組織正在推進(jìn)整個社區(qū)的進(jìn)步。
比如每年一度的unity 技術(shù)大會,以及其他優(yōu)秀的開源引擎都在積極推進(jìn)整個游戲社區(qū)的創(chuàng)建,除了吸引更多優(yōu)秀的技術(shù)人才和團(tuán)隊加入,這一切都讓游戲行業(yè)變得越來越開放和規(guī)范,讓行業(yè)內(nèi)的知識也得以流通和繼承。當(dāng)然了,也期望每個游戲人能夠加入進(jìn)來,分享自己的知識,讓自由開放的共享精神傳承每個地方。