專訪騰訊劉亞飛:復雜環境下手游運維的挑戰
原創從2013年到2014年,全球移動游戲市場產值將由132億美元飆升至220億美元。在產值飛速增長的背后是玩家數量的不斷攀升。不斷提升的玩家數量是一次對運維的嚴峻拷問。
不同于端游時代的游戲運維,手游時代的運維面臨著相比端游時代更加復雜的網絡環境,更加碎片化的游戲時間以及玩家數量的的迅速更迭,這些都給游戲運維人員的工作帶來諸多挑戰。51cto專訪訊移動游戲運營技術評審專家組負責人劉亞飛,為您解讀從端游到手游的運維挑戰。
記者:請您介紹一下您所在的技術評審專家組的情況以及負責的業務?
劉亞飛:評審團分為內部評審和外部評審兩個團隊一共六個人。主要負責游戲從簽約到上線期間內的架構、運營環境、運營規范等方面做一個測評。另外手游的評審周期比較短,一個月左右會進行三到四次。每次評審,都會分為線上、線下兩部分。從架構、基礎的運營環境設計、邏輯的處理、DB 、存儲的設計邏輯方面進行評審。
記者:您為許多端游進行過運維支撐,這其中不乏《穿越火線》《英雄聯盟》《DNF》這種非常火爆的游戲,在游戲上線之前您的團隊對這些游戲的預估是怎樣的,當實際情況遠超過預估時,如何進行快速擴容?
劉亞飛:拿《穿越火線》來說,雖然在上線之前大家都沒有預料到上線之后的火爆程度,但在做游戲評審的時候我們把擴容的便利性當做一個主要考量的維度,當預估和現實出現比較大的差別的時候,我們能夠迅速擴容,當擴容能力達到了標準,那么對運維人員來說一款游戲的火與不火就沒有太大區別,因為我們的資源迅速到位,快速的把游戲支撐起來。
與端游有相對較長的考察期以及擴容期不同的是,手游上線在一周內就會迅速爆發,我們只能參考之前類似的游戲來做一個測評,但正式由于這種迅速,要求我們十分鐘搞定前端擴容,后端的擴容也會在隨后的幾個小時內搞定。
記者:說到騰訊游戲就不得不提現在市面上最火的一款游戲-《英雄聯盟》,這幾乎是一款無論什么時候都會有人在線的游戲,在故障的修復和處理方面騰訊是如何運作的?
劉亞飛:一般的基礎故障我們會通過監控、自愈的手段快速修復。自愈手段就是指宕機時某一個進程掛掉了,或者某一個基礎的環境出現問題的時候,那我們就會自動的去切換,自動的去拉起,或者是類似于方式進行自愈。而且在我們在評審階段會建議開發商對重要的數據進行實時回寫,讀寫方式基本決定了回檔時間,如果在游戲設計之初沒有考慮到這點,十分鐘或者更久才會回寫一次DB,這樣一旦出現問題就很棘手了。
記者:您從手游和端游的運維有哪些不一樣?在開始階段會不會有一些不適應?
劉亞飛:端游和手游會形成鮮明對比,端游慢,手游快。端游時間長,手游時間短。端游數量少,手游數量多。其實端游到手游***的改變是變快了,這種快就需要我們快速調整,快速適應。
記者:中國的網絡環境很復雜,而玩手游的時間更趨于碎片化,比如在地鐵這種弱網絡的環境下對運維有哪些影響?
劉亞飛:針對弱網環境,我們做兩個方面的處理;***在切入體驗上做優化,同運營商去做一些弱網環境下的切網,不同的網絡環境之間優化交互的邏輯處理。,然后反饋到各個游戲上去。第二個方面是在評審環節我們會要求開發商達到一定的弱網處理能力。
記者:我們知道騰訊代理了很多韓國游戲,韓國的游戲邏輯甚至國內一些工作室的開發邏輯都不太一樣,這會給運維工作帶來哪困難?
劉亞飛:因為韓國的網絡情況非常好,家庭寬帶都是8M以上,移動網絡也比國內好的多。這些游戲進入中國首先要做一個本地化和水土適配,因為中國的網絡環境和機型都比韓國復雜的多。所以針對這兩點在出初期我們就會跟開發商不斷地探討對接,提出一些特殊的本地化的建議。
對于國內的開發商,首先架構一定要能夠動態調整,另外運維更加關注后期的故障快速修復、高穩定性、這些對玩家體驗影響非常大的,運維人員應該和開發商進行深入溝通。具體的還要去看單獨的游戲,畢竟用戶群不一樣,壓力也不一樣。騰訊對緩存、容災、故障快速恢復能力要求比較高,其他公司則更關注別的方面。
小結:
在記者問到,哪一次踩坑的經歷讓您印象深刻時,劉亞飛回憶說,其實那些踩過的坑都是寶貴的經驗和財富,做運維的多多少少都會踩坑,這些坑有的來自于開發商有的來自于周邊團隊,其實***的坑就是腦子一片空白。
在采訪的***劉亞飛感慨到,其實現在游戲行業都挺苦逼的,但是為了玩家能更好的體驗游戲,幾千萬人玩過你做的游戲,這種成就感是非常強的。