趣加游戲:亞馬遜AWS讓我們實現了業務與IT運維的融合
作者:趙效民
“趣加游戲”(FunPlus Game)是一家處于高速發展的初創公司,憑借著對海外社交游戲市場與游戲品質的專注,以約200人的規模即成為了Facebook上亞洲排名一,總排名第6的游戲開發商。在這一業績的背后,支撐起其整個IT運營的基礎則就是亞馬遜AWS公有云……
對于總部位于北京,于2010年創辦并在2012年年初即完成1200萬美元A輪融資的一家游戲公司,可能“趣加游戲”(FunPlus Game)在很多中國人的耳中都算是一個陌生的名字,可就是這樣一家公司,憑借著對海外社交游戲市場與游戲品質的專注,以約200人的規模成為了Facebook上亞洲排名一,總排名第6的游戲開發商,日均活躍用戶達到了600萬人。在這一業績的背后,支撐起其整個IT運營的基礎則就是亞馬遜AWS公有云。而不久前,對FunPlus相關高管的采訪,則讓我們有機會進一步了解這家年輕的創業公司的成長歷程,以及在這一過程中與AWS之間的故事。
基于中美加三國的跨洲團隊運營
由于創始合伙人中的兩位在美國工作,FunPlus在2010年5月先于美國硅谷后在中國北京成立。按照公司首席運營官 (COO)陳琦的說法,FunPlus是一家中西合璧的公司,“我們現在的理念還是融合東西,我們有一些工作人員兩邊都是有的,有西方背景,有東方背景。我們希望把兩方面的優勢融合在一起打造更好的游戲”陳琦表示。
趣加游戲CEO鐘英武(右)與COO陳琦
目前,FunPlus在北京、美國舊金山、加拿大的溫哥華設立了辦公地點,總共有200名員工,其中有一半是外國員工,來自于20多個國家,“外籍員工包括不止是做本地化和翻譯的人,還包括工程師人員、設計人員,以及非常好的美術設計師。”陳琦介紹到,“溫哥華辦公室就是美術辦公室,幫我們做游戲人物設定和研發設定,所以他們是我們的美術創新點。大概我們職能部門有這些——游戲設計師,開發工程師,市場分析,產品經理,產品運營,美術設計師。”近年來,隨著公司業務的飛速成長,越來越多的全球業界高手也在不斷加盟FunPlus,這些人的原東家包括EA、暴雪 、Zynga等等,有的甚至已經是VP的級別。
陳琦強調,FunPlus是一家技術驅動的公司,最關注4個點——移動、社交、云、大數據,公司的CTO(可以說是兼具CIO的角色)關毅濤,曾在領先的技術公司Ask.com,、yousendit.com及IBM擔任軟件架構師超過15年。曾負責構建在任何地方均可運行且每天可處理3億多條請求的世界級基礎設施。目前他長期的工作地點在美國,此次是通過越洋電話來接受采訪。在我看來,關毅濤將辦公室放在美國,一個重要的原因也許就是與AWS的關系。按照關毅濤的說法,在公司創建的早期,曾嘗試過用自有的物理服務器來承載業務平臺,但最終決定采用公有云的模式,而通過比較他最終選擇了亞馬遜AWS,并在后者的支撐下,迅速成為全球第6大以及亞洲第一大Facebook游戲開發商 ,而負責IT運維的技術人員只有6個人。
創業的IT基石:亞馬遜AWS基礎架構
FunPlus開發的社交游戲均采用的是業界通用的“免費上手、道具收費”的模式來進行贏利,這就意味著游戲的品質必須優秀,否則即使免費也沒人愿意長玩,其次游戲運營中的人流波動所帶來的對后臺IT需求彈性表現也比較明顯,尤其是在新游戲上線時,很難估計幾天、一周與一個月的玩家數量走勢,而這些玩家中付費購買的行動也基本會成比例變化。所以,如何應對這種波動不可預測的彈性需求,是每一個做在線社交游戲的企業都必須要面對的問題。顯然,公有云的特性 與FunPlus最吻合,而在公有云中,FunPlus最終選擇了亞馬遜AWS。
回顧選擇的歷程,其實早在公司創建之初,AWS就已經是關毅濤關注的對象。因為作為技術人員,關毅濤非常關注大規模系統層面的研發,他表示,“技術層面上面講,我們是互聯網技術公司,就是強調的是這種大規模,強調的是快速發布。”當時除了AWS之外,谷歌也有一個Apps Engine,此外還有一些傳統的技術。在一開始階段,關毅濤嘗試了上述三種手段。不過由于在初期只是做一些研發,所以采用的自有物理服務器,只需一臺足矣,遠程控制沒有任何問題。但是當考慮到這種社交休閑游戲的成長模式下,如果用戶量一旦上來,同時訪問時,對某些應用的響應速度則是非常關鍵的指標。而對于FunPlus要開發的大規模應用來講,關毅濤更多的是考慮到能夠完全控制一些東西。他表示,整個計算機技術不外乎出現3個大方面:CPU,內存,以及更重要的IO性能,后者還分為物理IO和網絡IO。而此時,AWS提供的是一種更接近于機器本身一項技術,這一點打動了關毅濤——“綜合考慮的時候,我們就是覺得AWS有足夠靈活性與可控性。”
FunPlus目前主推的4款游戲
在FunPlus初創階段,曾經有一段時間每一天增長10萬用戶,這就意味著,每一天都要增加很多臺機器。關毅濤認為,如果沒有AWS的話,這一點是很難達到的。目前,FunPlus的服務器數量在閑暇時大概有300臺,在高峰期的時候集群規模可達1700多臺,整個過程從流量監測開始,然后就是啟動,測試,全部自動化完成。關毅濤介紹到,有一些簡單的應用實例完全能夠實現自動伸展。此外,在亞馬遜AWS提供的伸縮性和開放化API控制方面,是物理機房比擬不了的,尤其是后者,讓客戶根據應用需求自動化配置自己的虛擬IT環境成為了可能。同時在成本方面,也因為是彈性的資源配給,也讓成本不會一成不變。
對此陳琦舉例到,每一個游戲都是有高峰期,低峰期。每一個國家晚上是很多人上線開始玩兒游戲,這個時候FunPlus會自動的在AWS上打開很多新的服務器。到凌晨時,則會自動把這些服務器關掉,從而大量節約運營成本。因為亞馬遜AWS是按小時按流量來計費。這樣可以把每一個小時都是用到非常的極致。同時AWS還有預留實例(Reserved Instance)的選項,你可以根據自己的業務需求提前預訂一定數量的虛擬機,等到需要時才真正激活,即保證了業務的即時彈性空間,也避免了為保證這一彈性而付出正規虛擬機的成本。綜合種種方面的優化與精打細算,陳琦表示IT方面的運營成本最多可以下降35%。并且,最有意思的在于,AWS的服務人員會主動提示一些省錢的方法和業務模式來幫助FunPlus節省開支,這一點頗讓陳琦感到意外。
目前,FunPlus一共用到了AWS在全球的5個 區(Region)的數據中心資源,可做到一分鐘部署一臺完整的虛擬服務器。而所用到的亞馬遜AWS的服務器,除了標準的EC2、S3外,還有ELB( Elastic Load Balancing,彈性負載均衡),它可以極大提高并穩定游戲用戶的訪問體驗,即使是跨洲訪問(如歐洲的玩家數據其實是存放在美國的Region里)也能保證很好的游戲體驗,其他的服務還包括RDS(Relational Database Service,關系型數據服務),Redshift(云數據倉庫),Cache(緩存),Dynamo DB(NoSQL數據庫),也就是說FunPlus的游戲業務與相關的支撐業務(如用戶行為與消費規律分析)基本架構,都是建在亞馬遜AWS上面。

FunPlus在AWS平臺上的IT架構圖
目前,FunPlus正在測試AWS的虛擬私有云服務(VPC,Virtual Private Cloud)。關毅濤表示,我們未來將把亞馬遜VPC技術變成內網跟外網結合技術,它在安全性,在網絡傳輸有效性上面都是有很大提高。“其實,亞馬遜AWS一直沖在前面幫開發者去完善底層基礎架構的能力與功能,”他總結到,“我們就是看哪些東西更適合我們。”這可以說是FunPlus以及類似的客戶與AWS之間最根本的合作關系形態。
亞馬遜應用商店:亞馬遜AWS用戶的增值服務
對于公司的具體運營來講,IT只是其中的一個方面,而對于游戲公司來說,最核心的業務還是游戲的推廣與用戶的拓展,這方面似乎與AWS關系不大,但同屬亞馬遜集團的亞馬遜應用商店,則為AWS的客戶提供了“近水樓臺”般的增值選項。尤其對于那些希望盡快打開海外市場的創業公司來講,這無疑為它們提供了一個有力的推廣平臺。
陳琦對此深有感觸,“說到海外業務的拓展,也要特別的感謝亞馬遜。亞馬遜AWS團隊幫我們參與到這個應用商店,我們上線8個月,目前移動版本的排名前10以內了,收入也是不錯。亞馬遜用戶對于整個支付習慣比較好。”根據陳琦掌握的數據,由于亞馬遜的用戶大都已經是電商客戶,由于早就綁定了信用卡,付費意愿與在線消費習慣都是整體游戲消費群體中的領先群體,因此每個用戶的平均消費值(ARPU),是Google Play的2倍以上。同時,FunPlus還正在與亞馬遜的朋友合作,幫助測試亞馬遜的廣告服務,比如在亞馬遜電子書Kindle上面做一些封面廣告,FunPlus也基于此做一些數據測試的工作。此外,在游戲道具的銷售方面,亞馬遜也為FunPlus提供了結算服務。
從某種角度上講,亞馬遜應用商店與AWS之間的這種聯動,的確可以算是AWS用戶,尤其是初創的互聯網應用企業的一個福利,從應用的開發、IT運營到產品的銷售、推廣都在亞馬遜集團的平臺上完成,可以說是一種“一站式”的服務。隨著亞馬遜集團自身業務的不斷擴展與強大,帶給AWS用戶的好處也將越來越多,這其中可能很難用成本指標來去衡量它所帶來的價值,相信也只有親歷者才能有最深刻的體會。
創新、可靠與成本之外的核心優勢:實現業務與IT運維的融合
當談到某一個IT技術架構的優勢時,我們通常會聽到一些非常熟悉的詞匯,如創新、可靠、成本等等,而這也是在采訪中FunPlus相關負責人所經常談到的。這并不難理解,亞馬遜AWS本身就是創新與低成本的代名詞,其所推行的開放API模式,為用戶提供了極大的創新空間,當然這僅僅是一方面,按照關毅濤的話說,他一直在跟蹤不同公司的前沿技術發展,“但是幾年嘗試下來,我們發現亞馬遜AWS是創新最快的”,他強調,“包括Google等比較下來之后,亞馬遜AWS的創新慣性很大,他真的是領先于很多的做云的廠商。”當然,創新并不等于全面的領先,畢竟某些方面AWS還沒有涉足。關毅濤也坦誠的表示,FunPlus會根據地區選擇對于用戶服務體驗更好的服務——“因為我們最終問題是給全球用戶提供一種比較好的解決方案。”
在可靠性方面,關毅濤對于AWS的技術實力非常認可,“我們通過研究,發現亞馬遜AWS可靠性很高的。比如磁盤技術,不用在開發層面去考慮,因為在系統層面,由于有虛擬機技術,當一塊磁盤壞的時候,我們換另外一塊磁盤,這個數據就可以保證不丟失,而且整個過程使用命令行來控制非常迅速。”他介紹到,“其實亞馬遜AWS在系統層面已經解決的很好了。如亞馬遜的Redshift數據庫和Dynamo DB數據庫,你都不需要關心這個數據庫是分布在多少臺物理機或虛擬機上。你只要往里面放數據,不管多大的數據,它能夠保證你幾毫秒到幾百毫秒的響應速度。”由此,關毅濤進一步強調——這就能夠讓我們游戲開發人員專注于我們所擅長的東西,而不是說數據大了以后這個數據庫會越來越慢,這就讓我們作為應用開發人員花很少時間去考慮這個,讓我們有精力去做更多有意義的事情。
當然,眾所周知AWS的某些服務也有宕機的現象發生,FunPlus的業務就因美國AWS的一次故障而受到影響,不過在FunPlus看來AWS的可靠性仍然是最好的。“世上沒有100%不出現問題的系統,這個我們必須客觀看待”,陳琦表示,“說實話,在故障發生時我們肯定也是著急的,但AWS的客服反應非常迅速,相比傳統的IT平臺以及其他云服務商的故障率要小得多,我們有一家合作伙伴,用的就是美國另一家知名的云服務商,據我所知,宕機率比AWS高多了”。關毅濤補充到,對于企業來說,開發自身的IT冗余架構是必須的,AWS在這方面提供了很好的平臺,它們的區、AZ(Region下面的可用區)相互間有很好的備援機制,不可能出現一個服務完全宕掉的情況,我們要做的就是盡量利用AWS的架構來實現自己的冗余性。IT的可靠性涉及到多個方面,AWS在這方面提供了很好的基礎,剩下的還要看企業如何進一步利用好這一基礎平臺。
而在成本方面也在不斷優化著用戶服務方案組合,這方面負責運營的陳琦在上文中已經指出了IT運營成本在這幾年間下降了35%。不過在采訪中,我認為真正讓FunPlus幾年來仍然專注于、留守在AWS平臺上的關鍵因素是,AWS大大簡化了IT運營的復雜度并提供極高的靈活力,對于擅長應用編程的企業來說,更是從某種層面上真正實現了業務人員與IT運維的融合,而這無疑是企業IT與業務部門的夢想。這一點從關毅濤的感觸中就能明顯體現出來。
“我本身是開發出身,我不是運維出身,當時就是因為亞馬遜AWS,讓我獲得了一種可編程式的機器管理方式”,關毅濤表示,“當把運維和編程開發結合起來之后,它的靈活度跟可擴展性的想象空間是很大的,這也就是我們為什么能在一個小時之內服務器集群從10臺擴展到1000臺,這個在傳統運維是想象不來的,只有亞馬遜才能提供這種高擴展性和高可靠性。對于我們這種全球用戶的一個開發的公司,我們要達到全球各個點,其實現在也只有亞馬遜可以做到最好。”
這也是為什么關毅濤的整體技術研發團隊有80多人,但負責IT運維的技術人員只有6人的原因。通過自動化運維管理的腳本化設計,可以最大限度的根據業務的需求,自動化管理與調配IT基礎設施,這一能力與游戲應用開發相結合,無疑有著巨大發揮空間。而IT運維人員本身則只關注于新的IT支撐平臺的研發(如全局的IT監測系統,以及針對游戲用戶行為分析的大數據平臺)、嚴重的故障解決與特殊實例的需求。
對此,陳琦為我們演示了FunPlus自己根據亞馬遜AWS API開發的自主管理系統Cloudplus,它可以實時更新FunPlus在AWS各區的機器部署情況,以及每臺機器的運行情況,并可進行自動化擴展(Auto Scale),而這套系統只用了關毅濤6人IT研發團隊中的2-3個人。
在筆者看來,AWS的創新與可靠性設計,在很大程度上都是支撐“將業務與IT相融合”這一特性來服務的,這也是所有需要IT支撐的企業所追求的目標,而創新是必須的手段,可靠則是必須的基礎,缺少它們也不可能實現真正有效的融合。而當創新、可靠性、成本等成為每個云服務商必說的“優勢”之后,我相信“將業務與IT相融合”無疑將更具誘惑力,在我看來,它也將是亞馬遜繼續引領公有云服務市場的核心吸引力——對FunPlus如此,對于其他企業亦是如此!
責任編輯:鳶瑋
來源:
ZDNet