有同也有異,對比BAT的運(yùn)維文化
相信做運(yùn)維的童鞋都會(huì)有這樣的經(jīng)歷,“參加過7*24小時(shí)的值班,抗過機(jī)器,敲過代碼,偶爾還得玩兩下數(shù)據(jù)。”在一些小公司中,運(yùn)維童鞋不敢說是全才,但至少是哪里有坑就能夠填哪里。但是,在大公司中運(yùn)維工作的分類就比較細(xì),例如專注于高反復(fù)度工作的操作運(yùn)維、專注于基礎(chǔ)運(yùn)維工作的業(yè)務(wù)運(yùn)維、專注于運(yùn)維工作項(xiàng)目管理及需求規(guī)劃設(shè)計(jì)的規(guī)劃運(yùn)維、專注于運(yùn)維工具開發(fā)的開發(fā)運(yùn)維等等。
大公司中的運(yùn)維工作不僅面臨著分工的紛繁復(fù)雜,同時(shí)還要經(jīng)受著峰值流量的沖擊。那么,大公司的運(yùn)維工作都是如何管理的呢?本文將以BAT為例,為你揭開大型互聯(lián)網(wǎng)公司運(yùn)維思想的冰山一角。
騰訊:服務(wù)化、標(biāo)準(zhǔn)化、自動(dòng)化和產(chǎn)品化
當(dāng)運(yùn)維團(tuán)隊(duì)只有幾個(gè)人的時(shí)候,大家的工作狀態(tài)可能是“個(gè)人自掃門前雪”,哪里需要救火就去支援哪里,但是當(dāng)團(tuán)隊(duì)人數(shù)增加到成百上千人時(shí),如果還是這樣的工作狀態(tài),那可能就會(huì)有很大的問題。所以騰訊的運(yùn)維服務(wù)有一個(gè)“四化建設(shè)”,即服務(wù)化、標(biāo)準(zhǔn)化、自動(dòng)化和產(chǎn)品化。
如何理解這“四化”呢?服務(wù)化指的是服務(wù)于業(yè)務(wù),傾向于解決產(chǎn)品的痛點(diǎn);標(biāo)準(zhǔn)化是自動(dòng)化的基礎(chǔ),因?yàn)闃I(yè)務(wù)架構(gòu)之間的差異各不相同,所以標(biāo)準(zhǔn)化的粒度和維度也需要進(jìn)行調(diào)節(jié);自動(dòng)化,一定要打通企業(yè)內(nèi)的各個(gè)信息孤島,只有實(shí)現(xiàn)了全流程的自動(dòng)化才是真正的自動(dòng)化;產(chǎn)品化,運(yùn)維平臺也要重視用戶交互,要以產(chǎn)品的理念來建設(shè)。
百度:書同文,車同軌,行同倫
從網(wǎng)上公開的信息來看,百度的運(yùn)維經(jīng)歷了四個(gè)階段,即腳本工具、基礎(chǔ)運(yùn)維平臺、開放運(yùn)維平臺和智能運(yùn)維平臺,運(yùn)維的核心目標(biāo)也從之前的提升效果過渡到現(xiàn)在的如何解放運(yùn)維自身的效率。
在SACC 2017大會(huì)上,來自百度的講師曾透露,“百度指導(dǎo)運(yùn)維的三個(gè)思想分別是書同文、車同軌和行同倫。”如何理解呢?書同文指的是一致運(yùn)維“語言”,如運(yùn)維應(yīng)用、服務(wù)、機(jī)房、集群的定義;車同軌指的是一致運(yùn)維“方法”,如擴(kuò)縮容執(zhí)行、流量切換執(zhí)行;行同倫指的是一致運(yùn)維“模式,如故障診斷策略、彈性伸縮策略、流量調(diào)度策略。

上圖是百度AIOps技術(shù)棧,據(jù)悉該平臺應(yīng)用于百度的內(nèi)部、公有云和私有云客戶。
阿里:普適的“大中臺和小前臺”
似乎每家公司運(yùn)維的“打怪升級”路線都很相似,阿里也經(jīng)歷了腳本化、工具化、DevOps、自動(dòng)化再到智能化的過程。在DTCC 2018大會(huì)中,阿里技術(shù)專家徐小飛曾將AIOps無人運(yùn)維和無人駕駛進(jìn)行了類比,二者都可以分為六個(gè)階段,并且每個(gè)對應(yīng)的階段都有相同之處。其中AIOps無人運(yùn)維的六個(gè)階段分別是人肉運(yùn)維、腳本/工具化運(yùn)維、平臺型運(yùn)維DevOps、數(shù)據(jù)化運(yùn)維DataOps、高度智能運(yùn)維AIOps和完全智能運(yùn)維AIOps。

了解阿里的人應(yīng)該都聽過,“大中臺和小前臺”這個(gè)名詞,這是阿里上上下下所有技術(shù)相關(guān)的部門都奉行的技術(shù)戰(zhàn)略,運(yùn)維也不例外。

阿里有個(gè)大數(shù)據(jù)運(yùn)維解決方案叫Tesla,該解決方案貫穿了阿里整個(gè)大數(shù)據(jù)體系,負(fù)責(zé)從基礎(chǔ)設(shè)施到基礎(chǔ)平臺到存儲計(jì)算平臺的所有產(chǎn)品的運(yùn)維支撐。運(yùn)維垂直體系也是一個(gè)SPI的分層結(jié)構(gòu),運(yùn)維IaaS層負(fù)責(zé)的是提供面向運(yùn)維管理的基礎(chǔ)操作能力;運(yùn)維PaaS層提供面向各運(yùn)維領(lǐng)域的功能服務(wù)以及運(yùn)維數(shù)據(jù)源與控制服務(wù);運(yùn)維SaaS層提供面向場景化的自動(dòng)智能運(yùn)維應(yīng)用。