詳解數(shù)據(jù)中心的運(yùn)維自動(dòng)化和DevOps
嘉賓介紹
智錦
這是真名和全名(編輯注:雖然智這個(gè)姓氏比較少)。
2006年~2011年,在支付寶負(fù)責(zé)系統(tǒng)運(yùn)維工作,是阿里集團(tuán)和國(guó)內(nèi)***批從事運(yùn)維自動(dòng)化系統(tǒng)體系建設(shè)者。
2011年到2014年, 在建設(shè)銀行總行負(fù)責(zé)運(yùn)維工具和私有云的建設(shè),運(yùn)用互聯(lián)網(wǎng)的經(jīng)驗(yàn)和開(kāi)源軟件做了一些二次開(kāi)發(fā)。
目前創(chuàng)辦杭州云霽科技,致力于把運(yùn)維自動(dòng)化經(jīng)驗(yàn)和DevOps的思想做成產(chǎn)品。
主題簡(jiǎn)介
現(xiàn)在“運(yùn)維自動(dòng)化”、“云計(jì)算”、“DevOps”很熱,也有很多解釋,但很多人的理解是狹義的甚至錯(cuò)誤的。本期分享嘉賓 智錦 將分享其在大型互聯(lián)網(wǎng)企業(yè)和大型傳統(tǒng)行業(yè)的工作感受,并從整個(gè)數(shù)據(jù)中心的運(yùn)維管理體系建設(shè)出發(fā) ,分享這幾年他親身實(shí)踐所總結(jié)出來(lái)的一些觀點(diǎn)。
分享實(shí)錄
我在支付寶的時(shí)期,剛好是支付寶快速發(fā)展的時(shí)期,業(yè)務(wù)每年翻4倍,僅僅3年時(shí)間,就從100臺(tái)機(jī)器達(dá)到了上萬(wàn)臺(tái)機(jī)器,最早的運(yùn)維自動(dòng)化是被業(yè)務(wù)倒逼,被動(dòng)的發(fā)現(xiàn)問(wèn)題解決問(wèn)題的過(guò)程。這個(gè)經(jīng)歷,大部分業(yè)務(wù)快速發(fā)展的互聯(lián)網(wǎng)公司的都會(huì)碰到,解決方式也都差不多,前段時(shí)間大眾點(diǎn)評(píng)運(yùn)維總結(jié)的非常好。
互聯(lián)網(wǎng)的運(yùn)維自動(dòng)化,我總結(jié)為:“自下而上,野蠻生長(zhǎng)”,見(jiàn)效快,但很難有資源停下來(lái)思考,相當(dāng)于華山的劍宗。
我去建行之后,有機(jī)會(huì)系統(tǒng)的讀了老外的ITIL、COBIT等***實(shí)踐,也看了不少IBM、HP、BMC的運(yùn)維產(chǎn)品。客觀的說(shuō),老外的方法論和***實(shí)踐很牛逼,雖然說(shuō)軟件太復(fù)雜,落地難,相當(dāng)于華山的氣宗。
在和從前在互聯(lián)網(wǎng)的實(shí)踐經(jīng)驗(yàn)驗(yàn)證之后,突然有一天仰望天空的朵朵白云,豁然開(kāi)朗,從此劍氣雙修,打通任督二脈,運(yùn)維自動(dòng)化的功力大進(jìn)。
以上為開(kāi)個(gè)玩笑。不過(guò)我現(xiàn)在關(guān)注的重點(diǎn)主要是整個(gè)數(shù)據(jù)中心的運(yùn)維管理體系建設(shè),下面分享的也是我這幾年實(shí)踐的一些觀點(diǎn)。可能離中小型互聯(lián)網(wǎng)公司比較遠(yuǎn)一點(diǎn),會(huì)顯得務(wù)虛一點(diǎn)。
現(xiàn)在“運(yùn)維自動(dòng)化”、“云計(jì)算”、“devops”很熱,也有很多解釋,但很多人的理解是狹義的甚至錯(cuò)誤的。 比如,“運(yùn)維自動(dòng)化”這個(gè)詞已經(jīng)被人叫爛了,但大部分人理解的運(yùn)維自動(dòng)化,其實(shí)只能叫“操作自動(dòng)化”。再比如,puppet 非常熱,很多人覺(jué)得puppet是一個(gè)自動(dòng)化工具,其實(shí)puppet的本質(zhì)和精華是一個(gè)配置管理工具。
再說(shuō)云計(jì)算。云計(jì)算代表了一種互聯(lián)網(wǎng)思維的全新技術(shù)路線,其核心思想是采用低成本、標(biāo)準(zhǔn)化的開(kāi)放硬件和開(kāi)源軟件構(gòu)建基礎(chǔ)設(shè)施,通過(guò)自服務(wù)和自動(dòng)化實(shí)現(xiàn)基礎(chǔ)設(shè)施資源的交付及運(yùn)維管理,通過(guò)分布式系統(tǒng)實(shí)現(xiàn)系統(tǒng)處理能力的***擴(kuò)展,并借助合適的應(yīng)用架構(gòu)彌補(bǔ)基礎(chǔ)軟硬件的不足,滿足高可用方面的要求。但是云計(jì)算實(shí)施之后,基礎(chǔ)設(shè)施規(guī)模急劇膨脹,我們可以發(fā)現(xiàn)運(yùn)維的復(fù)雜度是不減反增了。
數(shù)據(jù)中心的運(yùn)維管理定義
以前我提過(guò)一個(gè)黑盒運(yùn)維與白盒運(yùn)維的觀點(diǎn)。做了很多年的運(yùn)維,卻有可能不知道運(yùn)維的定義是什么。先來(lái)給數(shù)據(jù)中心的運(yùn)維管理下個(gè)定義吧!看看什么是運(yùn)維。
國(guó)際分析機(jī)構(gòu)Garnter把數(shù)據(jù)中心的運(yùn)維工作總結(jié)為“I&O(Infrastructure & Operation)”,也就是基礎(chǔ)設(shè)施管理和運(yùn)行管理這兩個(gè)領(lǐng)域。基礎(chǔ)設(shè)施服務(wù)是上線前,如何“建設(shè)基礎(chǔ)設(shè)施”。Opertion是上線后,如何管理業(yè)務(wù)活動(dòng)。
我是認(rèn)為自動(dòng)化是運(yùn)行維護(hù)的一個(gè)方面。 我對(duì)于廣義運(yùn)維自動(dòng)化的理解,就是體系和閉環(huán)的建立。基礎(chǔ)設(shè)施層面的閉環(huán)是一個(gè)運(yùn)維和運(yùn)維銜接的小閉環(huán),在運(yùn)行管理領(lǐng)域,涉及到了運(yùn)維和開(kāi)發(fā)的大閉環(huán),也就是DevOps。最終的一個(gè)現(xiàn)象是,完全的服務(wù)化和完全的自動(dòng)化。
IT運(yùn)維和IT服務(wù)管理的區(qū)別,就是一個(gè)是被動(dòng),一個(gè)是主動(dòng)。
說(shuō)明:圖大型私有云o和i成本比較 是本期中唯一源自網(wǎng)上的,也是根據(jù)garnter報(bào)告畫的圖,看了一下大致符合我的認(rèn)知,就用了,沒(méi)有去考證。
#p#
未來(lái)數(shù)據(jù)中心能力
六化是我們對(duì)未來(lái)數(shù)據(jù)中心能力的一個(gè)歸納總結(jié)。
“六化”分別指的是:
◆虛擬化
◆自動(dòng)化
◆一體化
◆標(biāo)準(zhǔn)化
◆可視化
智能化全面提升數(shù)據(jù)中心運(yùn)行管理的各方面能力。可以認(rèn)為這六化 合在一起才是廣義的自動(dòng)化。
運(yùn)維場(chǎng)景三要素
但是運(yùn)維的業(yè)務(wù)場(chǎng)景無(wú)法窮盡,最核心的是如何建立這一個(gè)閉環(huán)的系統(tǒng)?這是大家最關(guān)注的。最關(guān)鍵的還是透過(guò)現(xiàn)象看本質(zhì)。
運(yùn)維的三要素是什么?不是服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò),而是數(shù)據(jù)、流程、操作。這三者的編排和組合,就能完成所有的運(yùn)維場(chǎng)景。 而這中間數(shù)據(jù)和流程是最核心的,操作只是具體的實(shí)施手段而已。
運(yùn)維自動(dòng)化三個(gè)階段和閉環(huán)流程
這張圖是純干貨,體現(xiàn)的是運(yùn)維自動(dòng)化三個(gè)不同階段。
右下角的是最初級(jí)階段, 工具、流程、數(shù)據(jù)耦合的很厲害,要么都管,要么三不管, 小團(tuán)隊(duì)還能應(yīng)付, 一旦團(tuán)隊(duì)擴(kuò)大了就很難。
左下角則中級(jí)階段, 流程驅(qū)動(dòng)數(shù)據(jù),再驅(qū)動(dòng)操作,形成一個(gè)小的閉環(huán)。
最上方則是我們期望的最理想的架構(gòu), CMDB做為總控節(jié)點(diǎn),通過(guò)數(shù)據(jù)掌控所有的流程和工具。
這是我們最終實(shí)現(xiàn)的閉環(huán)流程。