傳統(tǒng)運維 VS 互聯(lián)網(wǎng)運維:從哪來,到哪去?
作者介紹
王天維,從事運維工作近十年,精通網(wǎng)絡(luò)技術(shù),CCIE專家。專注云計算、SDN、數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)設(shè)計。
韓曉光,專業(yè)運維,兼職開發(fā),干過商務。信息系統(tǒng)項目管理師、ITIL Foundation認證、IBM CATE、RHCE。著有《系統(tǒng)運維全面解析:技術(shù)、管理與實踐》一書。
概述
近一年,關(guān)于傳統(tǒng)運維與互聯(lián)網(wǎng)運維的探討越來越多,在運維體系快速變革地環(huán)境下,運維未來的走向,便成為運維行業(yè)的關(guān)注點。
那么:
到底什么是傳統(tǒng)運維體系?
什么是互聯(lián)網(wǎng)運維體系?
他們的特點,異同在哪?
從哪里來到哪里去?
本文將從以下角度探討兩大運維體系。
- 商業(yè)封閉式系統(tǒng)架構(gòu) vs 開源系統(tǒng)架構(gòu)辨析
- 傳統(tǒng)運維 vs 互聯(lián)網(wǎng)運維辨析
- 去IOE運動辨析
- 運維發(fā)展趨勢辨析
1、商業(yè)封閉式系統(tǒng)架構(gòu) vs 開源系統(tǒng)架構(gòu)辨析
每個單位組織的IT環(huán)境,不論大小復雜度,總會有個系統(tǒng)架構(gòu)層次。有了這個架構(gòu)體系,那所有的運維事情大體都圍繞著這個系統(tǒng)架構(gòu)上的每個元素及整體進行運維保障工作。
運維體系架構(gòu)從某種角度可以劃分為如下兩種:
- A. 商業(yè)封閉式系統(tǒng)架構(gòu)(IOE架構(gòu))
- B. 開源系統(tǒng)架構(gòu)
通常我們會將圍繞商業(yè)封閉式系統(tǒng)架構(gòu)(IOE架構(gòu))的運維視作傳統(tǒng)運維,將圍繞開源系統(tǒng)架構(gòu)的運維視作互聯(lián)網(wǎng)運維。
就上述兩種運維體系,下文做一些辨析。
A. 商業(yè)封閉式系統(tǒng)架構(gòu)(IOE架構(gòu))
典型的即以使用IOE(IBM、Oracle、EMC)產(chǎn)品軟硬件為主要元素的系統(tǒng)架構(gòu)。
IOE架構(gòu)以縱向擴展為特點,通過增加CPU、內(nèi)存、擴展柜、冗余備件等方式來提高處理能力及穩(wěn)定性。
該架構(gòu)的處理能力主要取決于單臺(套)設(shè)備(系統(tǒng))的最大擴展能力,很難通過增加設(shè)備(系統(tǒng))數(shù)量來增加處理能力,換句話說該架構(gòu)很難通過擴大集群規(guī)模的方式來解決問題。
隨著縱向擴展的規(guī)模增大,它的實施技術(shù)難度、管理復雜度以及隱患風險都會成比例大幅上升。基于IOE架構(gòu)的典型企業(yè)如:金融業(yè)、電信業(yè)、能源業(yè)、交通運輸業(yè)。IOE典型的系統(tǒng)架構(gòu)如下圖所示。
典型IOE架構(gòu)圖
上述為IOE型系統(tǒng)架構(gòu),其服務器多使用小型機、大型機(還有以往的中型機);數(shù)據(jù)庫系統(tǒng)往往會使用Oracle;存儲則多使用知名品牌的中高端存儲陣列、帶庫等設(shè)備。服務器與存儲之間多使用SAN存儲網(wǎng)絡(luò)。
這些服務器、存儲等硬件本身往往就是雙冗余的,線路連線也都是雙冗余的,而且設(shè)備性能指標往往非常好,例如一臺普通中端的Power 7系列服務器可以輕松劃分出若干個系統(tǒng)分區(qū)或者一二十個虛擬機系統(tǒng)。
B. 開源系統(tǒng)架構(gòu)
典型的即以使用廉價PC服務器,開源產(chǎn)品技術(shù)為主要元素的系統(tǒng)架構(gòu)。
開源系統(tǒng)架構(gòu)以橫向擴展,分布式部署為特點。常通過向集群中增加單機設(shè)備資源解決存儲空間、性能以及穩(wěn)定性問題,其集群規(guī)模可以小到兩三臺PC服務器,也可以大到上萬臺。
對于數(shù)據(jù)庫,可以通過分布式集群方式解決數(shù)據(jù)庫擴展性的問題。另外非結(jié)構(gòu)化數(shù)據(jù)庫及分布式文件系統(tǒng)在處理非結(jié)構(gòu)化數(shù)據(jù)的存儲與使用方面也很靈活方便。
基于開源系統(tǒng)架構(gòu)的典型企業(yè)如:以BAT(百度、阿里、騰訊)為代表的眾多互聯(lián)網(wǎng)企業(yè)。
開源系統(tǒng)架構(gòu)如圖所示:
典型開源系統(tǒng)架構(gòu)圖
上述開源系統(tǒng)架構(gòu)中使用了CDN和反向代理以提高網(wǎng)站性能。
例如我們的服務器可能部署在北京,對于北京及周邊用戶來說訪問是較快的,而對于遠離北京的用戶訪問則感覺較慢,因為數(shù)據(jù)傳輸時間比較長。
對于這種情況,常常使用CDN解決,CDN將數(shù)據(jù)內(nèi)容緩存到運營商(或自建CDN)的機房,用戶訪問時先從最近的CDN機房獲取數(shù)據(jù),這樣大大減少了網(wǎng)絡(luò)訪問的路徑。
對于反向代理,當用戶請求到達時首先訪問反向代理,反向代理服務器將(如:Varnish)緩存的數(shù)據(jù)返回給用戶,如果沒有緩存,才會從源站服務器獲取,這也減少了獲取數(shù)據(jù)的成本。
當然對于海量訪問請求,或龐大集群架構(gòu),則就需要分多層,綜合運用上述負載均衡以及代理(反代理),同時可能需要引入Zookeeper等功能以協(xié)調(diào)(服務)任務調(diào)度。
從上述架構(gòu)簡析中,我們便會感知到兩種運維體系的巨大差異。
俗話說隔行如隔山,現(xiàn)如今就算都是運維這一行,也可謂千山萬嶺。對于上述基于IOE架構(gòu)的傳統(tǒng)運維體系,對比基于開源架構(gòu)的互聯(lián)網(wǎng)運維體系,可以說是當前兩大運維陣營。
2、傳統(tǒng)運維 vs 互聯(lián)網(wǎng)運維辨析
一個奇怪的現(xiàn)象
傳統(tǒng)運維圈子通常高度認可商業(yè)閉源產(chǎn)品。而對開源產(chǎn)品及其技術(shù)則很謹慎,很少采納,甚至認為很多開源產(chǎn)品不上檔次。
而互聯(lián)網(wǎng)運維圈子通常高度青睞開源產(chǎn)品、技術(shù)、理念。而對商業(yè)閉源產(chǎn)品則比較排斥抵觸,再好也不買。
差異可見一斑
傳統(tǒng)運維圈子和互聯(lián)網(wǎng)運維圈子各有特點,同是運維行業(yè),但也有很多差異之處。關(guān)于傳統(tǒng)運維與互聯(lián)網(wǎng)運維的不同差異,本文總結(jié)了如下幾點差異:
A. 架構(gòu)差異
B. 面向?qū)ο蟛町?/p>
C. 運維人員差異
D. 體制理念差異
解析如下:
A. 架構(gòu)差異
- 傳統(tǒng)運維:
傳統(tǒng)運維多是圍繞以IOE架構(gòu)及其產(chǎn)品體系進行運維,在性能、數(shù)據(jù)庫、中間件、HA高可用、災備、存儲等環(huán)節(jié)通常大量采用商業(yè)閉源的軟硬件產(chǎn)品及其解決方案。
這些方案的特點是通常縱向擴展能力極強,橫向擴展能力很弱。商業(yè)案例成熟穩(wěn)定,方案組合重度耦合,講究兩地三中心這種典型的重量級、集中式運維管理方式。
另外IOE架構(gòu)后面通常有強大的MA維保支持體系,甚至MA人員常年駐場。
- 互聯(lián)網(wǎng)運維:
互聯(lián)網(wǎng)運維通常是圍繞開源產(chǎn)品、技術(shù)解決方案進行運維。在負載性能、數(shù)據(jù)庫、中間件、集群高可用、災備、分布式存儲、自動化部署等環(huán)節(jié)通常大量采用開源的軟件產(chǎn)品及其技術(shù)解決方案。
硬件通常使用廉價的X86服務器,甚至白盒產(chǎn)品。
這種開源解決方案通常縱向擴展能力很弱,橫向擴展能力很強。有大量社區(qū)、行業(yè)成熟案例。方案組合靈活,講究分布式存儲、負載集群、輕量級、模塊化、去中心化的運維管理方式。
另外互聯(lián)網(wǎng)系統(tǒng)架構(gòu)通常缺少MA維保支持。開源產(chǎn)品更新?lián)Q代甚至消亡的風險較大。
B. 面向?qū)ο蟛町?/strong>
- 傳統(tǒng)運維:
傳統(tǒng)行業(yè)的IT運維大多是面向企業(yè)內(nèi)部(體系)用戶,其需求相對明確、穩(wěn)定,具有很強的行業(yè)系統(tǒng)特點,另外桌面運維中的OA、ERP、MES、企業(yè)郵箱等系統(tǒng),也通常是面相企業(yè)內(nèi)部員工。
因此傳統(tǒng)運維面向的用戶在其數(shù)量、需求、特性通常是可控的、穩(wěn)定的、集中的。
也因此傳統(tǒng)運維圈子適合購買商業(yè)產(chǎn)品,這些產(chǎn)品通常是比較成熟的產(chǎn)品,經(jīng)過長期的測試和使用,有很好地最佳實踐,相對能夠較好地滿足傳統(tǒng)運維需求。
- 互聯(lián)網(wǎng)運維:
相比之下,互聯(lián)網(wǎng)運維通常面向的是廣大互聯(lián)網(wǎng)用戶。因此其面向的對象關(guān)系復雜,市場多變,需求五花八門,目的目標不可控,對象海量不可控。
也因此互聯(lián)網(wǎng)運維的系統(tǒng)環(huán)境變更迭代頻繁,對自動化、彈性需求要求較高。由于各種復雜多變因素,通常導致傳統(tǒng)商業(yè)產(chǎn)品不能很好地支撐互聯(lián)網(wǎng)運維環(huán)境。因此被逼無奈只能選擇開源,并走自主開發(fā)這條路子。
C. 運維人員差異
有服務器的地方就有運維
其實近年來,在這兩大運維體系之間流動的運維工程師也不在少數(shù)。本文作者就是這兩大運維圈子的跨界者。
- 傳統(tǒng)運維:
傳統(tǒng)運維圈的從業(yè)人員,其知識體系普遍比較高逼格。不論其學歷背景還是再教育背景通常比較高大上。
同時相關(guān)商業(yè)產(chǎn)品的培訓認證體系也相對完善,傳統(tǒng)行業(yè)的運維工程師在這方面有其特色。
比如他們通常玩過大型機、VMax、Z/os、Oracle、ITSM、PMP、ISO、PCI、某國加密產(chǎn)品、某國數(shù)據(jù)庫,等等一系列高逼格的玩法。
- 互聯(lián)網(wǎng)運維:
在互聯(lián)網(wǎng)運維圈的從業(yè)人員,其來歷千差萬別,既有超人大神,也有小白。他們通常LAMP/LNMP基礎(chǔ)扎實,寫得一手好腳本,練得一身全棧功夫。
互聯(lián)網(wǎng)天生具有萬眾創(chuàng)新的基因,因此這片空間廣闊任鳥飛,很多大神往往不是通過各種培訓出來的,都是在各種磨練中涅槃出來的。
由于互聯(lián)網(wǎng)產(chǎn)業(yè)的迅猛發(fā)展,互聯(lián)網(wǎng)運維人員的薪酬也普遍高于傳統(tǒng)運維從業(yè)人員。
D. 運維體制理念差異
傳統(tǒng)運維圈子里,看重商業(yè)運維產(chǎn)品、服務支持、業(yè)務運營流程這些因素,但對開源產(chǎn)品體系比較慎重或者沒興趣。
而在互聯(lián)網(wǎng)運維圈子里,則看重開源產(chǎn)品、看重研發(fā)、但凡是商業(yè)的東西則通常沒興趣。
傳統(tǒng)運維關(guān)注流程、關(guān)注業(yè)務、講究ITIL,ISO標準體系,通常關(guān)注業(yè)務運行的高度穩(wěn)定,高度一致性、集中性。傳統(tǒng)運維自動化程度通常不高,但求運營穩(wěn)定可靠。
而互聯(lián)網(wǎng)運維通常關(guān)注網(wǎng)站響應、網(wǎng)站性能、關(guān)注靈活快捷、分布式、開放式,關(guān)注安全體系。在很多互聯(lián)網(wǎng)大企業(yè)里,其運維自動化程度非常高。
另外傳統(tǒng)運維行業(yè)多是企事業(yè)單位,共和國長子長孫型企業(yè),在運維經(jīng)營指標、人事組織,薪資體系,運維KPI考核等一系列觀念和互聯(lián)網(wǎng)運維行業(yè)的理念還是有很大差別的。
由于架構(gòu)的不同,面向?qū)ο蟛煌赵瓌t不同,因此傳統(tǒng)運維與互聯(lián)網(wǎng)運維在商業(yè)運營模式上自然有很多不同。
3、去IOE運動辨析
近年來開源技術(shù)的迅猛發(fā)展,以及國內(nèi)外政策環(huán)境共同作用,引發(fā)了一場去IOE的風潮,其中以阿里巴巴發(fā)動的“去IOE”運動較為著名。他們使用低廉的軟硬件產(chǎn)品代替昂貴高門檻的IOE產(chǎn)品,搭建起自主開放的開源系統(tǒng)架構(gòu)。
之所以出現(xiàn)“去IOE”運動,其中原因總結(jié)概述如下幾條:
- 自“棱鏡門事件”之后,國家強烈意識到數(shù)據(jù)安全的重要性,開始大力提倡產(chǎn)品設(shè)備國產(chǎn)化與自主研發(fā),這正與“去IOE”觀點不謀而合,上下一致。
- 近年來,云計算、大數(shù)據(jù)等新興IT技術(shù)的蓬勃發(fā)展,促使眾多行業(yè)開始往更加開放靈活的開放系統(tǒng)架構(gòu)轉(zhuǎn)型。
而對于傳統(tǒng)的IOE架構(gòu)而言,其定制與擴展靈活性有限,往往是擅長于集中式架構(gòu)的管理,而很難應對大規(guī)模集群,分布式存儲計算。
- 在購買成本方面,以IOE為代表的商業(yè)產(chǎn)品價格昂貴(動輒上百萬元);而PC服務器則相對廉價,通常幾萬元。
在部署與管理方面,IOE產(chǎn)品的學習掌握門檻偏高,而開源系統(tǒng)環(huán)境相對容易搭建與管理。
另外IOE產(chǎn)品技術(shù)相對商業(yè)封閉,不易掌握。
基于上述一些原因,去IOE應時而生。看到別人去IOE很成功,然后自己也想玩花的。有沒有實力資本玩花的,具體到自身企業(yè)是否要去IOE,這需要慎重考慮,三思而行。畢竟適合自身發(fā)展需要的系統(tǒng)架構(gòu)就是好的架構(gòu)。
去IOE過程,其實是系統(tǒng)架構(gòu)的更新?lián)Q代,產(chǎn)品的更新?lián)Q代,運維理念的更新?lián)Q代,運維人員的更新?lián)Q代,知識體系的更新?lián)Q代,等等。
因此如果冒然去IOE,可能既不會降低成本,也不會提高效率,更不會穩(wěn)定架構(gòu)。如下列舉幾點“去IOE”要考慮的因素:
- 自身業(yè)務是否真正需要大數(shù)據(jù)、云計算以及分布式這種海量運維體系。
- 是否已經(jīng)考慮好系統(tǒng)架構(gòu)、運維理念、人員、知識更新?lián)Q代的方案。
- 自身的研發(fā)實力儲備是否夠解決大量開源產(chǎn)品的坑坑洼洼,并有實力搭建開源系統(tǒng)架構(gòu)。
- 是否有足夠的資金應對“去IOE”轉(zhuǎn)型中的成本,例如從軟硬件高成本轉(zhuǎn)向人力技術(shù)高成本。
小結(jié)論:
A. 去IOE只是給予我們一些最佳實踐與選擇路線,但去IOE技術(shù)門檻較高,一般企業(yè)很難復制。
B. 從目前發(fā)展來看,去I、E案例較多,去O不容易,IOE架構(gòu)與非IOE架構(gòu)仍將長期并存。 一時間很難找到一些能夠完美替代以IOE為代表的成熟(且普適)產(chǎn)品方案。
4、運維發(fā)展趨勢辨析
未來的運維道路在何方,我從哪來,要到那里去?這是每一個運維從業(yè)者都會面臨的問題。本文關(guān)于運維發(fā)展趨勢的一些辨析如下:
云計算等各種理念技術(shù)的發(fā)展,這些都將對運維行業(yè)帶來巨大的機遇與挑戰(zhàn)。很多企業(yè)都處在傳統(tǒng)IDC運維方式與云運維方式的探索中。
在新的形勢下,傳統(tǒng)運維方式與基于云計算的運維方式將長期并存,公有云與私有云及混合云運維局面將長期并存,傳統(tǒng)IT運維與互聯(lián)網(wǎng)IT運維也仍將長期并存。
基于IOE架構(gòu)的業(yè)務系統(tǒng)正在處于轉(zhuǎn)型中,但基于開源互聯(lián)網(wǎng)技術(shù)的成功經(jīng)驗也并非都能復制。
傳統(tǒng)運維領(lǐng)域正在探索容器、自動化、云計算、開源架構(gòu)等轉(zhuǎn)型之路。互聯(lián)網(wǎng)運維也在借鑒或使用成熟的商業(yè)產(chǎn)品與理念,例如IOE產(chǎn)品體系、F5、Vmware、Exchange、AD、ITIL、ISO……
在上述大環(huán)境下,運維部門不會變的越來越清閑了,相反承擔的企業(yè)發(fā)展戰(zhàn)略的責任越來越大了。運維部門將由傳統(tǒng)的IT成本中心更多地向IT服務中心、價值輸出中心、利潤輸出中心轉(zhuǎn)變。
在上述發(fā)展形勢下,運維的人、事、物、流程規(guī)范都將相應發(fā)生變化,如人員數(shù)量會有變化,職位職責會有變化,設(shè)備資產(chǎn)會會有變化,各種流程規(guī)范都將發(fā)生變化。
寫在最后一的句話:
最好的運維是在正確的領(lǐng)域由正確的人干正確的運維事情……