【2014WOT深圳站講師專訪】劉浩:自動化運維將成為趨勢
原創2014年11月21日至22日,51CTO傳媒主辦的2014WOT全球軟件技術峰會·深圳站將在深圳召開,技術人員和企業實踐用戶將齊聚深圳。
WOT是由51CTO傳媒主辦的國內***有影響的技術峰會,自2012年以來,秉承專注技術、服務技術人員的理念,獲得了廣大IT從業者和技術愛好者的一致認可,成為了業界重要的技術分享交流平臺以及人脈拓展平臺。
本次2014 WOT·深圳站將邀請國內外***的互聯網及創新企業技術負責人,***對外公開其當下最in技術,分享涵蓋六大主題,共有30+課程,移動游戲運營、運維開發、Web安全、數據挖掘、團隊管理等以及未來兩三年的技術趨勢。點擊報名》》
本次采訪對象是本次2014WOT深圳站<自動化運維>論壇的演講人劉浩,目前為奇虎360高級技術經理。博客鏈接:http://opsdev.blog.51cto.com/
1、您目前在貴公司負責哪些事情?能否先簡單談談您在運維領域的從業經驗,和您對此運維的理解?
我目前在公司負責一些基礎架構建設,比如360的自建CDN、DNS、運維自動化平臺等,同時也兼管IT開發和一些對外產品比如360網站監控服務。
我接觸運維行業有7年多。畢業進的百度,幾年之后來了360. 很幸運的經歷了這兩家公司業務快速增長、服務器規??焖僭鲩L的階段。我一直從事運維自動化方面的工作,是百度運維自動化平臺的最早期的幾個人之一,也是360運維自動化方面的構建者。
對于運維,我的理解可能還不夠深。我談談自己的看法。我認為運維工作是一個入門容易但想做好卻難度蠻高的行業。運維涉及的內容很廣,從IDC到服務器到服務,從網絡到OS到安全,從監控到服務發布等等,方方面面,從事計算機行業的人可以比較容易的上手其中的一部分內容,但只有少部分人能夠把握的比較寬的同時又做的很深。這也把運維工程師做了一些區分,大部分的人在從事基礎運維工作,只有少數人能夠既懂運維,又能在自己負責運維的業務上有相當的話語權。
2、能否講講這么多年運維工作的變化與演進?
我看到的變化是現在越來越多的往自動化運維的方向在演進。有幾個原因,互聯網在非??焖俚脑鲩L,互聯網公司的規模越來越大,服務器越來越多,客觀上要求運維精準、自動化;不斷涌現出了一批優秀的開源運維自動化工具;從業人員的水平也在不斷提高。7、8年前國內服務器過萬臺的公司***,現在一只手絕對數不過來。運維自動化已經不是理論,而是必須實踐的事情了。看一下大公司招運維的要求,目前很多都要有一定的開發能力了。
總體來說比前幾年的運維水平有提高。運維工作也更受到了關注和重視。從業人員的平均技術水平也有進步。但依然存在不少問題,比如基礎運維人員還是比例較大,技術水平依然不足夠,優秀的運維和運維開發人員稀缺。業內交流相比開發方向來說還是太少等。一方面是因為國內運維人員的人力成本還是比較低,以及公司基本都是眼睛里面只有業務指標,對運維工作重視不足,另外一方面是很多運維人員本身對自己定位也不高。
3、隨著如今大數據的爆發,這給運維工作帶來了怎樣的沖擊與改變?
大數據時代直接帶來的就是大規模集群的出現,大規模存儲、大規模計算都要建立在大規模的集群基礎上,甚至要自建IDC等,自然也就要求運維工作要高標準、要自動化。對運維從業人員的要求也從傳統的手工運維、基礎運維提升為要具備一定運維開發能力、運維規劃能力。
未來的運維趨勢我認為一定是運維開發的趨勢。運維,特別是基礎運維工作比如裝OS、服務器上架等,會被越來越多的自動化運維工具所替代,現在也涌現出越來越多的云計算公司,很多中小型公司只需要按需付費購買資源即可,基礎運維工作都由這些云計算公司實施了。 而這些云計算公司由于集群規模的增長,自動化運維是必然的。 另外現在國內互聯網公司的規模也越來越大,我相信達到千臺服務器規模的公司有一大批。這些公司本身的集群運維也需要自動化運維。
4、貴公司在監控上用了哪些技術?使用開源的還是自主研發?
360公司的監控平臺是自主研發的,用到的技術還是比較多的,支撐了360數萬臺服務器、數百個業務的智能監控報警,覆蓋了從IDC到集群、服務器、交換機、硬件/軟件、網絡等方方面面。參考了主流的優秀的開源軟件的優點。同時結合公司業務特點。對于360數萬臺服務器規模、數百個業務來說,任何一個開源軟件都是不適用的。但很多思想可以借鑒。
5、您認為目前國內的自動化平臺以及數據可視化平臺建設如何?還需要加強哪方面發展?
國內自動化平臺還在初級階段,開源的應用較多,但也停留在較淺的使用方面。目前監控方面應用的比較多,但對服務變更、發布部署等方面還是相對弱一點,這也符合現在國內現狀。國內運維的規范性、在業務上的影響力和話語權都不足夠,推動上也有困難。開發人員也很少從可運維方面考慮。這造成了自動化平臺建設的一個困難,就是必須要去適應現狀兼容現狀,哪怕有不合理的地方。規范性體現的不足夠。
6、您認為一名合格的運維工程師是如何定義的?需要具備哪些因素?
一個合格的運維人員,對于他自己負責運維的業務并不只是意味著收收報警、重啟一下機器、切個流量這種工作。更重要的是他能夠結合業務架構來有針對性的開展運維、部署架構的優化工作,讓業務更穩定、出問題更少、部署和切換更及時等。并努力將問題防范于未然,而不是簡單的遇到問題解決問題。
我覺得首先要熱愛運維,運維能做深做精,但又不局限于運維. 首先運維人員一定是要把運維工作做好的,包括要具備相當的運維技術;但要想對負責運維的業務有重要影響力,能夠具備一定的發言權,甚至對架構、開發都有影響力,那么必須不局限于運維。不能只停留在運維的一畝三分田里面。對系統、網絡、架構甚至開發方面都要了解。