一個CIO的快樂運維
在寬敞的會議里,坐著某企業(yè)的信息化主管,當公司系統(tǒng)出故障問題時,他不再像無頭的蒼蠅四處亂竄,用他的話說,“絕不充當救火隊員”,要做一個快樂的IT人。
擺脫運維煩惱,快樂IT生活,這就是信息化主任老張的運維方法論。可是在一年前的今天,也是在這間會議室里,老板的批評、同事的指責,讓老張的心里像打翻了五味瓶一般:孤獨、痛苦、無奈、羞辱,一股腦兒向這個一向要強的男人襲來……
“不管用任何方法,要讓整個公司的IT系統(tǒng)跑起來”,老板宣布完后便離開了。會議室內除了煙灰缸中的煙頭冒出的隨著老板關門離開而緩緩搖擺的幾縷青煙還在證明時間的流動之外,再沒有任何的生氣。老張就像經歷了一場噩夢,凝結著痛苦的臉上滲出了一層汗水。多少個夜以繼日的辛勞,換來的卻是這樣的結果,IT管理維護過程中發(fā)生的的一幕幕再次浮現(xiàn)在老張的眼前……
四面楚歌 煩惱運維無處不在
喂!是運維部嗎?
市場部的電腦是不是中毒了,怎么都開不了機?
喂!
你們運維部都忙什么呢?整個公司怎么上不了網?
財務部的上傳不了報稅單據!
銷售部的客戶關系管理系統(tǒng)怎么用不了了!……
用四面楚歌來形容老張和他的團隊一點也不為過,責備聲和埋怨聲,聲聲不斷,繁雜的IT運維已令他們苦不堪言,快樂IT生活對他來說也只是人生的一場夢而已。
隨著公司的業(yè)務的不斷增加,IT運維工作變得越來越無序忙亂,業(yè)務部門經常投訴,也讓老張反思問題到底出現(xiàn)在哪里?
第一、 被動管理
老張的公司一直采用傳統(tǒng)的IT運維管理模式,即通常由用戶先于IT人員發(fā)現(xiàn)問題,然后再找到IT部門要求解決問題。這是由于傳統(tǒng)的IT管理采用人工方式管理基礎設施,網絡管理是從各種IT基礎設備出發(fā)的,僅僅是保障各類IT設備如服務器、數(shù)據庫、存儲設備、交換機等等基礎設施的正常運行。
另外,不采用任何輔助手段,靠人海戰(zhàn)術輪詢。當系統(tǒng)規(guī)模較小時,只要參與運維的技術人員足夠負責,人工運維方式尚可滿足日常運維需要。但是隨著公司業(yè)務規(guī)模不斷壯大,這種救火式管理就顯出了嚴重的不足。并且IT人員面對過多服務請求,來一個處理一個,缺乏合理管理,導致有更重要的問題發(fā)生時,找不到運維人員,問題得不到及時的處理和解決。
第二、無關業(yè)務、孤島管理
即使采用監(jiān)控軟件也都是多種監(jiān)控并行監(jiān)管,這些監(jiān)控軟件各自獨立運作,沒有進行對業(yè)務的整合監(jiān)控,就算接到業(yè)務部門的故障申報,也很難定位故障源。
況且每個人的精力有限,在專業(yè)應用系統(tǒng)賴以生存的各項基礎設施支撐單元上很難做到專、精、準的多面手角色,加之由于管理范圍的界定和監(jiān)控手段的限制,運維人員很難直接判定問題是出在基礎網絡、系統(tǒng)服務器、數(shù)據庫還是應用系統(tǒng)自身,故障難以定位將直接導致業(yè)務恢復時間的推遲,影響業(yè)務系統(tǒng)的正常運行,大大降低運維管理的質量。
西天取經 借得東風
實際上,類似于老張的遇到的問題并非個例,目前多數(shù)公司的運維支持都存在這一現(xiàn)象。業(yè)務部門發(fā)生什么故障,運維部門就去處理什么,忙亂之中根本無法真正幫助用戶解決問題,排除隱患,特別是服務臺無法獨立解決問題的時候,反而會導致另一種惡性循環(huán)的發(fā)生。
迷茫之中,老張找到卡西亞(Kaseya)取經。通過卡西亞(Kaseya)集系統(tǒng)狀態(tài)監(jiān)控、遠程管理、補丁升級、IT審計、工單系統(tǒng)、綜合報告以及代理程序等各種功能于一身,強大的自動化管理平臺軟件,可以隨時隨地的通過服務器遠程自動化管理各地的代理終端,使IT工程師可以輕松實現(xiàn)運維的主動實施,從而提高IT資源管理效率、降低IT運維成本,保證IT系統(tǒng)運行的安全性、可靠性和穩(wěn)定性,并且能夠根據企業(yè)自身需要對該管理平臺進行二次開發(fā),打造最適合自己的IT運維管理方式,從而實現(xiàn)IT部門價值最大化。
通過流程,建立完善的運維團隊支持體系架構,同時通過知識的傳遞和軟件系統(tǒng)、工具的使用,提高服務臺一線解決率和問題解決效率,也徹底幫助老張從IT運維的圍困中解脫出來。老張也把兩種工作模式做了以下對比。
如今老張做起了甩手掌柜,成為了超脫的信息化主管。用他的話說: “信息化運維服務是一門管理的學問,并非是純技術業(yè)務。”