由成本中心轉變為服務中心的IT運維管理
網絡規模的發展和擴大,使得應用產品技術日漸多樣和復雜,越來越多的企事業單位的生產業務和日常工作將實現信息化,并通過提高信息化水平實現對內提高經營水平、對外提高服務水平的目的。各企業業務的展開越來越依賴IT系統的正常運轉,生產業務日漸依賴IT部門提供的系統服務,IT部門正由“成本中心”轉變為“服務中心”、“效益中心”。
隨之而來的問題是IT部門將如何通過管理為企業提供更好的、可度量的、符合業務需求的服務?同時,這些服務需要能夠適應業務需求以及新技術帶來的影響,為新業務系統的運行提供支撐,讓IT運維管理成為企業成長的助力。
何謂IT運維管理?在了解這個概念之前,我們首先需要了解一下什么是IT管理?
IT管理是在信息化運營階段通過運維管理制度的規范,IT管理系統工具的支持,引導和輔助IT管理人員對各種IT資源進行有效的監控和管理,保證整個IT系統穩定、可靠和永續運行,為業務部門提供優質的IT服務,以較低的IT運營成本追求業務部門較高的滿意度。
簡而言之,可以理解IT運維管理為:在網絡的基礎設施建設完成之后,整個網絡處于運行狀態,IT部門采用相關的管理方法,對運行環境(包括物理網絡,軟硬件環境等)、業務系統等進行維護管理,我們把這種IT管理的工作簡稱為IT運維管理。
IT運維管理包含內容
IT運維是IT管理的核心和重點部分,也是內容最多、最繁雜的部分,主要用于IT部門內部日常運營管理,涉及的對象分成兩大部分,即IT業務系統和運維人員。其管理內容又可細分為七個子系統:
第一、設備管理:對網絡設備、服務器設備、操作系統運行狀況進行監控,對各種應用支持軟件如數據庫、中間件、群件以及各種通用或特定服務的監控管理,如郵件系統、DNS、Web等的監控與管理;
第二、數據/存儲/容災管理:對系統和業務數據進行統一存儲、備份和恢復;
第三、業務管理:包含對企業自身核心業務系統運行情況的監控與管理,對于業務的管理,主要關注該業務系統的CSF(關鍵成功因素Critical Success Factors)和KPI(關鍵績效指標Key Performance Indicators);
第四、目錄/內容管理:該部分主要對于企業需要統一發布或因人定制的內容管理和對公共信息的管理;
第五、資源資產管理:管理企業中各IT系統的資源資產情況,這些資源資產可以是物理存在的,也可以是邏輯存在的,并能夠與企業的財務部門進行數據交互;
第六、信息安全管理:該部分包含了許多方面的內容,目前信息安全管理主要依據的國際標準是ISO17799,該標準涵蓋了信息安全管理的十大控制方面,36個控制目標和127中控制方式,如企業安全組織方式、資產分類與控制、人員安全、物理與環境安全、通信與運營安全、訪問控制、業務連續性管理等;
第七、日常工作管理:該部分主要用于規范和明確運維人員的崗位職責和工作安排、提供績效考核量化依據、提供解決經驗與知識的積累與共享手段IT運行維護管理的每一個子系統中都包含著十分豐富的內容,實現完善的IT運維管理是企業提高經營水平和服務水平的關鍵。
IT運維管理面臨的難題
IT運維管理是一門探討如何提高網絡應用性能的課題,怎樣利用網絡管理做到企業IT基礎設施建設的管理、合理分配網絡資源、保障生產業務、對網絡規劃和新業務上馬提供支撐,而其最核心的目的是保障企業生產業務。#p#
日常IT運維管理面臨諸多難題,具體體現在以下多個方面:
網絡設備
在企業IT基礎設施的搭建過程中,底層的網絡設備廠商和類型多樣且復雜。隨之而來的問題是:如何將不同廠商的網絡和應用管理產品在界面級、消息級和數據級集成起來實現統一管理?如何讓IT管理員了解到整個網絡全局的運行情況、發展趨勢和可能存在的故障隱患點,以便及時采取相應措施,實現事前管理。
拿曾經碰到過的一個典型客戶來說,它的網絡中有11種廠商的路由交換設備,還有存儲設備,安全設備,UPS等。同時還擁有:小型機,服務器等,上層的業務系統有OA和CRM等。這樣大而復雜的一個網絡環境,該怎么管呢?
北塔軟件認為,首先需要解決的是對IT基礎設施的管理,管理范圍要能覆蓋到機房所有硬件設備。這一點是前提和基礎。其次,才是對各種應用系統做到很好的監控。最后,才能為業務系統提供足夠的保障。
網絡流量
在絕大多數的企業網絡中,存在不同程度的網絡延遲,造成重要業務和應用時斷時續,這直接成為企業業務的殺手。另外,網絡的帶寬也是企業關心的重點。比如,哪個時間段很擁擠,哪個時間段很空閑,有沒有規律,怎么樣去調查擁塞的原因,網絡帶寬都是被誰占用了,是被哪些客戶端、哪些應用或者異常應用所占用了。這些都是擺在每一個企業運維管理領域中很實際的問題。
該如何很好的解決這些問題呢?
根據多年的運維管理經驗得出,對于這種情況,需要采用流量分析的方式。通過對出口流量或者監控對象進行采集,進行24小時實時的監控和分析,可以對流量進行多角度多層次的挖掘分析,比如按照流量、數據包個數、連接數、協議等類別分析當前網絡的負載情況,為網絡的優化配置提供參考。通過報表分析展現流量特征,讓IT管理員明白流量被誰、被何種應用、被何種異常行為占用得怎么樣。
IT運維管理怎么樣幫助IT管理員判斷和控制安全問題,也就是作為與防病毒、防火墻、IPS等安全產品不同的角色,從網絡的整體情況要能夠判斷未知的安全問題,并提供修復方案,在不影響正常網絡運行狀況下將安全問題防患于未然。如果IT管理員能針對異常行為的特征建立自動告警,在某些安全攻擊出現前發現故障隱患,并提供連動的判斷和處理機制,這樣IT管理員可以及時采取了措施避免業務遭受損失。如果能在對問題特征自動告警的同時,自動記錄問題的原始數據以供事后分析,這樣IT管理員可以再現數據異常行為、捕捉網絡數據異動入侵記錄,對癥下藥制訂策略防止問題的再次發生。#p#
業務系統
針對日益復雜的業務系統,現有的運維管理系統更多的強調的是功能的展現。比如,從業務主機負載、數據庫服務器負載、數據庫、中間件、應用系統、網際流量、進程狀況等等不同角度實施聯合監控,強調的是性能參數指標的多少,或者是界面的美觀程度。當然,這是落實業務系統管理環節所采用的方法。
但事實上,作為企業自身來說,無論采用哪種監控也好,IT管理手段或者運維管理系統也罷,其核心總是需要圍繞保障和改進企業的業務系統。
這就提出一個問題,如何來保障又如何改進企業的業務系統呢?
首先,需要了解清楚業務系統所涉及的具體環節,針對每一個環節進行管理落實。按照北塔軟件的觀點,分為:用戶—網絡—硬平臺—軟平臺—業務系統這五個環節。需要從這五個環節所涉及到的五個方面去做工作。這五個方面分別是:全局的性能管理、故障和事件管理、資源的使用狀況管理、安全管理和數據分析管理。其次,通過性能和歷史數據的反映,又可以做到對業務系統提供改進決策的指導。
當然,對于如何保障和改進業務系統這個問題,目前業界眾說紛紜,沒有統一的標準。但有一點是肯定的,就是需要從企業用戶的角度出發,通過明確的管理思路作為指引,使用軟件+服務的方式和企業用戶共同探索和研究,最終達到對業務的保障和改進。
當前IT運維管理的任務
在企業網絡運維早期,IT運維管理側重于網絡、硬件等設備。隨著業務系統涉及的環節日益增多,單一的網絡管理已經不足以滿足管理需求,越來越多的企業已經將關注點從單一網絡轉變到當前的業務系統,落實保障業務系統的各個環節成為重中之重。
因此,當前國內用戶最關心的莫過于如何保障業務系統的正常運行。IT運維系統應該從業務角度切入,以業務為導向,通過對整個業務系統的關注,落實業務系統的各個環節,從而來達到保證業務系統穩定運行和透明化管理的目的。
【編輯推薦】