數據虛擬化:實現企業數據整合新方向
伴隨公司業務穩健發展,生產和銷售部門不斷更新著亮麗的數字,在這樣的時候,整個企業總能找到一個憂郁的身影,那就是擔負為各職能部門正常運轉,提供準確數據支持,為各級領導決策及對外宣講,展示多維深度及廣度報表的IT負責人。李寧就是這些疲于奔命的CIO們的一員,每一分鐘時間的逝去,都意味著公司的業務數據在成K成M的增長,在這個過程中,不能指望這些數據都完美地進入到一個想像中“大一統”的系統,所有信息都有秩序地流入到指定的數據庫中,隨后,又被應用程序輕松發現并完美地展示出來。
企業數據之殤
事實卻是這樣的,在過去幾年公司發展的過程中,各部門為了快速支撐業務的擴張,都分別根據需要實現了各自滿意的系統,包括實現了進行有效工作管理的OA應用,與此同時,來自供應商的各種產品及供貨信息也源源不斷地通過EXCEL,文本等各種方式進入到公司的信息體系。剛開始的時候,李寧通過組織各種小型程序的開發,實現各級數據的導入及導出整合,全IT部門兢兢業業地工作,也還算不負眾望。
但是,這些工作正隨著時間的推移讓李寧感到越來越舉步維艱,數十個程序無休止地按要求進行改動,各類數據由于反復整合導致重復錯誤的幾率急劇升高。此外,由于數據量的急劇增長,現在已經無法在周五下班后提供準確的報表,全部數據需要在整個周末緊張的運行后,才能運算出一份拿得出的報表。而就在當下,管理層又提出了一個新的任務,為了應對重要客戶對產品生產信息訪問的需求,需要整合從供貨到生產銷售等各個環節的產品信息,為客戶提供全方位的查詢服務。
李寧很清楚,在形式上看,無數風光的企業信息都能在當下互聯網的大海中找到,但悲劇的是這些只不過都是企業信息的皮毛而已。從本質上看,95%以上有用或者無用的數據,不過就是躺在企業內部及外部那些大大小小的數據庫或者EXCEL表格中,永遠也不會被發現,直至漸漸死亡。和CIO峰會上眾多企業IT管理者們的哀嘆一樣:企業本身就是一個數據孤島,當踏上這個孤島后,內部更多互不相屬老死無法往來的島嶼,將呈現在數據管理者的面前。
云計算與數據虛擬化
此時此刻,李寧想起一個炙手可熱的法寶:云計算。是的,在云計算的理論體系之下,通過IAAS(基礎設施即服務), PAAS(平臺即服務)和SAAS(軟件即服務), 還有什么是不可戰勝的呢?
利用虛擬技術,通過動態適應,對各類資源根據實際需求進行擴展,這就是當今云計算大行其道的原因,企業不再需要配置大量專業資源和技術,轉而從專業供應商處獲取。對于少數擁有充分資源的巨無霸型企業,也可以尋求建立自己獨有的云計算平臺,實現全部資源的高效率應用整合。
但這個美好的云計算藍圖,無法幫助李寧走出現在的困境。
云計算所解決的問題,或者是對企業資源實現可配置管理,或者是針對某一成熟的軟件流程,直接使用來自專業供應商的服務(SAAS),最終在實現成本節約的前提下,同時達到企業資源應用的效率最大化。然而,廣大企業面臨的難題,則是錯綜復雜的企業軟件應用的溝通,多數據源數據之間聯系的建立,這是一座看似錯綜復雜又無法穿越的迷宮,但在這迷宮底下,卻是一張四通八達的隱形網絡,可以將所有道路的路標展示在探路者的面前。“數據虛擬化”技術,就是開啟這隱形網絡的開關。
與云計算的服務概念相對應,數據虛擬化又被稱作是Information as a Service(數據即服務)。通俗地講,通過數據虛擬化(Data Virtualization)技術,企業將能夠在應用程序、數據倉庫、交易數據庫、文本數據、互聯網及其他數據源之上,建立一個發現并整合所有信息的數據層,在無需創建存儲信息備份的環境下,將企業內部及外部的數據孤島進行統一,最后根據深度及廣度的需要將一個完整的信息世界展現在使用者面前。
敏捷企業
現代企業的成長之路,正在面臨信息社會的巨大挑戰,伴隨著各部門各地域的擴張,決策者們如何評估從內部發現問題,從外部發現商機,評估企業內外部環境,在很大程度上取決于對企業經營管理各類數據真實情況的掌握;甚至于每一位企業運營的參與者,如何針對每一項企業活動作出正確的反應,也同樣依賴于信息收集的準確與及時程度。伴隨著企業的發展,如何保持發展之初的活力與高效,應對數據和信息日復一日的變化和累積,這就是“敏捷企業”需要面臨的第一課題。這個課題和云計算有所不同,IAAS/PAAS/SAAS的建設,往往是IT服務供應商們所關心的領域。
商業決策敏捷性、解決方案敏捷性和資源敏捷性,是衡量敏捷企業運行的三個基本特征。在商業決策敏捷性方面,通常又需要回答三個問題:企業的過去發生了什么?企業的現在正在發生什么?企業的未來將要發生什么?這三個問題的正確答案,建立在對大量歷史數據的分析,關聯數據的對比及商業智能分析之上;解決方案敏捷性,則是指企業的發展,離不開持續創新和市場的拓展,對于一項新的企業活動,如何在盡快的時間提出正確的方案;當前,IT及信息資源的建設,常常成為企業的重要成本構成,在付出巨大努力之后,建設資源敏捷性,就是提升投入產出比(ROI),輸出更多有價值的信息。
以上三個基本的“敏捷”特征,離不開對企業數據的有效整合,而整合企業數據的任務,最終將由“數據虛擬化”來完成。
根據Garnter的統計數據,當前在“數據虛擬化”排名首位的Composite Software Inc.,經過對IT、金融、能源、政府等行業的大量探索和方案實施,驗證了數據虛擬化方案對財富五百強各行業的可行性,方案實施后帶來的巨大收益也證實了數據發現和整合的必要性和迫切性。數據虛擬化怎樣解決了我們的問題?就讓我們在大量成功的實施方案中來滄海拾貝吧。
首先,通過數據虛擬化的實施,企業中的數據關聯性被自動發現或人工定義,無論是歷史還是實時的數據,無論這些數據來自電子表格、文本、同構或異構數據庫、ERP或CRM等企業系統,所有信息都將被重新歸類和關聯,在無需存儲的新的虛擬平臺上進行展現。虛擬平臺同時通過Cache等手段增強性能,以及相對各原始數據源提供更為細粒度和強大的安全性保證。所有存在于企業的數據孤島,此時對全部使用者完全透明,他們所能看到的信息,全面、規則并且準確,和實施數據虛擬化前那些雜亂無章徹底決裂。
其次,虛擬數據平臺提供了多種統一的接口進行數據存取及訪問,利用ODBC/JDBC/ADO.NET接口技術,無論數據的源頭在何處,開發者不再關心位置以及使用上特定的差異,只需用同一規范化的函數和SQL查詢,就能訪問來自各類數據源的數據。更重要的是,虛擬數據平臺同時也是一個SOA平臺,可以任意集成并整合外部數據到內部平臺,并利用Web Services等技術,將所有數據按照需要的方式發布到外部世界。
此外,虛擬數據平臺具備強大整合功能,利用平臺腳本,所有信息資源可以在平臺上進行各種加工處理,最終以需要的方式呈現出來。
綜合以上數據虛擬化的主要能力,讓敏捷企業的數據生態藍圖不再遙不可及。無論何時,無論何地,所有無序的比特們將按照期待的方式,在這個虛擬的平臺上匯集。“數據虛擬化”也許不過是一個術語,而我們事實上收獲的卻不是虛擬,而是真實并可靠的企業脈動。