數據庫機時代將到來 DBA面臨新挑戰
近日數據庫領域可謂是波瀾壯闊:此次的戰場在數據庫機。甲骨文拿出了Exadata,IBM則把帶有新的DB2網格特性的pureScale拿出來與Exadata叫板(詳情參考51CTO記者從舊金山帶來的報導)。當然,從事數據庫領域的DBA和開發人員們也不能光顧著看熱鬧,因為數據庫領域正在逐漸發生變化,需要盡早做好準備。
計算機和各種智能設備的應用正在加重企業的負擔,因為它們所產生的數據量實在是太龐大了。十年之前,我們談起數據存儲,通常會說到1.2MB 的5.25英寸軟盤和1.44MB的3.5英寸軟盤,很快,這樣一個度量數據的單位就發生了變化,如果說從MB到GB還讓人覺得有些漫長,那么從GB到TB就不那么引人注意了。
不知不覺中,人們已經進入了一個數據爆炸的時代,曾經,我們買一個32MB的U盤就需要幾百塊錢,如今,600塊錢就可以買到1.5TB的移動硬盤了。這種數據量的大幅增加,給數據的存儲帶來了***的壓力,過去,數據庫的應用和部署并不像今天這么復雜,因為數據量不大,而且數據量被反復訪問和移動的頻率也很低,再加上互聯網并沒有像如今這么普及,通過互聯網傳輸的數據也很少。
當計算機和各種智能設備被網絡連接在一起時,數據的交換變得頻繁起來,而數據作為新的企業資產,企業的決策者同樣希望這些新的資產能夠給企業帶來新的利潤和增長空間。于是,對于數據的管理成為企業信息化關注的焦點,目前,數據庫的種類繁多,而牽扯到數據庫應用和部署的技術也紛繁復雜。
數據庫加速與硬件整合(數據庫機)
數據庫在過去只是被看作是軟件的一種,它雖然與操作系統軟件和企業應用軟件有所不同,但仍被認為是軟件的范疇。事實上,操作系統和應用軟件所賴以調用的數據往往存儲在數據庫中。盡管如此,很少有人能夠將其和存儲、服務器、網絡等硬件設備聯系起來。
但在數據庫巨頭甲骨文看來,數據庫已經和硬件密不可分,自2008年底甲骨文在OOW大會上聯合惠普發布新一代數據庫機Exadata以來,甲骨文就將數據庫和硬件的整合提上了日程。2009年,甲骨文通過收購Sun,成功將業務拓展到存儲和服務器等硬件設備領域,并在日前聯合Sun發布了新一代的數據庫機。
在目前甲骨文推出的數據庫11g R2版本中,特意加強了和Exadata的集成,在架構上,Exadata在“數據層”之外又建立了一個單獨的“存儲層”,并且和Oracle數據庫管理系統(DBMS)進行了充分的融合。而且,這一產品采用了Sun的FlashFire技術,成為了***個進行閃存優化的數據庫,而通過采用智能存儲技術,打破了數據帶寬和隨機I/O的瓶頸。
另外,在新版本的11G R2中,Oracle真正應用集群(RAC)提供了即插即用型網格和新的服務器合并功能,通過精簡配置和合并數據庫網格的管理,來減少服務器成本。虛擬化低成本服務器,使其成為共享資源,動態調配資源池,使面向共享平臺上的所有應用運行全部數據庫。
如果說Oracle數據庫通過虛擬化和精簡配置降低服務器的成本,那么與通過先進的壓縮技術則降低了數據庫在存儲方面的成本。通過和先進的壓縮和分區功能進行結合,可以將數據壓縮到原來的1/2至1/4,而通過擴展Oracle自動存儲管理(Oracle Automatic Storage Management)的功能,在支持通用集群文件系統的同時,也使得存儲和服務器資源用于容錯和運行生產工作量,從而避免服務器和存儲系統閑置著等待故障出現。
這種和存儲、服務器等充分互動的方式也使得數據庫在進行資源配置和應用時更加節省成本,不過,這也會給數據庫的管理員帶來新的挑戰,因為和硬件的融合勢必要讓過去單純了解數據庫管理的IT人員,開始熟悉如何和存儲和服務器相結合,而不簡簡單單的是需要多少存儲空間和多少計算資源的問題。
#p#
數據庫與數據分析進一步融合
過去,人們所理解的數據庫多是數據的存放和管理,并沒有想過如何利用這些資源,并從這些有用的信息中,提取出更加有價值的東西。但現在這一狀況正在改變。因為數據分析技術可以依據歷史數據,幫助各類企業去分析并找到他們正確的用戶,同時能夠優化其業務,預測未來的企業行為。
在這方面,IBM進行的非常徹底,2009年8月,IBM以12億美元收購分析軟件提供商SPSS軟件公司,這使得IBM向新興的數據分析領域又邁出了重大一步。 在此之前,IBM收購了維護與分析軟件供應商Exeros、商業智能和績效管理軟件廠商Cognos、數據歸檔及法律法規遵從軟件廠商Princeton Softech、內容管理廠商FileNet、數據集成廠商Ascential、變化數據捕捉軟件廠商DataMirror、身份識別軟件供應商SRD、產品信息管理軟件廠商Trigo、客戶信息管理廠商 DWL以及分析軟件廠商Alphablox等。
在完成這一系列收購之后,IBM將這些專注于數據分心的企業與自身的DB2充分融合在了一起,并將這些統歸在IBM信息管理(Information Management)這一大的部門之下,它們一起共同組成了IBM五大軟件產品線的一部分。目前IBM軟件產品線主要包含Information Management、Lotus、Rational、Tivoli、WebSphere。
當然,數據庫領域的領頭羊Oracle同樣不會放過這樣一個機會,事實上,Oracle也一直在數據分析領域深耕細作,并通過收購海波龍等一系列公司加強自己在這一方面的實力,在Oracle數據庫新版本的11G R2中,也同樣特意強調了其在數據分析方面的優勢,除此之外,與數據分析相關的法規遵從和風險管控也同樣受到Oracle新版數據庫產品的著重關注。
IT企業如此關注數據分析領域源于企業建設數據倉庫以后,會進一步考慮做元數據管理以實現數據標準化,即統一定義商業分析系統和應用中的數據, 以解決重復數據、數據不標準、數據不準確等問題。因為商業分析和業務系統有著緊密的聯系,涉及到復雜的數字模型和分析模型。
根據IDC報告,盡管遭遇金融危機,企業對風險管控和法規遵從等需求仍在推動中國商業分析市場快速增長。2008年中國商業分析軟件市場規模達到了2.6億美元,比2007年增長15.4%。2008年中國商業分析市場的領先廠商之間進一步整合,前四位廠商Oracle、SAP、IBM和SAS占據了52%的市場份額。同時,國內的應用廠商和專注與數據倉庫管理的廠商也貢獻了46%的份額。
數據安全迫在眉睫
當數據已經成為企業的核心資產,加強數據庫管理的安全性便也提到了企業決策者的議事日程。早在9.11發生時,許多公司就因為數據丟失而導致公司倒閉,自此,數據安全問題開始廣受關注。事實上,那時候,企業的數據還不像今天這么多,也不如現在這么復雜。
任何給定的公司的數據庫系統可能要收集、存儲和分析成千上萬行信息,這些信息本質上有公共的,也有私有的。由于有這項責任在身,數據庫必須使數據庫管理員能適當的授權和限制訪問。此外,數據庫還必須提供防止未授權用戶存取機密數據的方法。但是有時候,數據庫安全信息難以獲得或理解。
如今,數據庫安全性話題還沒有象測定最短宕機時間世界記錄和報告那么引人矚目,但它對于任何使用數據庫管理系統的企業來說,都是重要的顧慮。同時,隨著越來越多的企業通過互聯網傳輸信息,數據安全問題就更為突出。為了保護數據信息,Sybase將安全性進行分層解決的方式或許能夠給企業一些借鑒,它的安全措施也是一級一級層層設置的,以便做到層層設防。***層是注冊和用戶許可,保護對服務器的基本存取;第二層是存取控制,對不同用戶設定不同的權限,使數據庫得到***限度的保護;第三層是增加限制數據存取的視圖和存儲過程,在數據庫與用戶之間建立一道屏障。
基于上述層次結構的安全體系,Sybase提出以下四點實施安全的原則:選擇性訪問控制(Discretionary Access Controls DAC),DAC用來決定用戶是否有權訪問數據庫對象;驗證,驗證就是保證只有授權的合法用戶才能注冊和訪問;授權,對不同的用戶訪問數據庫授予不同的權限;審計,監視系統發生的一切事件。
【編輯推薦】