通過DB2 9 XML能獲取什么?
此文章主要講述的是在實際操作中我們大家希望通過 DB2 9 XML 來獲取什么?在開發(fā) pureXML與 DB2 9 數(shù)據(jù)庫的 5 年中,IBM公司深入研究了 XML 的性質(zhì)(XML 具有強大的靈活性,同時也非常繁瑣),發(fā)現(xiàn)了需要改進的五個方面。
IBM 主要關(guān)注兩個性能因素:存儲模型和查詢優(yōu)化。
XML 數(shù)據(jù)由一個層次化的樹結(jié)構(gòu)表示,通常包含多個層和大量節(jié)點,因此這種格式很難優(yōu)化和編制索引。它還涉及某種形式的壓縮。因此,XML 查詢可能變得非常復雜。
存儲 XML 數(shù)據(jù)的一種常用方法是字符大對象(CLOB)。與二進制大對象(BLOB)一樣,CLOB 通常作為一個整體存儲,很少為編制索引或查詢優(yōu)化進行預處理。另一種方法是把 XML 數(shù)據(jù) “分解” 為關(guān)系數(shù)據(jù)的列;這種方法需要復雜的解析技術(shù),通常使用大量存儲空間。
DB2 pureXML 把 XML 數(shù)據(jù)存儲為經(jīng)過預先解析的層次化格式,這種格式反映數(shù)據(jù)的底層嵌套結(jié)構(gòu)。這種格式支持編制復雜的索引,并允許對物理存儲中的數(shù)據(jù)進行壓縮。在執(zhí)行查詢時,pureXML 把 XQuery 和 SQL/XML 查詢轉(zhuǎn)換為一種在多方面(跨語言、查詢重寫、優(yōu)化索引和成本)經(jīng)過優(yōu)化的統(tǒng)一格式。XML 壓縮、查詢優(yōu)化以及關(guān)系和 XML 處理的混合(在 DB2 9.5 中還改進了插入和更新性能)改進了數(shù)據(jù)庫的處理性能;IBM 的測試和真實項目表明,與 DB2 V8 或其他 DBMS 中的相似操作相比,速度提高了 10 到 20 倍(參見相關(guān)內(nèi)容中 “成功帶來的喜悅”部分)。
更適合 DB2 9 XML 的模型
pureXML 的性能特點還包括其適應性。要點:XML 數(shù)據(jù)并不會取代關(guān)系數(shù)據(jù)。對于標準的金融業(yè)務,XML 數(shù)據(jù)很難超越關(guān)系數(shù)據(jù)庫,但是 RDBMS 很難處理出版物,比如整本書、雜志或期刊。如果應用程序中的數(shù)據(jù)具有復雜的層次結(jié)構(gòu),或者包含大量非結(jié)構(gòu)化信息,RDBMS 也很難處理。
例如,生命科學組織正在把許多常用數(shù)據(jù)由各種專有格式轉(zhuǎn)換為 XML。在某些情況下,對于難以在傳統(tǒng) RDBMS 中存儲和提取的數(shù)據(jù),XML 格式提供了優(yōu)化的數(shù)據(jù)訪問路徑,這使 XML 數(shù)據(jù)庫在根本上具有顯著的性能優(yōu)勢。
XML DBMS 還有一個優(yōu)點:它們能夠通過 Web 服務或其他方法與 DB2 9 XML 應用程序直接通信。因為 XML 在因特網(wǎng)上使用廣泛,應用程序之間的通信也大量采用 XML 格式,所以讓整個通信鏈(應用程序 - 消息 - 數(shù)據(jù)庫)都采用 XML 格式是很有意義的。
IBM 的 pureXML 在技術(shù)方面有許多重要的創(chuàng)新(68 項新專利!),但是 IBM 關(guān)系/XML 模型真正的價值在于它在主流企業(yè)應用程序中表現(xiàn)出的性能。
以上的相關(guān)內(nèi)容就是對通過 DB2 9 XML 獲得什么的介紹,望你能有所收獲
【編輯推薦】