企業級數據倉庫建模思想在商務智能領域的應用
隨著企業信息化程度的不斷提高,各類應用系統同時并存并支撐著企業的業務應用。越來越多企業的信息化主管在開發企業應用時已經考慮到數據集成和將來對數據的整體有效利用,因此,在實施了ERP解決方案之后,很多企業選擇實施數據倉庫產品來避免信息孤島,實現應用的內部聯系和信息的共享。
實施數據倉庫的企業,用何種標準去衡量本企業的數據倉庫建模是成功的呢?也許很多負責企業信息化建設的主管自己也不是很清楚。原因是:起初企業決定要實施數據倉庫的初衷大都因為一些跨模塊的報表開發不能夠實現,企業實施了ERP之后,財務報表,銷售分析的報表都很容易可以通過報表開發實現了,但一些跨模塊的集成報表變得十分復雜,例如一個服裝制造企業,高層主管需要看到每個零售店鋪的銷售凈利潤,但零售店鋪的幾乎所有信息都在零售系統中,而財務的相關信息在企業的ERP中,此時就需要將信息集成在企業級的中央數據倉庫中,去滿足此類集成的報表數據需求。在數據倉庫的建模過程中,實施人員往往會從滿足報表需求的角度出發,考慮如何搭建數據模型,而項目實施成功后的交付品就是實現了這樣的報表需求,信息化主管此時也滿意的結束了數據倉庫的項目,這樣就算是成功的實施了數據倉庫建模嗎?
請各位思考以下幾點問題:
1.隨著競爭加劇,企業也需要加速改變架構及行銷策略,如果企業組織架構發生了變化,也就意味著數據倉庫中的主數據發生了變化,目前的模型中是否能靈活應對主數據的變化?
2.隨著企業業務量的上升,源系統中的數據量也增大,數據倉庫在抽取數據的過程中是否會降低業務系統的運行效率?
3.不同的業務數據源是否能夠重復利用,如果有新增的報表需求,能否在現有建模的基礎上靈活實現?
以上提到的幾個問題與數據建模的思想息息相關,運用的得當,則企業在現在及未來都獲益不少,否則,對于企業而言可能在兩三年,甚至幾個月后就需要推到現行的項目重新要在軟、硬件上投資了。
針對上述問題,數據倉庫領域提出了EDW的數據建模思想,通過數據分層和在數據倉庫中保留企業的范圍內一致的原子層數據為企業建立靈活,可靠的數據倉庫解決方案。全球ERP市場的領先者SAP在其***數據倉庫產品SAPBI7.0對EDW提供了完善的支持,SAP的核心合作伙伴IDSScheer(愛迪斯)已經成功采用這種思想為多個客戶實施了基于EDW的數據倉庫。
EDW的建模思想將數據倉庫區分為三個層次:
1.ExtractLayer(數據提取層)
SAPBW將數據倉庫的數據源分為兩種:SAP數據源和Non-SAP數據源。SAPBW和mysap.com的組件完全集成,將各組件的數據源由預定義的提取機構及程序傳輸到BW的數據提取層。對于Non-SAP的數據源,BW有開放的架構,通過BAPI接口傳輸數據。
提取層的數據保留了來自源系統的原始數據,存儲在二維的表中,以便于下一步的數據清洗、整合。其優點是:一次抽取到BW后,如果模型作了更改,不需要重復去源系統中抽取,而直接從BW表中抽取,提高數據倉庫的提取效率,降低對源系統的資源占用,解決了上述第二個問題。
2.IntegrationLayer(數據合并層)
將提取層的原始數據進行清洗和整合,其實質就是建立數據源之間的關聯,把有用的相關數據統一放在二維表中,例如:把FI,CO的數據源整合到一個表中,以便于下一層的建模的使用。數據合并層能夠將提取層的原始數據自由組合,滿足多變的業務需求,解決了上述***個問題
3.DataMartLayer(數據集市層)
最終的報表將在這層膜型上建立,所以,該層將使用星型數據模型(BW中稱之為InfoCube)創建不同的分析緯度,提高查詢的效率。
數據上載的流程從源系統到數據提取層,在由數據合并層清洗、整合后傳輸到數據集市層建立多維模型。EDW建模思想的優勢在于:將未來企業可能發生的業務變化,用三個層面的模型靈活處理。例如:當企業組織架構變化,即主數據發生變化后,BW可以在數據合并層應對主數據的變化。
【編輯推薦】