SQL Server 2008數據集成服務簡介
將企業數據轉化為有意義的和可操作信息的能力,是企業在當今商業世界中獲得競爭優勢的***最重要的來源。通過控制數據爆炸來更好地了解過去并獲得未來的發展方向,已成為全球范圍內企業的信息技術部門所面臨的最富挑戰性的風險之一。與數據集成相關的問題可劃分為三個大類:
◆技術挑戰
◆組織問題
◆經濟挑戰
在本文中,我們將詳細探討這些挑戰并討論如何使用 Microsoft® SQL Server™ 2008 Integration Services (SSIS) 解決它們。首先,讓我們先看一個真實世界案例中存在的這些挑戰。
真實世界案例
一家大型的全球型運輸公司利用其數據倉庫來分析運營績效和預測其計劃交貨中存在的差異。
數據源
這家公司的主要數據來源包括基于 DB2 的訂單輸入系統的訂單數據,基于 SQL Server 的客戶關系管理(CRM)系統的客戶資料,以及基于 Oracle 的 ERP 系統的供應商數據。除了來自這些主要系統的數據以外,也有從跟蹤“特別”事件的電子表格合并到數據倉庫中的數據,這些數據由發貨管理員手動輸入。目前,該公司在合并各種來源的文本文件(如天氣信息、交通狀況和供應商詳細資料(針對轉包交付)等外部數據)時存在延遲。
數據使用
不僅這些數據的來源多種多樣,消費者的需求和他們的地理位置也多種多樣。這種多樣性導致了本地系統的擴張。信息技術部門的主要工作之一就是,至少要為客戶資料建立一個“真實的單一版本”。
數據集成要求
鑒于數據、業務需求和用戶需求的多樣性,信息技術部門已指定了以下一組數據集成要求:
◆他們提供的從各種內部和外部來源合并的歷史數據和當前數據必須可靠且一致。
◆為減少數據采集的滯后問題,來自提供者和供應商的數據必須能夠通過 Web 服務或一些其他直接機制(如 FTP)獲取 。
◆他們需要清理及刪除重復的數據以確保數據質量。
【編輯推薦】