SQL Server 2000 數據倉庫中使用分區之分區設計
今天我們向大家講述的是SQL Server 2000 數據倉庫中使用分區之分區設計的簡捷概述,SQL Server 數據庫中的分區表主其可以使用可更新或者是可查詢(不可更新)的分區視圖。在這兩種情況下,表分區都是由每個分區都包含正確數據的 CHECK 約束來創建的。
一個可更新的分區視圖支持對視圖進行 INSERT (或 UPDATE 或 DELETE)操作,并將操作推入至正確的基礎表。這很有益處,但SQL Server 2000 數據倉庫應用程序通常需要進行批量加載,而這是無法通過視圖執行的。下表總結了可更新和可查詢分區視圖的要求、優點和缺點。
Microsoft 建議的做法是定義主鍵,并將事實表設計為本地(單個服務器上)的分區聯合視圖。大多數情況下,該定義會產生可更新的分區視圖,但SQL Server 2000 數據倉庫維護應用程序應設計為直接將大多數數據批量加載至成員表(而不是通過視圖進行)。
語法示例:
以下代碼示例用來說明定義成員表和聯合視圖以及將數據插入視圖的語法:
創建 1999 年事實表:
- CREATE TABLE [dbo].[sales_fact_19990101] ( [date_key] [int] NOT NULL CHECK ([date_key] BETWEEN 19990101 AND 19991231),
- [product_key] [int] NOT NULL , [customer_key] [int] NOT NULL , [promotion_key] [int] NOT NULL ,
- [store_key] [int] NOT NULL , [store_sales] [money] NULL , [store_cost] [money] NULL ,
- [unit_sales] [float] NULL ) ALTER TABLE [sales_fact_19990101] ADD PRIMARY KEY ( [date_key], [product_key], [customer_key], [promotion_key], [store_key])
創建 2000 年事實表:
- CREATE TABLE [dbo].[sales_fact_20000101] ( [date_key] [int] NOT NULL CHECK ([date_key]
- BETWEEN 20000101 AND 20001231), [product_key] [int] NOT NULL , [customer_key] [int] NOT NULL ,
- [promotion_key] [int] NOT NULL , [store_key] [int] NOT NULL , [store_sales] [money] NULL ,
- [store_cost] [money] NULL , [unit_sales] [float] NULL ) ALTER TABLE [sales_fact_20000101]
- ADD PRIMARY KEY ( [date_key], [product_key], [customer_key], [promotion_key], [store_key])
創建 UNION ALL 視圖:
- CREATE VIEW [dbo].[sales_fact] AS SELECT * FROM [dbo].[sales_fact_19990101] UNION ALL SELECT * FROM [dbo].[sales_fact_20000101]
現在插入幾行數據,例如:
- INSERT INTO [sales_fact] VALUES (19990125, 347, 8901, 0, 13, 5.3100, 1.8585, 3.0)
- INSERT INTO [sales_fact] VALUES (19990324, 576, 7203, 0, 13, 2.1000, 0.9450, 3.0)
- INSERT INTO [sales_fact] VALUES (19990604, 139, 7203, 0, 13, 5.3700, 2.2017, 3.0)
- INSERT INTO [sales_fact] VALUES (20000914, 396, 8814, 0, 13, 6.4800, 2.0736, 2.0)
- INSERT INTO [sales_fact] VALUES (20001113, 260, 8269, 0, 13, 5.5200, 2.4840, 3.0)
要驗證分區是否正常工作,請使用查詢分析器來顯示查詢計劃,例如:
- SELECT TOP 2 * FROM sales_fact WHERE date_key = 19990324
您應該看到查詢計劃中僅包括表 1999。將該查詢計劃與主鍵已刪除的相同表生成的查詢計劃相比較,我們會發現:表 2000 仍然被排除。將這些計劃與在已刪除 date_key 約束的架構上生成的查詢計劃進行對比。這些約束被刪除的情況下,表 1999 和表 2000 都被包括在查詢中。
請注意,在通常情況下,在大型表上執行查詢時,使用“TOP N”語法是好的做法,因為它可以迅速返回結果并使用最少的服務器資源。查看分區表的查詢計劃時,這一點尤為重要,因為由“SELECT *”語句生成的查詢計劃很難解析。對于偶爾進行觀察的人而言,盡管在查詢執行期間,查詢中僅使用相關的表,但表面看起來好象查詢計劃包括了 UNION ALL 視圖的所有組件表。
將條件直接應用于事實表:
要獲得***的查詢性能,所有的查詢都應將條件直接放在事實表中的篩選鍵上。將約束放在第二張表(例如日期矢量表)的查詢將包括所有分區。對 UNION ALL 事實表的標準星號聯合查詢工作良好,將條件放在任意未分區的矢量表的屬性上,以標準方式創建星號查詢 WHERE 子句,包括分區矢量(日期)的屬性。
在分區矢量架構上設計查詢與在未分區的架構上設計完全一樣,只不過將日期條件直接放在事實表中的日期鍵上時日期條件最為有效。
如果每一分區表的索引中的***個列為帶日期的簇索引,轉到所有分區解析某一特定查詢的開銷相對較小。編寫預定義的查詢時應盡可能提高其效率,例如那些生成標準報表或漸變更新下行數據流數據庫的查詢。 以上的相關內容就是對在SQL Server 2000 數據倉庫中使用分區之分區設計概述 的介紹,望你能有所收獲。
【編輯推薦】