成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

關于數據增量抽取模擬實現原理

作者：bq_wang 2009-01-16 14:22:27

ETL是數據倉庫的一個重要處理環節，Extract即是從業務數據庫中抽取數據,Transform即是根據業務邏輯規則對數據進行加工的過程，Load即是把數據加載到數據倉庫的過程。

通常為了盡可能的減少對業務系統的壓力和性能影響，或者因為網絡傳輸異構數據庫等原因，一般都是根據特定的增量抽取原則，將數據從業務數據庫導出到flat文本文件或者XML文件中，也叫數據緩存區或者數據登臺區(這名字起得特別別扭)。本文討論的是從業務數據庫直接抽取到數據倉庫。數據倉庫是一種體系架構，而不是一種純粹的技術。實際上，大多數數據庫都提供了類似的不同數據庫直接連接的接口，例如SQL Server的鏈接數據庫，Oracle的透明網關等等。

關于數據的增量抽取也是一個重要的討論話題，其原因主要是在超大數據量情況下任何關系數據庫都無法滿足數據處理的要求。在《數據倉庫》(Inmon)一書中，主要描述了以下3種方法：

1.數據增量抽取，主要是基于時間戳的；

2.掃描增量文件，實際上就是關系數據庫的歸檔日志；

3.前后映像對比。

當然每種方法都有其優勢和劣勢，本文旨在討論基于時間戳的數據增量抽取的實現，無意探討和比較這三種方法的優劣。

當然在進行基于時間戳的數據增量處理之前，首先要滿足以下假設：

1.假設在業務數據庫中存在著一個特定的時間屬性，作為增量抽取的唯一標識；

2.假設在這個字段上存在著索引字段。這樣我們的數據增量抽取模擬腳本就不會遭遇到性能瓶頸。當然我們還會通過將大事務盡可能變成小事務的原則進行優化；

3.假設業務數據庫和數據倉庫能夠以某種方式直接連接；

4.抽取過程中，盡量避免數據轉換、清洗的動作，以減少對業務數據庫的性能影響；

在滿足了以上條件之后，我們才能進一步考慮數據增量抽取腳本的實現。

1.建立鏈接數據庫；

2.首先需要定義一張數據字典表，定義需要進行處理的任務，其中主要包括業務數據庫和目標數據庫的表名、字段列表、以及where條件等；

3.有了這張字典表就可以開始進行工作了，為了方便表達，暫時處理成偽代碼形式，同時只以一個表的處理為例。

◆獲取數據倉庫目標表目前的***時間(讀取字典表或者當前表均可)

◆獲取業務數據庫業務表目前的***時間(需要到業務系統中去讀取)

◆如果業務數據庫業務表數據為空，退出執行

◆如果數據倉庫為空，業務數據庫不為空，則再次讀取業務數據庫最小時時間

◆如果均不為空，則設置開始抽取最小時間和***時間

◆***時間設置為整點

◆根據控制事務處理大小的粒度，進行循環抽取

◆拼寫SQL語句，寫成類似以下的形式

INSERT INTO TargetTable (TargetFieldList) 
　　SELECT SourceFieldList FROM SourceTable 
　　WHERE WhereFieldName> BeginDate 
　　AND WhereFieldName< BeginDate+粒度

◆處理狀態寫入該字典表

4.有一點要主要的是，在SQL Server中有兩種使用鏈接數據庫的方法：

OPENQUERY ( linked_server , 'query' )

linked_server_name.catalog.schema.object_name的四部分名稱

這兩種方法各有利弊，第二種容易閱讀一些;***種方法據說把語句提交到源數據庫執行的，效率可能會高些(實際的資料并未找到)。

其次這兩種方法在使用起來語法有點差別，***種方法采用的是宿主數據庫的語法形式，第二種方法采用的是SQLServer本身的語法形式。因此在寫腳本的時候也會有所不同。主要差別是在字段列表和條件處，暫時采用***種方式。

【編輯推薦】

Oracle 11g R1中AWR基線增強
Oracle 11g R1中大小寫敏感的密碼
解析Oracle 11g閃回數據歸檔新功能

責任編輯：楊鵬飛來源：百度blog

ETL Extract 數據增量抽取數據庫

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：成人欧美一区二区三区在线观看 | 日本电影韩国电影免费观看 | 亚洲精品一二区 | 日韩在线视频一区 | 中文字幕在线第二页 | 黑人精品欧美一区二区蜜桃 | 国精品一区 | 日韩欧美在线视频一区 | 日韩欧美一区二区三区免费看 | 亚洲不卡在线观看 | 综合色久 | a级片在线观看 | 在线观看免费av网 | 成人av电影免费在线观看 | 精精国产xxxx视频在线播放7 | 日韩中文视频 | 99av成人精品国语自产拍 | 久久福利网站 | 99色综合| 欧美成人免费 | 国产一区二区视频在线观看 | 欧美精品区 | 亚洲一区成人 | 亚洲成人动漫在线观看 | 91精品国产综合久久香蕉麻豆 | 午夜极品| 视频一区二区在线观看 | av大全在线观看 | 国产伦精品一区二区三毛 | 人妖videosex高潮另类 | 国产精品视频中文字幕 | 高清国产午夜精品久久久久久 | 九色在线 | 精品综合| jizz亚洲人| 免费高潮视频95在线观看网站 | 欧美日韩综合一区 | 黄色免费在线观看 | 日韩一区二区三区在线 | 精品乱码一区二区三四区 | 911网站大全在线观看 |

<abbr id="jjxex"><style id="jjxex"></style></abbr>

<code id="jjxex"></code>