成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

SQL Server2008數據挖掘的9種算法

數據庫 SQL Server 算法
在SQL Server 2008數據挖掘提供的9種常用的算法中,這些算法用在不同數據挖掘的應用場景下,下面我們就各個算法逐個分析討論。

SQL Server2008數據挖掘之決策樹算法

決策樹,又稱判定樹,是一種類似二叉樹或多叉樹的樹結構。決策樹是用樣本的屬性作為結點,用屬性的取值作為分支,也就是類似流程圖的過程,其中每個內部節點表示在一個屬性上的測試,每個分支代表一個測試輸出,而每個樹葉節點代表類或類分布。它對大量樣本的屬性進行分析和歸納。根結點是所有樣本中信息量最大的屬性,中間結點是以該結點為根的子樹所包含的樣本子集中信息量最大的屬性,決策樹的葉結點是樣本的類別值。

從樹的根結點出發,將測試條件用于檢驗記錄,根據測試結果選擇適當的分支,沿著該分支或者達到另一個內部結點,使用新的測試條件或者達到一個葉結點,葉結點的類稱號就被賦值給該檢驗記錄。決策樹的每個分支要么是一個新的決策節點,要么是樹的結尾,稱為葉子。在沿著決策樹從上到下遍歷的過程中,在每個節點都會遇到一個問題,對每個節點上問題的不同回答導致不同的分支,最后會到達一個葉子節點。這個過程就是利用決策樹進行分類的過程。決策樹算法能從一個或多個的預測變量中,針對類別因變量,預測出個例的趨勢變化關系。

在sql server 2008中,我們可以通過挖掘模型查看器來查看決策樹模型。如圖1所示。

sql server2008

圖1

在圖1中,我們可以看到決策樹顯示由一系列拆分組成,最重要的拆分由算法確定,位于“全部”節點中查看器的左側。其他拆分出現在右側。依賴關系網絡顯示了模型中的輸入屬性和可預測屬性之間的依賴關系。并能通過滑塊來篩選依賴關系強度。

SQL Server2008數據挖掘之聚類分析算法

聚類分析算法就是衡量個體間的相似度,是依據個體的數據點在幾何空間的距離來判斷的,距離越近,就越相似,就越容易歸為一類。在最初定義分類后,算法將通過計算確定分類表示點分組情況的適合程度,然后嘗試重新定義這些分組以創建可以更好地表示數據的分類。該算法將循環執行此過程,直到它不能再通過重新定義分類來改進結果為止。簡單得說,聚類就是將數據對象的集合分組成為由類似的對象組成的多個類的過程。聚類用在商務方面的客戶分析中,可以從客戶庫中發現不同的客戶群,并分析不同客戶群的行為模式。

在sql server 2008中,我們可以通過挖掘模型查看器來查看聚類分析模型。如圖2所示。

 

圖2

在圖2中,分類關系圖表現個類間關聯性的強弱。分類剖面圖了解因變量與自變量的關聯性強弱程度。分類特征主要呈現每一類的特性。分類對比主要呈現出兩類間特性的比較。

SQL Server2008數據挖掘之Naive Bayes 算法

Naive Bayes 算法是 Microsoft SQL Server Analysis Services 提供的一種分類算法,用于預測性建模。Naive Bayes算法使用貝葉斯定理,假定一個屬性值對給定類的影響獨立于其他屬性的值。與其他算法相比,該算法所需的運算量小,因而能夠快速生成挖掘模型,以發現輸入列和可預測列之間的關系。可以使用該算法進行初始數據探測,在用于大型數據庫時,該算法也表現出了高準確率與高速度,能與決策樹和神經網絡相媲美。

算法采用監督式的學習方式,在分類之前,需要事先知道分類的類型。通過對訓練樣本的學習,來有效得進行分類。就是通過訓練樣本中的屬性關系,產生訓練樣本的中心概念,用這些已經產生的中心概念,對未分類的數據對象進行預測。在sql server 2008中,我們可以通過挖掘模型查看器來查看Naive Bayes模型。如圖3所示。

sql server2008

圖3在圖3中,依賴關系網絡可以對數據的分布進一步了解。屬性配置文件可以了解每個變量的特性分布情況。屬性特征可以看出不同群分類的基本特性概率。屬性對比就是呈現屬性之間的特性對比。

SQL Server2008數據挖掘之關聯規則算法

關聯算法規則是要發現數據庫中變量和個體之間關系程度,也就是要發現大量數據中項集之間有趣的關聯或相關聯系。例如,在關聯規則挖掘中,典型的例子就是購物籃分析,該分析過程就是通過分析顧客所購買的不同商品之間的聯系,來挖掘顧客的購買習慣,并幫助銷售商制定營銷策略。關聯規則算法中有兩個重要的參數支持度和置信度。支持度就是指X項集和Y項集中,同時發生X,Y事件的概率。置信度就是指X項集和Y項集中,X事件發生的概率下,Y事件發生的概率。

在sql server 2008中,我們可以通過挖掘模型查看器來查看關聯規則模型。如圖4所示

sql server2008

在圖4中,規則可以查看算法中產生的關聯規則,我們可以通過此來了解關聯規則內容以及其支持度和置信度。項集可以查看算法中產生的對象組,我們可以通過此來了解各個對象組內容及其支持。依賴關系網絡可以呈現產品間的相關性,并通過圖形了解產品間的相關性。

SQL Server2008數據挖掘之順序分析和聚類分析算法

順序分析和聚類分析算法是由 Microsoft SQL Server Analysis Services 提供的一種順序分析算法。可以使用該算法來研究包含可通過下面的路徑或順序鏈接到的事件的數據。該算法通過對相同的順序進行分組或分類來查找最常見的順序。

在sql server 2008中,我們可以通過挖掘模型查看器來查看順序分析模型。如圖5所示

sql server2008 

圖5

在圖5中分類關系圖可以顯示挖掘模型中的所有分類,分類之間連線的明暗程度表示分類的相似程度。通過調整分類右側的滑塊,可以調整顯示的連線數。分類剖面圖提供算法創建的分類的總體視圖,顯示了分類中的每個屬性以及屬性的分布。分類特征可以檢查分類的組成特征。分類對比可以比較兩個分類的屬性。狀態轉換可以在選中一個分類后,可在選中的分類中瀏覽序列狀態之間的轉換。

SQL Server2008數據挖掘之時序算法

時序算法提供了一些針對連續值預測進行了優化的回歸算法,并將時間序列分解成主要趨勢成分,季節變化成分,并檢驗理論模型是否能反應現象。

在sql server 2008中,我們可以通過挖掘模型查看器來查看時序模型。如圖6所示

sql server2008

圖6

在圖6中,圖表欄顯示預測變量個產品過去值以及預測值,以及誤差區間。模型將算法以完成的模型顯示為樹。

SQL Server2008數據挖掘之神經網絡算法

神經網絡是一組連接的輸入輸出單元,其中每一個連接都與一個權相連接。在訓練學習階段,通過調整訓練網絡的權,使得能夠預測輸入樣本的正確類標號。神經網絡算法創建由多至三層神經元組成的網絡。這些層分別是輸入層、可選隱藏層和輸出層。輸入層:輸入神經元定義數據挖掘模型的所有輸入屬性值及其概率。隱藏神經元接收來自輸入神經元的輸入,并向輸出神經元提供輸出。隱藏層是向各種輸入概率分配權重的位置。權重說明某一特定輸入對于隱藏神經元的相關性或重要性。輸入所分配的權重越大,則輸入的值越重要。輸出神經元代表數據挖掘模型的可預測屬性值。

在sql server 2008中,我們可以通過挖掘模型查看器來查看神經網絡模型。如圖7所示

 

圖7

在圖7中,輸入選擇神經網絡模型將用作輸入的屬性和屬性值。輸出指定使用輸出的神經網絡的屬性。變量指定屬性右側的條表示指定輸入屬性狀態所傾向的輸出屬性狀態。 條的大小則表示輸出狀態傾向于輸入狀態的程度。

SQL Server2008數據挖掘之邏輯回歸算法

邏輯回歸是根據輸入域值對記錄進行分類的統計方法,通過建立一組方程,把輸入域值與輸出字段每一類的概率聯系起來。模型在分析二分類或有序因變量與解釋變量的關系,用自變量去預測因變量在給定某個值的概率。一旦生成模型,便可用于估計新的數據的概率。概率最大的目標類被指定為該記錄的預測輸出值。邏輯回歸算法是神經網絡算法的一種變體,用于確定多個因素對一對結果的影響。通過對輸入和輸出之間的關系進行建模。來測量每個輸入對輸出的影響,并權衡不同輸入在完成的模型中的作用。

SQL Server2008數據挖掘之線性回歸算法

線形回歸算法是一種常用的用于統計并作出預測的方法,使決策樹算法的一種變體,有助于計算依賴變量和獨立變量之間的線性關系,根據輸入字段估計預測輸出字段的最佳線形方程,然后使用該關系進行預測。使用線性回歸確定兩個連續列之間的關系,代表一條直線或者平面,以評估數據列之間的關系。

【編輯推薦】

  1. SQL Server2008數據庫鏡像實施筆記
  2. 淺談SQL Server數據庫并發測試方法
  3. 用并行查詢讓SQL Server加速運行
  4. SQL Server數據庫內容替換方法
  5. 有效使用SQL Server的自動管理功能
責任編輯:冰荷 來源: it168
相關推薦

2009-08-05 10:00:04

數據挖掘算法SQL Server

2009-02-16 13:21:25

數據挖掘SQL Server SQL Server

2010-09-13 09:58:17

SQL Server2

2010-11-10 10:27:58

訪問SQL Serve

2011-09-07 15:11:31

SQL Server同步

2009-04-10 15:37:48

SQL Server2鏡像實施

2011-03-24 10:19:58

SQL Server2CPU性能監控

2011-03-24 10:07:03

SQL Server2引擎組件CPU性能監控

2010-11-10 11:42:35

SQL Server2

2010-11-09 16:03:27

2010-09-13 10:10:07

SQL Server2

2010-10-22 09:32:01

SQL Server2

2010-09-02 17:27:18

SQL Server安裝

2010-09-16 15:36:26

SQL Server2

2009-04-13 10:15:24

SQLServer 2005數據挖掘

2010-07-13 10:35:20

SQL Server2

2010-07-12 14:55:34

SQL Server

2009-04-16 18:25:55

2010-09-13 09:45:17

sql server2

2011-08-17 18:12:48

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产综合在线视频 | 欧美成人精品一区 | 99视频免费在线观看 | 91在线视频精品 | 亚洲欧美成人在线 | 久久伊人影院 | 九九热在线观看视频 | 秋霞精品 | 国产免费一级一级 | 精品久久久久久久人人人人传媒 | 在线一区 | 色婷婷久久综合 | 天堂亚洲 | 久久91精品国产 | 久久久精彩视频 | 久久精品99| 在线观看a视频 | 国产在线永久免费 | 国产美女黄色片 | 亚洲永久在线 | 欧美精品在线视频 | 亚洲综合无码一区二区 | 在线观看免费av片 | 国产精品伦一区二区三级视频 | 日韩中字幕 | 99久久精品免费 | 91精品国产91久久综合桃花 | www.一区二区| 成年女人免费v片 | 天堂男人av | 成人精品系列 | 日韩一区不卡 | 国产精品一区二区三区在线 | 亚洲97| 久久里面有精品 | 日本五月婷婷 | 羞羞视频在线观免费观看 | 国产毛片毛片 | 在线播放国产一区二区三区 | 午夜影院在线播放 | 福利视频一区 |