成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

SQL Server數據挖掘中的幾個問題之理解內容類型

數據庫 SQL Server
最近與一個客戶的開發團隊探討和學習SQL Server的數據挖掘及其應用。有幾個比較有意思的問題,整理出來。

最近與一個客戶的開發團隊探討和學習SQL Server的數據挖掘及其應用。有幾個比較有意思的問題,整理出來

關于數據挖掘的基本知識和學習資料,可以參考http://msdn.microsoft.com/zh-cn/library/bb510517.aspx

1. 如何理解Continuous(連續),Discretized(離散化)和Discreted(離散的)的區別

這是對于在數據挖掘結構中,對于內容類型設置的幾個常用的值,如下圖所示

【備注】其實除了這三個,還有其他好多個不同的ContentType,具體的請參考http://msdn.microsoft.com/zh-cn/library/ms174572.aspx

我的理解是這樣的

  1. 首先,這個ContentType是指定在挖掘模型中將如何這些屬性,而并非說這個屬性本身是連續的或者離散的。
  2. 其次,不同的挖掘算法對于ContentType的支持是不一樣的。例如貝葉斯算法就不支持連續的類型。其他一些算法也或多或少會有些自己的限制等
  3. 如果使用“連續(Continuous)”,則表示這一列的數據,最終可以在分析的時候,按照一定的規則劃分一些范圍,而不是單一的某個值。典型的連續類型,例如年收入,年齡等。因為年收入的值可能是很多的,如果每一個值都作為一個分析的個體去做,那么會導致太過細枝末節。我們通常在分析的時候,習慣將收入分段,例如1000~30000之間當做一個個體。如果要實現這樣的效果,那么年收入就要設置為“連續”。下圖是在決策樹中看到的一個效果
  4. 那么什么是“離散(Discreted)”的內容類型呢?和“連續”正好相反,它表示將每個數據都作為單一的個體進行分析,如果數據包含有限的幾個可選值,則很適合用這種類型。例如性別,職業等等。下圖是在貝葉斯算法中看到的一個效果。除了第一個屬性“Age”之外,其他的其實都是離散的。
  5. 那么,什么是離散化(Discretized)的呢?其實上面這個圖中看到的Age就是離散化的。為什么這么說呢?首先它肯定不是連續的,因為貝葉斯不支持連續的內容類型,其次它又不是離散的,離散的是將每個數據作為個體,而這里的Age其實是有范圍的意思。那么,這樣你就大致理解了為什么會有“離散化”這么一個類型了吧?就是說,在某些算法里面,既不支持連續的內容類型,而且你分析的時候,又不希望用離散的內容類型進行分析(因為個體可能很多),那么可以選擇將這些數據轉換為離散的,這個過程叫離散化。我們來看看是怎么做到的?

首先,設置為Discretized,

然后一定要設置另外兩個屬性:DiscretizationBucketCount,和DiscretizationMethod,第一個屬性表示分成多少組(最多),第二個屬性表示要用什么方法分組。這個Method有下面三種選擇

原文鏈接:http://www.cnblogs.com/chenxizhang/archive/2011/07/24/2115281.html

【編輯推薦】

  1. 代號:Denali,SQL Server再出擊
  2. 說說SQL Server編年史
  3. 簡單說說SQL Server上的加密術
  4. 擦亮自己的眼睛去看SQL Server
責任編輯:艾婧 來源: 陳希章@中國
相關推薦

2011-07-25 14:56:00

SQL SERVER數

2011-07-25 16:13:34

SQL Server數據挖掘

2011-07-25 15:17:50

SQL SERVER數

2011-07-25 15:39:49

SQL SERVER數聚類算法順序聚類算法

2011-07-26 10:16:14

SQL Server數據挖掘

2015-09-17 10:51:35

修改hostnameLinux

2021-10-12 00:04:24

腳本備份MariDB

2011-08-19 15:29:10

SQL Server 元數組

2011-05-18 11:31:56

數據安全數據備份

2021-03-03 21:24:57

數據倉庫工具

2011-07-04 16:40:39

QT 串口 QML

2011-05-20 08:55:15

J2EE

2023-07-04 08:09:05

數據庫選型集中式

2009-02-16 13:21:25

數據挖掘SQL Server SQL Server

2011-04-01 12:19:21

SQL Server商業智能

2013-05-06 15:42:49

2009-04-13 10:15:24

SQLServer 2005數據挖掘

2009-09-07 14:39:14

2010-06-09 16:57:14

路由選擇協議

2011-07-01 09:31:49

.net
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: av在线一区二区三区 | 最新高清无码专区 | 中文字幕日韩欧美一区二区三区 | 久久精品国产亚洲一区二区三区 | 国产成人艳妇aa视频在线 | 黑人巨大精品 | 国产做a爱免费视频 | 天天欧美 | 久久久精品一区 | 久久精品视频免费观看 | 久久精品这里 | 日本精品一区二区 | 亚洲一区国产精品 | 成人夜晚看av | 欧美三级电影在线播放 | 亚洲成人av一区二区 | 中文字幕1区| 精品乱码久久久久 | 国产精品美女久久久免费 | www.日本在线观看 | 久久成人av电影 | 日韩国产精品一区二区三区 | 久久福利电影 | 日韩一区二区三区在线 | 日韩高清www | 国产精品天堂 | 国产一级精品毛片 | 美女黄色在线观看 | 国产精品无码专区在线观看 | 久久国产视频网 | 久久国产精品视频 | 亚洲视频在线观看 | 粉嫩一区二区三区国产精品 | 91精品国产综合久久婷婷香蕉 | 天天插天天操 | 欧美日韩在线观看一区二区三区 | 日韩欧美国产成人一区二区 | www.久草.com| 欧美日韩视频在线播放 | 久久精品国内 | 我我色综合 |