成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

KDnuggets 官方調(diào)查:數(shù)據(jù)科學(xué)家最常用的十種算法

大數(shù)據(jù) 算法
最新一期的 KDnuggets 調(diào)查展示了一份數(shù)據(jù)科學(xué)家使用度最高的算法列表,這份列表中包含了很多驚喜,包括最學(xué)術(shù)的算法和面向產(chǎn)業(yè)化的算法。

 

[[174162]]

 

***一期的 KDnuggets 調(diào)查展示了一份數(shù)據(jù)科學(xué)家使用度***的算法列表,這份列表中包含了很多驚喜,包括最學(xué)術(shù)的算法和面向產(chǎn)業(yè)化的算法。

哪些方法/算法是您在過去 12 個月中運用到一個實際的數(shù)據(jù)科學(xué)相關(guān)的應(yīng)用程序中的?

這是基于 844 個投票者的結(jié)果。

排名前十的算法以及他們的投票者的比例分布如下:

圖 1 :數(shù)據(jù)科學(xué)家使用度***的 10 大算法

每個受訪者平均使用 8.1 個算法,這相比于 2011 的相似調(diào)查顯示的結(jié)果有了巨大的增長。

與 2011 年關(guān)于數(shù)據(jù)分析/數(shù)據(jù)挖掘的調(diào)查相比,我們注意到最常用的方法仍然是回歸、聚類、決策樹/Rules 和可視化。相對來說***的增長是由 (pct2016 /pct2011 – 1) 測定的以下算法

  • Boosting,從 2011 年的 23.5% 至 2016 年的 32.8%,同比增長 40%
  • 文本挖掘,從 2011 年的 27.7% 至 2016 年的 35.9%,同比增長 30%
  • 可視化,從 2011 年的 38.3% 至 2016 年的 48.7%,同比增長 27%
  • 時間序列/序列分析,從 2011 年的 29.6% 至 2016 年的 37.0%,同比增長 25%
  • 異常/偏差檢測,從 2011 年的 16.4% 至 2016 年的 19.5%,同比增長 19%
  • 集成方法,從 2011 年的 28.3%至 2016 年的 33.6%,同比增長 19%
  • 支持向量機,從 2011 年的 28.6% 至 2016 年的 33.6%,同比增長 18%
  • 回歸,從 2011 年的 57.9% 至 2016 年的 67.1%,同比增長 16%

***算法在 2016 年的調(diào)查中有了新的上榜名單:

  • K-近鄰,46%
  • 主成分分析,43%
  • 隨機森林,38%
  • 優(yōu)化,24%
  • 神經(jīng)網(wǎng)絡(luò) – 深度學(xué)習(xí),19%
  • 奇異值分解,16%

***幅下降的有:

  • 關(guān)聯(lián)規(guī)則,從 2011 年的 28.6% 至 2016 年的 15.3%,同比下降 47%
  • 隆起造型,從 2011 年的 4.8% 至 2016 年的 3.1%,同比下降 36%
  • 因素分析,從 2011 年的 18.6% 至 2016 年的 14.2%,同比下降 24%
  • 生存分析,從 2011 年的 9.3% 至 2016 年的 7.9%,同比下降 15%

下表顯示了不同的算法類型的使用:監(jiān)督算法、無監(jiān)督算法、元算法,以及職業(yè)類型決定的對算法的使用。我們排除 NA(4.5%)和其他(3%)的職業(yè)類型。

表 1:根據(jù)職業(yè)類型顯示的不同算法使用度

我們注意到,幾乎每個人都使用監(jiān)督學(xué)習(xí)算法。

政府和產(chǎn)業(yè)業(yè)數(shù)據(jù)科學(xué)家比學(xué)生和學(xué)術(shù)研究人員使用更多不同類型的算法,而產(chǎn)業(yè)數(shù)據(jù)科學(xué)家們更傾向于使用元算法。

接下來,我們根據(jù)職業(yè)類型分析了前 10 名的算法+深度學(xué)習(xí)使用情況。

表 2:根據(jù)職業(yè)類型分類的 10 大算法+深度學(xué)習(xí)使用情況

為了更明顯的看到差異,我們計算了具體職業(yè)分類相比于平均算法使用度的一個算法偏差,即偏差(ALG,類型)=使用(ALG,類型)/使用(ALG,所有的)

圖 2:職業(yè)對算法的使用偏好

我們注意到,產(chǎn)業(yè)數(shù)據(jù)科學(xué)家們更傾向于使用回歸、可視化、統(tǒng)計、隨機森林和時間序列。政府/非營利更傾向于使用可視化、主成分分析和時間序列。學(xué)術(shù)研究人員更傾向于使用主成分分析和深度學(xué)習(xí)。學(xué)生普遍使用更少的算法,但多為文本挖掘和深度學(xué)習(xí)。

接下來,我們看看某一具體地域的參與度,表示整體的 KDnuggets 的用戶:

  • 美國/加拿大,40%
  • 歐洲,32%
  • 亞洲,18%
  • 拉丁美洲,5%
  • 非洲/中東,3.4%
  • 澳洲/新西蘭,2.2%

由于在 2011 年的調(diào)查中,我們將產(chǎn)業(yè)/政府分在了一組,而將學(xué)術(shù)研究/學(xué)生分在了第二組,并計算了算法對于業(yè)界/政府的親切度:

因此親切度為 0 的算法表示它在產(chǎn)業(yè)/政府和學(xué)術(shù)研究人員或?qū)W生之間的使用情況對等。越高 IG 親切度表示算法越被產(chǎn)業(yè)界普遍使用,反之越接近「學(xué)術(shù)」。

最「產(chǎn)業(yè)」的算法是:

  • 異常檢測,1.61
  • 生存分析,1.39
  • 因子分析,0.83
  • 時間序列/序列,0.69
  • 關(guān)聯(lián)規(guī)則,0.5

而 uplifting modeling 又是最「產(chǎn)業(yè)的算法」,令人驚訝的發(fā)現(xiàn)是,它的使用率極低 – 只有 3.1% – 是本次調(diào)查的算法中***的。

最學(xué)術(shù)的算法是:

  • 常規(guī)神經(jīng)網(wǎng)絡(luò),-0.35
  • 樸素貝葉斯,-0.35
  • 支持向量機,-0.24
  • 深度學(xué)習(xí),-0.19
  • EM,-0.17

下圖顯示了所有的算法及其產(chǎn)業(yè)/學(xué)術(shù)親切度。

圖 3:KDnuggets 投票:最常被數(shù)據(jù)科學(xué)家使用的算法:產(chǎn)業(yè)界 VS 學(xué)術(shù)界

下表有關(guān)于算法的細(xì)節(jié)、兩次調(diào)查中使用算法的比例、以及像上面解釋的產(chǎn)業(yè)親切度。

接下來的圖表展示了算法的細(xì)節(jié),按列

N:根據(jù)使用度排名

  • 算法:算法名稱,
  • 類型:S – 監(jiān)督,U – 無監(jiān)督,M – 元,Z – 其他,
  • 在 2016 年調(diào)查中使用這種算法的調(diào)查者比例
  • 在 2011 年調(diào)查中使用這種算法的調(diào)查者比例
  • 變動(%2016 年/2011% – 1),
  • 產(chǎn)業(yè)親切度(如上所述)

 

 

表 3:KDnuggets 2016 調(diào)查:數(shù)據(jù)科學(xué)家使用的算法

責(zé)任編輯:趙寧寧 來源: 36大數(shù)據(jù)
相關(guān)推薦

2016-12-06 08:47:18

數(shù)據(jù)算法

2016-09-22 14:28:33

數(shù)據(jù)科學(xué)家算法

2017-06-01 16:25:36

數(shù)據(jù)挖掘算法

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2018-03-27 11:02:55

2016-05-11 10:36:16

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)大數(shù)據(jù)

2019-12-11 19:19:19

算法數(shù)據(jù)科學(xué)家代碼

2017-01-23 16:00:25

數(shù)據(jù)科學(xué)家大數(shù)據(jù)數(shù)學(xué)家

2025-04-25 07:10:00

GenAIAI工具人工智能

2025-06-16 08:22:23

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2012-12-06 15:36:55

CIO

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2019-01-30 08:05:14

數(shù)據(jù)科學(xué)編程語言Kaggle

2017-12-06 15:41:01

數(shù)據(jù)科學(xué)家機器學(xué)習(xí)預(yù)測

2018-10-18 09:00:00

機器學(xué)習(xí)機器學(xué)習(xí)算法數(shù)據(jù)科學(xué)家

2018-06-21 08:04:25

數(shù)據(jù)科學(xué)正態(tài)分布高斯

2019-09-26 08:43:34

算法數(shù)據(jù)庫Python

2016-12-19 10:05:01

數(shù)據(jù)面試題PCA
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲精品美女 | 国产综合第一页 | 欧美精品一区二区在线观看 | 欧美aaa一级片 | 亚洲国产精品久久久 | 欧美日韩高清一区 | 91极品欧美视频 | 国产免费一区二区三区免费视频 | 一区二区三区欧美大片 | 中文字幕在线视频观看 | 丁香一区二区 | 国产亚洲二区 | 亚洲小视频在线播放 | av网站在线看| 免费黄色日本 | 亚洲精品视频一区 | 久久国产视频播放 | 日本久久精品视频 | 一本岛道一二三不卡区 | 久久国产精品视频观看 | 日韩视频91 | 亚洲精品一区在线 | 成人性生交大片免费看中文带字幕 | 四虎永久免费影院 | 日韩视频在线观看一区二区 | 男女精品久久 | 欧美一区二区在线观看 | 九九热国产精品视频 | 国产精品免费av | 日韩视频在线免费观看 | 91在线视频网址 | 亚洲欧美日韩精品久久亚洲区 | 久久久久无码国产精品一区 | 欧美日韩一区二区三区四区 | 日日夜夜狠狠操 | 亚洲综合久久久 | 欧美国产一区二区 | 成人精品鲁一区一区二区 | 国产精品久久久久久久7777 | 欧美成ee人免费视频 | 国产精品美女久久久 |