成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<th id="kjhpk"><acronym id="kjhpk"></acronym></th>

<form id="kjhpk"><tr id="kjhpk"></tr></form>

<kbd id="kjhpk"></kbd>

<kbd id="kjhpk"><small id="kjhpk"><blockquote id="kjhpk"></blockquote></small></kbd><form id="kjhpk"></form>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

這一年來，數據科學家都用哪些算法？

作者：劉志勇 2017-02-05 17:10:17

大數據算法

在“數據為王”的今天，越來越多的人對數據科學產生了興趣。數據科學家離不開算法的使用，那么，數據科學家最常用的算法，都是哪些呢?

在“數據為王”的今天，越來越多的人對數據科學產生了興趣。數據科學家離不開算法的使用，那么，數據科學家最常用的算法，都是哪些呢?

最近，著名的資料探勘信息網站KDnuggets策劃了十大算法調查，這次調查對數據科學家常用的算法進行排名，并發現最“產業”和最“學術”的算法，還對這些算法在過去5年間(2011~2016)的變化，做了一番詳細的介紹。

這次調查結果，是基于844名受訪者投票整理出來。

KDnuggets總結出十大算法及其投票份額如下：

圖1：數據科學家使用的十大算法和方法。

請參閱文末的所有算法和方法的完整列表。

從調查中得知，受訪者平均使用8.1個算法，與2011年的一項類似調查相比大幅提高。

與用于數據分析/數據挖掘的2011年投票算法相比，我們注意到流行的算法仍然是回歸算法、聚類算法、決策樹和可視化。相對來說***的增長是以(pct2016/pct2011-1)測定的以下算法：

Boosting，從2011年的23.5%至2016年的32.8%，同比增長40%
文本挖掘，從2011年的從27.7%至2016年的35.9%，同比增長30%
可視化，從2011年的從38.3%至2016年的48.7%，同比增長27%
時間序列分析，從2011年的從29.6%至2016年的37.0%，同比增長25%
異常/偏差檢測，從2011年的從16.4%至2016年的19.5%，同比增長19%
集合方法，從2011年的從28.3%至2016年的33.6%，同比增長19%
支持向量機，從2011年的從28.6%至2016年的33.6%，同比增長18%
回歸算法，從2011年的從57.9%至2016年的67.1%，同比增長16%

在2016年***的新算法是：

K-近鄰算法(K-nearest neighbors，KNN)，46%份額
主成分分析(Principal Commponent Analysis，PCA)，43%
隨機森林算法(Random Forests，RF)，38%
***化算法(Optimization)，24%
神經網絡-深度學習(Neural networks-Deep Learning)，19%
奇異值矩陣分解(Singular Value Decomposition，SVD)， 16%

跌幅***的算法分別為：

關聯規則(Association rules)，從2011年的28.6%至2016年的15.3%，同比下降47%
增量建模(Uplift modeling)，從2011年的4.8%至2016年的3.1%，同比下降36%
因子分析(Factor Analysis)，從2011年的18.6%至2016年的14.2%，同比下降24%
生存分析(Survival Analysis)，從2011年的9.3%至2016年的7.9%，同比下降15%
下表顯示了不同算法類型的用途：監督學習、無監督學習、元分析和其他算法類型。我們排除了NA(4.5%)和其他(3%)的算法。

表1：按行業類型的算法使用

我們注意到，幾乎所有人都在使用監督學習算法。政府和產業的數據科學家們比學生或學術界使用了更多的不同類型的算法，產業數據科學家更傾向使用元算法。

接下來，我們分析深度學習的十大算法按行業類型的使用。

表2：深度學習的十大算法按就業類型的使用

Table 2: Top 10 Algorithms + Deep Learning usage by Employment Type

為了使差異更為醒目，我們計算特定行業類型相關的平均算法使用量設計算法為Bias(Alg,Type)=Usage(Alg,Type)/Usage(Alg,All)-1。

圖2：按行業的算法使用偏差

我們注意到產業界數據科學家更傾向使用回歸算法、可視化、統計算法、隨機森林算法和時間序列。政府/非盈利組織更傾向使用可視化、主成分分析和時間序列。學術研究人員更傾向使用主成分分析和深度學習。學生通常使用算法較少，但他們用的更多的是文本挖掘和深度學習。

接下來，我們看看代表整體KDnuggets訪客的地區參與情況。

參與投票者的地區分布如下：

北美，40%
歐洲，32%
亞洲8%
拉美，5.0%
非洲/中東，3.4%
澳洲/新西蘭，2.2%

與2011年的調查一樣，我們將產業/政府合并為同一個組，將學術研究人員/學生合并為第二組，并計算算法對產業/ 政府的“親切度”：

親切度為0的算法在產業/政府和學術研究人員/學生的使用情況相同。IG親切度約稿表示該算法越“產業”，越低則表示越“學術”。

其中最“產業”的算法”是：

增量建模(Uplift modeling)，2.01
異常檢測(Anomaly Detection)，1.61
生存分析(Survival Analysis)，1.39
因子分析(Factor Analysis)，0.83
時間序列(Time series/Sequences)，0.69
關聯規則(Association Rules)，0.5

雖然增量建模又一次成為最“產業”的算法，但出乎意料的是它的使用率如此低：區區3.1%，在這次調查中，是使用率***的算法。

最“學術”的算法是：

神經網絡(Neural networks - regular)，-0.35
樸素貝葉斯(Naive Bayes)，-0.35
支持向量機(SVM)，-0.24
深度學習(Deep Learning)，-0.19
***期望算法(EM)，-0.17

下圖顯示了所有算法以及它們在產業界/學術界的親切度：

圖3：Kdnugets調查：數據科學家使用的流行算法：產業界vs學術界

下表包含了算法的詳細信息，在2016年和2011年使用它們的受訪者百分比調查，變化(%2016 /%2011 - 1)和行業親切度如上所述。

表3：KDnuggets2016調查：數據科學家使用的算法

下表包含各個算法的詳細信息：

N: 根據使用度排名
Algorithm: 算法名稱
Type：類型。S - 監督，U - 無監督，M - 元，Z - 其他，
2016 % used：2016年調查中使用該算法的受訪者比例
2011 % used：2011年調查中使用該算法的受訪者比例%Change：變動 (%2016 / %2011 - 1)
Industry Affinity：產業親切度(上文已提到)

責任編輯：未麗燕來源：大數據雜談

數據科學數據分析數據挖掘

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：久久机热| 黄色片在线 | 国产精品成人国产乱一区 | 91正在播放 | av国产精品| 91免费观看在线 | 日韩在线电影 | 91久久视频 | 成人国产精品久久久 | 福利视频一区 | 韩日一区二区三区 | 九九久久这里只有精品 | 久久久久一区二区三区四区 | 国产极品粉嫩美女呻吟在线看人 | 黄色片视频网站 | 伊人久久麻豆 | 亚洲视频区 | 一级免费毛片 | av免费看在线 | 久久1区| 久久久青草 | 成人亚洲精品 | 国产成人精品一区二区三区视频 | 欧美日韩中文在线 | 天天舔天天 | 九一在线 | 久久精品99久久 | 一本一道久久a久久精品综合 | 欧美mv日韩mv国产网站91进入 | 91精品国产一区二区三区蜜臀 | 日韩视频一区二区 | 国产一区二区三区在线 | 国产一级片在线观看视频 | 2021狠狠天天天 | 黄色片免费看视频 | 日本精品在线播放 | 精品日韩一区 | 国产日韩精品一区二区 | 国产精品成人一区二区三区吃奶 | 欧美一级三级在线观看 | 一区在线视频 |

<tt id="wkhlt"></tt>