成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Scikit-learn玩得很熟了?這些功能你都知道嗎?

人工智能 機器學習
Scikit-learn是Python所有的機器學習程序包中,你必須掌握的最重要的一個包,它包含各種分類算法,,今天我們分享一些Scikit-learn程序包里鮮有人知的遺珠功能。

[[229302]]

大數據文摘作品

編譯:汪小七、笪潔瓊、Aileen

分享一些Scikit-learn程序包里鮮有人知的遺珠功能。

Scikit-learn是Python所有的機器學習程序包中,你必須掌握的最重要的一個包,它包含各種分類算法,回歸算法和聚類算法,其中包括支持向量機、隨機森林、梯度提升、k均值和基于密度的聚類算法(DBSCAN),且旨在與Python數值庫NumPy和科學庫SciPy進行相互配合。

它通過一個接口,提供了一系列的有監督和無監督算法。此庫希望在生產中使用時,能具有很好的穩健性和支撐性,所以它的著重點在易用性,代碼質量,協同工作,文檔生成和性能等問題上。

不管是對機器學習的初學者還是經驗豐富的專業人士來說,Scikit-learn庫都是應該熟練掌握的優秀軟件包。然而,即使是有經驗的機器學習從業者可能也沒有意識到這個包中所隱藏的一些特性,這些特性可以輕松地幫助他們完成任務。接下來本文將列舉幾個scikit-learn庫中鮮為人知的方法或接口。

管道(Pipeline)

這可以用來將多個估計量鏈化合一。因為在處理數據時,通常有著一系列固定的步驟,比如特征選擇、歸一化和分類,此時這個方法將非常有用。

更多信息:

http://scikit-learn.org/stable/modules/pipeline.html

網格搜索(Grid-search)

超參數在參數估計中是不直接學習的,在scikit-learn庫中,超參數會作為參數傳遞給估計類的構造函數,然后在超參數空間中搜索最佳的交叉驗證分數在構建參數估計量時提供的任何參數都是可以用這種方式進行優化的。

更多信息:

http://scikit-learn.org/stable/modules/grid_search.html#grid-search

驗證曲線(Validation curves)

每種估計方法都有其優缺點,它的泛化誤差可以用偏差、方差和噪音來分解。估計量的偏差就是不同訓練集的平均誤差;估計量的方差是表示對不同訓練集的敏感程度;噪聲是數據本身的一個屬性。

繪制單個超參數對訓練分數和驗證分數的影響是非常有用的,因為從圖中可以看出估計量對于某些超參數值是過擬合還是欠擬合。在Scikit-learn庫中,有一個內置方法是可以實現以上過程的。

更多信息:

http://scikit-learn.org/stable/modules/learning_curve.html

分類數據的獨熱編碼(One-hot encoding of categorical data)

這是一種非常常見的數據預處理步驟,在分類或預測任務中(如混合了數量型和文本型特征的邏輯回歸),常用于對多分類變量進行二分類編碼。Scikit-learn庫提供了有效而簡單的方法來實現這一點。它可以直接在Pandas數據框或Numpy數組上運行,因此用戶就可以為這些數據轉換編寫一些特殊的映射函數或應用函數。

Scikit-learn庫更多信息:

http://scikit-learn.org/stable/modules/preprocessing.html#encoding-categorical-features

多項式特征生成(Polynomial feature generation)

對于無數的回歸建模任務來說,一種常用的增加模型復雜程度的有效方法是增加解釋變量的非線性特征。一種簡單而常用的方法就是多項式特征,因為它可以得到特征的高階項和交叉項。而Scikit-learn庫中有現成的函數,它可根據給定的特征集和用戶選擇的最高多項式生成更高階的交叉項。

更多信息:

http://scikit-learn.org/stable/modules/preprocessing.html#generating-polynomial-features

數據集生成器(Dataset generators)

Scikit-learn庫包含各種隨機樣本生成器,可以根據不同大小和復雜程度來構建人工數據集,且具有分類、聚類、回歸、矩陣分解和流形測試的功能。

更多信息:http://scikit-learn.org/stable/datasets/index.html#sample-generators

相關報道:

https://heartbeat.fritz.ai/some-essential-hacks-and-tricks-for-machine-learning-with-python-5478bc6593f2

【本文是51CTO專欄機構大數據文摘的原創譯文,微信公眾號“大數據文摘( id: BigDataDigest)”】

     大數據文摘二維碼

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2021-07-29 06:55:03

Spring@AutowriedbyType注入

2024-04-28 08:20:52

Controller接口URL

2021-04-10 07:04:00

WPS技巧辦公軟件

2016-01-11 09:48:07

2021-08-05 18:21:29

Autowired代碼spring

2023-08-30 07:39:16

PawSQL數據庫

2019-02-12 11:15:15

Spring設計模式Java

2019-07-08 10:18:38

MPLSIP數據

2016-03-18 19:03:35

認知計算IBM

2022-11-10 09:00:41

2022-09-07 09:01:14

JS操作符運算符

2020-05-27 11:30:54

Chrome DevT前端命令

2023-02-15 08:12:19

http超時過濾器

2024-03-26 10:10:45

JavaScript操作符操作表達式

2022-05-02 09:17:41

Edge瀏覽器微軟

2020-10-28 11:20:55

vue項目技

2018-02-06 09:06:03

主流分布式存儲系統

2020-02-20 08:30:49

OSPF網絡協議路由協議

2018-04-24 15:40:39

無線路由器無線網絡上網

2020-11-18 07:52:08

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一区二区三区四区三区四 | 男女羞羞视频在线 | www.xxxx欧美 | 2019天天干天天操 | 9999视频 | 亚洲欧美中文字幕在线观看 | 精品久久视频 | av黄色免费在线观看 | av中文字幕在线观看 | 国产精品国产三级国产aⅴ原创 | 色免费视频 | 黄色免费网站在线看 | 欧美a v在线| 拍拍无遮挡人做人爱视频免费观看 | 色综合久 | 亚洲精品乱码久久久久久久久 | 亚洲美乳中文字幕 | 九九久久久 | 亚洲国产aⅴ成人精品无吗 国产精品永久在线观看 | 久久久久久美女 | 国产一区二区三区四区五区加勒比 | 亚洲成av| 自拍偷拍视频网 | 国产福利小视频 | 天天躁日日躁xxxxaaaa | 久久夜视频 | 一二三四在线视频观看社区 | 久久手机视频 | 免费毛片www com cn | 亚洲免费高清 | 亚洲日韩中文字幕一区 | 精品国产一区久久 | a a毛片| 亚洲欧美aⅴ | 综合久久一区 | 欧美成人免费 | 99re视频精品| 九九热精品视频在线观看 | 久久99精品久久久久子伦 | 羞羞的视频免费看 | 91社区在线观看播放 |