成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

K折交叉驗證與GridSearch網格搜索

人工智能 機器學習
大型模型在許多任務上都產生了令人印象深刻的結果,但是訓練和微調的成本很高,而且解碼速度過慢,以至于研究和使用難度提升。華沙大學,谷歌研究和OpenAI的學者們通過利用稀疏性來解決這個問題。他們研究了模型中所有層級的稀疏變量,并提出了下一代Transformer模型族-Scaling Transformers。

大家好,我是志斌~

今天跟大家分享一下如何用GridSearch網格搜索和K折交叉認證對決策樹模型進行參數調優。

上一篇文章給大家介紹了決策樹模型的搭建和實戰,當時只用到了一個參數max_depth,但是模型實際上還有其他影響參數,如criterion(特征選擇標準)、class_weight(類別權重)等參數。如果我們想要更精確的結果,那么勢必要對模型參數進行調整,找到最優參數,來構建模型。

1.K折交叉驗證

K折交叉驗證實際上是將一個數據集分成K份,每次選K-1份為訓練集,用剩下的一份為測試集,然后取K個模型的平均測試結果作為最終的模型效果。如下圖所示:

K值的選取跟數據集的大小有關,數據集較小則增大K值,數據集較大則減小K值。實現代碼如下:

from sklearn.model_selection import cross_val_score
acc = cross_val_score(model,X,Y,cv=5)

2.GridSearch網格搜索

GridSearch網格搜索是一種窮舉搜索的參數調優方法,它會遍歷所有的候選參數,并評估每個模型的有效性和準確性,選取最好的參數作為最終結果。

參數調優分為單參數調優和多參數調優,志斌分別給大家舉例介紹一下。

(1)單參數調優

我們以單參數max_depth參數為例,來演示單參數調優,代碼如下:

from sklearn.model_selection import GridSearchCV
param = {'max_depth':[1,3,5,7,9]}
grid_search = GridSearchCV(model,param,scoring='roc_auc',cv=5)grid_search.fit(X_train,Y_train)

輸出參數的最優結果:

grid_search.best_params_

得到max_depth參數的最優結果為:

我們用上面獲得的參數最優值重新搭建模型,來查看AUC值是否得到了提高,代碼如下:

model = DecisionTreeClassifier(max_depth=7)
model.fit(X_train,Y_train)
y_pred_proba = model.predict_proba(X_test)
from sklearn.metrics import roc_auc_score
score = roc_auc_score(Y_test.values,y_pred_proba[:,1])

得到的AUC值為:

比之前的0.958有所上升,看來模型的準確度有所上升。

(2)多參數調優

決策樹模型有下圖這些參數:

這些參數都會影響我們搭建的決策樹模型的準確性,這里我們以max_depth(最大深度)、criterion(特征選擇標準)、min_samples_split(子節點向下分裂所需最小樣本數),這三個參數為例,來進行多參數調優,代碼如下:

from sklearn.model_selection import GridSearchCV
params = {'max_depth':[5,7,9,11,13],'criterion':['gini','entropy'],'min_samples_split':[5,7,9,11,13,15]}
model = DecisionTreeClassifier()
grid_search = GridSearchCV(model,params,scoring='roc_auc',cv=5)
grid_search.fit(X_train,Y_train)

輸出參數的最優值:

grid_search.best_params_

我們用上面獲得的參數最優值重新搭建模型,來查看AUC值是否得到了提高,代碼如下:

model = DecisionTreeClassifier(criterion='entropy',max_depth=13,min_samples_split=15)
model.fit(X_train,Y_train)
y_pred_proba = model.predict_proba(X_test)
from sklearn.metrics import roc_auc_score
score = roc_auc_score(Y_test.values,y_pred_proba[:,1])

得到的AUC值為:

比之前的0.985有所提高,看來模型得到進一步優化。

責任編輯:武曉燕 來源: 志斌的python筆記
相關推薦

2017-10-18 16:08:15

可視化交叉驗證代碼

2023-11-06 18:32:04

交叉驗證機器學習

2022-12-15 16:53:55

2010-02-06 14:31:54

ibmdw云計算

2009-07-31 17:02:51

ibmdw云計算

2025-01-22 07:59:59

2023-03-27 08:00:00

機器學習人工智能

2017-06-26 10:43:22

互聯網

2024-10-30 08:23:07

2025-01-15 11:25:35

2022-08-14 16:04:15

機器學習數據集算法

2020-02-18 12:13:25

摩托羅拉|Rezr|聯

2023-02-13 15:00:13

機器學習scikit-leaPyTorch

2023-11-01 08:08:22

k8s服務網格

2018-01-23 10:29:50

主搜索店鋪搜索

2010-03-23 14:20:22

2019-11-18 20:34:55

折疊屏平板電腦手機

2023-11-07 17:32:31

Istiok8s

2022-02-17 13:04:57

網絡驗證運營商

2018-05-28 11:03:22

交叉驗證時序數據數據集
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 九九热在线免费视频 | 亚洲精品99久久久久久 | 国产精品久久午夜夜伦鲁鲁 | 69电影网 | 国产日韩欧美在线 | 美女在线视频一区二区三区 | 国产美女在线免费观看 | 免费在线播放黄色 | 黄色网址在线播放 | 中文字幕欧美一区 | 亚洲天堂中文字幕 | 精品国产乱码久久久久久图片 | 日韩一区在线观看视频 | 亚洲视频一区在线播放 | 久草在线在线精品观看 | 91精品国产91综合久久蜜臀 | 国产精品国产精品国产专区不卡 | 高清av在线 | 国产国产精品久久久久 | 国产日韩精品视频 | 365夜爽爽欧美性午夜免费视频 | 99精品久久久久久中文字幕 | 91精品一区二区三区久久久久久 | 午夜精品久久久 | 美女天天操 | 日韩精品一区二区三区在线观看 | 久久久久久亚洲精品 | 日本中出视频 | 日韩中文电影 | 日韩精品视频一区二区三区 | 国产一级视频 | 羞羞网站在线免费观看 | 国产黄视频在线播放 | 久久6视频 | 九九99久久 | 成人亚洲性情网站www在线观看 | 日韩在线xx | 国产一区二区三区视频在线观看 | 最新中文字幕 | 国产亚洲成av人片在线观看桃 | 日韩精品中文字幕一区二区三区 |