成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Kaggle機器學習之模型融合(stacking)心得

人工智能 機器學習
本文適用于被stacking折磨的死去活來的新手,在網上為數不多的stacking內容里,我已經假設你早已經看過了上述所提到的那幾篇有用的文章了。我希望下面的內容能成為,你在學習stacking的曲折道路上的一個小火把,給你提供一些微弱的光亮。

[[205595]]

此文道出了本人學習Stacking入門級應用的心路歷程。

在學習過程中感謝@貝爾塔的模型融合方法,以及如何在 Kaggle 首戰中進入前 10%這篇文章(作者是章凌豪)。對于兩位提供的信息,感激不盡。同時還有Kaggle上一些關于ensemble的文章和代碼,比如這篇。

本文適用于被stacking折磨的死去活來的新手,在網上為數不多的stacking內容里,我已經假設你早已經看過了上述所提到的那幾篇有用的文章了。但是,看完之后內心還是臥槽的。我希望下面的內容能成為,你在學習stacking的曲折道路上的一個小火把,給你提供一些微弱的光亮。

本文以Kaggle的Titanic(泰坦尼克預測)入門比賽來講解stacking的應用(兩層!)。

數據的行數:train.csv有890行,也就是890個人,test.csv有418行(418個人)。

而數據的列數就看你保留了多少個feature了,因人而異。我自己的train保留了 7+1(1是預測列)。

在網上為數不多的stacking內容里,相信你早看過了這張圖:

 

這張圖,如果你能一下子就能看懂,那就OK。

如果一下子看不懂,就麻煩了,在接下來的一段時間內,你就會臥槽臥槽地持續懵逼……

因為這張圖***‘誤導性’。(注意!我沒說這圖是錯的,盡管它就是錯的!!!但是在網上為數不多教學里有張無碼圖就不錯啦,感恩吧,我這個小弱雞)。

我把圖改了一下:

 

對于每一輪的 5-fold,Model 1都要做滿5次的訓練和預測。

Titanic 栗子:

Train Data有890行。(請對應圖中的上層部分)

每1次的fold,都會生成 713行 小train, 178行 小test。我們用Model 1來訓練 713行的小train,然后預測 178行 小test。預測的結果是長度為 178 的預測值。

這樣的動作走5次! 長度為178 的預測值 X 5 = 890 預測值,剛好和Train data長度吻合。這個890預測值是Model 1產生的,我們先存著,因為,一會讓它將是第二層模型的訓練來源。

重點:這一步產生的預測值我們可以轉成 890 X 1 (890 行,1列),記作 P1 (大寫P)

接著說 Test Data 有 418 行。(請對應圖中的下層部分,對對對,綠綠的那些框框)

每1次的fold,713行 小train訓練出來的Model 1要去預測我們全部的Test Data(全部!因為Test Data沒有加入5-fold,所以每次都是全部!)。此時,Model 1的預測結果是長度為418的預測值。

這樣的動作走5次!我們可以得到一個 5 X 418 的預測值矩陣。然后我們根據行來就平均值,***得到一個 1 X 418 的平均預測值。

重點:這一步產生的預測值我們可以轉成 418 X 1 (418行,1列),記作 p1 (小寫p)

走到這里,你的***層的Model 1完成了它的使命。

***層還會有其他Model的,比如Model 2,同樣的走一遍, 我們有可以得到 890 X 1 (P2) 和 418 X 1 (p2) 列預測值。

這樣吧,假設你***層有3個模型,這樣你就會得到:

來自5-fold的預測值矩陣 890 X 3,(P1,P2, P3) 和 來自Test Data預測值矩陣 418 X 3, (p1, p2, p3)。

—————————————–

到第二層了………………

來自5-fold的預測值矩陣 890 X 3 作為你的Train Data,訓練第二層的模型

來自Test Data預測值矩陣 418 X 3 就是你的Test Data,用訓練好的模型來預測他們吧。

—————————————

*** ,放出一張Python的Code,在網上為數不多的stacking內容里, 這個幾行的code你也早就看過了吧,我之前一直卡在這里,現在加上一點點注解,希望對你有幫助: 

責任編輯:龐桂玉 來源: 36大數據
相關推薦

2021-01-26 09:46:59

PythonStacking機器學習

2022-10-08 06:30:23

機器學習人工智能工具

2022-09-06 08:00:00

機器學習金融數據科學

2024-11-04 00:24:56

2024-11-26 09:33:44

2024-12-26 00:46:25

機器學習LoRA訓練

2017-10-23 15:46:37

2022-01-25 08:00:00

人工智能

2017-10-18 14:11:20

機器學習決策樹隨機森林

2014-07-09 09:29:34

機器學習

2025-04-03 15:40:41

機器學習大模型DeepSeek

2018-07-19 10:35:12

機器學習數據平臺

2024-04-18 10:39:57

2017-11-24 10:43:43

Madlib機器學習

2022-06-20 07:16:25

機器學習模型Codex

2020-08-10 15:05:02

機器學習人工智能計算機

2024-09-09 11:45:15

ONNX部署模型

2024-12-09 00:00:10

2017-08-25 14:05:01

機器學習算法模型

2022-05-18 16:24:36

PythonPyCaret機器學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲美女网站 | 黄色一级免费 | 亚洲精品一区二区三区在线 | 97精品超碰一区二区三区 | 精品亚洲一区二区三区 | 日本韩国欧美在线观看 | 亚洲毛片在线观看 | 一级片免费视频 | 日韩在线精品 | 免费黄网站在线观看 | 久久久久久久电影 | 亚洲福利在线视频 | 欧美视频免费 | 亚洲综合一区二区三区 | 国产免费看 | 秋霞在线一区 | 国产99久久久国产精品下药 | 亚洲精品日本 | av一级 | 日韩视频在线观看中文字幕 | 日韩av高清 | 色吊丝2288sds中文字幕 | 成人免费大片黄在线播放 | 国产精品区一区二 | 国产综合久久久 | 欧美一区二区三区在线看 | 日韩伦理一区二区 | 在线观看黄视频 | 久久久久久91 | 91电影 | 亚洲精品9999久久久久 | 特黄色一级毛片 | 欧美久久一区二区 | 国产精品一卡 | 国产欧美一区二区三区在线看 | 国产成人免费 | 免费的色网站 | 久久九精品 | 国产午夜影院 | 亚洲欧美精品久久 | 在线观看中文字幕视频 |