成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

手把手教你可視化交叉驗證代碼,提高模型預測能力

開發 開發工具
本文介紹了如何使用K折交叉驗證提高模型預測能力,并對代碼進行了可視化。

我們試著利用代碼可視化來提高模型預測能力。

比如說,你正在編寫一個漂亮清晰的機器學習代碼(例如線性回歸)。你的代碼還不錯,首先按照往常一樣用 train_test_split 這樣的函數將數據集分成「訓練集和測試集」兩個部分,并加入一些隨機因素。你的預測可能稍微欠擬合或過擬合,如下圖所示。

欠擬合和過擬合情況下的預測結果

圖:欠擬合和過擬合情況下的預測結果

這些結果沒有變化。這個時候我們能做什么呢?

正如題目所建議的,在學習了線性回歸之后,下一件有趣的事情就是交叉驗證了,因為它可以使用 K 折策略(K-Fold strategy)提高模型的預測能力。那 K 折究竟是什么呢?下面我們將用代碼對此進行解釋。

完整的代碼如下:

圖:交叉驗證的可視化

代碼解析:

以上代碼可分為 4 個步驟。

1. 加載并分割目標數據集。

加載數據集

圖:加載數據集

將該數據集中的目標復制到 y 變量中。如果想看到數據集,請將 print 行的注釋符「#」刪除。

2. 模型選擇

模型選擇(LinearRegression())

圖:模型選擇(LinearRegression())

為簡化過程,我們將選擇使用線性回歸。如果想了解更多,請查看文章《Linear Regression: The Easier Way》。

3. 交叉驗證

在 sklearn 中進行交叉驗證

圖:在 sklearn 中進行交叉驗證

這是 sklearn 中的流程,也是一個函數:

  1. cross_val_predict(model, data, target, cv) 

其中,

  • model 是我們選來要進行交叉驗證的模型。
  • data 是數據。
  • target 是數據的目標值。
  • cv(可選項)是數據折疊的總次數(K 折)。

在這個流程中,我們不像往常一樣將數據集分成訓練集和測試集兩部分,如下圖所示。

訓練集(藍色)和測試集(紅色)

圖:訓練集(藍色)和測試集(紅色)

我們將數據集平均分成 K 個部分(K 折或者 cv)。為了提高預測精度并實現更好地泛化,我們會在較大的數據集中進行模型訓練,在較小的數據集上測試。這里,我們把 cv 設置成 6。

圖:6 個相同的部分

現在,模型分割的***次迭代如下圖所示,其中紅色的是測試集,藍色的是訓練集。

圖:交叉驗證的***次迭代

第二次迭代如下圖所示:

圖:交叉驗證的第二次迭代

以此類推,直到***一次迭代,如下圖所示:

圖:交叉驗證的第六次迭代

4. 使用 Matplotlib 進行數據可視化

圖:使用 Matplotlib 進行可視化

為了將結果可視化,我們導入了 matplotlib 庫,然后創建一個 subplot(子圖)。

創建采用黑色(即 (0,0,0))邊框的散點。

使用 ax.plot 計算兩個軸的***最小值,k-- 代表線型,lw=4 代表寬度。然后,給 x 軸和 y 軸加上標簽。***,用 plt.show() 展示圖像。

結果如下:

圖:預測結果

這張圖展示了使用線性回歸模型對 Boston 數據集進行 K 折交叉驗證的結果。

我知道其實還有很多種交叉驗證方法,但 K 折交叉驗證是一個很好、很簡單的起點。

完整代碼地址:https://github.com/Sagarsharma4244/Cross-Validation

【本文是51CTO專欄機構“機器之心”的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】

 

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2020-12-17 09:40:01

Matplotlib數據可視化命令

2020-03-06 13:09:42

JavaScriptSublimeTextNode.js

2016-04-27 09:49:16

用戶模型產品總結

2021-03-12 10:01:24

JavaScript 前端表單驗證

2021-09-26 16:08:23

CC++clang_forma

2021-08-26 09:00:48

PyechartsPython可視化

2022-07-24 21:43:48

數據可視化大數據

2021-07-14 09:00:00

JavaFX開發應用

2011-01-10 14:41:26

2025-05-07 00:31:30

2011-05-03 15:59:00

黑盒打印機

2021-07-14 09:00:36

Python數據Python基礎

2024-01-26 08:16:48

Exporter開源cprobe

2023-04-26 12:46:43

DockerSpringKubernetes

2022-01-08 20:04:20

攔截系統調用

2022-12-07 08:42:35

2022-03-14 14:47:21

HarmonyOS操作系統鴻蒙

2022-07-27 08:16:22

搜索引擎Lucene

2011-02-22 13:46:27

微軟SQL.NET

2021-02-26 11:54:38

MyBatis 插件接口
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人在线一区二区 | 亚洲成人精品国产 | 国产欧美在线一区 | 欧美激情久久久 | 色www精品视频在线观看 | av影音资源 | 成人在线免费 | 国产精品欧美一区二区三区不卡 | 久久久视频在线 | 日本黄色一级片视频 | 在线视频日韩 | 精品欧美乱码久久久久久 | 久久久国产一区二区三区四区小说 | 欧美成人精品一区二区男人看 | 亚洲国产一区二区三区四区 | 二区中文 | 4h影视| 欧美日韩在线免费观看 | 国产精品3区 | 一级毛片免费完整视频 | 羞羞免费网站 | 免费av播放 | 天天搞天天搞 | 欧美在线a| 黄免费看 | 欧美精品日韩 | 久草福利 | 成人在线一级片 | 91p在线观看 | 日韩高清在线观看 | 亚洲成人精品国产 | 黄网站在线播放 | 欧美一级片在线观看 | 亚洲综合在线视频 | 人人干人人舔 | 日韩在线免费视频 | 午夜男人免费视频 | 日韩有码一区 | 久久久国产一区二区三区 | 久久精品成人 | 毛片视频免费观看 |