成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

使用MultiTrain在數據集上訓練多個機器學習分類模型示例

人工智能 機器學習
MultiTrain是一個python庫,它允許您一次訓練多個機器學習模型,以評估它們在數據集上的性能。Python

現在,讓我們用MultiTrain庫訓練一個數據集,看看它與傳統的測試模型方法相比是如何工作的。

注意:訓練結果可作為選擇適合您特定情況的最佳模型的參考。為了使模型執行得更好,需要進行更多的超參數調優。

在本教程中,我們將使用手機價格分類數據集(https://www.kaggle.com/datasets/iabhishekofficial/mobile-price-classification)處理一個分類問題

安裝庫

pip install MultiTrain

導入所需的Python庫

要處理這個數據集,我們需要導入以下庫

import warnings 
import pandas as pd
import seaborn as sns
from MultiTrain import MultiClassifier
from numpy import mean,
arange from matplotlib import pyplot as plt
warning.filterwarnings('ignore')

導入機器學習數據集

現在,讓我們也導入我們將使用的數據集

df = pd.read_csv(“train_phone.csv”)

檢查數據集標簽是否平衡

我們檢查數據集中包含的標簽,以確定它是是否平衡,這將幫助我們決定如何訓練數據集。

在運行下面的代碼時,您將發現數據集標簽是均勻分布的。

# price_range is the column name for the labels
df["price_range"].value_counts()

模型訓練

我們將跳過探索性數據分析,這里的重點是看看我們如何使用 MultiTrain 來實現它的目的。

下一步是將數據集劃分為特征和標簽。

features = df.drop('price_range', axis=1)
labels = df['price_range']

在定義了訓練特征和標簽之后,我們現在需要進一步將它們分為訓練集和測試集。模型將使用訓練集進行訓練,并使用測試集對其性能進行評估。

然后必須在MultiTrain庫中定義MultiClassifier對象。我們正在處理的數據集包括四個不同的標簽,這使它成為一個多類問題。

通過定義隨機狀態參數,在數據集上訓練的所有機器學習模型將產生一致的結果。設置“cores”為“-1”可以確保訓練使用CPU中的所有內核來提高性能。

train = MultiClassifier(random_state=42,
imbalanced=False,
target_class='multiclass',
cores=-1)
# It's important to assign this method to a variable because it
# returns the training and test splits to be used in the fit method
returned_split = train.split(X=features,
y=labels,
randomState=42,
sizeOfTest=0.2)
fit = train.fit(X=features,
y=labels,
splitting=True,
split_data=returned_split,
show_train_score=True)

圖片

您也可以使用 KFold 拆分對數據集進行訓練。

train = MultiClassifier(random_state=42,
imbalanced=False,
target_class='multiclass',
cores=-1)
# setting kf to True tells the fit method to use the KFold Split for # training.
fit = train.fit(X=features,
y=labels,
kf=True,
fold=5,
show_train_score=True)

圖片

您還可以將單個模型與scikit-learn實現進行比較,以查看它們是否產生類似的結果。


責任編輯:華軒 來源: 不靠譜的貓
相關推薦

2023-11-06 10:50:35

機器學習LIME

2020-08-10 15:05:02

機器學習人工智能計算機

2017-03-24 15:58:46

互聯網

2022-03-28 09:00:00

SQL數據庫機器學習

2022-06-05 21:16:08

機器學習Python

2023-01-11 07:28:49

TensorFlow分類模型

2022-09-19 15:37:51

人工智能機器學習大數據

2022-08-15 15:16:20

機器學習圖片深度學習

2025-02-24 08:40:00

神經網絡模型矩陣變換

2024-11-04 00:24:56

2024-11-26 09:33:44

2024-12-26 00:46:25

機器學習LoRA訓練

2018-11-07 09:00:00

機器學習模型Amazon Sage

2024-09-09 11:45:15

ONNX部署模型

2022-07-22 08:00:00

深度學習數據機器學習

2023-01-09 08:00:00

遷移學習機器學習數據集

2022-04-01 14:50:52

算法架構OnFire

2024-07-01 12:55:50

2023-09-05 10:41:28

人工智能機器學習

2017-07-07 14:41:13

機器學習神經網絡JavaScript
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久伊人青青草 | 四虎永久在线精品免费一区二 | 久久久久一区二区三区 | 成人福利网 | 老司机深夜福利网站 | 日本a∨视频 | 国产.com| 亚洲精品电影 | 久久福利电影 | 亚洲国产成人在线视频 | 亚洲一区亚洲二区 | 在线免费观看成年人视频 | 九九热国产视频 | 日韩有码在线观看 | 美女日皮网站 | 91精品久久久 | 激情一区二区三区 | 日韩一区二区三区四区五区六区 | 国产精品无 | 欧美日韩成人在线 | 久草在线青青草 | 久久久久久网站 | 国产精品免费看 | 久久久日韩精品一区二区三区 | 不卡一区| 久久国产精品视频免费看 | 一区二区亚洲 | 免费不卡一区 | 精品国产乱码久久久久久1区2区 | 国产成人久久久 | www午夜视频| 国产激情视频 | 欧美精品导航 | 成人在线免费视频 | 99精品视频免费观看 | 国产成人精品一区二区三区四区 | 欧美不卡一区二区三区 | 久久精品一级 | 在线免费黄色小视频 | av先锋资源 | 久久成人一区 |