LazyPredict：為你選擇最佳ML模型！

譯文精選

作者：崔皓 2023-04-04 08:00:00

人工智能機器學習開發

本文討論使用LazyPredict來創建簡單的ML模型。LazyPredict創建機器學習模型的特點是不需要大量的代碼，同時在不修改參數的情況下進行多模型擬合，從而在眾多模型中選出性能最佳的一個。

摘要

本文討論使用LazyPredict來創建簡單的ML模型。LazyPredict創建機器學習模型的特點是不需要大量的代碼，同時在不修改參數的情況下進行多模型擬合，從而在眾多模型中選出性能最佳的一個。?

本文包括的內容如下：?

簡介?
LazyPredict模塊的安裝?
在分類模型中實施LazyPredict?
在回歸模型中實施?
總結?

簡介

LazyPredict號稱最先進的Python軟件包，它的誕生正在徹底改變機器學習模型的開發方式。通過使用LazyPredict，可以快速創建各種基本模型，幾乎不需要任何代碼，從而騰出時間來選擇最適合我們數據的模型。?

LazyPredict的主要優點是可以使模型選擇更加容易，而不需要對模型進行大量的參數調整。LazyPredict提供了一種快速有效的方法來尋找和適配數據的最佳模型。?

接下來，讓我們通過這篇文章探索和學習更多關于LazyPredict的用法。?

LazyPredict模塊的安裝

LazyPredict庫的安裝是一項非常簡單的任務。如同安裝任何其他Python庫一樣，只需一行代碼輕松搞定。?

!pip install lazypredict

在分類模型中實施LazyPredict

在這個例子中，我們將利用Sklearn包中的乳腺癌數據集。?

現在，讓我們來加載數據。?

from sklearn.datasets import load_breast_cancer
from lazypredict.Supervised import LazyClassifier

data = load_breast_cancer()
X = data.data
y= data.target

為了選擇最佳分類器模型，現在讓我們部署"LazyClassifier "算法。這些特征和輸入參數適用于該類。

LazyClassifier(
    verbose=0,
    ignore_warnings=True,
    custom_metric=None,
    predictions=False,
    random_state=42,
    classifiers='all',
)

接著把該模型應用于加載好的數據并進行擬合。?

from lazypredict.Supervised import LazyClassifier
from sklearn.model_selection import train_test_split

# split the data
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0)

# build the lazyclassifier
clf = LazyClassifier(verbose=0,ignore_warnings=True, custom_metric=None)

# fit it
models, predictions = clf.fit(X_train, X_test, y_train, y_test)

# print the best models
print(models)

執行上述代碼之后，得到下面結果：?

然后，我們可以進行以下工作，來看看模型的細節。?

model_dictionary = clf.provide_models(X_train,X_test,y_train,y_test)

接下來，設置模型的名稱來顯示詳細的步驟信息。?

model_dictionary['LGBMClassifier']

在這里，我們可以看到SimpleImputer被用于整個數據集，然后是StandardScaler用于數字特征。在這個數據集中沒有分類或序數特征，但如果有，就會分別使用OneHotEncoder和OrdinalEncoder。LGBMClassifier模型在轉換和歸類后接收數據。?

LazyClassifier的內部機器學習模型使用sci-kit-learn工具箱進行評估和擬合。LazyClassifier函數在被調用時，會在我們的數據上自動建立和擬合各種模型，包括決策樹、隨機森林、支持向量機等。你提供的一組性能標準，如準確率、召回率或F1得分，被用來評估這些模型。訓練集用于擬合，而測試集則用于評估。?

在對模型進行評估和擬合后，LazyClassifier會提供一份評估結果總結（如上表），以及每個模型的頂級模型和性能指標列表。由于不需要手動調整或選擇模型，你可以快速簡單地評估許多模型的性能，并選擇最適合數據的模型。

在回歸模型中實施LazyPredict

使用"LazyRegressor "函數，可以再次為回歸模型完成同樣的工作。讓我們導入一個適合回歸任務的數據集（使用波士頓數據集）。

現在，讓我們使用LazyRegressor來擬合我們的數據。?

from lazypredict.Supervised import LazyRegressor
from sklearn import datasets
from sklearn.utils import shuffle
import numpy as np

# load the data
boston = datasets.load_boston()
X, y = shuffle(boston.data, boston.target, random_state=0)
X = X.astype(np.float32)

# split the data
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=0.3,random_state =0)

# fit the lazy object
reg = LazyRegressor(verbose=0, ignore_warnings=False, custom_metric=None)
models, predictions = reg.fit(X_train, X_test, y_train, y_test)

# print the results in a table
print(models)

代碼執行結果如下：?

以下是對最佳回歸模型的詳細描述：?

model_dictionary = reg.provide_models(X_train,X_test,y_train,y_test)
model_dictionary['ExtraTreesRegressor']

這里可以看到SimpleImputer被用于整個數據集，然后是StandardScaler用于數字特征。這個數據集中沒有分類或序數特征，但如果有的話，會分別使用OneHotEncoder和OrdinalEncoder。ExtraTreesRegressor模型接收了轉換和歸類后的數據。?

結論

LazyPredict庫對于任何從事機器學習行業的人來說都是一種有用的資源。LazyPredict通過自動創建和評估模型的過程來節省選擇模型的時間和精力，這大大提高了模型選擇過程的有效性。LazyPredict提供了一種快速而簡單的方法來比較幾個模型的有效性，并確定哪個模型系列最適合我們的數據和問題，因為它能夠同時擬合和評估眾多模型。?

閱讀本文之后希望你現在對LazyPredict庫有了直觀的了解，這些概念將幫助你建立一些真正有價值的項目。?

譯者介紹

崔皓，51CTO社區編輯，資深架構師，擁有18年的軟件開發和架構經驗，10年分布式架構經驗。

原文標題：??LazyPredict: A Utilitarian Python Library to Shortlist the Best ML Models for a Given Use Case??，作者：Sanjay Kumar

責任編輯：華軒來源： 51CTO

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

LazyPredict：為你選擇最佳ML模型！

摘要

簡介

LazyPredict模塊的安裝

在分類模型中實施LazyPredict

在回歸模型中實施LazyPredict

結論

譯者介紹