摘要
本文討論使用LazyPredict來創建簡單的ML模型。LazyPredict創建機器學習模型的特點是不需要大量的代碼,同時在不修改參數的情況下進行多模型擬合,從而在眾多模型中選出性能最佳的一個。?
本文包括的內容如下:?
- 簡介?
- LazyPredict模塊的安裝?
- 在分類模型中實施LazyPredict?
- 在回歸模型中實施?
- 總結?
簡介
LazyPredict號稱最先進的Python軟件包,它的誕生正在徹底改變機器學習模型的開發方式。通過使用LazyPredict,可以快速創建各種基本模型,幾乎不需要任何代碼,從而騰出時間來選擇最適合我們數據的模型。?
LazyPredict的主要優點是可以使模型選擇更加容易,而不需要對模型進行大量的參數調整。LazyPredict提供了一種快速有效的方法來尋找和適配數據的最佳模型。?
接下來,讓我們通過這篇文章探索和學習更多關于LazyPredict的用法。?
LazyPredict模塊的安裝
LazyPredict庫的安裝是一項非常簡單的任務。如同安裝任何其他Python庫一樣,只需一行代碼輕松搞定。?
在分類模型中實施LazyPredict
在這個例子中,我們將利用Sklearn包中的乳腺癌數據集。?
現在,讓我們來加載數據。?
為了選擇最佳分類器模型,現在讓我們部署"LazyClassifier "算法。這些特征和輸入參數適用于該類。
接著把該模型應用于加載好的數據并進行擬合。?
執行上述代碼之后,得到下面結果:?
然后,我們可以進行以下工作,來看看模型的細節。?
接下來,設置模型的名稱來顯示詳細的步驟信息。?
在這里,我們可以看到SimpleImputer被用于整個數據集,然后是StandardScaler用于數字特征。在這個數據集中沒有分類或序數特征,但如果有,就會分別使用OneHotEncoder和OrdinalEncoder。LGBMClassifier模型在轉換和歸類后接收數據。?
LazyClassifier的內部機器學習模型使用sci-kit-learn工具箱進行評估和擬合。LazyClassifier函數在被調用時,會在我們的數據上自動建立和擬合各種模型,包括決策樹、隨機森林、支持向量機等。你提供的一組性能標準,如準確率、召回率或F1得分,被用來評估這些模型。訓練集用于擬合,而測試集則用于評估。?
在對模型進行評估和擬合后,LazyClassifier會提供一份評估結果總結(如上表),以及每個模型的頂級模型和性能指標列表。由于不需要手動調整或選擇模型,你可以快速簡單地評估許多模型的性能,并選擇最適合數據的模型。
在回歸模型中實施LazyPredict
使用"LazyRegressor "函數,可以再次為回歸模型完成同樣的工作。讓我們導入一個適合回歸任務的數據集(使用波士頓數據集)。
現在,讓我們使用LazyRegressor來擬合我們的數據。?
代碼執行結果如下:?
以下是對最佳回歸模型的詳細描述:?
這里可以看到SimpleImputer被用于整個數據集,然后是StandardScaler用于數字特征。這個數據集中沒有分類或序數特征,但如果有的話,會分別使用OneHotEncoder和OrdinalEncoder。ExtraTreesRegressor模型接收了轉換和歸類后的數據。?
結論
LazyPredict庫對于任何從事機器學習行業的人來說都是一種有用的資源。LazyPredict通過自動創建和評估模型的過程來節省選擇模型的時間和精力,這大大提高了模型選擇過程的有效性。LazyPredict提供了一種快速而簡單的方法來比較幾個模型的有效性,并確定哪個模型系列最適合我們的數據和問題,因為它能夠同時擬合和評估眾多模型。?
閱讀本文之后希望你現在對LazyPredict庫有了直觀的了解,這些概念將幫助你建立一些真正有價值的項目。?
譯者介紹
崔皓,51CTO社區編輯,資深架構師,擁有18年的軟件開發和架構經驗,10年分布式架構經驗。
原文標題:??LazyPredict: A Utilitarian Python Library to Shortlist the Best ML Models for a Given Use Case??,作者:Sanjay Kumar