成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

2021年最酷的數據科學庫

大數據
我成為數據科學家是因為我最喜歡找到解決復雜問題的解決方案,工作的創造性部分以及從數據中獲得的見解。如果您還喜歡將無聊的東西自動化,那么您會喜歡本文中將要介紹的庫。

我成為數據科學家是因為我最喜歡找到解決復雜問題的解決方案,工作的創造性部分以及從數據中獲得的見解。諸如清理數據,預處理和調整超參數之類的無聊的事情并沒有給我帶來什么樂趣,這就是為什么我嘗試盡可能自動執行這些任務的原因。

[[379727]]

如果您還喜歡將無聊的東西自動化,那么您會喜歡本文中將要介紹的庫。

如今,沒有人使用Scikit-Learn的線性回歸來預測Kaggle競爭中的房價,因為XGboost方法更準確。

但是,XGboost超參數很難調整。它們很多,而機器學習工程師在使用此算法時浪費了很多時間進行調整。好吧,不再了。

介紹Xgboost-AutoTune

我很高興與您分享由MIT的Sylwia Oliwia開發的Python Xgboost AutoTune庫,該庫最近已成為我自動XGboost微調的首選。

讓我們看一下此氣候數據集的示例,我們可以根據溫室氣體濃度預測溫度升高,并評估每種氣體的影響。

首先,我們導入數據集并繪制CO2,CH4,N20和合成氣的氣體濃度:

通過運行,我們可以看到過去140年中所有溫室氣體的增加情況:

太酷了,現在我們可以導入我提到的Autotuning庫,但是以防萬一您沒有下載存儲庫,我也會在此處顯示代碼:

基本上,您只需要記住該自動調整庫的主要方法是“ fit_parameters”,只需調用它,它就為找到超參數的最佳值進行了所有艱苦的工作,如下所示:

請注意,我們選擇了一種計分方法(在本例中為均方根對數誤差RMSLE),并且初始模型為XGBRegressor,因為這是一個回歸問題(另一個選項將是分類問題)。

太酷了,因此我們僅用兩行代碼構建了最佳的XGboost模型,現在讓我們做出預測:

這將輸出一個圖形,其中包含預測溫度與測試集中的實際值的對比:

看起來不錯。

現在,如果我們想知道在變暖作用中最重要的氣體是什么,我們可以做:

這將返回以下內容:

正如預期的那樣,CO2是效果最強的氣體,這不足為奇,但是我們可以看到CH4也具有非常重要的作用,最重要的是,這種模型訓練起來非常快。

結論

梯度提升是其不涉及深度學習的回歸和分類任務中最常用的算法,因為它具有很高的準確性,可解釋性和速度。

遺憾的是,盡管Python生態系統提供了XGboost庫,但是它沒有像Scikit-Learn這樣的其他庫那么廣泛,并且數據科學家必須手動完成調整參數,這會造成很多麻煩。

這就是為什么我認為這個自動調整庫是一個需要共享的瑰寶。

我最后的反思是:數據科學家的聘用費用昂貴,而他們的時間最好花在進行非瑣碎的工作上。

您能想象一位銷售主管打了電話嗎?當然那不是他們的工作。

好吧,可悲的是,許多數據科學家都是各行各業的佼佼者,他們的工作通常包括:查找數據,清理數據,攝取數據,決定使用的模型,編碼模型,編碼腳本以調整模型,部署模型,將模型展示給企業,上帝知道還有什么。

因此,數據科學家擁有的自動化工具越多,她就越能專注于最重要的工作:理解數據并從中獲取價值

希望您喜歡這篇文章,它可以幫助您更快地訓練模型。

祝您編碼愉快!

原文鏈接:https://towardsdatascience.com/the-coolest-data-science-library-i-found-in-2021-956af253fb2c

 

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2021-01-03 10:27:43

數據科學技術

2015-12-22 18:02:39

科學技術故事

2021-01-07 17:11:16

數據科學數據分析IT

2020-12-01 22:33:17

大數據初創公司數據

2021-02-09 10:53:21

數據科學數據分析IT

2021-04-26 08:28:55

數據科學機器學習數據科學工具

2017-01-09 16:11:28

開源容器數據庫

2020-12-01 22:35:12

數據分析初創公司數據

2016-10-19 15:34:57

2016大數據

2020-07-22 11:39:30

物聯網人工智能技術

2020-05-25 10:07:32

Python數據工具

2017-05-22 09:48:04

數據科學Python深度學習

2017-05-19 14:31:41

Python數據

2021-01-21 11:16:32

人工智能機器學習數據科學

2021-01-25 09:50:01

人工智能數據科學機器學習

2021-11-19 17:25:03

AI 數據人工智能

2021-06-27 17:24:01

數據科學機器學習初創公司

2020-12-17 15:11:51

數據科學家開發Python

2016-08-23 00:33:56

數據中心創新

2020-12-28 09:26:02

人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99re在线视频 | 黄色精品 | 国产精品久久久久久久久久久久久 | 日韩1区| 男女爱爱网站 | 日韩电影免费在线观看中文字幕 | 精品乱码一区二区三四区视频 | 7777精品伊人久久精品影视 | 欧美韩一区二区三区 | 欧美一级高潮片免费的 | 国产久| 国产精品国产三级国产aⅴ中文 | 国产精品久久国产精品 | 成人欧美一区二区三区在线播放 | 国产成人精品免高潮在线观看 | 精品中文字幕在线观看 | 亚洲精品久久久久久久久久久 | 亚洲精品免费视频 | 99精品国自产在线 | 亚洲精品在线国产 | 在线成人| 日本在线黄色 | 嫩呦国产一区二区三区av | 欧美在线精品一区 | 在线观看免费av网 | 一区二区三区成人 | 成年免费大片黄在线观看一级 | 日韩在线观看中文字幕 | 免费毛片网站在线观看 | 久久91视频| 成人免费视频久久 | 久久久久亚洲精品 | 天天躁日日躁狠狠躁2018小说 | 亚洲精品福利在线 | 国产精品视频一区二区三区四蜜臂 | 欧美精品一区三区 | 久久久涩 | 国产激情在线观看 | 91精品一区二区三区久久久久 | 精品免费国产一区二区三区 | 国际精品鲁一鲁一区二区小说 |