成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

盤點(diǎn)10大回歸類型:總有一款深得你心

人工智能 機(jī)器學(xué)習(xí) 開發(fā)工具
除了統(tǒng)計模型和其他的一些算法,回歸是機(jī)器學(xué)習(xí)成功運(yùn)行的重要構(gòu)成要素。本文將用通俗易懂的方式介紹最常用的回歸類型,遇到具體任務(wù)時你便知曉該使用哪一種。

除了統(tǒng)計模型和其他的一些算法,回歸是機(jī)器學(xué)習(xí)成功運(yùn)行的重要構(gòu)成要素。回歸的核心是尋找變量之間的關(guān)系,而機(jī)器學(xué)習(xí)需要根據(jù)這種關(guān)系來預(yù)測結(jié)果。

顯然,任何稱職的機(jī)器學(xué)習(xí)工程師都應(yīng)重視回歸,但回歸也有很多種。線性回歸和邏輯回歸通常是人們最先學(xué)習(xí)的算法,然而還有許多回歸類型。每種類型都有各自的重要性,并且有最適合應(yīng)用的情境。那么,該用哪一種呢?

本文將用通俗易懂的方式介紹最常用的回歸類型,遇到具體任務(wù)時你便知曉該使用哪一種。

[[267540]]

1. 線性回歸Linear regression

線性回歸是最典型的回歸類型,大約250年前就已出現(xiàn),也被稱為普通最小二乘法(OLS)和線性最小二乘法回歸。可以使用它對小數(shù)據(jù)集進(jìn)行計算,甚至可以手動計算。目前線性回歸常用于插值,但不適合實際預(yù)測和主動分析。

另外,現(xiàn)代數(shù)據(jù)常常結(jié)構(gòu)混亂,線性回歸容易“滯后”:線性回歸過于精確。如果模型對一組數(shù)據(jù)計算精確,對另一組數(shù)據(jù)卻極不精確,而線性回歸本應(yīng)描述一般模式,過于精確會使其在幾乎所有情況下變得不穩(wěn)定。

2. 嶺回歸Ridge regression

嶺回歸是線性回歸的重要改進(jìn),增加了誤差容忍度,對回歸系數(shù)進(jìn)行了限制,從而得到更加真實的結(jié)果,并且結(jié)果更容易解釋。該方法用于解決自變量之間相互關(guān)聯(lián)(多重共線性)時的數(shù)據(jù)冗余問題。

嶺回歸需要使用如下公式來評估參數(shù):

線性回歸

3. 套索回歸Lasso-regression

套索回歸與嶺回歸類似,但回歸系數(shù)可為0(模型中排除了一些符號)。

線性回歸

4. 偏最小二乘法回歸Partial least squares(PLS)

與自變量數(shù)目相比,觀察結(jié)果很少時,或者自變量高度相關(guān)時,PLS會很有用。PLS可將自變量減少,并使其不相關(guān),類似于主成分分析。然后,對這些自變量而非原始數(shù)據(jù)進(jìn)行線性回歸。

PLS強(qiáng)調(diào)發(fā)展預(yù)測模型,不用于篩選變量。與OLS不同,PLS可以包含多個連續(xù)因變量。PLS利用相關(guān)結(jié)構(gòu)識別較小的效應(yīng),并對因變量中的多元模式進(jìn)行建模。

[[267543]]

來源:Pexels

5. 邏輯回歸Logistic regression

邏輯回歸廣泛應(yīng)用于臨床試驗、量化,或者欺詐分析——當(dāng)測試藥物或信用卡交易的信息可以二進(jìn)制形式(是/否)獲得時。線性回歸固有的缺點(diǎn)它也有,如低誤差容忍度、依賴數(shù)據(jù)集,但總的來說,邏輯回歸更好,并且可以簡化為線性回歸類型來簡化計算。有些版本如泊松回歸得到了改進(jìn),以便有時需要得到非二進(jìn)制答案,例如分類、年齡組、甚至回歸樹。

線性回歸

6. 生態(tài)回歸 Ecological Regression

生態(tài)回歸用于將數(shù)據(jù)劃分為相當(dāng)大的層或組的情況(回歸分別應(yīng)用于每個層或組),例如,在政治學(xué)中生態(tài)回歸用于根據(jù)匯總數(shù)據(jù)評估選民的群體行為。

然而,應(yīng)該警惕“大數(shù)據(jù)的詛咒”:如果對數(shù)百萬次回歸進(jìn)行統(tǒng)計,其中一些模型可能完全不準(zhǔn)確,成功的模型將被高度(且人為)一致的嘈雜模型“擊潰”。因此,這種類型的回歸不適合預(yù)測極端事件(地震)和研究因果關(guān)系(全球變暖)。

線性回歸

7. 貝葉斯線性回歸Bayesian linear regression

貝葉斯線性回歸與嶺回歸類似,但它的前提是所有可能的誤差都服從正態(tài)分布。因此,假設(shè)對數(shù)據(jù)結(jié)構(gòu)有基本了解,就可能獲得更精確的模型(特別是與線性回歸相比)。

然而,在實際操作中,若處理大數(shù)據(jù),對數(shù)據(jù)的初始了解并不能保證準(zhǔn)確性,所以這種假設(shè)是基于共軛值的,即本質(zhì)上是人為的,這是這種回歸類型的一個顯著缺陷。

觀測變量的計算:

線性回歸

誤差服從正態(tài)分布:

線性回歸

8. 分位數(shù)回歸Quantile regression

分位數(shù)回歸用于極端事件,包括故意在結(jié)果中引入偏差,從而提高模型的準(zhǔn)確性。

線性回歸

9. 最小絕對偏差Least absolute deviations(LAD)

最小絕對偏差也稱為最小絕對誤差(LAE)、最小絕對值(LAV)、最小絕對殘差(LAR)、絕對偏差之和或L1范數(shù)條件,是最小的模量方法。它用于從包含隨機(jī)誤差的測量值中評估未知值,以及估算給定函數(shù)的表示法(近似值)。最小絕對偏差看起來像線性回歸,但使用的是絕對值而不是平方。因此,模型的準(zhǔn)確性有所提高,且沒有使計算復(fù)雜化。

線性回歸

 

10. 刀切法重采樣Jackknife resampling(大折刀法)

刀切法重采樣是一種用于聚類和數(shù)據(jù)細(xì)化的新型回歸方法。這種方法不具有典型回歸類型的缺點(diǎn),能為回歸問題提供近似但非常準(zhǔn)確、抗誤差的解決方案,自變量相關(guān)或不“服從”正態(tài)分布時都可使用。

這種類型的回歸很適合黑盒類型預(yù)測算法,它非常接近線性回歸,沒有精度損失,即使傳統(tǒng)回歸假設(shè)(變量不相關(guān)、數(shù)據(jù)正態(tài)分布、條件方差恒定)由于數(shù)據(jù)性質(zhì)不被接受,它依舊可以使用。

假設(shè)樣本如下:

線性回歸

在概率統(tǒng)計理論中,假設(shè)這是一組獨(dú)立同分布的隨機(jī)變量,且以下是要研究的數(shù)據(jù):

線性回歸

約翰•圖基(John Tukey)在1949年提出的觀點(diǎn)(即“大折刀法”)是對一個樣本做大量的研究,排除一個觀察結(jié)果(并返回之前被排除的結(jié)果)。下面列出了從原始數(shù)據(jù)中獲得的樣本:

線性回歸

每一項都有n個新樣本,樣本容量為n-1,且都可用來計算計量經(jīng)濟(jì)學(xué)感興趣的統(tǒng)計數(shù)據(jù)的價值(樣本容量減1):

線性回歸

通過獲得的統(tǒng)計值,可了解其分布和分布的特征,如期望、中值、分位數(shù)、散點(diǎn)和均方差。

那么,該使用哪一種回歸?

[[267552]]

  • 如果模型需要連續(xù)的因變量:線性回歸是最常見和最直接的使用類型。如果有一個連續(xù)的因變量,可能要首先考慮線性回歸模型。然而,要注意線性回歸的幾個缺點(diǎn),如對異常值和多重共線性很敏感。在這種情況下,最好使用更高級的線性回歸變體,如嶺回歸、套索回歸和偏最小二乘法回歸(PLS)。
  • 如果模型需要分類因變量:應(yīng)使用邏輯回歸。這種模型最適合二元因變量。在進(jìn)行更復(fù)雜的分類建模之前,最好先使用這種模型。分類變量的有些值可以根據(jù)特征放入可計數(shù)的不同組中。邏輯回歸對因變量進(jìn)行變換,然后使用最大似然估計法而非最小二乘法來估計參數(shù)。
  • 如果模型需要計數(shù)因變量:應(yīng)使用泊松回歸。計數(shù)數(shù)據(jù)往往遵循泊松分布,因此泊松回歸很適合。使用泊松變量可以計算和評估發(fā)生率。
責(zé)任編輯:趙寧寧 來源: 讀芯術(shù)
相關(guān)推薦

2020-07-06 10:29:21

Linux系統(tǒng)數(shù)據(jù)

2018-11-14 08:14:59

工具云遷移云計算

2021-05-11 11:20:54

VRAR虛擬現(xiàn)實技術(shù)

2018-08-01 09:00:00

測試工具負(fù)載測試性能測試

2021-02-03 05:18:26

開源Ceph存儲

2020-07-30 08:34:04

物聯(lián)網(wǎng)開發(fā)工具

2012-10-08 09:59:29

惠普打印

2021-07-13 07:03:18

Linux遠(yuǎn)程工具

2021-08-31 07:54:23

數(shù)據(jù)庫選型

2012-01-10 15:44:33

相冊應(yīng)用軟件體驗

2016-03-28 10:32:26

Linux桌面發(fā)行版

2018-09-09 23:07:17

物聯(lián)網(wǎng)可視化編程工具

2023-03-07 14:18:43

2018-12-10 10:30:40

阿里Linux命令

2017-08-17 10:16:36

2019-05-30 08:43:45

JavaScript富文本編輯器編輯器

2019-08-30 14:30:11

2019-01-02 13:34:13

Python IDEGeditEclipse

2020-07-13 11:20:21

Python開發(fā)工具

2021-04-27 09:00:59

PythonAidLearning編程神器
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 久久久久久高潮国产精品视 | 国产在线一区二 | 一区二区av | 91国产精品 | 久久久国产一区二区三区 | 日韩图区 | 我想看一级黄色毛片 | 日韩一区在线播放 | 99免费在线观看视频 | av在线播放网站 | 九九亚洲 | 亚洲视频在线一区 | 久久www免费人成看片高清 | 欧洲视频一区二区 | 中国一级特黄真人毛片免费观看 | 精品久久久久久久久久久 | www.青青草 | 午夜电影合集 | 欧美日韩在线观看视频网站 | 日韩一级一区 | 日韩精品成人 | 国产精品亚洲综合 | 国产一区二区a | 91大神在线资源观看无广告 | 国产伦一区二区三区四区 | 男女视频91 | 欧美久久久久久久久中文字幕 | 久久久精品高清 | 国产精品一区二区三区四区 | 午夜电影在线播放 | 亚洲视频在线观看 | 一级片网址 | 黑人精品欧美一区二区蜜桃 | 国产午夜精品福利 | 91中文字幕在线 | 国产99久久精品一区二区300 | 国产一区二区三区 | 理论片87福利理论电影 | 久久久久久久久91 | 久久精品视频一区二区三区 | 亚洲综合在线一区二区 |