成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

R數據分析:如何理解模型中的“控制”,圖例展示

大數據 數據分析
如果兩個變量有共變關系,我們就可以用其中一個變量來預測另外一個變量的走勢,如果這種共變關系是一種因果關系,我們就可以在統計分析中對其進行控制。有點不好理解,所以今天給大家準備了實例,并且用圖形給大家說明這個問題。

如果兩個變量有共變關系,我們就可以用其中一個變量來預測另外一個變量的走勢,如果這種共變關系是一種因果關系,我們就可以在統計分析中對其進行控制。

有點不好理解,所以今天給大家準備了實例,并且用圖形給大家說明這個問題。

實例操練

今天用的數據依然是R自帶的diamonds數據集,數據變量什么意思請大家自行百度。

在上一篇文章中,我們用箱型圖畫出不同的cut上鉆石價格的分布如下圖 

R數據分析:如何理解模型中的“控制”,圖例展示

在上面的圖中我們可以看到隨著鉆石的cut越好,似乎鉆石的價格越低,這個關系明顯是不符合常理的,值得探討一下。

其實探討cut、price之間的關系是挺復雜的一個事情,因為cut和carat, carat和price之間都有緊密的關系,所以我們現在的思路就是說,希望能夠在去除了carat對price的效應之后,再看cut和price的關系。

下面的代碼建立了carat和price的模型,并且計算了模型的殘差(就是預測值和實際值的區別),殘差就反映了因變量未被自變量解釋的部分,在本例中就是price的變異中carat解釋不了的部分。

  1. library(modelr) 
  2. mod <- lm(log(price) ~ log(carat), data = diamonds) 
  3. diamonds2 <- diamonds %>%   add_residuals(mod) %>%  
  4.   mutate(resid = exp(resid)) 
  5. ggplot(data = diamonds2) +   geom_point(mapping = aes(x = carat, y = resid)) 

 R數據分析:如何理解模型中的“控制”,圖例展示

上面的代碼同時還做出了carat與模型殘差的散點圖,可以看出只用carat來解釋price是不太好的。

那么摳掉了carat和price的關系之后,怎么看cut和price的關系呢?代碼如下:

  1. ggplot(data = diamonds2) +  
  2.   geom_boxplot(mapping = aes(x = cut, y = resid)) 

 R數據分析:如何理解模型中的“控制”,圖例展示

這個時候我們是用cut為自變量,殘差為因變量進行了作圖,也就是看一看摳掉了carat對price的效應后,cut對price的實際的關系,可以看到這回隨著cut越來越好,price也愈來愈高,這下就對了。

實際上,上面的過程就是一個統計控制的過程,我們在看cut對price的關系的時候需要控制掉carat對price的關系,這樣得到的結果才是純凈的結果,有興趣的同學還可以去看一看控制變量和混雜變量的區別,嘿嘿。

小結

今天用一個實際的例子給大家寫了統計控制,感謝大家耐心看完。發表這些東西的主要目的就是督促自己,希望大家關注評論指出不足,一起進步。內容我都會寫的很細,用到的數據集也會在原文中給出鏈接,你只要按照文章中的代碼自己也可以做出一樣的結果,一個目的就是零基礎也能懂,因為自己就是什么基礎沒有從零學Python和R的,加油。

 

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2024-07-01 08:51:19

可視化數據分析漏斗

2021-01-14 12:17:52

大數據數據分析技術

2020-05-15 15:09:51

R語言數據分析

2024-03-04 11:10:01

2019-07-31 14:16:35

大數據人工智能算法

2017-10-14 14:49:46

RPython數據分析

2017-05-19 08:45:34

R用戶Python數據分析

2024-08-06 11:32:07

2017-09-28 16:31:02

大數據數據分析漏斗模型

2017-07-24 09:18:55

大數據數據分析行為事件分析

2018-07-05 14:18:12

數據分析神經網絡模型

2014-03-12 10:17:22

R語言Hadoop

2024-10-10 11:59:11

2024-10-30 12:21:18

2022-02-21 17:35:50

漏斗模型流程數據

2022-05-09 18:46:28

EOQ模型數據分析

2024-02-26 12:34:52

模型數據決策模型

2020-08-20 20:33:57

大數據R假設檢驗

2013-05-22 08:55:14

R語言

2015-09-23 09:55:26

數據分析分類變量
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 老牛影视av一区二区在线观看 | 在线视频一区二区三区 | 日韩中文字幕在线 | 成人18亚洲xxoo | 一本一道久久a久久精品蜜桃 | 亚洲精品日韩一区二区电影 | 天天色天天射天天干 | 亚洲成人一级 | 欧美中文一区 | 亚洲 自拍 另类 欧美 丝袜 | 91美女在线| 天天操天天拍 | 欧美一区二区三区在线观看 | 亚洲成人精品一区 | 国产精品一区二区三区四区五区 | 久久91精品 | 精品欧美一区二区三区久久久 | 欧美综合一区 | 午夜精品三区 | 成人午夜免费视频 | 天天草天天干天天 | 亚洲欧洲一区二区 | 国产免费一区 | 日韩精品一区二区三区四区视频 | 在线小视频| 亚洲一区 中文字幕 | h视频在线观看免费 | 国产美女一区二区 | 免费看国产片在线观看 | 国产精品久久久久久久久久 | 欧美国产日韩精品 | 九九久久在线看 | 国产三区视频在线观看 | 91视频免费 | 91高清在线观看 | 亚洲综合天堂网 | 免费黄色录像视频 | 国产aa| 成人精品在线视频 | 欧美日韩亚洲视频 | av永久|