成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一文搞懂“預(yù)測模型”:建模思路,模型分類,應(yīng)用場景

大數(shù)據(jù) 數(shù)據(jù)分析
時間序列法就是模擬過去的走勢,然后按過去的走勢推演。這種做法和我們用肉眼觀察數(shù)據(jù)走勢,拍腦袋拍個數(shù)值沒有思路上的區(qū)別,僅僅是用公式替代了肉眼觀察,增加了精確度而已。

“建個模型預(yù)測一下!”一聽到要建模預(yù)測,很多同學(xué)都會菊花一緊。可以用來做預(yù)測模型很多,但是往往領(lǐng)導(dǎo)們喊著“建個模型”的時候,他丟給你的就孤零零的一行數(shù),形如下圖:

圖片圖片

這咋辦呀!你可能很想說:“就幾個數(shù),咱拍腦袋吧!”,這時候還會被領(lǐng)導(dǎo)批評。那死馬當(dāng)活馬醫(yī)的話,該咋整呢?

一、建模思路

建預(yù)測模型有兩個基本思路:因果關(guān)系/時間序列

1、基于因果關(guān)系建模。比如預(yù)測一個用戶是否消費(fèi),會把該用戶性別、年齡、過往消費(fèi)記錄、喜歡什么商品、瀏覽過哪些網(wǎng)頁等可能影響消費(fèi)的因素視為X,將消費(fèi)結(jié)果視為Y,之后利用數(shù)據(jù)計算出X與Y的公式。

2、基于時間序列建模。它把待預(yù)測的指標(biāo)(銷售額、用戶數(shù)、出貨量等)視為Y,把時間視為X,把待預(yù)測指標(biāo)隨著時間發(fā)展而變化的公式計算出來(形如y=ax+b,不過具體形式會更復(fù)雜)。

直觀地看,兩種思路需要的數(shù)據(jù)格式如下:

圖片圖片

顯然,在僅有一行數(shù)據(jù)的情況下,因果關(guān)系預(yù)測很難實(shí)現(xiàn)。并且一般這種只丟一行數(shù)據(jù)讓預(yù)測的公司,一般數(shù)據(jù)基建也很稀爛,最多給個業(yè)績=訂單數(shù)*客單價,很少記錄影響用戶購買的原因。綜上,在只有一列數(shù)的情況下,用時間序列法比較省事。

二、建模準(zhǔn)備

時間序列法有3種基礎(chǔ)形態(tài)(如下圖所示):

圖片圖片

根據(jù)不同的形態(tài),可以選擇不同的方法。因此在建模的時候,要先觀察數(shù)據(jù)形態(tài)。比如開頭的例子,顯然同時有季節(jié)性+趨勢性(如下圖所示),因此可以用帶趨勢的季節(jié)回歸來做。

圖片圖片

三、建模過程

第一步:分別把代表趨勢的自變量(t),代表季節(jié)的自變量Q1、Q2、Q3構(gòu)造出來(如下圖)因變量(Y)就是銷售額。

圖片圖片

第二步:利用回歸模型,計算相關(guān)參數(shù),這里直接用Excel的回歸分析功能做。

圖片圖片

第三步:觀察結(jié)果,寫出預(yù)測模型的公式。

圖片圖片

第四步:代入下一年度的參數(shù),得出預(yù)測數(shù)值。

圖片圖片

這樣就做完啦!如果領(lǐng)導(dǎo)想看,可以從回歸分析的源頭講起,R平方的計算公式,參數(shù)估計原理,F(xiàn)檢驗(yàn)與t檢驗(yàn)。非數(shù)據(jù)出身的領(lǐng)導(dǎo)們一聽這么多專業(yè)名詞,對模型的幻想得到了一定程度的滿足,也就能交差了。

四、模型擴(kuò)展

Excel的回歸分析默認(rèn)是線性回歸。但有可能X與Y之間不是線性關(guān)系,比如公司業(yè)務(wù)在高速增長階段,隨著時間發(fā)展,業(yè)績越來越好,此時可能是多項(xiàng)式 or 對數(shù)關(guān)系。

因此在建模以前,可以先做散點(diǎn)圖,檢查下數(shù)據(jù)之間的關(guān)系。有趣的是,excel在添加趨勢線的時候,可以直接選擇擬合曲線,因此想偷懶的同學(xué),完全可以直接如下圖操作。

圖片圖片

不過要注意的是:R平方并不是唯一判斷標(biāo)準(zhǔn),在擬合完走勢后,還得關(guān)注:

1、是否擬合走勢與原數(shù)據(jù)走勢明顯不相符

2、是否擬合走勢某些點(diǎn)不合業(yè)務(wù)邏輯

3、是否擬合走勢近期誤差過大

要先做排除法,剔除這些明顯有問題的。

圖片圖片

如果剔除過后,依然有多個模型符合條件,可以計算每個模型擬合數(shù)據(jù) VS 實(shí)際數(shù)據(jù)的均方差(MSE:Mean Squared Error),選一個均方差較小的模型來用。

圖片圖片

當(dāng)然,時間序列法還有平滑法以及平滑法的各種變體(holter & winter模型),還有ARIMA、LSTM等模型可用,等以后有機(jī)會再一一介紹。

小結(jié)

本質(zhì)上看,時間序列法就是模擬過去的走勢,然后按過去的走勢推演。這種做法和我們用肉眼觀察數(shù)據(jù)走勢,拍腦袋拍個數(shù)值沒有思路上的區(qū)別,僅僅是用公式替代了肉眼觀察,增加了精確度而已。

不過,話說回來,做預(yù)測,本身就是“長袖善舞,多錢善賈”,數(shù)據(jù)越豐富,預(yù)測準(zhǔn)確可能性越大。數(shù)據(jù)貧瘠,那也只能這樣將就下。

責(zé)任編輯:武曉燕 來源: 接地氣的陳老師
相關(guān)推薦

2022-10-12 07:24:18

大文件哈希算法Hash

2023-12-27 14:03:48

2025-03-31 08:50:00

模型量化神經(jīng)網(wǎng)絡(luò)AI

2020-05-15 16:37:13

PowerBI數(shù)據(jù)分析

2024-09-04 16:19:06

語言模型統(tǒng)計語言模型

2024-11-05 14:00:56

2025-03-12 02:00:00

經(jīng)營分析模型策略

2024-01-12 07:14:52

AI應(yīng)用架構(gòu)

2022-07-26 00:00:03

語言模型人工智能

2022-03-24 08:51:48

Redis互聯(lián)網(wǎng)NoSQL

2019-09-12 09:56:33

TCPUDPHTTP

2024-04-12 12:19:08

語言模型AI

2025-03-06 07:28:31

DeepSeek大模型人工智能

2025-05-20 11:55:22

人工智能Vision RAGLLM

2025-03-26 10:57:40

PyTorchGGUF

2023-04-26 13:48:36

2025-05-30 01:00:00

RAG大模型流程

2022-07-03 08:25:09

OSITCP/IP

2025-04-07 08:40:00

開源Llama 4大模型

2022-06-08 08:11:56

威脅建模網(wǎng)絡(luò)安全網(wǎng)絡(luò)攻擊
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产精品区二区三区日本 | 国产在线精品一区二区三区 | 亚洲视频免费 | 欧美日韩综合精品 | 羞羞视频在线观看网站 | 人人艹人人爽 | 久久亚洲视频网 | 91亚洲一区 | 欧美精品一区二区三区在线播放 | 亚洲综合在线一区二区 | 精品视频一区二区三区 | 久久99国产精一区二区三区 | 精品一区二区三区电影 | 欧美一级欧美三级在线观看 | 久久国产精品一区二区三区 | 亚洲精品视频在线观看视频 | 国产a区| h视频在线播放 | 超碰最新在线 | 国产成人精品一区二区三区 | 欧美日韩国产一区二区三区 | 日韩一区二区三区在线观看视频 | 欧美激情精品久久久久久变态 | 国内精品视频免费观看 | 国产精品亚洲视频 | 成人欧美一区二区三区黑人孕妇 | 911精品美国片911久久久 | 天天综合91 | 中国av在线免费观看 | 久久久久网站 | 国产成年人小视频 | www狠狠爱com | 一区二区三区四区不卡视频 | 不卡一区| 羞羞视频网 | 玩丰满女领导对白露脸hd | 天天拍天天操 | 亚洲人成人一区二区在线观看 | 91免费在线看 | 日韩中文字幕一区二区 | www国产亚洲精品 |