成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

除了計算大姨媽周期,時間序列分析還有什么用

企業(yè)動態(tài)
時間序列分析是一種廣泛應(yīng)用的數(shù)據(jù)處理統(tǒng)計方法,除了計算大姨媽周期,在實際很生活還有很多應(yīng)用,小白今天就來帶大家探探究竟。

[[183905]]

據(jù)說最貼心的男票是會記錄下女票每一次大姨媽來的時間,然后繪制成一張月份折線圖以監(jiān)測女票的身體健康(以避開無法啪啪啪的時間)。你知不知道,這張圖其實就是一個時間序列圖,你看圖預(yù)測未來幾個月女票的大姨媽時間就叫做時間序列分析……

咳咳,言歸正傳,時間序列分析是一種廣泛應(yīng)用的數(shù)據(jù)處理統(tǒng)計方法,除了計算大姨媽周期,在實際很生活還有很多應(yīng)用,小白今天就來帶大家探探究竟。

小白問:時間序列分析就是分析時間的么?

答:你是想問分析的是什么數(shù)據(jù)吧?簡單來說,時間序列數(shù)據(jù)是在特定時間內(nèi)監(jiān)測或記錄下的有序數(shù)據(jù)集合。太陽活動、潮汐、股票市場趨勢、疾病傳播等都是時間序列的典型案例。幾乎在任意應(yīng)用科學(xué)或工程學(xué)領(lǐng)域,只要涉及到基于時間的測量,都可以找到時間序列的聲影。科學(xué)的定義就是:在特定時間(例如,小時,月或年)內(nèi)記錄下的有序觀測值集合。

下圖為1720年至1980年的太陽活動圖,就是典型的時間序列:

1720年至1980年的太陽活動圖

小白問:哦,就是說在規(guī)律的時間間隔內(nèi)檢測到的有序數(shù)據(jù)集,那怎么來分析數(shù)據(jù)呢?

答:首先,時間序列分析的前提是認(rèn)為這些收集到的數(shù)據(jù)點(diǎn)在一段時間內(nèi)的變化可能具有特定的內(nèi)部結(jié)構(gòu),比如趨勢啦或季節(jié)變化啦等等。在此前提下,通過比較不同時間點(diǎn)上單個或多個時間序列的值,對時間序列數(shù)據(jù)進(jìn)行分析,進(jìn)而提取出有意義的統(tǒng)計量或其他數(shù)據(jù)特征。

小白問:分析完了怎么用吶?

時間系列模型

答:當(dāng)然就是來預(yù)測女票大姨媽啦。哦,口誤,當(dāng)然是利用時間系列模型,基于前期觀察到的序列規(guī)律來預(yù)測未來的數(shù)值啦。比如下圖,綠線就是預(yù)測值,周邊的灰色是置信區(qū)間:

小白問:什么信什么區(qū)間?

答:哈哈,我就知道你會問這個問題。舉個例子,你明天要考試數(shù)學(xué)了,你覺得大概能多少分? 估計70分吧,上下不超過10分。那你對這個預(yù)測有多大把握呢?9成吧!我們就說你明天數(shù)學(xué)考試成績90%的置信區(qū)間(Confidence Interval)為60~80,也就是你有90%的信心考出介于60~80的分?jǐn)?shù)。

小白問:好像懂些了。其實我真想做個時間序列分析,然后預(yù)測女票啥時候會生氣啊!

答:你還想預(yù)測女票啥時候會生氣?你咋不找個機(jī)器人做女票!時間序列預(yù)測的應(yīng)用可比這廣泛多了,比如金融市場分析、庫存控制、銷售與市場預(yù)測、產(chǎn)量預(yù)測、地震預(yù)測、工作量預(yù)測等等,舉例都舉不完。

小白問:不明覺厲!

答:呃,那我再給你說明白點(diǎn)兒。下面這張圖非常清楚地解釋了一般時間序列可以被分解成的三個部分。最上面的曲線是我們實際觀測到的點(diǎn),它是由下面三個曲線疊加而成的結(jié)果——趨勢性(第二條曲線),季節(jié)性(第三條曲線)和隨機(jī)性(第四條曲線)

一般時間序列可以被分解成的三個部分

時間序列分析的目的主要有兩個,一是要識別監(jiān)測到的數(shù)據(jù)所展現(xiàn)出的現(xiàn)象及其本質(zhì),就是找到規(guī)律,這個規(guī)律往往是趨勢性的或者有著較為明確的周期即季節(jié)性,因此就需要去掉一些不必要的噪音干擾(比如上面的的第四條曲線),并且把趨勢性和季節(jié)性分解出來,想圖示那樣;二是要利用這些數(shù)據(jù)來預(yù)測未來同樣時間軸上可能會出現(xiàn)的數(shù)值(統(tǒng)籌考慮三個分解部分)。

這兩個目的都要求我們識別時間序列數(shù)據(jù)內(nèi)在的模式并將其盡可能準(zhǔn)確地描述出來。因為事物發(fā)展的規(guī)律在長期內(nèi)相對穩(wěn)定(比如你女票的大姨媽來訪這樣的事件的發(fā)生),所以趨勢性和季節(jié)性這樣代表規(guī)律的因素,它們的數(shù)值變化也相對穩(wěn)定,在未來的一定時期內(nèi),還會像現(xiàn)在看到的這樣子變化,所以一旦我們了解了數(shù)據(jù)系列的模式,就可以解釋這些數(shù)據(jù)并結(jié)合其他數(shù)據(jù)來做預(yù)測(例如:季節(jié)性商品價格的變化和預(yù)測)。

不過小白你要記住,無論我們的理解有多深刻,對現(xiàn)象的解釋有多靠譜,時間序列預(yù)測的未來越久遠(yuǎn),準(zhǔn)確度會愈低。

小白問:一定一定。對了,時間序列分析不會出現(xiàn)很多異常的影響因素么?比如女票為了不影響游泳比賽,吃藥推遲了大姨媽時間,再按照曲線推測她后續(xù)的經(jīng)期,就會不準(zhǔn)了吧?

答:好問題,看來小白你已經(jīng)會舉一反三了。是的,通常收集到的時間序列數(shù)據(jù)中都會包含有一些隨機(jī)擾動因素的影響,我們把這些具有不確定性的因素導(dǎo)致的數(shù)量變化統(tǒng)稱為隨機(jī)變量,業(yè)內(nèi)常見的是通過“平滑數(shù)據(jù)”的方法來降低或消除隨機(jī)變量帶來的影響,“平滑”通常也被稱為過濾,目前主要有兩大類:平均法和指數(shù)平滑法。

小白問:指數(shù)平滑聽起來就是更快一點(diǎn)的平滑唄?

答:差不多是這個意思。

平均法就是取相鄰幾個數(shù)的平均數(shù),然后分析平均數(shù)而不是原始數(shù)據(jù)。舉一個簡單的例子,平均法中最常見的其中一種叫做“移動平均”(Moving Average),這個例子中,我們把前三個時間點(diǎn)的數(shù)值取平均數(shù),當(dāng)作第3個時間點(diǎn)的移動平均數(shù)8.667=(9+8+9)/3,第2,3,4個點(diǎn)數(shù)值的平均數(shù)作為第4個點(diǎn)的移動平均數(shù)…以此類推。

移動平均

指數(shù)平滑法稍微復(fù)雜一點(diǎn),但是也更受歡迎,很多時候也更準(zhǔn)確。平均法中,過去的歷史觀測點(diǎn)的權(quán)重是一樣的,而在指數(shù)平滑法里,越遙遠(yuǎn)的觀測點(diǎn)的權(quán)重呈指數(shù)倍減少,就是說越靠近的點(diǎn)給的權(quán)重越高。

移動平均里也有加權(quán)移動平均噢,加權(quán)是為了體現(xiàn)距離平均值對應(yīng)時點(diǎn)位置的遠(yuǎn)近,對平均值的不同影響程度,但是,移動平均只能考慮短期影響,對長期影響怎么辦呢?雖然離得越遠(yuǎn),影響越小,但是不能杜絕啊,科學(xué)的辦法來解決,就是指數(shù)平滑了,它是通過往期平滑值與當(dāng)期實際值的加總來體現(xiàn)平滑預(yù)測的理念,通過調(diào)整兩部分的權(quán)重來體現(xiàn)過去對現(xiàn)在的影響,乃至對未來的影響。

小白問:嗯嗯,那平滑之后,時間序列分析里面都用到哪些方法和技術(shù)建模啊?

答:其實時間序列的應(yīng)用可以說非常廣泛但又備受限制。記得上面我們提到時間序列數(shù)據(jù)被分解為三個部分嗎?其中大趨勢和季節(jié)效應(yīng)是相對容易建模的,而隨機(jī)變化是比較難預(yù)測的。常見的針對“普通數(shù)據(jù)”的統(tǒng)計模型(如響應(yīng)模型,提升模型等)中,趨勢和季節(jié)效應(yīng)可能都不存在時間序列分析就需要做更多的數(shù)據(jù)準(zhǔn)備工作。例如,與用于標(biāo)準(zhǔn)線性回歸的數(shù)據(jù)不同,時間序列的數(shù)據(jù)不一定是獨(dú)立的或呈現(xiàn)出相同分布。它的一個決定性特征就是數(shù)據(jù)的排序是有意義的。數(shù)據(jù)的排序與內(nèi)在含義有強(qiáng)依賴關(guān)系,更改順序可能會更改數(shù)據(jù)的意義。

用來建立時間序列數(shù)據(jù)的模型主要包括以下幾種:

  • ——Box-Jenkins ARIMA(Autoregressive Integrated Moving Average)模型
  • ——Box-Jenkins多變量模型
  • ——Holt-Winters指數(shù)平滑法(單,雙,三倍)
  • ——不可觀察成分模型(Unobserved Components Model)

通常使用者的偏好和需要應(yīng)用的場景會決定最終使用哪類技術(shù)。時間有限,這里肯定沒法給你介紹清楚所有的方法和技術(shù),日后真需要用的時候,就要你自己多做做功課,再多加探索了。

小白問:我簡單查了一下有關(guān)時間序列分析的資料,好多數(shù)學(xué)公式啊,這些模型有沒有現(xiàn)成的程序包?

答:哈哈,小白你真是個求知欲旺盛的好喵。R和Python都有的,推薦你一個鏈接,有Python的樣本程序,可以從基礎(chǔ)學(xué)習(xí)哦。https://bicorner.com/2015/11/16/time-series-analysis-using-ipython/

剛剛女票召喚我了,你自己去研究研究吧!

【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)文章,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】

      大數(shù)據(jù)文摘二維碼

戳這里,看該作者更多好文

責(zé)任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2013-08-12 16:29:05

2018-11-26 08:16:05

無線路由器WiFi網(wǎng)絡(luò)

2014-10-22 11:34:25

阿里百川無線開放計劃

2020-08-10 11:54:36

人工智能機(jī)器學(xué)習(xí)AI

2023-02-21 14:58:12

間序列周期數(shù)據(jù)集

2012-06-19 09:21:17

BYOD

2018-10-09 13:23:22

2018-01-24 05:08:24

2020-04-17 11:45:30

程序員技術(shù)創(chuàng)業(yè)

2022-12-02 08:48:16

CSS置灰網(wǎng)站

2014-05-19 16:03:38

姨媽假

2022-01-20 08:44:25

HashMap死循環(huán)開放性

2012-02-22 10:23:59

WAN優(yōu)化帶寬管理

2012-03-05 13:21:35

筆記本評測

2020-10-20 09:57:04

量子計算人工智能技術(shù)

2016-10-26 08:57:13

HadoopScrapy大數(shù)據(jù)

2020-06-17 07:56:19

前端存儲數(shù)據(jù)

2017-01-15 14:18:35

大數(shù)據(jù)HadoopScrapy

2021-08-30 08:40:02

網(wǎng)頁404HTTP

2024-01-25 10:23:22

對象存儲存儲數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 日韩区 | yiren22 亚洲综合 | 午夜激情在线 | 涩涩鲁亚洲精品一区二区 | 国产激情一区二区三区 | 毛片免费看 | 国产精品久久视频 | 国产一区二区观看 | 91精品久久久久久久久 | 国产婷婷色一区二区三区 | 7777在线视频免费播放 | 日韩在线免费电影 | 色婷婷精品 | 中文字幕日韩在线观看 | h视频免费在线观看 | 久久久噜噜噜久久中文字幕色伊伊 | 精品在线看| 国产69久久精品成人看动漫 | 国产高清无av久久 | 亚洲在线一区二区 | 国产1区2区 | 日韩高清成人 | aaaaaa大片免费看最大的 | 国产亚洲一区二区三区在线 | 欧美一区二区在线播放 | 日本电影一区二区 | 亚洲精品黄色 | 亚洲第一女人av | 欧美性生活网 | 欧美在线不卡 | 美国av毛片 | 欧美激情在线播放 | 337p日本欧洲亚洲大胆 | 欧美精品成人一区二区三区四区 | 99精品国产一区二区三区 | 欧美成人精品一区二区男人看 | 99在线免费视频 | 国产日产精品一区二区三区四区 | 国产一区电影 | 国产精品三级 | 最新中文字幕在线播放 |