基于時空算法研究的商業決策分析
常言道:”時空變幻莫測”。在自然界中,時空變化瞬息,常常難以捕捉其準確的規律。然而,時間與空間共同記錄了過去存在的屬性,通過它們我們可以發現事物存在的規律,從而預測未來的趨勢,以提前應對未來情形或把握未來時機。
隨著現代科學技術的發展,定位技術變得愈加普及。例如, GPRS 、位置傳感器等技術的普遍應用,使得采集與空間相關的數據變得非常容易。而采集到時空數據后,人們理所當然希望利用這些信息的價值,洞察其中的關鍵因素以獲取決策支持。那么,合適的數據分析方法就是提取有用價值的關鍵所在。
在現有的數據分析工具中,大多數模型僅考慮空間維度的作用,常用的時序模型也往往難以將同時發生在不同地點的信息關聯起來。如果勉強使用這些模型,得出的模型結論常常不準確,預測的結果更加無所適從。
因此,IBM SPSS 提供了結合時間與空間的數據分析模型( Spatio-Temporal Prediction ,簡稱 STP )。研發 STP 模型的初衷即是為了幫助人們解決涉及時空數據的商業難題。它可以應用于天氣與環境預測,智能交通解決方案,網絡應用與安全分析,建筑或空間的能量管理等等。通過使用 STP 進行建模和預測,能夠為管理者或者企業提供***的決策支持,以節省時間、成本和資源。本文主要闡述了時空分析算法的特點及其應用舉例,來幫助人們了解其使用方法和實際的價值意義。
STP 模型特征
首先,STP 模型同時支持二維和三維空間場景,如地理信息,三維空間坐標等。因此,STP 模型能夠被廣泛使用于各類時空應用。
其次,STP 模型僅憑有限的樣本點進行建模,就能夠預測空間中未來任意位置的目標信息,因此它具備強大的預測能力,能夠輻射到空間中任意點的信息。
***,STP 模型支持參數的假設分析。從而為用戶提供未來的決策支持,使他們能夠通過調整參數來適應預期目標,幫助用戶提前防范或消除未來的問題與負面影響。
圖 1. 時空模型應用示例
STP 數據特點
圖 2. STP 模型數據格式
STP 算法實例
下面通過兩個實例來講述 STP 算法是如何被應用并解決用戶問題的。
- Space dimension: 連續型變量, 同時支持二維和三維兩種空間維度;
- Time dimension: 連續型變量,時間維度在 STP 使用之前需要轉換為整數索引的形式。一般可使用 STEMDP 工具進行轉換,也可手動轉換;
- Predictors: 連續型或者離散型變量,對 Target 有影響的回歸參數。沒有指定參數時,必須包含常量系數;
- Target:連續型變量,模型創建與預測的目標參數。
圖 3. STP 模型數據要求
* STP 要求數據必須包含一組在固定的位置信息上采集的相同時間序列的數據。
STP 建模流程
圖 4. STP 簡要流程圖
Input Spatio-Temporal Data: 輸入原始采集的時空數據。
Spatio-Temporal Data Preprocessing(STEMDP): STEMDP 是 IBM SPSS 研發的轉換空間數據的工具。它能夠將.shp 文件轉換成空間坐標數據,并將時間格式轉換為時間索引。如果數據本身不需要經過 STEMDP 處理,此步驟可省略。
Spatio-Temporal Prediction(STP): STP 使用 STEMDP 轉換后的數據進行建模。建模過程中會對協方差矩陣的使用方法進行篩選。協方差矩陣可以應用參數化(variogram)或者非參數化(EOF)兩種方式表示。默認為參數化方式,若參數化方式不滿足條件,則應用非參數化方式。
Output STPXML & StatXML: STP 的建模結果被存儲在 STPXML 和 StatXML 兩種文件中。STPXML 中的模型信息被用于預測未來目標信息,StatXML 中內容被用于進行模型可視化的展示。其中,StatXML 還包含位置簇的信息。當空間維度是二維模型且非參數化方式被最終應用時,位置簇信息將被輸出。
STP 應用案例
數據中心溫控解決方案
從 2000 年至今,以互聯網為主的 IT 技術迅速發展,大量的數據中心被建設使用。據 Federal 能源管理體系總結的《美國數據中心能源消耗報告》顯示,僅以 2014 年為例,美國的數據中心電能消耗為 70 億千瓦時,大約占美國總電力消耗的 1.8%。從 2000 年至 2005 年,IT 業經過初步發展,數據中心電能的消耗超過了 90%的增長,從 2005 年至 2010 年,IT 業快速發展時期電能消耗驚人增長 24%,而從 2010 年至 2014 年,IT 業逐漸進入穩定時段,電能消耗增長為 24%,以后未來五年每年將以大約 4%的增速平穩增長。中國同樣經歷了 IT 業發展的幾個階段,數據中心建設一直保持著飛速發展,能源消耗也居高不下。
能源消耗占數據中心運營成本的大約 70%左右。因此在全球范圍內,關于如何降低數據中心電力消耗,提高能源利用率的問題迫在眉睫。
某一數據中心打算節省大量使用的電能成本。除卻硬件與設備升級以外,還需要更為精準的溫控與濕度管理,以高效的利用能源,節省成本并符合國家提倡的環保政策。
數據中心通過部署溫度傳感器和風速傳感器來采集一段時間空間中樣本位置的溫度和風量情況,然后使用 STP 算法進行建模預測來幫助提升能源使用效率。
圖 5. 在數據中心選取多個樣本點布置溫度傳感器和風速傳感器
1. 數據采集
圖 6. 來自于傳感器等設備采集的實時數據
STP 模型數據格式必須包含空間維度、時間維度、目標參數。輸入參數可選。以上表格為從數據中心采集到的數據,它們將被對應到 STP 模型的數據輸入中,用于模型創建。
空間維度是位置傳感器的坐標位置。其中 u,v,w 分別表示水平位置與高度。
時間維度表征數據采集的時間。在 STP 使用之前,需要將具體的時間轉換為時間索引,用戶可使用 STEMDP 工具進行轉換,也可手動進行轉換。
輸入參數中 x1、x2、x3 分別代表風速 、ACU 的作用以及高度 。 x4 和 x5 為其他可能影響的因素,但 STP 模型最終證明它們的影響非常弱,可忽略不計。
目標參數為樣本位置的實際監測溫度。
2. 數據建模
將以上數據作為輸入在 STP 中創建模型,如下圖所示。
圖 7. STP 數據輸入
圖 8. STP 模型結果
從以上結果可知,參數 x4 和 x5 的 significance 值均大于 0.05,說明它們對模型的貢獻較小,顯著性較差,因此在監測結果時可省略對這兩個數據的采集。
x1、x2、x3 均對模型貢獻顯著,因此主要對這三個參數進行搜集分析即可。
同時,MSE、R Square 等值表征該 STP 模型效果很好,誤差很小。
3. 模型預測
根據給定輸入參數,即風速、ACU 等值,對數據中心未來空間內溫度進行預測。橙色部分標注 STP 預測的未來時間的溫度相關信息。
$STP-y、$STPVAR-y、STPUCI-y 和$STPLCI-y 分別代表代表預測溫度、方差、預測上下區間。實際 STP 可以預測未來連續時刻的任意空間位置溫度。下面用散點熱圖表示該例中溫度的分布情況。
圖 9. 采集樣本位置的***時間點的溫度分布
圖 10. 預測下一時間點在不同高度層上的立體溫度分布效果圖
圖 11. 預測下一時間點在不同高度層上的平面溫度分布效果圖
圖 12. 預測下一時間點在整個空間內立體溫度分布效果圖
STP 具備 score anywhere 的特性。即通過有限位置的樣本點,便可以預測整個空間的溫度分布。從以上溫度效果圖可知,隨著高度增加,熱氣流往上上升,因此在高度 5.5 米時,造成熱量大量聚集,溫度過高,可以在該高度及以上范圍進行足夠的通風散熱與降溫。除此之外,在高度 4.5 米位置對應圖形的右上方局部溫度過高,因此考慮在此范圍內加強設備運行以使溫度下降。通過 STP 對整個空間溫度的預測,用戶可今早獲悉數據中心的整體溫度分布情況,從而避免局部溫度過高而造成設備的損壞與不可逆損失。
STP 還具備 what-if-analysis 的特性。用戶可以調整影響模型的可控參數來達到預期目標。調整風量與 ACU 后,STP 可以預計多久即可將溫度下降到合理范圍內。如下面一組圖所示同一高度層上調整參數后溫度的變化情況。
圖 13. 預測同一高度層上未來時間段溫度變化效果圖
STP 解決方案在數據機房中的應用不僅限于溫度預測,同時也可對濕度變化及與空間相關的任一因素進行分析預測。從而,數據中心的自動化管理將更為先進與優越,且更加有效、可靠的節省電能并減少人為干預。即使當前機房老舊、設備硬件來不及提升的情形下,也可為數據中心打造環保、智能的管理系統。
銀行選址決策支持方案
某銀行高管欲在某市建設新的銀行分支機構,通過一些普查與調研數據他能夠獲取到每個區域的家庭收入、以及區域內所有銀行現有的分支機構信息。通過這些信息,他考慮使用 SPSS 的 STP 模型來幫助其預測擁有潛在市場價值的地點。
他通過 STP 模型創建了兩個模型,一個模型用于預測每個區域的收入信息、另一個模型用于預測這些區域未來的銀行分支機構的數量。然后通過這兩種預測結果,得出該市所有區域的潛在市場的分布情況,從而迅速高效地幫助其完成市場分析,以支持決策方案的可行性。
圖 14. 預測未來銀行數量供給情況
圖 15. 預測未來居民收入情況
圖 16. 預測未來潛在市場分布情況
結束語 (the end)
如果你是一個上班族,你是否時常想如何減少交通擁堵?如何高效地利用公共自行車資源?如何快速地在高峰期打到合適價格的車?
如果你是一個經營者,你是否經常為市場選擇而躊躇不決?怎樣才能選擇一個商機***的地點而不至于錯誤的擴張帶來不可估量的損失?怎樣才能應用大數據分析幫助企業提升智能信息化的競爭力并降低成本?
STP 算法的應用將為你提供時空問題的***解決方案和預測支持。SPSS 同時提供各類廣泛應用于商業數據中的算法,最全面的幫助人們做好大數據的分析與商業決策。