成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

時間圖:長時間內離散事件的可視化

大數據
在我們的日常生活中離散事件無處不在。比如通話記錄、網上交易和心跳數據。盡管離散事件的數據比較單一,但是在保留細節信息的前提下,對長時間內的離散事件進行可視化處理還是挺困難的。

數據可視化

在我們的日常生活中離散事件無處不在。比如通話記錄、網上交易和心跳數據。盡管離散事件的數據比較單一,但是在保留細節信息的前提下,對長時間內的離散事件進行可視化處理還是挺困難的。

下圖闡明了這個問題。該圖描述了七個月內某一IP地址的網站訪問量。它是利用離散事件數據所繪制的。其中每個直方柱的高度代表每個時間點上事件發生的次數。

數據可視化

當此圖涵蓋了所有事件的信息時,每個時間點上的細節信息則完全被忽略。人們總是可以對條形圖進行一定比例的放大后再次繪圖,但是問題就來了–我們應該選擇多大的縮放比例呢?我們應該考察哪個時間段的信息呢?比如,如果我們想放大到間隔為一天的水平,那么我們大致需要觀察210天的信息。而且在不同的縮放級別中尋找匹配值和異常值是非常耗費時間的。

在這篇博客中,我將會介紹如何在一張圖中對長時間內離散事件的數據進行可視化處理的方法。不管面對的是毫秒級還是月度數據,它都允許讀者從圖中快速地識別出關鍵信息。該方法出自于混沌系統領域,它起先是用于研究滴水時間的問題。這個可視化方法擁有許多不同的名字:延遲映射圖、復原時間圖和時間-時間圖。為了簡潔起見,我把它稱為“時間圖”。盡管人們早就利用時間圖對混沌系統進行可視化處理,但它還沒被應用到信息科學領域中。我將會展示時間圖是如何提供關于推特賬號行為和網絡機器人程序活動的寶貴信息。

這篇博客雖然篇幅短,但是包含了幾個略微不同的案例。這篇文章已經被 2015 年 IEEE 大數據會議所接收。本文結尾部分附帶了如何制作時間圖的 Python 代碼。

制作時間圖非常簡單。首先,想象時間軸上一系列用點表示的事件。每個事件之間的時間間隔用標簽 t1 ,t2 ,t3 ,t4 ,…所表示。

數據可視化

時間圖可以簡單看成二維散點圖,其中事件的坐標分別為(t1, t2),(t2, t3),(t3, t4)等。在時間圖上,紫色點事件將被畫在圖中所示的位置。

數據可視化

換句話說,散點圖中的每個點都代表一個事件。其中橫坐標表示這個事件和前續事件之間的時間間隔,縱坐標表示與后續事件之間的時間間隔。因此時間圖中無法表示第一個事件和最后一個事件。

下圖是兩個簡單的例子:

數據可視化

等間距事件序列(A)的時間圖中只有一個有效點,因為所有事件的坐標完全相同。序列 B中除了一個事件略有延遲以外,它與序列 A 是一樣的。由此產生的時間圖包含四個有效點,這使得讀者可以更直觀地觀察事件的變化。除非選擇很小的直方柱,否則這兩個序列隨時間變化的直方圖將是完全相同的。

為了得到更直觀的時間圖,我們考慮一個分為四個象限的啟發式圖:

數據可視化

每個象限中是一張沿著時間軸的事件序列圖。其中右上角和左下角象限中包含的是等間距事件,因此這兩個象限中的事件是“穩定的”。又因為左下角象限中事件之間的時間間隔較小,我們稱它為“快而穩”事件,并稱右上角象限中的事件為“慢而穩”事件。對于右下角象限而言,一個事件發生之后,需要較長的等待時間然后兩個事件再接連發生,因此我們稱之為“加速”事件。左上角象限的事件則剛好相反,此象限中的事件為“慢化”事件。查看時間圖有點像閱讀新城市的地圖。即使起初的時候不熟悉,最終你還是會得心應手。

因為時間圖只繪制事件之間的時間間隔,所以它解決了長時間維度的問題。為了防止時間間隔的數量級太大,我們以對數刻度繪制坐標軸。這允許讀者可以在一張圖中看到小至毫秒大至月份的不同時間尺度展示。讓我們來看一些真實世界的案例吧!

@白宮 推文

推特的 API 允許人們收集用戶最近發送的 3200 條推文。利用 Twython,我下載了 @白宮 (這個賬號由總統的員工所管理) 的推文。下圖是 2015 年 1 月到 9 月之間 @白宮 推文的時間圖:

數據可視化

每條推文都用基于時間的顏色編碼,而且時間軸已經經過對數化處理。按照推文結果,圖中的兩個聚類群對應于工作日的開始和結束。每天的第一條推文通常發生在早上九點和中午之間。而最后一條推文的發生時間則比較廣泛。

有趣的是,上圖中存在兩個代表不同行為模式的聚類群。我將聚類群一命名為“日常事務”,其中人們大約一小時發送一條推特。位于圖中左下角區域的推文具有頻率高的特點,我們稱之為“重要事件”。

由于時間圖中很難計算出每個聚類群中包含多少樣本點,而“熱感時間圖”可以用紅色來表示密度較高的點。

數據可視化

在熱感時間圖中,我們可以觀測到孤立的樣本點。額外的好處是我們還可以看到樣本點的聚集情況。從上圖可以看出,“日常事務”聚類群中的推文數量最多,這從側面驗證了我們稱其為日常事務的合理性。

#p#

個人賬戶的推文情況

@白宮 是由公關人員管理的推特賬號。那么個人推特賬號的情況是啥樣的呢?尼古拉斯·菲爾頓是一名從事信息可視化的平面設計師。他的工作包括年度報告,該報告利用他生活中的數據繪制平面圖形。下圖是關于他推文的熱感時間圖:

數據可視化

該圖中沒有像 @白宮 所展示出來的明顯聚類情況。與公共賬號不同,個人賬號的推文通常沒有一個嚴格的時間表。然而,時間圖仍然捕捉到了總體的趨勢情況。大量的樣本點落在“慢而穩”事件的區域中,而且這些推文差不多每天發送一次。

網絡機器人

網絡機器人是在網頁上執行自動運行任務的計算機程序。當用戶點擊特定的鏈接時,機器人在無意中被安裝到數以百萬計的個人電腦中。當你讀這句話的時候,機器人甚至可以操控你的電腦!我分析了一個來自提供網站監控服務公司的數據。于是,我得到了博客開頭所展示的那張圖:

數據可視化

這幅圖展示了來自一個特定 IP 地址的網站訪問量(這里提到的 IP 地址不同于我的論文中說所提到的 IP )。盡管直方圖確實包含了整體行為的重要信息,但讓我們來看看時間圖所展示的信息:

數據可視化

上述的直方圖無法展現出這些活動模式的信息。通過繪制時間圖,一些重要信息馬上顯現出來:一大塊“快而穩”事件點,兩個條形區域點分別代表“加速”和“慢化”事件,而且在這兩個區域上面還存在一些稀疏的點。

右下角和左上角區域的稀疏點代表在高頻率活動事件之間的長休眠期中所發生的事件。這和直方圖中的長間隙結果一致。條形區域中的事件發生在兩次高頻率活動爆發期之間的八分鐘間歇期。高頻率爆發期如左下角的大塊區域所示,這表示網站被接二連三地訪問。爆發期是否存在可以通過檢查極度放大的直方圖來證實:

數據可視化

正如我們所料,確實存在相隔大約為八分鐘的爆發期。盡管放大后的直方圖所涵蓋的信息與時間圖一致,但是誰會想到把直方圖放大到這個水平呢?!時間圖可以立即顯現出機器人定期的高頻行為,而且和直方圖不同的是,時間圖不需要進行放大處理。

利用 Python 繪制時間圖

下面是繪制時間圖的一個簡單 Python 程序。它是基于隨機生成的數據來繪圖的。

數據可視化

現在讓我們來繪制熱感時間圖吧。它利用上述代碼來構建程序。總的來說,我們需要構建一個用來計算時間圖中每個網格內所發生事件數的二維直方圖。直方圖被當成圖像來對待,然后我們將高斯模糊方法(Gaussian blur)應用到圖像中,這可以對突變事件進行平滑處理。

數據可視化

下載推文和繪制時間圖的 Python 文件可以在我的 github 界面中找到。

結論

我上面提到了用來演示時間圖勘探價值的三個例子。在所有的例子中,時間圖可以立即展現出潛在的信息,而直方圖卻需要更多的時間來挖掘這些信息。盡管如此,時間圖確實無法替代其他的時間可視化工具,它們之間是互補關系。最好的視覺探索工具同時需要時間圖和其他圖形。例如,時間圖和直方圖都展現了數據的重要信息,它們應該相互配合使用。

畢加索畫圖的時候通過將多重視角下的信息綜合到同一張圖中以獲取物品的完全信息。相似地,時間圖在一張圖中從多個時間角度提取數據集的信息。鑒于其具有容易實現和發現隱藏信息的能力,在我們這個數據驅動的社會中時間圖應該成為一個非常寶貴的工具。

責任編輯:李英杰 來源: 數據工匠
相關推薦

2010-01-19 18:18:21

C++語言

2010-02-05 14:40:14

Android開源系統

2010-03-03 17:19:48

Android

2010-02-24 13:56:27

Python編程語言

2019-08-06 10:35:25

Python時間序列可視化

2010-03-19 10:46:34

交換技術

2015-01-08 14:04:49

電信CDMA

2010-03-17 13:07:47

交換機故障

2010-03-16 10:32:23

配置交換機

2014-06-24 14:44:59

2020-03-11 14:39:26

數據可視化地圖可視化地理信息

2009-11-25 15:31:40

VS2003 SDK

2025-04-28 02:22:00

2021-07-02 14:07:00

可視化Plotly漏斗圖

2023-03-27 23:42:29

樹狀圖開發可視化

2022-08-18 11:36:16

可視化JavaScript事件循環

2015-08-26 13:49:06

可視化

2015-11-06 14:04:54

數據可視化信息圖

2009-11-25 13:22:49

VS2003代碼

2022-03-17 14:36:20

后門網絡安全
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产在线观看一区二区三区 | 欧美日韩亚洲国产 | 自拍偷拍av | 欧美精品一区二区免费视频 | 日韩av第一页 | 欧美视频 亚洲视频 | 成人在线亚洲 | 男女网站免费观看 | 最新国产在线 | 在线观看日韩 | 国产美女一区二区 | 精品99久久久久久 | 亚洲精品二区 | 久久精品久久久 | 午夜精品久久久久久久久久久久 | 99精品久久 | 久久精品一区二区三区四区 | 国产一级片在线观看视频 | 羞羞网站免费观看 | 国产精品一区久久久 | 亚洲一区播放 | 午夜电影日韩 | 中文字幕精 | 国产黄色在线观看 | 一级做a爰片性色毛片16美国 | 欧美毛片免费观看 | 成人av观看 | 成人美女免费网站视频 | 手机看片1| 欧美一级片在线看 | 亚洲视频一区在线观看 | 一级毛片在线播放 | 国产第一页在线观看 | 四虎精品在线 | 国产精品综合色区在线观看 | 久久久久国产一区二区三区四区 | 狠狠av| 91久久| 久久精品国产一区二区三区 | 亚洲精品一区二区三区在线观看 | 毛片免费看 |