成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟亞洲研究院鄭宇:用人工智能進行城市人流預測

開發 開發工具
在鄭宇看來,從技術層面講,此前還沒有真正意義上為時空數據設計的深度學習算法,而未來這個方向的研究還會有更深遠的發展。這個發展不是簡單的拿來 CNN、RNN 就用,一定是基于對時空數據深刻的理解,充分利用時空數據本身的特性。

在貴陽「塊數據」實驗室的一塊大屏幕上,每一分每一秒都在進入新的數據,不停地預測每個區域有多少輛出租車進和出,這是微軟亞洲研究院一個基于云計算和大數據的系統正實時運轉,貴陽出租車的數據實時上傳作為測試樣本,驗證模型的準確性和有效性。每點一個格子會跳出一個圖表,都能清楚知道整個城市某區域人群流動接下來十幾個小時會呈現什么狀態,黑色的是已經發生過的出租車進出情況,綠色預測未來部分,藍色是昨天同一時間的情況。而同樣,任何人流預測數據來源,比如手機信號、地鐵刷卡記錄等,都可以通過該系統模型進行運算得到某地將有多少人進和出的結果,并預測到未來十幾個小時的城市人流情況。

[[183032]]

「這個系統背后的模型研究,其目標是預測整個城市里每個區域在未來時刻有多少人進、有多少人出,從而使得管理者能迅速了解每個區域的公共安全狀況,及時采取預警措施。」微軟亞洲研究院主管研究員鄭宇說,直接促使他下決心開展研究的是,2014 年新年夜那場發生在上海的踩踏事件,當時,鄭宇曾在微博上呼吁通過基于手機數據的城市異常檢測來避免踩踏悲劇。「如果在上海市踩踏事件之前,我們應用了這樣的系統,就可以提前給民眾發信息,告知他們這里會有多少人進來,提醒注意是否需要提前離開。」鄭宇說。

目前,該研究論文《Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction》已經發表在 AAAI 2017,在鄭宇看來,除了具有推廣應用的社會價值,從技術層面講,「此前還沒有真正意義上為時空數據設計的深度學習算法,這是***篇論述文章,而未來這個方向的研究還會有更深遠的發展。這個發展不是簡單的拿來 CNN、RNN 就用,一定是基于對時空數據深刻的理解,充分利用時空數據本身的特性。」在北京,鄭宇向《機器之心》解讀了這篇論文的研究方法、過程以及正在積極推進的應用方向。

「傳統的深度學習方法不能直接拿來用」

以往提及人流預測,通常會采取預測個人行為的方法,理想狀態下,只要統計某個區域每個人去哪里就能測算出該區域有多少人進、多少人出。但這樣的統計本身有很大的障礙,準確性很難保證,并且涉及隱私。除此之外,傳統方法還有一些基于物理學模型、動力學模型或是土木工程的經典模型等,但這些始終難以應對大規模的人流預測。

我們這套方法首先不涉及隱私,只要進和出的數據并不需要知道哪個人進和出,然后把整個城市,比如北京劃分成兩千個格子同時預測,并不是一個個進行,它是一種整體性的預測。整體性預測的必要性在于,區域和區域之間具有相關性,不能單獨預測,在預測 A 的時候,其實預測 B 和 C 區域同樣可能產生影響,反之亦然。因此,把深度學習引入進來進行整體預測,與使用傳統方法有很大區別。

但同樣,我們在研究過程中面臨很多困難。首先,會影響人流的因素非常多,與區域里前一個小時有多少人進和出,周邊區域甚至是很遠的地方有多少人進和出都有關系,比如上海的踩踏事件里,不少人是從外地搭乘高鐵、地鐵或通過高速公路前往,并不通過周圍區域就直接到達了外灘。還有很多外部因素,包括天氣、事件都會導致區域人流發生變化。更重要的是,在做預測時,人流具有時空屬性,即時間屬性和空間屬性,這種屬性很特別,它會導致其他傳統的深度學習方法不能直接拿來用到預測上。

人流作為一種時空屬性數據有特定的屬性。一個城市有很多區組成,一個區有很多街道和社區,天然有層次感,這是空間的差別,在時間維度上,相鄰兩個時間點之間,交通量和人流量是一個平滑變化的趨勢,但周期性有明顯的差別,車流量、人流量是有一個往復的周期性,今天早晨 8 點和昨天早晨 8 點的車流量和人流量趨勢看起來很類似,但今天早晨 8 點和今天中午 12 點的流量差別就會很大,雖然它們之間只隔了 4 個小時,而兩天早晨之間相隔了 24 小時,時間差更大卻更相似。這都是傳統視頻、圖像中不存在的特性,一般情況下,人不會看了五分鐘視頻又回去看第二分鐘的視頻,這種周期性是在時空數據也就是人流數據中特有的屬性,周期性也不是固定化的而是隨著時間的變化呈現趨勢性上揚或下降,比如,天越來越冷,天亮的時間越來越晚,人出門的時間也越來越晚,因此早高峰也會越來越晚,所以周期和趨勢加在一起,使得時空數據和以前的圖像、視頻等數據完全不同,以往使用的方法就會失效。

如果我們直接使用傳統 RNN,要考慮周期性和趨勢性,輸入的數據必須很長,如果只使用最近兩三個小時的數據,就無法體現周期性,也不可能體現趨勢性。要體現周期性至少需要 24 小時以上,而趨勢性甚至需要幾個月的數據,如果把 RNN 作為模型,這么長的數據作為輸入,那么 RNN 模型會變的非常大、非常復雜,***很難訓練,效果也不會好。我們也和 LSTM 做了比較發現,我們數據用的幀數更少,結果反而更好。

「我們設計出一個特殊的網絡模型」

我們在北京市的出租車 GPS 軌跡上面做了驗證,大概用了約 3 萬多輛出租車長達 5 年的數據,同時我們也利用紐約公開的自行車租賃數據做了驗證。一方面,我們通過政府合作項目來獲取開放給我們的數據,另一方面,我們也要好好利用公開數據。再將這些瑣碎的數據轉變成有規律的、能夠對深度學習作為輸入的格式,通過空間的劃分和折射,變成一個二維矩陣,使它能夠作為深度學習模型的輸入。這個轉換過程很重要,涉及到不同數據之間的多元化融合,這里需要一些時空數據經驗。

基于對時空數據深刻的理解,我們設計出一個特殊的網絡模型。在這個結構里,我們只需要抽取一些關鍵幀,比如說昨天同一時刻,前天同一時刻,其他時間我們可以不做輸入,大概只要用幾十幀的關鍵幀作為輸入,就可以體現出我們幾個月里所包含的周期性和趨勢性,使得我們的網絡結構大大簡化,但訓練的質量和效果卻大大提高,這是很關鍵的一點。

具體而言,我們把城市劃分成均勻且不相交的網格,比如劃分成一個個一平方公里的網格,然后輸入人流數據(包括手機、出租車軌跡等)投射在網格里面,計算出每個格子里有多少人進和出。紅色越亮的地方就表示人越多,一幀的圖像比如說是二維圖像,如果有很多時間點就可以持續生成圖片,同時我們有對應的事件和天氣信息,這就構成了數據的輸入,把時空數據轉換成這樣一個模式。

時空數據轉換成這樣一個模式

有了這樣的數據之后,再對時間特性進行模擬。我們把最近幾個小時、幾幀的數據,輸入到時空殘差網絡里面,模擬相鄰時刻變化的平滑過程,然后把對應時間點昨天、前天的數據輸入來模擬周期性,再把更遠的時間點對應的讀數拿進來,模擬一個趨勢性,分別模擬了三個時間屬性。這三個殘差網絡結構都是深度殘差網絡,然后做***次融合,再把外部事件、天氣等因素拿進來進行二次融合,得到一個結果。

接著,再進行空間屬性模擬。深度卷積神經網絡的過程就是把區域劃成格子之后,對相關區域進行卷積運算得到一個值,你可以認為,通過一次卷積之后把周圍區域人流的相關性抓住了,卷積多次后把更遠地方的區域屬性都卷積到一起,如果你想捕捉很遠的地方,意味著你的卷積網絡層次必須要比較深,只有一層抓不到很遠地方的相關性。之所以要這樣做,是因為之前有提到,很多人可能從外地很遠的地方通過高鐵或高速公路直接抵達,不會經過你所覆蓋到的周邊區域。

一旦網絡層次比較深,訓練會變得非常復雜,基于卷積神經網絡,我們引入了深度殘差網絡結構來做人流預測,用來幫助深度卷積網絡提高訓練精度,使用這種方法的靈感也來源于我們的前同事孫劍此前的研究。從目前的驗證結果來看,這項研究效果***的是 24 層,但這與不同應用和數據規模都有關系。

深度殘差網絡結構來做人流預測

此外,在融合相似性、周期性和趨勢性這三個模塊時,相比于直接的融合,我們提出的基于參數矩陣的融合方法考慮到了每個區域的時間特性的強度不同,因此取得了更好的結果。在最近的研究中,我們已經考慮了門限機制去調控,而非簡單的相加,很期待會有更好的實驗結果。而 XExt 這部分的輸入,已經做過歸一化或 one-hot coding,之后經過 FC(或加 embedding)后可以緩解「numerical scales」的問題。事實上,融合依然是一個富有挑戰性的難題,異構時空數據的融合仍值得深入研究。

接下來,對于這個模型本身,我們會繼續提升,現在只是做到了預測每個區域有多少人進和出,體現出不同區域之間的關系,下個階段,我們需要同時把每個區域的進和出以及區域和區域之間的進出轉移數量都算出來。

而深度學習在時空數據方面的應用,已經是我們組的重點研究方向。人工智能也有它的局限性,并不是像大家想象的那樣無所不能,目前看來,我認為利用深度學習來解決大規模物流調度問題的時機已經比較成熟,同時它也會對一系列調度問題產生影響,比如共享單車、外賣、快遞等等。

【本文是51CTO專欄機構機器之心的原創文章,微信公眾號“機器之心( id: almosthuman2014)”】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2023-12-01 13:54:00

訓練AI

2018-04-24 14:39:07

微軟航運人工智能

2009-04-21 14:36:44

微軟女性職場

2022-01-24 17:47:10

微軟AIOps智能運維

2019-05-14 10:33:35

人工智能教育部微軟

2009-02-17 11:52:44

2018-01-31 16:06:36

培生微軟人工智能

2018-09-17 11:00:05

AWS人工智能亞馬遜

2009-02-24 10:07:58

開發微軟蓋茨

2023-11-13 10:17:56

2023-06-06 11:22:23

2015-12-18 11:54:20

微軟亞洲研究院圖數據庫

2017-11-23 08:24:31

人工智能網頁設計

2021-06-25 09:47:06

KDD Cup Graphormer

2023-06-25 14:33:10

人工智能AI

2017-04-26 14:11:46

大數據人工智能零售

2016-09-28 01:05:14

工智能視頻分析漏洞

2013-02-26 10:41:29

微軟研究院數據挖掘奧斯卡
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 看一级毛片视频 | 国产精品入口久久 | 精区3d动漫一品二品精区 | 玖操| 91文字幕巨乱亚洲香蕉 | 最新免费av网站 | 国产色片在线 | 成人精品一区二区 | 91麻豆精品国产91久久久更新资源速度超快 | 自拍视频网站 | 国产美女精品 | 久久这里有精品 | 伊人爽 | 国产资源在线观看 | 波多野结衣中文字幕一区二区三区 | 色永久 | 成人精品一区二区三区中文字幕 | 久久日韩精品一区二区三区 | 狠狠操狠狠干 | 午夜码电影 | 免费黄色av网站 | 日韩欧美在线不卡 | 伊人久久精品一区二区三区 | 欧美一区二区三区久久精品视 | 黄色毛片免费看 | 欧美精品久久久久久久久久 | 久久久久久久综合色一本 | 欧美在线不卡 | 亚洲午夜网 | 羞羞羞视频 | 国产精品一区二区av | 久久精品网 | 日本一道本 | 操人网| 精品欧美一区二区三区久久久 | 久久久国| 91在线影院| 日韩不卡一区二区三区 | 欧美天堂| 国产高清在线精品 | 玖玖视频 |