阿里iDST團隊三篇論文入選ACM MM
在近日召開的ACM Multimedia 2017會議上,來自阿里巴巴iDST(Institute of Data Science and Technologies)團隊的三篇關于“城市大腦”的論文入選其中,三位論文作者受邀赴峰會做報告。
ACM MM是全球多媒體領域的頂級會議,屬中國計算機學會(CCF)指定的A類國際會議。今年受邀赴美作口頭報告的論文作者占比僅為7.5%,ACM MM組委會在郵件中稱整個論文評選過程為“艱難激烈的”。此次阿里巴巴入選的三篇論文涉及的交通事故、人流軌跡、交通數據樣本等技術問題均來自“城市大腦”實際應用場景。
早在2016年阿里巴巴就推出了人工智能“ET城市大腦”,通過為城市安裝人工智能樞紐,以攝像頭為核心進行數據采集與計算,對整個城市進行全局實時分析,自動調配公共資源,修正城市運行中的Bug。
“城市大腦”成功落地杭州、蘇州等地,整個項目團隊解決了大量難題,并在2017杭州云棲大會上交出了一份漂亮答卷:經過一年測試,“城市大腦”成功接管了杭州128個信號燈路口,試點區域通行時間減少15.3%,高架道路出行時間節省4.6分鐘。此外,在主城區城市大腦對交通事件進行智能報警,日均事件報警數達500次以上,準確率達92%,大大提高了執法指向性,在蕭山區,120救護車到達現場時間縮短一半。
會議現場,iDST團隊的申晨、趙一儒對《時空自編碼器的視頻異常檢測模型》、《基于多層相似度感知的深度神經網絡及其在同人鑒別中的應用》兩篇論文進行了口述報告。
(ACM MM參會人員在阿里展位觀看城市大腦演示內容)
在阿里巴巴展區,技術人員向來自北美、亞洲、歐洲等區域的參會者介紹了阿里巴巴杭州“城市大腦”技術方案,在現場演示了DEMO內容。
來自美國 University of California, Irvine的Ramesh Jain教授(多媒體領域著名資深領軍人物),瑞士Idiap和EPFL的Daniel Gatica-Perez(多媒體領域知名專家),澳大利亞墨爾本La Trobe University大學的Phoebe Chen教授(Chair of Department of Computer Science and Information Technology),以及新加坡國立大學、清華大學、北京大學、浙江大學等國內外大學知名教授紛紛參觀了展臺,并對阿里巴巴“城市大腦”方案進行了高度點評,他們認為“城市大腦”的確是人工智能的超級應用和創新平臺,城市大腦方案真切地反映出阿里巴巴在人工智能技術領域的深厚實力,尤其通過技術推動城市管理與商業發展,為市場拓寬了技術發展思路。同時表達了和“城市大腦”項目合作的意向。
(浙江大學莊越挺教授<左三>在阿里展區觀看城市大腦演示DEMO)
(Ramesh Jain教授<右一> 和華先勝博士討論城市大腦)
(Daniel<中>和華先勝博士交流)
“城市大腦”人工智能技術負責人、阿里巴巴 Distinguished Engineer及iDST副院長華先勝表示,“城市大腦”包含多項人工智能技術,如視覺認知、優化決策、視覺搜索、預測、大規模實時視頻處理系統等?!俺鞘写竽X”的應用場景也是許多技術研究的起點,研究成果都將保證“城市大腦”的真實落地。同樣在這次會議組織的LSVC(Large-Scale Video Classification Challenge)大規模視頻分類比賽上,阿里巴巴iDST視頻技術團隊憑借平均準確率87.41%創造本年度最佳成績并奪得冠軍。
除“城市大腦”外,阿里巴巴的人工智能“ET大腦”還落地了“工業大腦”、“”醫療大腦、“環境大腦”等多個領域。正是因為有了阿里巴巴領先的人工智能技術,才會有如今不斷演進的“ET大腦”。在未來,阿里巴巴也將不斷精進在人工智能領域的技術研究,推進人工智能在多個領域的成熟落地,以技術提升效率改善生活。
以下為本次ACM MM峰會入選論文介紹:
Spatio-Temporal Auto Encoder for Video Anomaly Detection
時空自編碼器的視頻異常檢測模型
Yiru Zhao (Shanghai Jiao Tong University & Alibaba Group)
趙一儒
Bing Deng (Alibaba Group)
鄧兵
Chen Shen (Zhejiang University & Alibaba Group)
申晨
Yao Liu (Alibaba Group)
劉垚
Hongtao Lu (Shanghai Jiao Tong University)
盧宏濤
Xian-Sheng Hua (Alibaba Group)
華先勝
論文摘要:
為城市大腦提供監控交通異常的方法。受動作識別等領域的最新研究成果啟發,設計了一種時空自編碼進行視頻異常檢測,同時提出一種權重遞減的預測誤差計算方法。經真實的交通場景評測,該算法在重要指標上已經超過了此前的最好方法。
Deep Siamese Network with Multi-level Similarity Perception for Person Re-identification
基于多層相似度感知的深度神經網絡及其在同人鑒別中的應用
Chen Shen (Zhejiang University & Alibaba Group)
申晨
Zhongming Jin (Alibaba Group)
金仲明
Yiru Zhao (Shanghai Jiao Tong University & Alibaba Group)
趙一儒
Zhihang Fu (Alibaba Group)
付志航
Rongxin Jiang (Zhejiang University)
蔣榮欣
Yaowu Chen (Zhejiang University)
陳耀武
Xian-Sheng Hua (Alibaba Group)
華先勝
論文摘要:
為人流軌跡的識別判斷提供技術支持。結合深度學習的Siamese網絡和分類網絡模型優勢,同時將相似度擴展到其他層次。與經典的大規模同人鑒別公開數據集對比,目前檢索精確度的最優結果已達業內最高水平。
Stylized Adversarial Autoencoder for Image Generation
基于風格化對抗自編碼器的圖像生成算法
Yiru Zhao (Shanghai Jiao Tong University & Alibaba Group)
趙一儒
Bing Deng (Alibaba Group)
鄧兵
Jianqiang Huang (Alibaba Group)
黃建強
Hongtao Lu (Shanghai Jiao Tong University)
盧宏濤
Xian-Sheng Hua (Alibaba Group)
華先勝
論文摘要:
解決城市大腦交通視頻數據樣本不足的問題。受條件對抗生成網絡和風格遷移學習的啟發,采用內容提取網絡和風格提取網絡分別從內容圖片和風格圖片中提取特征,將兩者融合后,通過圖片生成網絡獲得融合相應內容和風格的圖片。