運籌學領域頂級獎項瓦格納杰出實踐獎揭幕 滴滴成首個獲獎中國公司
美國時間10月20-23日,2019年運籌學和管理科學研究協會年會(2019 INFORMS Annual Meeting)在西雅圖召開,會上滴滴憑借基于強化學習的網約車派單解決方案獲國際運籌學領域的頂級實踐獎項--2019年度瓦格納運籌學杰出實踐獎(Daniel H. Wagner Prize)。這也是瓦格納運籌學杰出實踐獎創建22年以來,中國公司第一次被授予該獎項。
(滴滴AI Labs團隊提出的基于強化學習的網約車派單解決方案在入圍項目中脫穎而出,獲得2019年度Daniel H. Wagner獎)
INFORMS是全世界公認的運籌學 (OR)、管理科學 (MS) 和商業分析領域最具影響力的專業學會,每年年會及年會上頒發的瓦格納運籌學杰出實踐獎都備受關注。瓦格納獎設立于1998年,作為國際運籌學領域的頂級實踐獎項之一,其每年評選一次,旨在向全球表彰運籌學研究實踐方面的杰出成果,看重分析的質量和連貫性,解決方案的獨創性和數學應用,以及成功的實踐,每年獲獎項目也被認為是代表了運籌學領域內的最前沿應用。往屆獲獎項目來自康奈爾大學、佐治亞理工學院、美國疾病控制與預防中心、福特汽車、麻省理工學院、杜克大學、智利大學、美國海岸警衛隊、英特爾、IBM和普林斯頓大學等。
今年INFORMS2019共吸引了全球6000余位知名學者、行業專家和學生積極參與。而瓦格納獎評審委員會對來自全球的眾多申請項目進行了篩選,最終僅有五項獲得決賽提名,相關論文均收錄于INFORMS Journal on Applied Analytics期刊。經過在INFORMS2019大會上的決賽輪答辯,滴滴AI Labs團隊提出的基于強化學習的網約車派單解決方案,憑借其創新性和實踐影響力,得到由學術和工業界組成的評審委員會一致認可,最終從入圍項目中脫穎而出,獲得2019年度瓦格納運籌學杰出實踐獎。
滴滴AI Labs對網約車派單問題進行半馬可夫過程建模,提出基于強化學習的泛化決策迭代框架,創新有效的結合了深度強化學習,時間差學習和傳統組合優化方法,在確保乘客出行體驗的同時進一步提升司機的收入,體現了廣泛的應用能力和影響力。
評審委員會指出,滴滴解決方案中的半馬可夫過程和深度強化學習方法非常前沿,首次成功應用在派單場景。通過將數學、機器學習及仿真問題進行了創新性結合,滴滴非常新穎地應對了一個運籌學難題。
(在滴滴AI Labs強化學習團隊負責人秦志偉看來,滴滴運用前沿AI技術結合傳統優化來解決運籌學難題,是獲得評委會青睞的關鍵)
本次瓦格納獎評審委員會由IBM、馬里蘭大學、谷歌、微軟、美國海軍研究所等的研究人員和教授組成。其他決賽入圍團隊分則別來自于倫敦大學學院、哈佛大學、佐治亞理工學院、哥倫比亞大學等世界頂級高校,項目包括利用實時數據分析優化倫敦希斯羅機場的運營、Hopeful Journey教育中心的天級補習排班支持、系統優化丹佛公立學校校車運營、可輪轉備件的定價分析等。
(INFORMS 2019現場展示2019年Daniel H. Wagner Prize決賽入圍名單,滴滴憑借提出的基于強化學習的網約車派單解決方案最終脫穎而出獲得第一名)