阿里斬獲AI領域“奧斯卡”四項冠軍,AI可精準預測視頻目標位置
近日,全球計算機視覺頂會CVPR 2020公布了各大挑戰賽結果,阿里巴巴獲得四項比賽的世界冠軍,其中,在難度最高的DAVIS挑戰賽中,阿里提出了可以精準預測視頻目標位置的方法,并且首次以超過80分的成績奪得第一名。
CVPR是AI領域規模最大的會議,被譽為計算機視覺領域“奧斯卡”,其覆蓋范圍涵蓋計算機視覺領域的前瞻學術研究和工業應用,會議的研究成果體現了視覺AI領域研究的趨勢。由于視頻會議、直播等應用逐漸普及,今年頂級科技公司的研究成果逐步從圖像延伸到了視頻領域,涵蓋視頻壓縮、視頻分割、三維視覺等領域。
和圖像識別不同,AI分析理解視頻的技術門檻更高,長期以來,業界在視頻AI技術的研究上鮮有重大突破。以CVPR會議難度最高的比賽之一DAVIS( Densely Annotated Video Segmentation)為例,該比賽需要參賽團隊精準處理復雜視頻中物體快速運動、外觀變化、遮擋等信息,過去幾年,全球頂級科技在該比賽中的成績從未突破80分。
據介紹,阿里參加的四項比賽均為視頻技術領域。在DAVIS挑戰賽中,阿里率先實現了突破,以 84.1 的分數獲得了第一名,比去年的第一名提高了7.4分。
阿里AI以84.1分的成績獲得DAVIS比賽第一名
公開資料顯示,阿里提供了一種全新的空間約束方法,打破了傳統STM方法缺乏時序性的瓶頸,可以讓系統基于視頻前一幀畫面預測目標物體下一幀的位置;此外,阿里還引入了語義分割中的精細化分割微調模塊,大幅提高了分割的精細程度。最終,精準識別動態目標的輪廓邊界,并且與背景進行分離,實現像素級目標分割。
阿里AI可以基于視頻前一幀畫面精準預測目標物體下一幀的位置
業內人士普遍認為,視頻分割技術將成為線上會議、直播、自動駕駛、影視制作等場景的標配。例如直播場景使用阿里AI算法,可以實現一秒鐘替換背景;在自動駕駛中,視頻分割也是自動駕駛系統識別障礙物的關鍵技術。
據介紹,除了獲得四項比賽冠軍,阿里巴巴還有17篇論文入選CVPR 2020,其中涵蓋一篇自動駕駛領域的研究成果,該論文提出了一個通用、高性能的自動駕駛檢測器,首次實現 3D 物體檢測精度與速度的兼得,有效提升自動駕駛系統安全性能。
目前,阿里巴巴視覺AI技術已在全球率先實現大規模落地。例如,城市大腦、拍立淘、優酷視頻等阿里巴巴集團內部業務場景均已大規模使用該技術;阿里巴巴CT影像AI已經服務全球600多家醫療機構,疫情期間已完成50余萬例病例臨床診斷。