成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

引入多感官數據學習,華人學者摘得2021 UT-Austin最佳博士論文獎

新聞
UT-Austin 本年度的最佳博士論文獎獲得者 Ruohan Gao,目前是斯坦福大學的博士后研究員。

 [[431686]]

在本年度的評選中,華人學者 Ruohan Gao 的博士學位論文《Look and Listen: From Semantic to Spatial Audio-Visual Perception》獲得了 Michael H. Granof 獎。

引入多感官數據學習,華人學者摘得2021 UT-Austin最佳博士論文獎

杰出博士論文獎設立于 1979 年,旨在表彰出色的研究以及鼓勵最高的研究、寫作、學術水平。每年頒發三個獎項,其中一篇會被選中獲得該校的最佳論文獎「Michael H. Granof 獎」。杰出論文獎獲得者將獲得 5000 美元獎金,Granof 獎獲得者獲得 6000 美元獎金。

Ruohan Gao

[[431687]]

Ruohan Gao2015 年于香港中文大學(CUHK)信息工程系獲得一等榮譽學位,導師為劉永昌(Wing Cheong Lau)教授。

博士期間,Ruohan Gao 師從 Kristen Grauman 教授。他的研究興趣是計算機視覺、機器學習、數據挖掘等,特別是視頻中的多模態學習和多模態下的 embodied learning。2021 年初,Ruohan Gao 從德克薩斯大學奧斯汀分校獲得博士學位。

目前,Ruohan Gao 是斯坦福大學視覺與學習實驗室(SVL)的博士后研究員。

此外,Ruohan Gao 還獲得過谷歌博士生獎研金(Google Ph.D Fellowship)、Adobe 研究獎研金(Adobe Research Fellowship)等榮譽。

這篇論文研究了什么?

引入多感官數據學習,華人學者摘得2021 UT-Austin最佳博士論文獎

論文鏈接:https://ai.stanford.edu/~rhgao/Ruohan_Gao_dissertation.pdf

理解場景和事件本質上是一種多模態經驗。人們通過觀察、傾聽 (以及觸摸、嗅和品嘗) 來感知世界,特別是物體發出的聲音,無論是主動產生的還是偶然發出的,都提供了關于自身物理屬性和空間位置的有價值的信號,正如鈸在舞臺上撞擊,鳥在樹上鳴叫,卡車沿著街區疾馳,銀器在抽屜里叮當作響……

盡管通過「看」,也就是根據物體、行為或人的外表檢測的識別取得了重大進展,但它往往不能夠「聽」。在這篇論文中,作者證明了與視覺場景和事件同步的音頻可以作為豐富的訓練信號來源,用于學習 (視聽) 視覺模型。此外,作者開發了計算模型,利用音頻中的語義和空間信號,從連續的多模態觀測中理解人、地點和事物。

引入多感官數據學習,華人學者摘得2021 UT-Austin最佳博士論文獎

當前大多數計算機視覺系統的現狀是從大量「無聲」數據集的標記圖像中學習,而該論文研究目標是既要會傾聽,又要了解視覺世界。

作者表示,受到人類利用所有感官對世界進行感知的啟發,自己的長期研究目標是建立一個系統,通過結合所有的多感官輸入,能夠像人類一樣感知世界。在論文的最后一章,作者概述了在此博士論文之外希望追求的未來研究方向。

引入多感官數據學習,華人學者摘得2021 UT-Austin最佳博士論文獎

圖 1.2: 音頻本身是一個監督信號,用于語義和空間理解。

研究的首要目標是從視頻和嵌入智能體中復現視聽模型: 當多個聲源存在時,算法如何知道發聲對象是什么以及在哪里?這些視聽模型如何在傳統的視聽任務有所提升?為了解決這些問題,該研究利用了音頻中的語義和空間信號,從連續的多模態觀測中理解人、地點和事物(圖 1.2)。

這篇論文研究了以下四個重要問題,以逐步接近視聽場景綜合理解的最終目標:

  • 同時觀看和聆聽包含多個聲源的未標記視頻,以學習音視頻源分離模型(第 3 章、第 4 章和第 5 章);
  • 利用音頻作為預覽機制,在未修剪的視頻中實現高效的動作識別(第 6 章);
  • 利用未標記視頻中的視覺信息推斷雙耳音頻,將平面單聲道音頻「提升」為空間化的聲音(第 7 章);
  • 通過回聲定位學習空間圖像表征,監測來自與物理世界的聲學互動(第 8 章)。

作者表示,本論文對視聽學習的研究,體現了無監督或自監督的多感官數據學習對人工智能的未來發展具有積極而重要的意義。

更多細節請參見論文原文。

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2021-04-24 16:40:55

計算機互聯網 技術

2023-04-06 15:45:00

博士論文

2023-06-05 14:11:14

論文

2021-07-19 15:02:48

機器人人工智能算法

2024-08-28 14:30:00

論文AI

2023-08-09 17:10:01

論文獲獎

2021-08-17 14:57:01

數據論文 技術

2024-11-15 14:00:00

AI論文

2025-04-03 08:30:00

AI科學論文

2024-06-20 10:39:49

2023-11-10 12:53:35

論文AI

2021-10-18 17:54:13

論文博士數據

2021-07-15 16:05:29

編程Rust開發

2018-04-09 09:19:08

谷歌開源機器學習

2023-11-07 17:30:50

2019-02-25 10:09:48

Python翟天臨數據

2023-12-27 14:07:00

模型訓練

2024-06-13 20:20:46

2021-11-16 15:26:23

強化學習火箭人工智能

2021-08-17 17:00:22

華為云大數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久久久国产精品影院 | 一区观看| 亚洲成人自拍 | 国产成人免费网站 | 精品九九 | 国产精品伦理一区二区三区 | 久久久久久久综合 | 欧美一区二区三区在线观看视频 | 亚洲精品二区 | 国产高清精品网站 | 男女网站免费观看 | 高清成人免费视频 | 日韩精品一区二区三区四区 | 久草成人 | 免费骚视频 | 91精品国产欧美一区二区成人 | 亚洲精品视频导航 | 精品欧美一区二区三区久久久 | 精品国产青草久久久久96 | 日韩精品在线视频 | 免费看片国产 | 欧美中文字幕一区 | 欧美日韩电影一区 | 毛片免费视频 | 欧美一区二区三区视频 | 成年免费大片黄在线观看岛国 | 日韩精品视频在线 | 青青久久 | 精品久久精品 | 久久一级 | 日韩在线国产 | 成人精品视频在线观看 | 视频三区 | 亚洲国产网址 | 国产高清在线视频 | 久草成人 | 亚洲国产成人久久久 | 精品久久久av | 欧美一区二区三区久久精品视 | 成人精品 | 亚洲精品久久久久久久久久久久久 |