成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

想搞懂李飛飛的創業方向?這里有一份機器人+3D的論文清單

人工智能 新聞
除了李飛飛,現在有很多研究團隊都在關注 3D 視覺 + 機器人這一方向。這些團隊認為,當前 AI 存在的很多局限都是因為模型缺乏對于 3D 世界的深刻理解。

前段時間,多家媒體報道稱 ,著名 AI 學者、斯坦福大學教授李飛飛的創業公司 World Labs 在短短三個月內已經完成了兩輪融資,其中最新一輪融資中籌到了約 1 億美元,公司估值已超過 10 億美元,成為新晉獨角獸。

World Labs 的發展方向聚焦于「空間智能」,即開發能夠理解三維物理世界的模型,模擬物體的物理特性、空間位置和功能。李飛飛認為「空間智能」是 AI 發展的關鍵一環,她的團隊正在斯坦福大學實驗室里訓練計算機和機器人在三維世界中采取行動,例如使用大型語言模型讓一個機械臂根據口頭指令執行開門、做三明治等任務。(詳情請參見《李飛飛解讀創業方向「空間智能」,讓 AI 真正理解世界》)

圖片

為了解釋「空間智能」這一概念,李飛飛展示了一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她表示,在一瞬間,人類大腦可以評估「這個玻璃杯的幾何形狀,它在三維空間中的位置,它與桌子、貓和所有其他東西的關系」,然后預測會發生什么,并采取行動加以阻止。

其實,除了李飛飛,現在有很多研究團隊都在關注 3D 視覺 + 機器人這一方向。這些團隊認為,當前 AI 存在的很多局限都是因為模型缺乏對于 3D 世界的深刻理解。如果要補全這一拼圖,勢必要在 3D 視覺方向投入更多的研究精力。此外,3D 視覺提供了對環境的深度感知和空間理解能力,這對于機器人在復雜三維世界中的導航、操作和決策至關重要。

那么,有沒有一份系統的研究資料可以供這一方向的研究者參考呢?機器之心最近就找到了一份:

圖片

項目鏈接:https://github.com/zubair-irshad/Awesome-Robotics-3D

這個名叫「Awesome-Robotics-3D」的 GitHub 存儲庫總共收集了 80 多篇「3D 視覺 + 機器人」方向的論文,大部分論文都給出了相應的論文、項目、代碼鏈接。

圖片

這些論文可以分為以下幾個主題:  

  • 策略學習
  • 預訓練
  • VLM 和 LLM
  • 表示
  • 模擬、數據集和基準

這些論文既有 arXiv 預印本,也有 RSS、ICRA、IROS、CORL 等機器人學頂會以及 CVPR、ICLR、ICML 等計算機視覺、機器學習領域的頂會論文,含金量非常高。

每部分的論文列表如下:

1、策略學習

圖片

圖片

2、預訓練

圖片

3、VLM 和 LLM

圖片

圖片

4、表示

圖片

圖片

5、模擬,數據集和基準

圖片

圖片

此外,作者還給出了兩篇可以參考的綜述論文: 

  • 論文 1:When LLMs step into the 3D World: A Survey and Meta-Analysis of 3D Tasks via Multi-modal Large Language Models
  • 論文鏈接:https://arxiv.org/pdf/2405.10255

論文介紹:這篇論文全面概述了使 LLM 能夠處理、理解和生成 3D 數據的方法論,并強調了 LLM 的獨特優勢,例如 in-context learning、step-by-step 推理、開放詞匯能力和廣泛的世界知識,這些優勢有望顯著推進具身人工智能系統中的空間理解和交互。研究涵蓋了從點云到神經輻射場(NeRF)的各種 3D 數據表示方法,并考察了它們與 LLM 的集成,用于 3D 場景理解、描述生成、問答和對話,以及基于 LLM 的代理進行空間推理、規劃和導航等任務。此外,論文還簡要回顧了其他將 3D 和語言進行整合的方法。通過對這些研究的元分析,論文揭示了取得的顯著進展,并強調了開發新方法以充分利用 3D-LLM 潛力的必要性。

為了支持這項調查,作者建立了一個項目頁面,整理和列出了與主題相關的論文:https://github.com/ActiveVisionLab/Awesome-LLM-3D

圖片

  • 論文 2:A Comprehensive Study of 3-D Vision-Based Robot Manipulation
  • 論文鏈接:https://ieeexplore.ieee.org/document/9541299

論文介紹:這篇文章全面分析了 3D 視覺在機器人操控領域的最新進展,特別是在模仿人類智能和賦予機器人更靈活工作能力方面。文章討論了傳統機器人操控通常依賴的 2D 視覺系統及其局限性,指出了 3D 視覺系統在開放世界中面臨的挑戰,如在雜亂背景下的一般物體識別、遮擋估計以及類似人類的靈活操控。文章涵蓋了 3D 數據獲取與表示、機器人視覺校準、3D 物體檢測 / 識別、6 自由度姿態估計、抓取估計和運動規劃等關鍵技術。此外,還介紹了一些公開數據集、評估標準、比較分析以及當前面臨的挑戰。最后,文章探討了機器人操控的相關應用領域,并對未來的研究方向和開放問題進行了討論。

感興趣的讀者可以點擊項目鏈接開始學習。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2018-04-19 10:33:39

DevOps開源工具

2018-07-30 09:33:21

2020-03-30 11:32:49

IT技術面試

2020-11-16 11:10:21

代碼開發工具

2019-08-16 09:55:22

Pandas編程語言代碼

2018-05-15 08:35:37

AI微軟人工智能

2020-04-22 16:21:57

HTTP3數據HTTP2

2018-04-19 14:42:48

深度學習DL數據集

2019-04-16 13:13:56

碼農程序員開發

2020-12-30 10:20:03

數據技術架構

2018-02-08 08:35:23

區塊鏈食品安全食品供應商

2018-01-02 16:42:42

iPhone電池Apple

2017-08-24 10:24:49

機器人模式人工智能

2022-03-28 13:04:10

機器學習模型計算機

2012-12-10 11:32:12

打印機

2012-12-12 14:01:58

惠普打印

2018-02-08 08:26:54

紅包春節支付寶

2024-04-01 11:52:46

2019-01-02 07:43:51

機器學習人工智能學歷
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品亚洲视频 | 美国av毛片| 国产乱码精品一区二区三区忘忧草 | 免费成人av网站 | 欧美一级电影免费 | 第一色在线| 中文字幕一区二区三区精彩视频 | 在线中文字幕第一页 | 91精品国产91久久综合桃花 | 天天影视网天天综合色在线播放 | 高清视频一区二区三区 | 一本一道久久a久久精品综合 | 在线免费观看成年人视频 | 日本高清中文字幕 | 久久99久久99| 国产高清视频 | 国产亚洲精品久久久久动 | 成人在线视频免费观看 | 欧美精品1区2区3区 精品国产欧美一区二区 | 国产一区二区三区免费观看在线 | 日本电影一区二区 | 精品久久久久久久久久久 | 日日干夜夜操天天操 | 国产高清不卡 | 91麻豆精品国产91久久久更新资源速度超快 | 超碰8| 欧美日韩电影一区二区 | 在线国产中文字幕 | 日韩欧美网| 中文字幕在线观看av | 精品一区电影 | 欧美在线a| 亚洲一区二区三 | 一区二区三区国产好 | 国产四区| 国产成人一区二区三区电影 | 欧美成人激情 | 国产98色在线 | 日韩 | xxxxx免费视频 | 午夜日韩精品 | 亚洲视频免费在线播放 |