成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌公布13GB 3D掃描數據集:17大類、1030個家用物品

人工智能 新聞
谷歌的研究者提出了 Google Scanned Objects (GSO) 數據集,這是一個由超過 1000 個 3D 掃描的家用物品組成的精選集。

近年來,深度學習技術使得計算機視覺和機器人領域的許多進展成為可能,但訓練深度模型需要各種各樣的輸入,以泛化到新的場景。

此前,計算機視覺領域已經利用網頁抓取技術收集了數百萬個主題的數據集,包括 ImageNet、Open Image、Youtube-8M、COCO 等。然而,給這些數據集貼標簽仍是一個勞動密集型工作,標簽錯誤可能會影響到對技術進步的感知,而且這種策略也很難推廣至 3D 或真實世界的機器人數據上。與圖像不同的是,目前網絡上并沒有大規模、高質量的 3D 場景,而從真實世界收集這類數據又極具挑戰性。此外,人工標注員也很難從圖像中提取 3D 幾何特性。

一般來說,使用 Gazebo、Bullet、MuJoCo、Unity 等工具對機器人和環境進行仿真可以減輕上述限制。但是,仿真畢竟不完全是真實世界,即使一個場景是直接通過對真實環境的 3D 掃描建立起來的,掃描中的離散對象也會像固定的背景物一樣,不會像真實世界的對象那樣對輸入做出回應。

因此,關鍵問題在于提供一個高質量的 3D 對象模型庫,這些模型可以整合到物理和視覺建模中,為深度學習提供所需的多樣性。

為了解決這個問題,谷歌的研究者提出了 Google Scanned Objects (GSO) 數據集,這是一個由超過 1000 個 3D 掃描家用物品組成的精選集,可用于 Ignition Gazebo、Bullet 模擬器和其他可以讀取 SDF 模型格式的工具。

在一篇論文中,研究者介紹了該數據集的收集、管理、擴展等內容。

論文鏈接:https://arxiv.org/pdf/2204.11918.pdf

據不完全統計,GSO 數據集已經在計算機視覺、計算機圖形學、機器人操作、機器人導航和 3D 形狀處理等 10 個項目的 12 篇論文中得到應用:

該研究貢獻主要有幾點:

  • 提出 Google Scanned Objects 數據集;
  • 3D 掃描 pipeline 設計;
  • 3D 掃描管理和發布過程;
  • 該數據集在研究領域中的影響。

數據集的創建

GSO 數據集起源于 2011 年谷歌的云機器人計劃,目的是讓機器人基于普通家用物品的高保真 3D 模型,能夠在自己的環境中識別和抓取物體。

然而,除了物體識別和機器人抓取之外,3D 模型還有很多用途,包括用于物理模擬的場景構建和用于終端用戶應用的 3D 物體可視化。因此,谷歌研究院發起了一個項目,將 3D 體驗大規模引入谷歌,以低于傳統商業級產品攝影的成本收集大量家用物品的 3D 掃描圖像。

這是一項端到端的工程,包括物體獲取、新穎的 3D 掃描硬件、高效的 3D 掃描軟件、快速 3D 渲染的質量保障、網絡與移動瀏覽器,以及人機交互研究。

在收集數據之后,研究者構建了一個 pipeline,讓這些數據能以各種格式使用。

3D 掃描 pipeline

即使限于家用物品的領域,3D 掃描也會帶來獨特的挑戰,包括高效的物理掃描設置、目標照明、相機可靠性、掃描儀性能、配色、紋理渲染,以及處理光學上不一致的材料,比如近白色、有光澤或透明的表面。

專用的 3D 掃描硬件是勞動密集型的,性價比不高。為了進行大規模掃描,還需要一些更具可用性和可靠性的工具。

因此,研究者設計了自己的專用掃描硬件和軟件(圖 2),能夠在 10 分鐘內掃描物體并生成高分辨率模型。控制光線的物理外殼(圖 2b)使用兩臺機器視覺相機和一臺投影儀進行結構光掃描,捕捉 3D 幾何圖形,并使用單獨的單反高分辨率相機以產品友好的光線捕捉紋理。

項目第一年結束的時候能夠做到每周超過 400 次掃描,過程中,研究團隊共獲得了 100K 份 360 度照片旋轉和 10k 份完全 3D 掃描的獨特對象。

圖 2。

圖 3:作為校準過程的掃描。(a) 校正模式使 2D pipeline 能夠精確對齊相機。(b) 計算機控制的投影儀為 3D 掃描物體創造了類似的圖案。(c) 合適的模式能夠以亞像素精度探測位置。(d) 提取掃描物體的完整 3D 形狀。

圖 4:掃描的物品需要通過質量檢查。(a) 許多物品被捕獲為高質量的封閉流形 mesh。(b) 有的物體很少產生無效的 mesh,但有時會出現變形。

仿真模型轉換

這些原始的掃描模型使用協議緩沖元數據、非常高分辨率的可視化、不適合模擬的格式。對象的一些物理屬性,比如質量,會被捕獲,但諸如摩擦之類的表面屬性在元數據中則沒有表示。

為了讓這些掃描的模型能夠在仿真系統中使用,每個模型都通過一個 pipeline 進行下列步驟:

  1. 過濾無效對象。
  2. 分配對象名稱。
  3. 驗證對象 mesh。
  4. 計算物理屬性。
  5. 構造碰撞體積。
  6. 減小模型尺寸。
  7. 創建 SDF 模型。
  8. 創建縮略圖。
  9. 打包模型。

數據集屬性

組成

GSO 數據集包含 1030 個掃描對象和相關的元數據,總計 13GB,根據 CCBY 4.0 License 授權。表 III.1 分解了數據集中的模型類別。

表 III.1

優勢

自動化 pipeline 可以快速生成大量模型,而無需手工處理。因為這些模型是掃描的,而不是手工建模的,所以它們是真實的,而不是理想中的,這減少了將學習從模擬轉移到真實世界的困難。

掃描儀的玻璃平臺可以從各個方面掃描模型,包括底座,不像其他掃描儀有不透明的平臺。類似地,從環境中提取的模型通常缺少像底座這樣起到銜接作用的遮擋區域。

因為該掃描儀根據投影圖案而不是深度照相機數據重建表面形狀,所以得到的 mesh 具有高保真度。光滑的表面是平滑的,輪廓邊緣是準確的 (圖 5)。相比之下,RGB-D 數據得到的 mesh,可能出現斑駁和不規則,特別是在輪廓上。

圖5

限制

同時,這個數據集也有一些限制:掃描儀的捕捉區域不能容納比面包箱 (約 50 厘米) 大的對象,因此該數據集不包括在其他數據集中較大的對象,如椅子、汽車或飛機。同樣,掃描分辨率是有限的,所以非常小的對象不能以合理的保真度建模。此外,生成的紋理是漫反射的:高度鏡面或透明的對象不能表征出來,生成結果也不夠理想。

更多細節可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2010-11-15 15:20:13

Oracle索引掃描

2009-11-11 09:40:53

Oracle索引掃描

2020-08-26 10:37:21

阿里3D

2021-09-14 10:11:46

谷歌3D舞蹈生成模型FACT

2011-11-18 09:42:45

時代周刊Intel3D工藝芯片

2010-04-21 16:47:05

Oracle數據

2020-11-13 14:56:24

AI 數據谷歌

2013-04-11 20:49:51

愛普生家用投影

2012-03-07 15:25:04

索尼投影機

2012-03-31 15:42:07

愛普生投影機

2020-07-27 10:23:10

開源技術 數據

2012-03-08 15:43:58

明基投影機

2012-01-16 15:15:22

明基投影機

2020-03-02 11:50:05

人工智能機器學習技術

2021-03-08 15:40:46

開源技術 軟件

2024-01-29 06:50:00

3D模型

2024-06-26 10:07:38

2011-04-26 16:40:43

投影機

2012-08-01 10:51:20

投影

2012-03-31 10:38:15

明基投影機
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩精品免费 | 99re国产视频 | 亚洲成人精品一区 | 久久一级 | 综合久久久 | 99精品久久99久久久久 | 古典武侠第一页久久777 | 日韩精品一区二区在线 | 精品综合视频 | 99re6在线视频精品免费 | 一道本视频 | 成人在线免费视频 | 国产精品成人一区二区三区 | 国产精品成人在线播放 | 中文字字幕一区二区三区四区五区 | 中文字幕不卡在线88 | 国产激情91久久精品导航 | 亚洲一区中文字幕在线观看 | 一区二区三区视频在线免费观看 | 免费看片在线播放 | 国产高清久久 | 国产精品久久久久久久久久久久久久 | 日韩在线观看一区二区三区 | 中文字幕第十一页 | 香蕉视频91 | 国产精品毛片 | 亚洲精品大全 | 狠狠爱网址 | 欧美日韩综合精品 | 亚洲精品综合 | 视频一区在线观看 | 在线国产视频 | 最新中文字幕在线播放 | 国产精品毛片一区二区在线看 | 99热这里都是精品 | 精品久久久久久亚洲精品 | 麻豆视频在线免费看 | 国产在线成人 | 日日操夜夜操天天操 | 9999精品视频 | 欧美日韩1区2区3区 欧美久久一区 |