成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

人工智能 新聞
這是谷歌的開源3D物體數據集Objectron,包含15000份短視頻樣本,以及從五個大洲、十個國家里收集來的400多萬張帶注釋的圖像。

  本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

[[352105]]

見過3D物體數據集,見過會動的3D物體數據集嗎?

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

每段動態視頻都以目標為中心拍攝,不僅自帶標注整體的邊界框,每個視頻還附帶相機位姿和稀疏點云。

這是谷歌的開源3D物體數據集Objectron,包含15000份短視頻樣本,以及從五個大洲、十個國家里收集來的400多萬張帶注釋的圖像。

谷歌認為,3D目標理解領域,缺少像2D中的ImageNet這樣的大型數據集,而Objectron數據集能在一定程度上解決這個問題。

數據集一經推出,1.6k網友點贊。

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

有網友調侃,谷歌恰好在自己想“谷歌”這類數據集的時候,把它發了出來。

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

也有團隊前成員表示,很高興看到這樣的數據集和模型,給AR帶來進步的可能。

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

除此之外,谷歌還公布了用Objectron數據集訓練的針對鞋子、椅子、杯子和相機4種類別的3D目標檢測模型。

來看看這個數據集包含什么,以及谷歌提供的3D目標檢測方案吧~(項目地址見文末)

9類物體,對AR挺友好

目前,這個數據集中包含的3D物體樣本,包括自行車,書籍,瓶子,照相機,麥片盒子,椅子,杯子,筆記本電腦和鞋子。

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

當然,這個數據集,絕不僅僅只是一些以物體為中心拍攝的視頻和圖像,它具有如下特性:

注釋標簽(3D目標立體邊界框)

用于AR數據的數據(相機位姿、稀疏點云、二維表面)

數據預處理(圖像格式為tf.example,視頻格式為SequenceExample)

支持通過腳本運行3D IoU指標的評估

支持通過腳本實現Tensorflow、PyTorch、JAX的數據加載及可視化,包含“Hello World”樣例

支持Apache Beam,用于處理谷歌云(Google Cloud)基礎架構上的數據集

所有可用樣本的索引,包括訓練/測試部分,便于下載

圖像部分的畫風,基本是這樣的,也標注得非常詳細:

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

而在視頻中,不僅有從各個角度拍攝的、以目標為中心的片段(從左到右、從下到上):

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

也有不同數量的視頻類型(一個目標、或者兩個以上的目標):

谷歌希望通過發布這個數據集,讓研究界能夠進一步突破3D目標理解領域,以及相關的如無監督學習等方向的研究應用。

怎么用?谷歌“以身示范”

拿到數據集的第一刻,并不知道它是否好用,而且總感覺有點無從下手?

別擔心,這個數據集的訓練效果,谷歌已經替我們試過了。

看起來還不錯:

此外,谷歌將訓練好的3D目標檢測模型,也一并給了出來。(傳送見文末)

算法主要包括兩部分,第一部分是Tensorflow的2D目標檢測模型,用來“發現物體的位置”;

第二部分則進行圖像裁剪,來估計3D物體的邊界框(同時計算目標下一幀的2D裁剪,因此不需要運行每個幀),整體結構如下圖:

谷歌AI最新3D数据集,1.5万张动图,让AR主宰你的生活

在模型的評估上,谷歌采用了Sutherland-Hodgman多邊形裁剪算法,來計算兩個立體邊界框的交點,并計算出兩個立方體的相交體積,最終計算出3D目標檢測模型的IoU

簡單來說,兩個立方體重疊體積越大,3D目標檢測模型效果就越好。

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

這個模型是谷歌推出的MediaPipe中的一個部分,后者是一個開源的跨平臺框架,用于構建pipeline,以處理不同形式的感知數據。

它推出的MediaPipe Objectron實時3D目標檢測模型,用移動設備(手機)就能進行目標實時檢測。

看,(他們玩得多歡快)實時目標檢測的效果還不錯:

其他部分3D數據集

除了谷歌推出的數據集以外,此前視覺3D目標領域,也有許多類型不同的數據集,每個數據集都有自己的特點。

例如斯坦福大學等提出的ScanNetV2,是個室內場景數據集,而ScanNet則是個RGB-D視頻數據集,一共有21個目標類,一共1513個采集場景數據,可做語義分割和目標檢測任務。

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

而目前在自動駕駛領域非常熱門的KITTI數據集,也是一個3D數據集,是目前最大的自動駕駛場景下計算機視覺的算法評測數據集,包含市區、鄉村和高速公路等場景采集的真實圖像數據。

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

此外,還有Waymo、SemanticKITTI、H3D等等數據集,也都用在不同的場景中。(例如SemanticKITTI,通常被專門用于自動駕駛的3D語義分割)

谷歌AI最新3D數據集,1.5萬張動圖,讓AR主宰你的生活

無論是視頻還是圖像,這些數據集的單個樣本基本包含多個目標,使用場景上也與谷歌的Objectron有所不同。

感興趣的小伙伴們,可以通過下方傳送門,瀏覽谷歌最新的3D目標檢測數據集,以及相關模型~

Objectron數據集傳送門:
https://github.com/google-research-datasets/Objectron/

針對4種物體的3D目標檢測模型:
https://google.github.io/mediapipe/solutions/objectron

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2020-12-18 10:14:11

谷歌AR技術

2011-09-07 10:00:53

Ubuntu3D

2024-07-16 12:02:11

2016-08-31 00:34:51

AR技術VR技術3D技術

2020-08-26 10:37:21

阿里3D

2021-03-05 16:14:08

AI 數據人工智能

2023-11-07 22:19:05

消息服務端care

2021-08-10 15:40:50

AR蘋果谷歌

2024-03-15 08:10:00

2021-09-14 10:11:46

谷歌3D舞蹈生成模型FACT

2024-05-16 09:24:17

3D技術

2022-12-15 21:59:56

AIVR場景

2023-03-06 15:08:54

AI

2013-01-28 10:02:39

Wi-Fi無線網絡3D模型

2015-06-05 13:36:42

2015-03-04 10:33:24

3D小熊七牛AR

2022-06-29 10:21:33

3d打印輔助工具

2011-09-22 10:07:52

奧圖碼投影儀

2011-12-21 12:46:43

2022-09-19 19:16:42

輪播圖has
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩在线视频观看 | 99精品欧美 | 在线视频日韩 | 视频一区在线播放 | 精品亚洲一区二区三区四区五区 | 中文字幕免费视频 | www亚洲精品 | 中文字幕在线观看一区 | 国产精品久久久久久久久免费 | 成人自拍视频网站 | 黄色网址在线免费播放 | 午夜www| 国产欧美精品一区二区三区 | 日韩一区二区三区视频在线观看 | 欧美日韩视频在线播放 | 九九热免费在线观看 | 亚洲精品一区二区三区 | 精品国产欧美一区二区 | 激情久久av一区av二区av三区 | 婷婷成人在线 | 黄色片亚洲 | 国产在线a | 国产婷婷色一区二区三区 | 国产福利久久 | 欧美一区二区三区,视频 | 亚洲精品在线视频 | 亚洲精视频 | 国产在线精品一区二区 | aaaa一级毛片 | 91精品免费 | 精品久久久久国产免费第一页 | 人人爱干| 亚洲精品成人 | 欧美日韩不卡合集视频 | 国产色在线| 成人国产精品久久久 | 亚洲永久免费 | 国产ts人妖一区二区三区 | 日韩精品一区二区三区中文字幕 | 91国产视频在线观看 | 成人精品一区二区 |