成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

快20倍!谷歌AI推TensorFlow 3D,智能汽車好用

人工智能 智能汽車 智能汽車
Google AI發布了TensorFlow 3D,將3D深度學習能力引入TensorFlow,加入3D稀疏卷積網絡,在Waymo Open數據集上的實驗表明,這種實現比預先設計好的TensorFlow操作提速「20倍」。

Google AI發布了TensorFlow 3D,將3D深度學習能力引入TensorFlow,加入3D稀疏卷積網絡,在Waymo Open數據集上的實驗表明,這種實現比預先設計好的TensorFlow操作提速「20倍」。

隨著自動駕駛汽車與機器人的深入發展,激光雷達、深度傳感攝像機、雷達等3D傳感器已經成為了獲取道路數據的必要設備。

而利用這些傳感器的機器學習系統則顯得尤為重要,因為它可以幫助硬件在現實世界中進行導航等操作。

近期,包括目標檢測、透明目標檢測等模型的3D場景理解方面取得了很大進展,但是由于3D數據可用的工具和資源有限,這個領域仍面臨挑戰。

TensorFlow 3D:TensorFlow與3D深度學習合體

為了進一步提高對3D場景的建模,簡化研究人員的工作,Google AI發布了TensorFlow 3D (TF 3D) ,一個高度模塊化、高效的庫,旨在將3D深度學習能力引入TensorFlow.

TF 3D提供了一系列當下常用的操作、損失函數、數據處理工具、模型和度量,使更多的研究團隊能夠開發、培訓和部署最先進的3D場景理解模型。

TF 3D包含用于最先進的3D語義分割、3D目標檢測和3D實例分割的培訓和評估任務,還支持分布式訓練。

另外,TF 3D還支持其他潛在的應用,如三維物體形狀預測、點云配準和點云增密。此外,它提供了一個統一的數據集規范和訓練、評價標準三維場景理解數據集的配置。

目前,TF 3D支持Waymo Open、 ScanNet和Rio數據集。

然而,用戶可以自由地將其他流行的數據集,如NuScenes和Kitti,轉換成類似的格式,并將其用于已有或自定義的pipeline模型中,還可以利用TF 3D進行各種3D深度學習研究和應用,從快速原型設計到部署實時推理系統。

快20倍!谷歌AI推TensorFlow 3D,智能汽車好用

左邊顯示的是TF 3D中3D物體檢測模型在Waymo Open Dataset的一幀畫面上的輸出示例。右邊是ScanNet數據集上3D實例分割模型的輸出示例。

在這里,我們將介紹在TF 3D中提供的高效且可配置的稀疏卷積骨干,這是在各種3D場景理解任務中獲得最先進結果的關鍵。

此外,我們將逐一介紹TF 3D目前支持的3個流水線任務: 3D語義分割、3D目標檢測分割和3D實例分割。

3D稀疏卷積網絡

傳感器采集到的3D數據通常包含一個場景,該場景包含一組感興趣的物體(如汽車、行人等),其周圍大多是開放空間。所以,3D數據本質上是稀疏的。

在這樣的環境中,卷積的標準實現將需要大量的計算、消耗大量的內存。因此,在TF 3D 中,我們采用了流形稀疏卷積(submanifold sparse convolution)和池操作,這些操作可以更有效地處理3D稀疏數據。

稀疏卷積模型是大多數戶外自動駕駛(如Waymo,NuScenes)和室內基準測試(如 ScanNet)中應用的sota方法的關鍵。

快20倍!谷歌AI推TensorFlow 3D,智能汽車好用

谷歌還應用了各種CUDA技術來加快計算速度(如hash、在共享內存中分區/緩存過濾器以及使用位操作)。

在Waymo Open數據集上的實驗表明,這種實現比預先設計好的TensorFlow操作要快「20倍」左右。

快20倍!谷歌AI推TensorFlow 3D,智能汽車好用

圖源:Waymo Open Dataset on GitHub

然后,TF 3D使用3D流形稀疏U-Net架構來提取每個voxel的特征。通過讓網絡提取粗細特征并將它們組合起來進行預測,U-Net架構已被證明是有效的。

U-Net網絡由編碼器、瓶頸和解碼器三個模塊組成,每個模塊都由許多稀疏卷積塊組成,并可能進行池化或非池化操作。

快20倍!谷歌AI推TensorFlow 3D,智能汽車好用

一個3D稀疏體素U-Net架構。注意,一個水平的箭頭接收體素特征,并對其應用流形稀疏卷積。向下移動的箭頭會執行流形稀疏池化。向上移動的箭頭將收集池化的特征,與水平方向箭頭的特征進行concat,并對concat后的特征進行流形稀疏卷積。

上述稀疏卷積網絡是TF 3D提供的3D場景理解pipeline模型的backbone。

下面描述的每個模型使用這個骨干網絡提取稀疏體素特征,然后添加一個或多個額外的預測頭來推斷感興趣的任務。

用戶可以通過改變編碼器/解碼器層數和每層卷積的數量來配置U-Net網絡,并通過修改卷積濾波器的尺寸,從而能夠通過不同的網絡配置來權衡的速度和精度。

三維語義分割

三維語義分割模型只有一個輸出,用于預測每一個點的語義分數,將其映射回點,預測每一個點的語義標簽。

快20倍!谷歌AI推TensorFlow 3D,智能汽車好用

從ScanNet數據集對室內場景進行3D語義分割。

三維實例分割

在三維實例分割中,除了要預測語義,更重要的是將同一對象的體素組合在一起。

在TF 3D中使用的3D實例分割算法是基于用深度度量學習方法進行的2D圖像分割工作。這種模型預測能預測每個體素的實例嵌入向量以及每個體素的語義評分。

實例嵌入向量將體素映射到一個嵌入空間,其中對應于同一對象實例的體素相距很近,而對應于不同對象的體素相距很遠。

在這種情況下,輸入是一個點云而不是一個圖像,并且他將使用一個三維稀疏網絡而不是一個二維圖像網絡。在推理過程中利用貪心算法選取實例種子,并利用體素嵌入的距離函數將不同的體素聚合到對應的實例上去。

三維目標檢測

目標檢測模型可以預測每個體素的大小、中心和旋轉矩陣以及對象的語義評分。

在推理時,推選機制將給出的多個候選框處理為少數幾個精確的3D目標框。在訓練時使用了預測與GT間的Huber Loss距離來計算損失。由于利用大小、中心和旋轉矩陣估算框邊角是可差分過程,損失可以自然地傳遞到預測過程的權重中。研究人員利用動態框分類損失來對預測的框進行正例和負例進行區分。

快20倍!谷歌AI推TensorFlow 3D,智能汽車好用

ScanNet數據集上的3D物體檢測結果。

TF 3D只是市場上的3D深度學習擴展之一。2020年,Facebook推出了 PyTorch3D,專注于3D渲染和虛擬現實。另一個是英偉達的Kaolin,這是一個模塊化的可分辨渲染的應用,如高分辨率模擬環境。

從這個概述來看,TF 3D應用程序似乎更專注于機器人感知和映射,而其他選項則更專注于3D模擬和渲染。為了實現3D渲染,Google推出了TensorFlow Graphics.

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-03-15 08:10:00

2021-03-18 15:29:10

人工智能機器學習技術

2019-12-23 10:22:05

AI 數據人工智能

2024-04-01 07:00:00

模型AI

2021-09-14 10:11:46

谷歌3D舞蹈生成模型FACT

2018-03-28 09:18:35

CITE智能制造3D打印館

2021-01-24 12:52:32

AI 數據人工智能

2024-03-25 09:18:15

2021-08-10 15:40:50

AR蘋果谷歌

2025-01-16 10:35:00

3D數據模型

2018-11-26 12:29:27

2024-09-20 16:20:00

2023-12-06 13:36:00

模型數據

2018-10-24 14:15:15

機器學習人工智能谷歌

2021-03-08 15:40:46

開源技術 軟件

2011-10-06 13:30:45

宏碁投影儀

2024-07-03 14:29:38

2022-11-22 15:21:43

模型3D

2025-01-26 10:19:21

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品视频在线看 | 免费视频二区 | 一本色道精品久久一区二区三区 | 一区二区三区av | 欧美激情国产日韩精品一区18 | 日本精品视频一区二区 | 亚洲天堂av网 | 9999久久| 亚洲精品在线免费观看视频 | 久久久精品一区二区三区四季av | 久久天天躁狠狠躁夜夜躁2014 | 夜夜爆操 | 久久av影院 | 中文字幕亚洲视频 | 国产情侣在线看 | av在线播放网 | 日本三级精品 | 国产乱码精品一区二区三区忘忧草 | 久久99国产精一区二区三区 | 日韩在线欧美 | 日韩www视频 | 九九热国产视频 | 久久久久久女 | 在线国产一区二区 | 毛片a级| 成人国产免费视频 | 亚洲精品国产第一综合99久久 | 欧美日韩国产中文 | 欧美日韩亚洲一区 | 午夜寂寞福利视频 | 中文字幕 国产 | 国产精品成人一区二区 | 超碰成人免费观看 | 理论片87福利理论电影 | 91色在线 | 天堂免费| 久久久久久久久久久福利观看 | 一级黄片一级毛片 | 天堂av在线影院 | 国产成人jvid在线播放 | 黄色毛片网站在线观看 |