成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

自然語言融入NeRF,給點文字就生成3D圖的LERF來了

人工智能 新聞
NeRF 大家都很熟悉了,但是你聽說過 LERF 嗎?本文中,來自 UC 伯克利的研究者將語言嵌入到 NeRF 中,并在 3D 場景中實現靈活的自然語言查詢。

NeRF(Neural Radiance Fields)又稱神經輻射場,自從被提出以來,火速成為最為熱門的研究領域之一,效果非常驚艷。然而,NeRF 的直接輸出只是一個彩色的密度場,對研究者來說可用信息很少,缺乏上下文就是需要面對的問題之一,其效果是直接影響了與 3D 場景交互界面的構建。

但自然語言不同,自然語言與 3D 場景交互非常直觀。我們可以用圖 1 中的廚房場景來解釋,通過詢問餐具在哪,或者詢問用來攪拌的工具在哪,以這種方式就可以在廚房里找到物體。不過完成這項任務不僅需要模型的查詢能力,還需要能夠在多個尺度上合并語義等。

本文中,來自 UC 伯克利的研究者提出了一種新穎的方法,并命名為 LERF(Language Embedded Radiance Fields),該方法將 CLIP(Contrastive Language-Image Pre-training)等模型中的語言嵌入到 NeRF 中,從而使得這些類型的 3D 開放式語言查詢成為可能。LERF 直接使用 CLIP,無需通過 COCO 等數據集進行微調,也不需要依賴掩碼區域建議。LERF 在多個尺度上保留了 CLIP 嵌入的完整性,還能夠處理各種語言查詢,包括視覺屬性(如黃色)、抽象概念(如電流)、文本等,如圖 1 所示。

圖片

論文地址:https://arxiv.org/pdf/2303.09553v1.pdf

項目主頁:https://www.lerf.io/

LERF 可以實時交互地為語言提示提取 3D 相關示圖。例如在一張有小羊和水杯的桌子上,輸入提示小羊、或者水杯,LERF 就可以給出相關 3D 圖:

圖片

對于復雜的花束,LERF 也可以精準定位:

圖片

 廚房中的不同物體:

圖片

方法

該研究通過與 NeRF 聯合優化語言場構建了新方法 LERF。LERF 將位置和物理尺度作為輸入并輸出單個 CLIP 向量。在訓練期間,場(field)使用多尺度特征金字塔(pyramid)進行監督,該金字塔包含從訓練視圖的圖像裁剪(crop)生成的 CLIP 嵌入。這允許 CLIP 編碼器捕獲不同尺度的圖像語境,從而將相同的 3D 位置與不同尺度的語言嵌入相關聯。LERF 可以在測試期間以任意尺度查詢語言場以獲得 3D 相關性映射。

圖片

由于從多尺度的多個視圖中提取 CLIP 嵌入,因此通過 LERF 的 3D CLIP 嵌入獲得的文本查詢的相關性映射與通過 2D CLIP 嵌入獲得的相比更加本地化(localized),并且是 3D 一致的,可以直接在 3D 場中進行查詢,而無需渲染多個視圖。

圖片

LERF 需要在以樣本點為中心的體積上學習語言嵌入場。具體來說,該場的輸出是包含指定體積的圖像裁剪的所有訓練視圖的平均 CLIP 嵌入。通過將查詢從點重構為體積,LERF 可以有效地從輸入圖像的粗略裁剪中監督密集場,這些圖像可以通過在給定的體積尺度上進行調節以像素對齊的方式呈現。

圖片

LERF 本身會產生連貫的結果,但生成的相關性映射有時可能是不完整的,并且包含一些異常值,如下圖 5 所示。

圖片

為了規范優化的語言場,該研究通過共享瓶頸引入了自監督的 DINO。

在架構方面,優化 3D 中的語言嵌入不應該影響底層場景表征中的密度分布,因此該研究通過訓練兩個獨立的網絡來捕獲 LERF 中的歸納偏置(inductive bias):一個用于特征向量(DINO、CLIP),另一個用于標準 NeRF 輸出(顏色、密度)。

實驗

為了展示 LERF 處理真實世界數據的能力,該研究收集了 13 個場景,其中包括雜貨店、廚房、書店、小雕像等場景。圖 3 選擇了 5 個具有代表性的場景,展示了 LERF 處理自然語言的能力。

圖片

圖 3

圖 7 為 LERF 與 LSeg 的 3D 視覺對比,在標定碗里的雞蛋中,LSeg 不如 LERF:

圖片

圖 8 表明,在有限的分割數據集上訓練的 LSeg 缺乏有效表示自然語言的能力。相反,它僅在訓練集分布范圍內的常見對象上表現良好,如圖 7 所示。

圖片

不過 LERF 方法還不算完美,下面為失敗案例,例如在標定西葫蘆蔬菜時,會出現其他蔬菜:

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-01-16 16:05:49

語義云App自然語言

2024-07-16 12:02:11

2012-11-26 12:51:44

木材3D打

2024-07-04 09:26:16

2024-07-31 15:30:05

2025-01-14 09:24:46

2011-08-26 14:50:23

2023-09-20 12:13:47

開發模型

2023-05-26 07:08:05

CSS模糊實現文字

2024-12-10 15:17:11

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2024-03-20 15:51:00

AI數據

2023-06-05 12:49:27

神經網絡AI

2021-05-13 07:17:13

Snownlp自然語言處理庫

2024-02-29 09:38:13

神經網絡模型

2023-06-26 15:11:30

智能家居自然語言

2021-08-30 06:20:39

CSS 技巧3D 效果

2017-10-19 17:05:58

深度學習自然語言

2024-04-24 11:38:46

語言模型NLP人工智能

2011-09-22 10:07:52

奧圖碼投影儀
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产亚洲精品成人av久久ww | 国产美女一区 | 久久久久久久久国产精品 | www.4hu影院| 欧美一区视频 | 国产aⅴ爽av久久久久久久 | 91国产精品 | 精品入口麻豆88视频 | 国产精彩视频在线观看 | 国产91视频播放 | 日本精品视频在线 | 成人视屏在线观看 | a国产视频 | 欧美精品一区二区在线观看 | 91精品国产91久久久久久吃药 | 高清人人天天夜夜曰狠狠狠狠 | 九九九视频在线 | 精品一二 | 成人黄色电影在线观看 | 精品一二区 | 久久成人人人人精品欧 | 国产一区不卡 | 精品一级毛片 | 国产成人jvid在线播放 | 狠狠入ady亚洲精品经典电影 | 91精品国产一区二区三区动漫 | 精品国产一区二区三区久久久久久 | 久久久久国产视频 | 成人在线视频网站 | 91九色视频在线 | 精品在线播放 | 色资源在线 | 天堂一区二区三区 | 天天澡天天狠天天天做 | 成人在线观看网站 | 欧美日韩高清免费 | 成人网在线 | 中文字幕av网站 | 久久久人成影片一区二区三区 | 国产玖玖 | 精品久久久久久久久亚洲 |