成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

僅憑RGB圖像實現戶外場景高精度定位與重建,來自港科廣團隊 | ICRA 25

人工智能 新聞
港科廣團隊提出全新解決方案——OpenGS-SLAM。僅憑RGB圖像實現高精度定位 與逼真場景重建。

從自動駕駛、機器人導航,到AR/VR等前沿應用,SLAM都是離不開的核心技術之一。

現有基于3D高斯分布(3DGS)的SLAM方法雖在室內場景表現出色,但使用僅RGB輸入來處理無界的戶外場景仍然面臨挑戰

  • 準確的深度和尺度估計困難,這影響了姿態精度和3DGS初始化
  • 圖像重疊有限且視角單一,缺乏有效的約束,導致訓練難以收斂

為了解決上述挑戰,港科廣團隊提出全新解決方案——OpenGS-SLAM。僅憑RGB圖像實現高精度定位與逼真場景重建。

圖片

△OpenGS-SLAM管線示意圖

具體來說,研究人員采用了一個點圖回歸網絡來生成幀間一致的點圖。

這些點圖儲存了來自多個標準視角的3D結構,包含了視角關系、2D到3D的對應關系和場景幾何信息。這使得相機位姿估計更加穩健,有效緩解了預訓練深度網絡的誤差問題。

此外,OpenGS-SLAM將相機位姿估計與3DGS渲染集成到一個端到端可微的管道中。通過這種方式,實現了位姿和3DGS參數的聯合優化,顯著提高了系統的跟蹤精度。

研究人員還設計了一種自適應比例映射器和動態學習率調整策略,能夠更準確地將點圖映射到3DGS地圖表示。

值得注意的是,在Waymo數據集上的實驗表明,OpenGS-SLAM將追蹤誤差降低至現有3DGS方法的9.8%。研究人員還在新視角合成任務上建立了一個新的基準,達到了最先進的結果。

基于3DGS表示的RGB-only SLAM系統

來看具體技術細節。

在OpenGS-SLAM的管線示意圖可以看到,每一幀都會輸入一張RGB圖像用于追蹤。

當前幀和上一幀作為圖片對輸入到Pointmap回歸網絡進行位姿估計,隨后基于當前的3D高斯地圖進行位姿優化。

在關鍵幀處,系統執行地圖更新,并通過自適應尺度映射器(Adaptive Scale Mapper)對Pointmap進行處理,以插入新的3D高斯點。

此外,相機位姿與3D高斯地圖會在局部窗口內進行聯合優化,確保更精準的追蹤與場景重建。

追蹤

幀間點圖回歸與位姿估計

之前基于3DGS和NeRF的SLAM工作,主要集中在室內和小規模場景中,其中相機的運動幅度較小,視角密集。在這種情況下,NeRF或3DGS可以直接用于優化相機位姿。

然而,戶外場景通常涉及基于車輛的攝影,特征是運動幅度較大且視角相對稀疏。這使得直接優化相機位姿難以收斂。

鑒于點圖包含視角關系、2D到3D的對應關系和場景幾何信息,OpenGS-SLAM團隊提出了一種基于幀間點圖回歸網絡的位姿估計方法,旨在實現穩健且快速的當前幀相機位姿估計。

他們利用一個預訓練的點圖回歸網絡,該網絡結合了ViT編碼器、帶有自注意力和交叉注意力層的Transformer解碼器以及一個MLP回歸頭,生成連續幀圖像的點圖。特別地,兩個圖像分支之間的信息共享有助于點圖的正確對齊。

盡管應用點圖可能看起來有些反直覺,但它能夠在圖像空間中有效表示3D形狀,并且允許在不同視角的射線之間進行三角測量,而不受深度估計質量的限制。隨后,團隊使用穩健且廣泛應用的RANSAC和PnP來推斷兩幀之間的相對姿態圖片,使用這種方法,可以估計第k幀的位姿為:圖片

位姿優化

為了實現精確的相機位姿追蹤,團隊基于3DGS可微光柵化管道,構建了一套可微的相機位姿優化方法。

定義光度損失為:

圖片

其中圖片表示每個像素的可微渲染函數,通過高斯圖片和相機位姿圖片生成圖像,圖片表示真實圖像。光度損失圖片關于位姿圖片

的梯度為:

圖片

通過這些步驟,利用渲染函數的微分,將增量位姿更新與光度損失緊密關聯。這一策略使得相機位姿能夠基于3DGS 渲染結果進行端到端優化,從而確保高精度且穩定的位姿跟蹤。

3DGS場景表示

研究人員使用3DGS作為場景表示,提出自適應尺度映射器(Adaptive Scale Mapper),在關鍵幀時為地圖插入新的高斯點。

利用先前獲得的點圖來映射3D高斯地圖,由于幀間點圖存在尺度不穩定的問題,研究人員基于點匹配關系計算連續幀之間的相對尺度變化因子,以確保整個場景的尺度一致性。

建圖

高斯地圖優化

管理一個局部關鍵幀窗口圖片,以選擇觀察相同區域的非冗余關鍵幀,為后續的建圖優化提供更高效的多視角約束。在每個關鍵幀上,通過聯合優化圖片窗口中的高斯屬性和相機位姿來實現局部BA。

優化過程仍然通過最小化光度損失進行。為了減少高斯橢球體的過度拉伸,研究人員采用了各向同性正則化:

圖片

高斯地圖優化任務可以總結為:

圖片

自適應學習率調整

在經典的室內 SLAM 數據集中,相機通常圍繞小范圍場景運動并形成閉環,使高斯優化的學習率隨迭代次數逐漸衰減。然而,戶外數據由前向車輛相機捕獲,所經過區域不會重訪,因此需要不同的學習率衰減策略。

為此,研究人員提出了一種基于旋轉角度的自適應學習率調整策略:當車輛沿直路行駛時,學習率逐步衰減;在遇到坡道或轉彎時,動態提升學習率,以更有效地優化新場景。

首先,計算當前關鍵幀和上一關鍵幀之間的旋轉矩陣圖片圖片,其相對旋轉矩陣為:

圖片

接著計算旋轉弧度:

圖片


接著將弧度圖片轉換為度數圖片,并根據以下公式調整累計迭代次數:

圖片

當旋轉角度達到90度時,累積迭代次數將被重置。

實驗結果

如下圖所示,在Waymo數據集的無界戶外場景上,OpenGS-SLAM能渲染高保真的新視角圖片,準確捕捉車輛、街道和建筑物的細節。相比之下,MonoGS和GlORIE-SLAM存在渲染模糊和失真的問題。

圖片

如下圖所示,OpenGS-SLAM擁有明顯更優的追蹤性能,在面臨大轉彎時也能穩定收斂。

圖片

精度方面,OpenGS-SLAM在Waymo數據集上實現了新視角合成(NVS)的最佳性能。在追蹤精度方面,與GlORIE-SLAM相當;而相比同樣基于3DGS的SLAM方法MonoGS,OpenGS-SLAM誤差降低至 9.8%,顯著提升了系統的魯棒性和準確性。

圖片

消融研究結果顯示,自適應學習率調整和自適應尺度映射均對整體性能產生積極影響,而Pointmap回歸網絡更是本方法的核心支撐,對系統性能至關重要。

圖片

總結

OpenGS-SLAM是一種基于3DGS表示的RGB-only SLAM系統,適用于無界的戶外場景。

該方法將點圖回歸網絡與3DGS表示結合,確保精確的相機姿態跟蹤和出色的新視圖合成能力。

與其他基于3DGS的SLAM系統相比,該方法在戶外環境中提供了更高的跟蹤精度和魯棒性,使其在實際應用中具有較高的實用性。

論文鏈接:https://arxiv.org/abs/2502.15633
代碼鏈接:https://github.com/3DAgentWorld/OpenGS-SLAM
官方主頁:https://3dagentworld.github.io/opengs-slam/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-27 10:54:06

2025-03-26 09:55:14

2025-04-02 09:50:00

機器人訓練數據

2021-09-30 09:54:29

科技人工智能優化

2021-01-18 09:39:35

室內定位技術物聯網

2025-04-14 08:40:00

算力AI模型

2025-05-06 08:50:00

2025-03-31 09:22:00

強化學習模型AI

2023-01-11 09:02:50

2024-05-21 09:46:35

視覺自動駕駛

2021-11-22 10:19:09

英偉達人工智能數據

2023-10-24 19:06:59

模型訓練

2024-01-26 16:33:00

2021-09-08 17:50:04

數據

2024-09-30 09:35:55

圖像生成AI

2023-09-14 09:40:22

自動駕駛技術

2021-08-16 13:26:49

Linuxx86 Linux
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品特级片 | 奇米av| 爱操影视| 精品中文字幕在线观看 | 欧美h视频 | 国产精品视频一二三区 | 美女视频一区 | 亚洲精品一区二区在线观看 | 99reav| 亚洲免费在线观看 | 久久久美女 | 午夜成人在线视频 | 男人天堂999 | 免费精品久久久久久中文字幕 | 精品无码久久久久国产 | 亚洲国产片 | 国产精品一区二区三 | 91精品国产91久久综合桃花 | 欧美国产日韩在线 | 久久久久久av| www操操| 影音av| 日韩欧美专区 | 狠狠操狠狠操 | 国产精品久久久久久久久免费高清 | 欧美精品在欧美一区二区少妇 | 国产高清在线观看 | 国产精品视频不卡 | 国产丝袜一区二区三区免费视频 | 亚洲精品第一 | 久久免费精彩视频 | 五月天婷婷综合 | 日日爱av | 欧美aaaaaaaaaa| 午夜免费在线电影 | 国产高清精品一区二区三区 | 国产美女免费视频 | 毛片a级 | 欧美高清免费 | 亚洲一区二区三区在线 | 黑人巨大精品欧美一区二区免费 |