成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

SLAM算法解析:抓住視覺SLAM難點,了解技術發展大趨勢

移動開發 開發 算法
SLAM(Simultaneous Localization and Mapping) 是業界公認視覺領域空間定位技術的前沿方向,中文譯名為「同步定位與地圖構建」,它主要用于解決機器人在未知環境運動時的定位和地圖構建問題。

 SLAM(Simultaneous Localization and Mapping) 是業界公認視覺領域空間定位技術的前沿方向,中文譯名為「同步定位與地圖構建」,它主要用于解決機器人在未知環境運動時的定位和地圖構建問題。本次閱面科技資深研究員趙季也將從 SLAM 方向著手,為大家展現更深層次的技術干貨。

趙季:閱面科技資深研究員。2012 年獲華中科技大學博士學位,2012 年至 2014 年在 CMU 機器人研究所做博士后。曾在三星研究院從事深度相機、SLAM、人機交互方面的研究。目前專注于空間感知技術的研發。

目前科技發展速度飛快,想讓用戶在 AR/VR、機器人、無人機、無人駕駛領域體驗加強,還是需要更多前沿技術做支持,SLAM 就是其中之一。實際上,有人就曾打比方,若是手機離開了 WIFI 和數據網絡,就像無人車和機器人,離開了 SLAM 一樣。

SLAM 主要解決的是相機在空間中的定位、以及創建環境的地圖。在當前比較熱門的一些創業方向中,都可以看到它的身影:

  • 在 VR/AR 方面,根據 SLAM 得到地圖和當前視角對疊加虛擬物體做相應渲染,這樣做可以使得疊加的虛擬物體看起來比較真實,沒有違和感。

  • 在無人機領域,可以使用 SLAM 構建局部地圖,輔助無人機進行自主避障、規劃路徑。

  • 在無人駕駛方面,可以使用 SLAM 技術提供視覺里程計功能,然后跟其他的定位方式融合。

  • 機器人定位導航方面,SLAM 可以用于生成環境的地圖。基于這個地圖,機器人執行路徑規劃、自主探索、導航等任務。

SLAM 技術的發展距今已有 30 余年的歷史,涉及的技術領域眾多。由于本身包含許多步驟,每一個步驟均可以使用不同算法實現,SLAM 技術也是機器人和計算機視覺領域的熱門研究方向。

SLAM 技術大解析

SLAM 的英文全程是 Simultaneous Localization and Mapping,中文稱作「同時定位與地圖創建」。SLAM 試圖解決這樣的問題:一個機器人在未知的環境中運動,如何通過對環境的觀測確定自身的運動軌跡,同時構建出環境的地圖。SLAM 技術正是為了實現這個目標涉及到的諸多技術的總和。

SLAM 技術涵蓋的范圍非常廣,按照不同的傳感器、應用場景、核心算法,SLAM 有很多種分類方法。按照傳感器的不同,可以分為基于激光雷達的 2D/3D SLAM、基于深度相機的 RGBD SLAM、基于視覺傳感器的 visual SLAM(以下簡稱 vSLAM)、基于視覺傳感器和慣性單元的 visual inertial odometry(以下簡稱 VIO)。

基于激光雷達的 2D SLAM 相對成熟,早在 2005 年,Sebastian Thrun 等人的經典著作《概率機器人學》將 2D SLAM 研究和總結得非常透徹,基本確定了激光雷達 SLAM 的框架。目前常用的 Grid Mapping 方法也已經有 10 余年的歷史。2016 年,Google 開源了激光雷達 SLAM 程序 Cartographer,可以融合 IMU 信息,統一處理 2D 與 3D SLAM 。目前 2D SLAM 已經成功地應用于掃地機器人中。

 

[[195879]]

基于深度相機的 RGBD SLAM 過去幾年也發展迅速。自微軟的 Kinect 推出以來,掀起了一波 RGBD SLAM 的研究熱潮,短短幾年時間內相繼出現了幾種重要算法,例如 KinectFusion、Kintinuous、Voxel Hashing、DynamicFusion 等。微軟的 Hololens 應該集成了 RGBD SLAM,在深度傳感器可以工作的場合,它可以達到非常好的效果。

視覺傳感器包括單目相機、雙目相機、魚眼相機等。由于視覺傳感器價格便宜,在室內室外均可以使用,因此 vSLAM 是研究的一大熱點。早期的 vSLAM 如 monoSLAM 更多的是延續機器人領域的濾波方法。現在使用更多的是計算機視覺領域的優化方法,具體來說,是運動恢復結構(structure-from-motion)中的光束法平差(bundle adjustment)。在 vSLAM 中,按照視覺特征的提取方式,又可以分為特征法、直接法。當前 vSLAM 的代表算法有 ORB-SLAM、SVO、DSO 等。

視覺 SLAM

視覺傳感器對于無紋理的區域是沒有辦法工作的。慣性測量單元(IMU)通過內置的陀螺儀和加速度計可以測量角速度和加速度,進而推算相機的姿態,不過推算的姿態存在累計誤差。視覺傳感器和 IMU 存在很大的互補性,因此將二者測量信息進行融合的 VIO 也是一個研究熱點。按照信息融合方式的不同,VIO 又可以分為基于濾波的方法、基于優化的方法。VIO 的代表算法有 EKF、MSCKF、preintegration、OKVIS 等。Google 的 Tango 平板就實現了效果不錯 VIO。

總的來說,相比于基于激光雷達和基于深度相機的 SLAM,基于視覺傳感器的 vSLAM 和 VIO 還不夠成熟,操作比較難,通常需要融合其他傳感器或者在一些受控的環境中使用。

Visual LAM 為什么比較難?

我們通過分析傳感器的測量信息做個定性的分析。激光雷達或者 RGBD 相機可以直接獲取環境的點云。對于點云中的一個點,它告訴我們在某個方位和距離上存在一個障礙點。而視覺傳感器獲取的是灰度圖像或者彩色圖像。對于圖像中的一個像素,它只能告訴我們在某個方位有障礙點、障礙點周圍的表觀(local appearance)如何,但它不能告訴我們這個障礙點的距離。要想計算該點的距離,需要把相機挪動一個位置再對它觀察一次,然后按照三角測量的原理進行推算。

原理上很清晰,實際做起來并不簡單。首先需要在兩幅圖像中尋找點的對應,這涉及到特征點的提取和匹配、或者準稠密點之間的匹配。計算機視覺發展到今天,其實還不存在性能和速度上很好滿足 vSLAM 的特征提取和匹配算法。常見的特征點提取算法,性能上大致可以認為 SIFT>SURF>ORB>FAST,效率上可以認為 FAST>ORB>SURF>SIFT(大于號左邊代表更優。性能主要包括匹配精度、特征點的數量和空間分布等)。為了在性能和效率上取得折中,通常采用 FAST 或者 ORB,只能舍棄性能更好的 SIFT、SURF 等。

其次,匹配點的圖像坐標與空間坐標之間的關系是非線性的,例如 2D-2D 點的對應滿足對極幾何、2D-3D 點的對應滿足 PnP 約束。這些匹配數量較多,前后兩幀圖像中一般有幾十至數百的匹配。這些匹配會引入眾多約束關系,使得待估計變量的關系錯綜復雜。為了得到一個較優的估計,通常需要建立優化問題,整體優化多個變量。說起來這無非是一個非線性最小二乘優化問題,但實現起來并不簡單,因為存在非線性約束、約束數量很多、存在誤差和野值點,并且要將計算時間控制在允許范圍。目前廣泛采用關鍵幀技術,并且通過很多方法來控制問題規模、保持問題的稀疏性等。

 

非線性優化問題的形象圖示

圓餅代表待優化的變量(相機姿態、特征點的空間坐標),桿子代表約束(對線幾何、PnP 等)。圖片來源自 https://www.pinterest.com/81chevycowper/70s-80s-toys/

前面分析了 vSLAM 的兩個困難。前者導致了前端的特征跟蹤不易,后者導致了后端的優化不易。想做出一個高效率、魯棒的 vSLAM 系統還是一個非常有挑戰的任務。效率方面,SLAM 必須是實時運行的。如果不能做到實時,就不能稱作 SLAM。不考慮實時性,采用從運動恢復結構(structure-from-motion)效果會更好。魯棒性方面,一個脆弱的系統會導致用戶體驗很差,功能有限。

 

使用 structure-from-motion 對玲瓏塔進行三維重建

vSLAM 的核心算法

預備階段,包括傳感器的選型和各種標定。Visual SLAM 自 PTAM 算法以來,框架基本趨于固定。通常包括 3 個線程,前端 tracking 線程、后端 mapping 優化線程、閉環檢測(loop closure)線程。

前端 tracking 線程主要涉及到:

  1. 特征的提取、特征的匹配;

  2. 多視圖幾何的知識,包括對極幾何、PnP、剛體運動、李代數等。

后端優化線程涉及到非線性最小二乘優化,屬于數值優化的內容。閉環檢測線程涉及到地點識別,本質上是圖像檢索問題。對于 VIO,還涉及到濾波算法、狀態估計等內容。

將 SLAM 算法拆解了看,用到的技術是偏傳統的。與當前大熱的深度學習「黑箱模型」不同,SLAM 的各個環節基本都是白箱,能夠解釋得非常清楚。但 SLAM 算法并不是上述各種算法的簡單疊加,而是一個系統工程,里面有很多 tradeoff。如果僅僅跑跑開源程序,沒有什么核心競爭力。不論是做產品還是做學術研究,都應當熟悉各種技術,才能有所創造。

SLAM 的未來發展趨勢

VSLAM 的發展感覺是中規中矩,各個環節在前人的基礎上一點點優化,同時不斷吸收其他方向的最新成果。短期內肯定會在現有框架下不停地改進。至于長遠一些的趨勢,IEEE TRO 2016 有一篇綜述文章 Past, present, and future of SLAM: towards the robust-perception age。幾位有聲望的學者在文中對 SLAM 的趨勢做了非常好的總結。這里僅就自己感興趣的點提一些個人感想。

新型傳感器的出現會不停地為 SLAM 注入活力。如果我們能夠直接獲取高質量的原始信息,SLAM 的運算壓力就可以減輕很多。舉例來說,近幾年在 SLAM 中逐漸有使用低功耗、高幀率的 event camera(又稱 dynamic vision system, DVS)。如果這類傳感器的成本能降下來,會給 SLAM 的技術格局帶來許多變化。

自從深度學習在諸多領域所向披靡,不少研究者試圖用深度學習中 end-to-end 的思想重構 SLAM 的流程。目前有些工作試圖把 SLAM 的某些環節用深度學習代替。不過這些方法沒有體現出壓倒性優勢,傳統的幾何方法依然是主流。在深度學習的熱潮之下,SLAM 涉及的各個環節應該會逐漸吸收深度學習的成果,精度和魯棒性也會因此提升。也許將來 SLAM 的某些環節會整體被深度學習取代,形成一個新的框架。

SLAM 原本只關注環境的幾何信息,未來跟語義信息應該有更多的結合。借助于深度學習技術,當前的物體檢測、語義分割的技術發展很快,可以從圖像中可以獲得豐富的語義信息。這些語義信息是可以輔助推斷幾何信息的,例如已知物體的尺寸就是一個重要的幾何線索。

責任編輯:張子龍 來源: 閱面科技微信公號
相關推薦

2017-08-03 16:07:23

SLAM視覺傳感器

2022-02-22 11:35:13

身份管理安全管理

2020-03-05 18:32:52

NFV網絡5G

2015-09-09 15:31:34

2018-07-12 16:03:26

SLAM技術定位

2016-05-13 15:13:02

平安城市

2024-01-11 15:27:53

人工智能數字孿生量子計算

2023-09-14 11:47:05

2020-06-28 10:26:38

網絡安全網絡犯罪安全技術

2020-08-25 10:11:04

云原生運維容器

2009-12-27 21:53:33

中國機柜技術發展趨勢

2017-11-02 13:13:45

2016-10-26 13:55:34

桌面云技術趨勢

2018-05-10 16:24:45

數據庫發展趨勢

2015-05-22 16:01:11

傳送網傳送網技術

2019-12-12 08:26:34

技術網絡安全人工智能

2021-06-25 10:32:49

首席信息官技術發展人工智能

2009-10-29 10:14:08

2009-11-02 12:53:25

接入網技術

2009-05-05 14:11:44

存儲虛擬化gartner
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久久久久91 | av一区二区在线观看 | av中文字幕在线 | 国产日产精品一区二区三区四区 | 免费99精品国产自在在线 | 三极网站| 成人免费在线网 | 国产成人精品免费 | 精品视频一区二区三区在线观看 | 欧美黑人国产人伦爽爽爽 | 精品久久香蕉国产线看观看亚洲 | 日韩欧美一区二区三区四区 | 免费观看的av毛片的网站 | 久久久久久久久久久91 | 成人精品福利 | 97精品久久 | 久久久久亚洲精品 | 国产精品美女久久久久久免费 | 久久久久国产一区二区三区四区 | 久久91精品国产一区二区 | 中文字幕日韩一区二区 | 国产成人免费视频网站视频社区 | 精品日韩在线 | 一级黄色毛片免费 | 久久99精品视频 | 欧美一级特黄aaa大片在线观看 | 国产黑丝av | 亚洲国产精品久久人人爱 | 日韩一区二区视频 | 欧美精品综合在线 | 精品国产乱码一区二区三区a | 91精品国产综合久久婷婷香蕉 | 欧美日韩精品一区二区三区视频 | 黄色在线免费观看 | 免费观看黄色一级片 | 久久网日本 | 欧美色影院 | 中文字幕 在线观看 | 一区二区三区四区国产 | 日本久久一区二区三区 | 免费一区二区 |