不確定環境下的自動駕駛如何實現?
本文經自動駕駛之心公眾號授權轉載,轉載請聯系出處。
Automated Driving in Uncertain Environments: Planning with Interaction and Uncertain Maneuver Prediction,Constantin Hubmann1, Jens Schulz2, Marvin Becker3, Daniel Althoff4, and Christoph Stiller5。
文章采用了pomdp的方式建模環境的不確定性問題,從而達到處理環境車輛意圖和感知的不確定性。這里處理的環境主要是十字路口環境,決策是先固定了空間軌跡,然后進行縱向決策,體現在自動的速度變化上。是一種解耦的思路。這個文章還有一個更早的版本,不過內容是一樣的,所以不必去看了,Decision making for autonomous driving considering interaction and uncertain prediction of surrounding vehicles。
而對于目標車,由于其route是hidden variable, 是我們希望估計的東西,這個東西會通過后面的貝葉斯推斷的方式進行更新,所以對于目標車,我們關注的狀態中有一個route r, 此外由于后面是通過這個車的空間位置和車速進行貝葉斯推斷的,所以觀測空間中有位置和速度的信息,這里其他車的state包括:
離散空間的狀態轉移方程:
這里的加速度,通過heuristic的方式計算得到,這個值可以用數據訓練獲得,也可以用一些簡單的規則的方式獲得:
接下來是觀測空間,這個觀測上面說了,要用貝葉斯推斷來更新概率,且用了空間位置和車速,所以這里的觀測狀態對于自己來說是:
而對于其他車輛則是:
對于觀測函數來說,觀測特征是:
采用貝葉斯推斷:
pomdp的求解采用了ABT算法,沒有仔細研究過ABT, 這里就不多寫了。下面可以看一下實驗數據。一個是十字路口場景:
這目標車有可能直行,也有可能右轉,所以存在一定與本車發生交互的可能性。
可以看到上圖中的對比,如果只是采用不考慮不確定性的算法,我們會選擇保守的策略,而考慮了不確定性之后,則會看到軌跡的車速并不會非常保守,這種特點非常像contingency plan出來的效果。往后看實驗數據,在這個類似的場景中:
我們可以看到本車的車速,也就是下圖中的藍色線,首先在不確定目標意圖的時候,在兩車逼近到9s的時候發生了減速,然后隨著目標意圖的收斂,從直行變成了右轉,不與本車發生交互,本車在接下來就開始加速。而在 v-t圖中的對比可以看到,別的兩種軌跡,分別是假設目標100%右轉或者直行的情況下的本車軌跡,考慮不確定性的軌跡事實上是介于兩者中間的,所以有一次非常像contingency plan的結果:
從s-t圖上面可以看到類似的效果:
可以看到本車的藍色線也是介于另外兩種極端可能性之間的。考慮不確定性后可以將軌跡粘合在兩種極端可能性之間,起到contingency的效果。
原文鏈接:https://mp.weixin.qq.com/s/uBOG8XzE5DKYxwTMB9Shkg?poc_token=HG1FAWWjK2Gour3uC1UlGWQ6eowaEestvkP6mi6J