ClutterGen:用于機器人學習的雜亂場景生成器 原創
模擬在推動機器人學習方面發揮了重要作用,通過提供一個受控而多變的環境來開發和測試算法。特別是數據驅動方法通常將機器人部署到仿真環境中,在各種多樣化和隨機化的設置中進行廣泛訓練,以實現可泛化和適應性強的行為。通過隨機化物體形狀、紋理和動態特性,機器人學習取得了顯著進展。然而,盡管物體屬性是一個關鍵因素,但物體布局仍然具有挑戰性,難以實現完全開放式的隨機化。與可以在不干擾其他物體的情況下輕松指定范圍的物體屬性不同,物體布局必須考慮其他物體的存在和物理可行性。例如,在場景中布置物體需要確保它們不重疊,并且放置在穩定的位置,而不是從空中掉落。現有的努力通常通過固定物體的基礎來解決這個問題,但這種策略對于像瓶子或杯子等許多物體并不適用。隨著物體數量在有限空間內的增加,生成隨機化而又穩定的物體布局變得指數級困難。圖(a)展示了使用廣泛采用的隨機采樣和拒絕失敗軌跡的方法在桌子上放置七個物體時遇到的挑戰。其他方法需要人工手動指定物體區域以進行局部隨機化,或者將可能的放置空間離散化以避免碰撞。然而,導航和操作混亂環境是將機器人學習應用于現實世界的重要挑戰。
近日,杜克大學研究人員提出了ClutterGen,一個物理上可適應的仿真場景生成器,能夠生成多樣化、混亂且穩定的場景,用于機器人學習。生成這樣的場景具有挑戰性,因為每個物體都必須遵守重力和碰撞等物理法則。隨著物體數量的增加,找到有效的姿勢變得更加困難,需要大量的人工工程工作,這限制了場景的多樣性。為了克服這些挑戰,研究人員提出了一種強化學習方法,可以利用仿真器提供的基于物理的獎勵信號進行訓練。ClutterGen是一個自回歸仿真場景生成器,用于創建物理合規且高度多樣化的混亂場景。通過將混亂場景生成視為強化學習問題,ClutterGen從3D觀測中學習閉環策略,無需預先存在的數據集或人工規范。一旦訓練完成,ClutterGen可以應用于原始環境的各種變化,無需進行精細調整。實驗表明,ClutterGen可以在有限的桌面表面上生成包含多達十個物體的混亂物體布局。此外,該策略設計明確鼓勵生成場景的多樣性,以支持開放式生成。真實機器人實驗結果表明,ClutterGen可以直接用于混亂重新排列和穩定放置策略的訓練。
譯自(有刪改):http://www.generalroboticslab.com/blogs/blog/2024-07-06-cluttergen/index.html
本文轉載自公眾號AIGC最前線
原文鏈接:??https://mp.weixin.qq.com/s/85u-GzpTesyko-Ma7dO-QQ??
