最新機器人學習系統(tǒng)問世 一段視頻就能學會工作內容
人類或許很快就能夠通過向機器人展示如何工作,讓機器人學會如何完成工作任務,而且只需要演示一次。美國加州大學伯克利分校的研究人員已經研發(fā)出一種方式來加速我們對這些機器朋友的教育。在最近發(fā)表的一篇論文中,研究人員公布了一種全新的學習算法,能夠讓機器人模擬完成在視頻中只觀看過一次的行動。
現(xiàn)在訓練機器人是一項艱難的工作,即使是拿起一個杯子這樣非常簡單的動作也需要一段又一段的編碼,來告訴機器人每一個步驟需要做什么。這個編程過程對于我們人類來說非常困難而且復雜,甚至有時會令人感到沮喪。
即使是編碼完全編寫完成之后也還有許多工作要做。我們拿裝配線的機器人來舉例。在所有的指令被輸入到電路當中之后,這些機器人必須經歷一個長時間的訓練過程,在這個訓練過程中它們必須重復執(zhí)行每一個步驟。它們需要不斷重復這個過程,直到它們能夠在不犯錯誤的情況下完成任務。
最近已經有程序員研發(fā)出了一種軟件,能夠讓機器人僅僅通過觀察特定的任務就能夠實現(xiàn)編程。雖然這種學習方式非常類似于我們或者動物的學習方式,但這仍然是一種笨拙的方法。目前來說,我們需要向我們的機器人朋友展示這樣的訓練視頻,而且在它們完全掌握之前需要播放數(shù)千次。
然而,加州大學伯克利的研究團隊已經描述了他們研發(fā)的另外一項新技術,這項技術能夠讓機器人只觀察一次人類的某種動作就學會它。研究人員稱,他們研發(fā)的這項技術將模仿學習與一種元學習算法結合到一起。
他們把這個系統(tǒng)命名為“未知模型元學習系統(tǒng)(簡稱MAML)”。元學習本質上意味著學會學習的過程。MAML系統(tǒng)意味著機器人能夠在之前獲得經驗的基礎上來學習某種新的東西。比如說,如果向機器人展示的是某人拿取蘋果并且放進一個杯子的視頻,那么它就能夠估計自己的目標是什么,就是把蘋果放進杯子當中。
當它學會如何處理這些物體時,它就能夠將這種知識推廣到其它類似的行為。比如說,如果你隨后向它展示一段某人將一個桔子放在盤子上的視頻,它就能夠識別這些行為并且快速將其轉變成為自己完成這個任務需要的動作。
對于那些流水線的裝配機器人來說,它們不需要了解什么是桔子或者什么是盤子,它只需要執(zhí)行需要完成的任務。簡言之,MAML系統(tǒng)提供了一個平臺,讓神經網絡或者機器人以相對較少的數(shù)據(jù)學會如何執(zhí)行各種任務。這幾乎與現(xiàn)在的神經網絡工作方式完全相反,后者執(zhí)行一項簡單任務就需要大量的數(shù)據(jù)。
研究團隊在幾個機器人身上對MAML系統(tǒng)進行了測試。研究人員聲稱,在展示了一段演示視頻之后,機器人能夠成功完成視頻中展示的任務。研究人員推斷,經過元學習之后,機器人借助人類的演示視頻就能夠學會放置、推動以及拾取和放置新物體。