成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

李飛飛的華人斯坦福博士提出SLIDE模型 與英偉達探索通用人工智能

新聞 機器學習
以往的強化學習模型都是指定任務來學習策略,近日,李飛飛的一位本科畢業于清華的博士生Kuan Fang,聯手英偉達提出一個學習模型SLIDE,通過生成多種任務來學習泛化性超強的技能,或許能帶來通用人工智能的新思考。

   [[409525]]

機器學習可以顯著提高智能體的學習效率和泛化能力。

然而在現實世界的應用中,機器人的設計往往比其他問題更加棘手,因為機器人需要大量的訓練和專業知識才能完成設計。

針對這個問題,李飛飛團隊聯合英偉達提出了一個全新的技能訓練方法Skill Learning In Diversified Environments(SLIDE),通過自動生成的一系列不同的任務來發現一般化的技能。

李飛飛的華人斯坦福博士提出SLIDE模型 與英偉達探索通用人工智能

與之前無監督的技能發現工作不同的是,他們是在相同的環境下訓練產生不同的技能,而這篇論文中的方法將每個技能與一個可訓練的任務生成器產生的獨特任務結合起來。

為了鼓勵一般化技能的出現,對于每個被配對到的任務都進行技能訓練,并最大化生成任務的多樣性。在生成的任務中定義一個任務判別器來估計多樣性目標的證據下界。

李飛飛的華人斯坦福博士提出SLIDE模型 與英偉達探索通用人工智能

機器人的技能是通過自動生成任務來學習的。每一項技能都與一項由可訓練的獨特任務相匹配任務生成器。這些技能被訓練成專門從事被匹配到的任務。通過生成的多樣化任務來發現不同的技能。

方法中發現技能的關鍵是設計訓練技能條件任務的目標函數生成器g來創建不同的任務。為了讓更通用的技能可以被學習出來,研究人員認為技能間(inter-skill)的多樣性和技能內部(intra-skill)的多樣性都需要被考慮,在訓練任務生成器g時應當適當平衡。

技能間的多樣性鼓勵每項任務為配對到的技能提出更獨特的挑戰。而內部技能多樣性衡量每個任務所能提供的環境變化。

對于機器人操作任務,開發人員肯定希望機器人擅長不同類型的互動(如推、抓、放等)具有特定類型的對象。同時,也希望每項技能都有足夠能力去處理場景變化和任務初始的通用性。

最后,還需要考慮了任務的可行性以防止在無法解決的任務中學習技能。

李飛飛的華人斯坦福博士提出SLIDE模型 與英偉達探索通用人工智能

上圖就是通過SLIDE模型發現的示例任務和技能,通過展示兩個相關的采樣軌跡來展示技能間和技能內的多樣性。每一個灰色區塊中都有相同的技能指數。每列顯示生成的任務的初始化和技能的執行。不同顏色表示不同物品類別的目的地,包括罐頭(紅色)、盒子(綠色)和餐具(藍色)

文中的實驗設計的主要目的是回答以下問題:1)SLIDE可以通過生成的任務來學習到不同的技能嗎?2) 通過SLIDE學到的技能,能夠被利用和泛化到其他沒見過的任務上嗎?3)SLIDE中的設計選項如何影響學習技能和任務績效?

李飛飛的華人斯坦福博士提出SLIDE模型 與英偉達探索通用人工智能

為了學習機器人技能并評估其對未知目標任務的泛化能力,設計了兩個桌面操作區域。每個域定義一個包含共享相同狀態和動作空間但不同的環境設計和獎勵功能。這兩個任務空間由多個離散和離散變量參數化用于定義初始化、動力學和獎勵功能。

首先訓練技能發現的方法,通過從參數化任務按程序生成任務沒有目標任務概念的空間。然后訓練利用分層策略解決每個沒見過的目標任務從同一領域學到的技能。

研究結果表明,相對于現有的強化學習和技能學習方法,論文中提出的方法學會的技能可以有效地提高機器人在各種沒有目標的任務中的表現。

文章的主要貢獻在于提出了在多樣化的環境中學習技能的模型SLIDE,它通過自動生成一組不同的任務。通過最大化生成任務的多樣性,SLIDE方法能夠發現各種任務以啟用技能策略來激發機器人學習到各種各樣的行為。

通過訓練分層結構,利用所學技能的強化學習算法作為低層策略,在兩個桌面操作區域,能夠有效地提高了隱性目標任務的學習能力與學習效率。

在今后的工作中有幾個方面可以改進。首先,提出的方法是專為學習一定數量的技能而設計的,一個有趣的研究方向是對任務進行開放式技能發現和靈活的技能數量。

其次,文中暗示了在目標任務中對目標任務是有用的,并假設參數化獎勵函數在任務中預定義,但未來的工作可以生成相應任務任務基于內在激勵的獎勵函數。

最后,希望這項工作能鼓勵更多的人努力利用面向機器人學習和類似應用的程序化內容生成,可以為更廣泛的應用范圍提出方法,比如視覺導航和仿人機器人。

文章的第一作者Kuan Fang是斯坦福大學Vision and Learning實驗室的一名博士生,由Silvio Savarese教授和李飛飛教授共同指導,主要研究方向是計算機視覺、機器人和機器學習。

他的本科在清華大學,曾在Google Brain, Google X, 微軟亞洲研究院實習。

[[409526]]

本文的第二作者Yuke Zhu是德克薩斯州大學奧斯汀分校計算機科學系的助理教授,也是機器人感知和學習實驗室的主任,同時還是 NVIDIA 研究中心的高級研究科學家。

主要研究方向是為機器人和具身代理人構建智能算法,這些機器人和具身代理人可以推理并與現實世界互動,這項研究是機器人學、計算機視覺和機器學習的交叉。重點研究了感知和控制的方法和機制,以實現通用機器人的自主性。

[[409527]]

這篇論文的導師是李飛飛,2020年當選為美國國家工程院院士,美國國家醫學院院士,2021年當選為美國藝術與科學院院士。她的工作包括括受認知啟發的AI,機器學習,深度學習,計算機視覺和AI+醫療保健,尤其是用于醫療保健交付的環境智能系統。

她還從事認知和計算神經科學方面的工作。她發明了ImageNet和ImageNet Challenge,其中ImageNet Challenge是一項重要的大規模數據集和基準測試工作

[[409528]]

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-05-01 15:42:30

NLP人工智能自然語言處理

2018-11-21 14:54:56

2022-06-20 11:05:58

通用人工智能機器人

2024-05-06 07:10:00

李飛飛智能空間

2023-03-06 10:26:37

AI研究

2022-07-31 23:46:57

人工智能語言模型感知力

2022-07-04 15:29:59

人工智能機器計算機

2019-03-27 10:47:05

人工智能法律AI

2019-03-20 14:02:13

AI 行業 人工智能

2017-09-09 15:00:17

谷歌AI皮膚病

2024-01-16 10:22:23

人工智能大型語言模GPT 4

2021-02-06 10:43:49

人工智能

2023-03-15 10:35:16

GPTAI

2023-07-10 10:36:17

人工智能AI

2020-04-07 15:22:56

李飛飛AI人工智能

2016-09-20 10:22:58

京東智能GPU技術

2019-03-24 12:11:47

AI 數據人工智能

2020-10-16 10:27:58

人工智能

2024-05-24 16:38:28

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕高清 | 亚洲91 | 精品动漫一区 | 亚洲精品久久久一区二区三区 | 91久久久www播放日本观看 | 欧美视频三区 | 日韩欧美一区二区在线播放 | 色男人天堂av| 一区二区三区四区视频 | 欧美综合国产精品久久丁香 | 欧美5区 | 91视频在线看 | 国产精品久久久久久久午夜片 | 国产精品无码专区在线观看 | 午夜久草 | 国产精品久久777777 | 久久久久黑人 | 91免费在线 | 嫩草视频在线免费观看 | 日韩av成人| 国产高清精品一区二区三区 | 亚洲成人免费观看 | 国产露脸对白88av | 久久久男人的天堂 | 色综合美女 | av在线天堂 | 日韩久草 | 中文字幕成人av | 欧美国产激情二区三区 | 国产高清在线视频 | 国产精品久久久久久久久久久久午夜片 | 国产一区亚洲二区三区 | 在线国产视频观看 | 免费观看成人鲁鲁鲁鲁鲁视频 | 久久久久国产 | 日韩一级黄色毛片 | 欧美aaaaa| 日韩在线视频一区二区三区 | 天堂成人国产精品一区 | 一级女毛片| 国产一区二区三区在线 |