成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

百度IDL最新成果:從自然語言入手,教AI智能體像人類一樣學習

人工智能 機器學習
盡管人工智能取得了巨大的進步,但在許多方面仍然存在局限。例如,在電腦游戲中,如果AI智能體未預先編程游戲規則,則必須嘗試數百萬次才能確定正確的選擇。人類可以在更短的時間內完成相同的壯舉,因為我們擅長通過使用語言將過去的知識轉移到新的任務中。

盡管人工智能取得了巨大的進步,但在許多方面仍然存在局限。例如,在電腦游戲中,如果AI智能體未預先編程游戲規則,則必須嘗試數百萬次才能確定正確的選擇。人類可以在更短的時間內完成相同的壯舉,因為我們擅長通過使用語言將過去的知識轉移到新的任務中。

在一個屠龍游戲中,AI智能體需要嘗試許多其他的動作(對著墻或是花叢噴火),才能理解它必須殺死龍。然而,如果AI智能體理解語言,人類可以簡單地使用語言來指示它:“殺死龍才能使游戲獲勝”。

在人類如何概括技能并將其應用于新任務方面上,基于視覺的語言發揮著重要作用,這對于機器仍然是一個重大挑戰。開發復雜的語言系統對于機器變得真正智能,并獲得像人類一樣學習的能力至關重要。

作為實現這一目標的第一步,百度IDL實驗室開發了一個使用監督學習和強化學習的組合系統,允許虛擬教師向虛擬AI智能體教授語言,通過將語言與感知和動作連接起來,就像父母教他們的寶寶一樣。

IDL實驗室的結果表明,在訓練結束后,AI智能體能夠以自然的語言正確地解讀老師的指令,并采取相應的行動。更重要的是,AI智能體開發了“zero-shot學習能力”,這意味著智能體能夠理解潛在的語句,研究院發現,“這項研究使我們向教機器像人類一樣學習邁進一步。”

論文鏈接:http://arxiv.org/abs/1703.09831

學習概況

該研究在稱為XWORLD的2D迷宮般的環境中進行,百度的虛擬智能體需要根據虛擬教師發出的自然語言命令進行導航。一開始,智能體對這種語言一無所知,每一個字都同等的沒有任何意義。 然而,當它探索環境時,如果執行命令成功(或失敗),老師會給出積極的(或消極的)回應。

為了幫助智能體學習得更快,老師還會在智能體導航時詢問有關環境的簡單問題。智能體需要正確的回答問題。通過鼓勵正確的行動/答案,懲罰不正確的行動/回答,經過多次試驗和錯誤,老師得以訓練智能體去了解自然語言。

一些示例命令包括:

  • 請移動到蘋果處。
  • 你可以移動到蘋果和香蕉之間的網格嗎?
  • 你能移動到紅蘋果處嗎?

一些Q&A的例子:

  • 問:北方的物體是什么?答:一根香蕉。
  • 問:香蕉在哪里?答:北邊。
  • 問:蘋果西邊物體的顏色是多少? 答:黃色

結果

最后,智能體能夠正確地解釋教師的命令并導航到正確的地方。更重要的是,智能體開發了研究團隊的所謂的“zero-shot learning ability”,這意味著即使是以前沒有看到的全新命令,如果有足夠的以前看過的相似形式的句子,仍然能夠正確的執行任務。換句話說,智能體能夠以已知的方式(語法)理解用已知單詞組合的新句子。

例如,一個學習如何用刀切一個蘋果的人將會知道如何用刀切火龍果。將過去的知識應用于新任務對于人來說非常容易,但是對于目前的端到端學習機器來說仍然是困難的。

雖然機器可能知道“火龍果”的樣子,但是除非它已經使用包含該命令的數據集進行了明確的訓練,否則它無法執行“用刀切割火龍果”的任務。相比之下,我們的智能體表現出能夠轉移它所知道的關于火龍果的視覺外觀,以及“用刀切”的任務,即使沒有經過確切的的訓練,仍然可以成功進行用“用刀切割龍果”的任務 。

下圖展現了我們的智能體成功執行導航任務測試。

百度IDL最新成果:從自然語言入手,教AI智能體像人類一樣學習

導航語句

  • 請移動到卷心菜的西邊。
  • 請移動到無花果的東邊。

識別語句

  • Q:東南邊是什么?
  • A:西瓜。

導航測試

  • 請移動到無花果的西邊。

百度IDL最新成果:從自然語言入手,教AI智能體像人類一樣學習

導航語句

  • 你可以移動到椰子處嗎?
  • 你可以移動到蘋果處嗎?

導航測試

  • 你可以移動到西瓜處嗎?

百度研究院的后續研究有兩個方向:

  • 一個是在當前2D環境中用自然語言命令教授智能體更多的能力,
  • 另一個是將其遷移到虛擬3D環境。虛擬3D環境帶來更多的挑戰,而且更像是我們現實生活的環境。

而百度的最終目標,是讓人類在現實環境中,采用自然語言來訓練一個真正意義上的機器人。

責任編輯:未麗燕 來源: 雷鋒網編譯
相關推薦

2020-01-09 17:03:29

人工智能技術算法

2020-07-30 15:14:16

AI阿里SIGIR 2020

2020-09-30 17:12:09

人工智能技術數據

2022-07-28 14:46:01

人工智能機器人計算機科學

2017-11-14 19:19:07

人工智能自然語言處理百度

2022-03-28 10:32:28

AI功能手勢

2015-03-11 17:53:36

2022-02-24 13:59:59

AI智能體研究

2023-09-22 11:56:57

模型駕駛

2024-08-14 14:43:00

2024-01-05 07:36:54

人工智能創造力模型

2020-09-05 22:16:08

百度AI王海峰

2021-07-08 20:00:27

AI

2020-11-10 19:19:55

百度

2021-10-19 10:08:39

人工智能機器學習技術

2017-01-12 16:13:28

自然語言深度學習系統

2018-12-17 16:25:10

百度AI陽泉
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 色综合激情 | 久久久国产精品 | 日韩一区二区黄色片 | 一区二区三区四区毛片 | 蜜桃av一区二区三区 | 一区二区三区四区在线视频 | 久久一| 日韩精品 电影一区 亚洲 | 日韩精品在线免费观看 | 91免费视频| 欧美三级成人理伦 | 99精品视频免费观看 | 国产欧美日韩精品一区 | 亚洲人成一区二区三区性色 | 大陆一级毛片免费视频观看 | 成人精品福利 | www.黄网 | 99re在线免费视频 | 在线观看中文视频 | 中文字幕一区在线 | 九九热精品在线 | 亚洲精品视 | 国产精品久久久久久久7电影 | 国产一级淫片a直接免费看 免费a网站 | 97国产一区二区精品久久呦 | 特级毛片www | 久久精品av麻豆的观看方式 | 欧美久久综合 | 99精品国自产在线 | 中文成人无字幕乱码精品 | 午夜电影网站 | 91短视频网址 | 1000部精品久久久久久久久 | 国产成人精品网站 | 国产日韩欧美 | 精品一区二区三区四区 | 国产乱码精品1区2区3区 | 黄色av网站在线免费观看 | 亚洲欧美aⅴ | 国产成人精品一区二三区在线观看 | 久久精品在线 |