機器人正在創造自己的語言,未來將實現自主交流?
人工智能技術突飛猛進,但是如何解決他們之間交流的問題呢?科幻電影中一般假設它們使用人類語言,但是很明顯,人類語言是一種低效率而模糊的語言,先進的人工智能完全沒必要采用。最近,有一群科學家正在致力于讓機器人創造自己的語言。這當然是一個很有前途的研究,但不知為什么,總讓人有一種細思恐極的感覺。以下是相關介紹。
Igor Mordatch正在努力開發能夠進行對話的機器,這也是其他許多人正在努力的事情。
聊天機器人在硅谷是一個熱詞,但是Mordatch和其他人不一樣:他是一個動畫師出身的機器人專家而不是語言學家,他通常不參與那些語言相關的AI技術。他在皮克斯待過一段時間,并且參與制作了《玩具總動員3》,在此期間還在斯坦福大學和華盛頓大學這樣的地方作為高校科研人員工作,在這些大學訓練機器人像人一樣行動。“我總是熱衷于從零到一的過程,”他說。
讓機器人創造互相交流的語言
在烏克蘭出生,在多倫多長大,31歲的Mordatch是OpenAI的一位訪問學者,這間AI實驗室是由特斯拉的創始人Elon Musk和科技孵化器的主席Sam Altman創立的。Mordatch正在那里研究一種新的方法,使得機器不僅能夠和人交談,而且能夠在機器人之間進行交流。他正在創立一個虛擬世界,軟件機器人出于需要可以在里面創造出他們自己的語言。如OpenAI本周發表的一篇研究論文所披露出的細節那樣,Mordatch和他的伙伴們創造出了一個世界,那里的機器人需要完成特定的任務,比如要把自己移動到某個特定的坐標。這個世界很簡單,就是一個白色的大方塊——只有兩個維度——而機器人是帶顏色的圖形:一個綠色、紅色或是藍色的圓形。但是這個宇宙的意義要更加復雜。作為一種協同合作的方式,這個世界允許機器人創造自己的語言,以幫助其他機器人完成這些任務。
與AlphaGo類似
所有這些都是通過增強式學習(reinforcement learning)實現的,如同圍棋高手AlphaGo的那種基本技術一樣。基本上,這些機器人通過極端的試驗和錯誤來指引自己的世界,它們尋求獎勵的時候會小心地遵循著正確的事情,避開錯誤的事情。他們通過同樣的方式創造出了自己的語言,告訴其他人要去哪些地方能夠幫助他們更快地各就各位。
為了建立它們的語言,當它們在它們的虛擬世界里航行的時候,這些機器人會給自己學到的一些簡單概念指定隨機的抽象特征。他們給彼此指定特征;給虛擬世界里的地點或是物品指定特征;還給比如“去到”和“看著”這樣的動作指定特征。Mordatch和他的同事們希望,隨著這些機器人的語言變得越來越復雜,相關的科技可以把它們的語言翻譯成英語這樣的語言。這是一條漫漫長路——至少對于實用軟件來說是這樣的——但是OpenAI的另一位研究員已經開始研究這種“翻譯機器人”了。
Mordatch說,這些方法最終能使機器對語言有更深的領會,可以讓它們看到語言是如何產生的——而這就為真正的對話提供了一個跳板,一種計算機科學家們夢寐已久卻從未實現的電腦交互界面。
AI里程碑:從模仿人類語言,到創造自己語言
這些方法是語言相關的AI研究的一次重要里程碑。如今,科學家們一般都在研究試圖模仿人類語言的方法,而不是創造出一種新的語言。其中一個例子就是以深度神經網絡為中心的工作。近幾年來,深度神經網絡——能夠從大量數據中找出模式從而學習任務的復雜數學系統——在識別圖像中的物體、識別智能手機的語音命令以及更多其他事情上已經被證明出了有極大的高效性。現在,在Google、Facebook、還有Microsoft這些地方的研究人員憑著有限的成功,開始在理解語言、在英語對話中找出模式應用相似的方法。
Mordatch和他的同事,包括OpenAI和加利福尼亞的研究員、伯克利大學的教授Pieter Abbeel,都質疑那種方法會不會奏效。所以他們從一個截然不同的地方開始了。“智能體要想和人智能地互動,光靠捕獲數據模式是不夠的,”他們的論文里這樣寫道。“如果一個智能體在他的環境里能夠使用語言來達到自己的目的,那么它就理解了這門語言(包括其他非語言的交流以及身體語言)。
對于早期人類來說,語言是因為需要而產生的。他們學著如何交流,因為這能夠幫助他們做其他的事情,可以讓他們有超過動物的優勢。OpenAI的這些研究員想給機器人創造出一種一樣的動態。在他們的虛擬世界里,機器人不僅會學習自己的語言,它們同時還會用簡單的動作輔助交流——比如指向一個特定的位置,或者就把一個機器人從一個地方領到另一個地方——很像嬰兒們的行為。那也是一種語言,或者起碼算是一條通向語言的道路。
但是,仍然有很多AI研究人員認為深度神經網絡——從數據里找出統計模式從而發現語言——的方法有用。“它們本質上還是在捕獲統計模式,只不過是在一個更簡單、更智能的環境里。”Salesforce在OpenAI的團隊里的一名AI研究員Richard Socher說。“在一片有趣的新領域里取得進步沒什么問題,但是那些抽象的論斷就有點太過了。”
無論如何,Mordatch的項目顯示,分析大量數據并不是唯一的道路。系統也可以通過自己的行動來學習,而這可能會帶來非常不一樣的優勢。OpenAI的其他研究人員透露一個更大更復雜的叫做“宇宙”的虛擬世界之后,取消了差不多一樣的這種想法。除此之外,機器人可以在“宇宙”里學習使用常見的軟件應用,比如網頁瀏覽器。這在增強式學習的一種形式里也會發生。而對于OpenAI的創始人之一Ilya Sutskever來說,這種安排其實是理解語言的另一條道路。一個AI只有在理解了人類聊天的自然方式之后才可以瀏覽互聯網。與此同時,微軟正在通過增強式學習的另一種方式來處理語言,而斯坦福的研究員正在探究他們與“機器人協同合作”有關的方法。
***,成功可能會隨著科技的結合而到來,而不是僅憑單一的科技。而Mordatch其實正在提倡另一種科技,讓機器人不僅僅是學著交談,而是理解語言本身,并自己創造出語言。如同人類最初創造語言一樣,機器人也可能因此而迎來新紀元。