突發(fā)!OpenAI聯(lián)創(chuàng)、ChatGPT架構(gòu)師「叛逃」,官宣入職勁敵Anthropic
一大早,全世界都被這個消息震驚了:OpenAI的領(lǐng)導(dǎo)班子動搖了一大片?
根據(jù)外媒Information的曝料,首先是OpenAI聯(lián)創(chuàng)John Schulman官宣離職,轉(zhuǎn)投OpenAI勁敵Anthropic。
此外,另一位聯(lián)創(chuàng)Greg Brockman(經(jīng)常出鏡那位)正在進行長期休假;而去年才加入的產(chǎn)品負責(zé)人Peter Deng也已離職。
根據(jù)Observer今年7月的統(tǒng)計,OpenAI的11人創(chuàng)始團隊,當時只剩下Sam Altman、Greg Brockman、John Schulman和Wojciech Zaremba四人。
圖片
馬庫斯本人對此點評:OpenAI正在上演一場「權(quán)利的游戲」。
圖片
圖片
OpenAI再失創(chuàng)始元老
剛剛,領(lǐng)導(dǎo)「后訓(xùn)練」團隊的AI科學(xué)家John Schulman官宣——自己已經(jīng)做出離開OpenAI的艱難決定。
而現(xiàn)在,他正式入職勁敵Anthropic,專注于AI對齊研究,扎入實際的技術(shù)工作。
Schulman在長文中表示,自己并不是因為OpenAI缺乏對對齊研究的支持,才做出離職的決定。
圖片
離開OpenAI的選擇,是因為自己更加希望專注于AI對齊研究,希望能夠重新從實際技術(shù)工作,開始自己職業(yè)生涯新篇章。
接下來,我決定在Anthropic實現(xiàn)這一目標,在這里我相信可以獲得新的視角,并與對自己最感興趣的話題有深入研究的人一起工作。
需要明確的是,我并不是因為OpenAI缺乏對對齊研究的支持而離開。相反,公司領(lǐng)導(dǎo)在這個領(lǐng)域投入了很多精力。我的決定是個人的,基于我在職業(yè)生涯下一階段中希望如何集中精力。
我感謝Sam和Greg在最初招募我,以及Mira和Bob對我的信任,帶來了很多機會,并幫助我成功應(yīng)對了各種挑戰(zhàn)。我為我們在OpenAI共同取得的成就感到自豪:建立了一家具有公共利益使命的獨特且前所未有的公司。
我相信OpenAI以及我曾參與的團隊在沒有我的情況下仍會繼續(xù)繁榮發(fā)展。后訓(xùn)練由一支擁有出色人才的團隊負責(zé)。
我在ChatGPT上得到了過多的贊譽——Barret在將團隊建設(shè)成現(xiàn)在這樣高效運作上做了出色的工作,還有Liam、Luke和其他人。我很高興看到對齊團隊正在一些有前途的項目上逐步成型。在Mia、Boaz等人的領(lǐng)導(dǎo)下,我相信這個團隊非常有能力。
我非常感激能夠參與到這樣一個重要的歷史階段,并為我們共同取得的成就感到自豪。即使在其他地方工作,我仍會為你們加油。
幾個月前,OpenAI超級對齊團隊負責(zé)人Jan Leike也加盟了Anthropic。Jan Leike激動地表示,「又能在一起工作了」!
圖片
Sam Altman發(fā)文對Schulman在OpenAI期間做出的貢獻表示了感謝。
圖片
你是一位杰出的研究者,對產(chǎn)品和社會有著深刻見解,最重要的是,你是我們所有人的摯友。我們會非常懷念你,會繼續(xù)努力讓你為OpenAI感到自豪。
(2015年,我第一次在伯克利一家咖啡館見到了Schulman。他大概說了這么一句話:「一方面,現(xiàn)在談?wù)揂GI似乎很荒謬,但另一方面,我認為這是非常合理的,這里是為什么以及為什么我認為談?wù)撍苤匾梗缓笏年U述了構(gòu)成了OpenAI初始戰(zhàn)略的重要部分。這大約花了15分鐘,然后我們又尬聊了45分鐘。)
OpenAI研究副總裁Bob MacGrew幾乎在第一時間回復(fù)了Schulman的推特,對他的離職表示惋惜。
圖片
還有已經(jīng)離職OpenAI的研究員,對Schulman未來研究感到興奮。
圖片
網(wǎng)友們也紛紛在評論中玩起了梗。
圖片
圖片
圖片
ChatGPT架構(gòu)師,PPO一作
Schulman與OpenAI的結(jié)緣,是在研究生學(xué)業(yè)完成后,以創(chuàng)始人身份正式加入OpenAI。
至今,他已在OpenAI供職9年。值得一提的是,這是Schulman除實習(xí)之外,唯一工作的公司。
之前,他負責(zé)的是對齊團隊,隨后他開始主要領(lǐng)導(dǎo)「后訓(xùn)練」團隊,對部署在ChatGPT和OpenAI API中的模型進行微調(diào)。
John Schulman本科在加州理工學(xué)院學(xué)習(xí)物理學(xué),之后到加州大學(xué)伯克利分校攻讀神經(jīng)科學(xué)方向的博士。
當時,他對人工智能也有點興趣,但在其中并沒有看到類似神經(jīng)科學(xué)的可遵循的道路。
直到參與伯克利的實驗室輪換項目時,他與Pieter Abbeel共同進行了直升機和機器人方面的工作,由此決定轉(zhuǎn)到EECS(電子工程和計算機科學(xué))。
圖片
Schulman與OpenAI結(jié)緣已久。作為ChatGPT架構(gòu)師,早在2015年還在讀博士學(xué)位時,他就加入OpenAI成為聯(lián)合創(chuàng)始人之一。
圖片
在一次采訪中,Schulman解釋了自己加入OpenAI的原因:
「我想做人工智能方面的研究,我認為OpenAI這家公司的使命雄心勃勃,并且致力打造通用人工智能。」
「盡管,在當時談?wù)揂GI似乎有些瘋狂,但我認為開始考慮它是合理的,我希望在一個地方談?wù)揂GI是可以接受的。」
另外,據(jù)Schulman透露,OpenAI將人類反饋強化學(xué)習(xí)(RLHF)引入ChatGPT的想法可以追溯到2017年,當時Jan Leike和Dario Amodei等人發(fā)表的一篇論文提到了這個方法。
圖片
論文地址:https://arxiv.org/abs/1706.03741
此外,2017年,Schulman在OpenAI任職期間也和團隊首次提出了近端策略優(yōu)化(PPO)算法,其變體PPO-Clip成為了OpenAI使用的主要算法。
圖片
論文地址:https://arxiv.org/abs/1707.06347
OpenAI安全團隊之所以致力于這項工作,是因為想讓模型符合人類的偏好,真正傾聽人類意見,并試圖做人類想做的事情。
在GPT-3完成訓(xùn)練時,Schulman看到了整個研究方向的潛力并決定加入這股潮流,
在很多次采訪中,Schulman都表達了對于人工智能下一前沿領(lǐng)域的看法:AI在更艱難的任務(wù)上不斷進步的同時,人類應(yīng)該做些什么?在哪些任務(wù)中,人類可以在大模型幫助下有更大影響力,做更多的工作。
此外,指路Schulman在個人博客上發(fā)布的機器學(xué)習(xí)研究指南,最初是在2017年為OpenAI研究員計劃編寫的。干貨滿滿,值得一觀。
圖片