成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI喜提姚班學(xué)霸姚順雨:思維樹(shù)作者,普林斯頓博士,還是個(gè)Rapper

人工智能 新聞
這位姚順雨,到底為何能夠引來(lái)如此關(guān)注?

清華姚班學(xué)霸姚順雨,官宣加入了OpenAI。

圖片

而就是這么一則簡(jiǎn)短的消息,卻引來(lái)了圈內(nèi)眾人的圍觀和祝福,來(lái)感受一下這個(gè)feel:

圖片

其中不乏像OpenAI前沿研究主管、美國(guó)IOI教練Mark Chen,以及AI領(lǐng)域的教授、投資人等等。

那么這位姚順雨,到底為何能夠引來(lái)如此關(guān)注?

從他過(guò)往的履歷來(lái)看,我們可以提煉出這樣幾個(gè)關(guān)鍵詞:

  • 清華姚班
  • 姚班聯(lián)席會(huì)主席
  • 清華大學(xué)學(xué)生說(shuō)唱社聯(lián)合創(chuàng)始人
  • 普林斯頓計(jì)算機(jī)博士
圖片
△姚順雨,圖源:個(gè)人主頁(yè)

但除了較為亮點(diǎn)的履歷之外,真正讓姚順雨步入公眾的視野,還是因?yàn)樗亩囗?xiàng)科研成果:

  • 思維樹(shù)(Tree of Thoughts):讓LLM反復(fù)思考,大幅提高推理能力。
  • SWE-bench:一個(gè)大模型能力評(píng)估數(shù)據(jù)集。
  • SWE-agent:一個(gè)開(kāi)源AI程序員。

毫不夸張的說(shuō),幾乎每項(xiàng)研究都在圈里產(chǎn)生了不小的漣漪;并且非常明顯的一點(diǎn)是,它們都是深深圍繞著大模型而展開(kāi)。

圖片

這或許也正應(yīng)了姚順雨此次官宣里的一句話:

是時(shí)候?qū)⒀芯吭妇稗D(zhuǎn)變?yōu)楝F(xiàn)實(shí)了。

至于這個(gè)“研究愿景”,我們繼續(xù)深入了解一下。

研究關(guān)鍵詞:Language Agents

如果縱觀姚順雨的主頁(yè),尤其是論文研究部分,就不難發(fā)現(xiàn)有一個(gè)出鏡頻率極高的詞組——Language Agents

圖片

包括在他X主頁(yè)中的簡(jiǎn)介,第一句話上來(lái)也是Language Agents:

圖片

而這,也正是他博士畢業(yè)論文的題目:Language Agents: From Next-Token Prediction to Digital Automation

圖片

Language Agents,即語(yǔ)言智能體,是姚順雨提出來(lái)了一種新的智能體類別。

和傳統(tǒng)智能體不同的是,這種方法是將語(yǔ)言模型用于智能體的推理和行動(dòng),主打一個(gè)讓它們實(shí)現(xiàn)數(shù)字自動(dòng)化(Digital Automation)

至于具體的實(shí)現(xiàn)方法,則有三個(gè)關(guān)鍵技術(shù)(均有獨(dú)立的論文),它們分別是:

  • ReAct:一種將推理和行動(dòng)相結(jié)合的方法,通過(guò)語(yǔ)言模型生成推理軌跡和行動(dòng),來(lái)解決各種語(yǔ)言推理和決策任務(wù)。
  • 思維樹(shù):一種基于樹(shù)搜索的方法,通過(guò)生成和評(píng)估多個(gè)思維路徑來(lái)解決復(fù)雜問(wèn)題,提高語(yǔ)言模型的推理能力。
  • CoALA:一個(gè)概念框架,用于組織和設(shè)計(jì)語(yǔ)言代理,包括內(nèi)存、行動(dòng)空間和決策制定等方面。

圖片

以ReAct為例,研究是將語(yǔ)言模型的動(dòng)作空間擴(kuò)充為動(dòng)作集和語(yǔ)言空間的并集。

語(yǔ)言空間中的動(dòng)作(即思維或推理軌跡)不影響外部環(huán)境,但能通過(guò)對(duì)當(dāng)前上下文的推理來(lái)更新上下文,可以支持未來(lái)的推理或行動(dòng)。

例如在下圖展示的對(duì)話中,采用ReAct的方法,可以引導(dǎo)智能體把“產(chǎn)生想法→采取行動(dòng)→觀察結(jié)果”這個(gè)過(guò)程進(jìn)行循環(huán)。

如此一來(lái),便可以結(jié)合推理的軌跡和操作,允許模型進(jìn)行動(dòng)態(tài)的推理,讓智能體的決策和最終結(jié)果變得更優(yōu)。

圖片

若是把ReAct的方法歸結(jié)為讓智能體“reason to act”,那么下一個(gè)方法,即思維樹(shù),則重在讓智能體“reason to plan”

圖片

思維樹(shù)是把問(wèn)題表示為在樹(shù)結(jié)構(gòu)上的搜索,每個(gè)節(jié)點(diǎn)是一個(gè)狀態(tài),代表部分解決方案,分支對(duì)應(yīng)于修改狀態(tài)的操作。

它主要涉及四個(gè)問(wèn)題:

  • 思維分解:將復(fù)雜問(wèn)題分解為一系列中間步驟,每個(gè)步驟都可以看作是樹(shù)的一個(gè)節(jié)點(diǎn)。
  • 思維生成:利用語(yǔ)言模型生成每個(gè)節(jié)點(diǎn)的潛在思維,這些思維是解決問(wèn)題的中間步驟或策略。
  • 狀態(tài)評(píng)估:通過(guò)語(yǔ)言模型對(duì)每個(gè)節(jié)點(diǎn)的狀態(tài)進(jìn)行評(píng)估,判斷其在解決問(wèn)題中的進(jìn)展和潛力。
  • 搜索算法:采用不同的搜索算法(如廣度優(yōu)先搜索 BFS 或深度優(yōu)先搜索 DFS)來(lái)探索思維樹(shù),找到最優(yōu)的解決方案。

圖片

將思維樹(shù)應(yīng)用到“24點(diǎn)”游戲中,與此前的思維鏈(CoT)相比,準(zhǔn)確率有了明顯提高。

圖片

至于Language Agents中的最后一個(gè)關(guān)鍵技術(shù),即CoALA,則是一種用于組織和設(shè)計(jì)語(yǔ)言智能體的概念框架。

圖片

從下面的結(jié)構(gòu)圖來(lái)看,它大致分為信息存儲(chǔ)、行動(dòng)空間和決策制定三大模塊。

信息存儲(chǔ)是指語(yǔ)言智能體將信息存儲(chǔ)在多個(gè)內(nèi)存模塊中,包括短期工作記憶和長(zhǎng)期記憶(如語(yǔ)義記憶、情景記憶和程序記憶)

這些內(nèi)存模塊用于存儲(chǔ)不同類型的信息,如感知輸入、知識(shí)、經(jīng)驗(yàn)等,并在智能體的決策過(guò)程中發(fā)揮作用。

除此之外,CoALA 將智能體的行動(dòng)空間分為外部行動(dòng)和內(nèi)部行動(dòng);外部行動(dòng)涉及與外部環(huán)境的交互,如控制機(jī)器人、與人類交流或在數(shù)字環(huán)境中執(zhí)行操作。

內(nèi)部行動(dòng)則與智能體的內(nèi)部狀態(tài)和記憶交互,包括推理、檢索和學(xué)習(xí)等操作。

最終,語(yǔ)言智能體會(huì)通過(guò)決策制定過(guò)程選擇要執(zhí)行的行動(dòng);而這個(gè)過(guò)程也是會(huì)根據(jù)各種因素、反饋,從中找出最優(yōu)解。

圖片

除此之外,還有像開(kāi)源AI程序員的工作SWE-agent等,也在圈里廣泛傳播。

但我們從姚順雨眾多的科研課題中,除了Language Agents之外,還能看到他所追求的另一個(gè)關(guān)鍵詞——計(jì)算的思維

而這一點(diǎn),其實(shí)在他念本科的時(shí)候便已經(jīng)有所透露。

在即將奔赴普林斯頓大學(xué)攻讀計(jì)算機(jī)博士學(xué)位前,作為2015級(jí)學(xué)長(zhǎng),姚順雨曾在清華2019年各類型自主選拔復(fù)試的開(kāi)營(yíng)儀式上向復(fù)試考生分享了本人在清華的學(xué)習(xí)成長(zhǎng)經(jīng)歷。

相關(guān)內(nèi)容記錄在他自己寫的名為“你在清華姚班學(xué)到了什么?姚順雨:足以改變世界”的文章中。

當(dāng)時(shí)他從理論和實(shí)踐兩方面重點(diǎn)分享了計(jì)算的思維,并透露覺(jué)得四年下來(lái),最大的收獲就是計(jì)算的思維

從理論上我們現(xiàn)在看到很多不可能做到的事情。所謂理論指導(dǎo)實(shí)踐,我覺(jué)得更多的是說(shuō),我們得從一個(gè)高度理解一個(gè)系統(tǒng)的能力極限和事情難易,然后再選擇能做的、有意義的事情去做。

和陽(yáng)光開(kāi)朗大男孩tag鎖死,姚順雨還分享了因清華南方浸潤(rùn)計(jì)劃項(xiàng)目,前往阿根廷的經(jīng)歷:

我遇到了一群阿根廷的孩子……英語(yǔ)并不是世界通用的,阿根廷人說(shuō)西班牙語(yǔ)。我曾經(jīng)試圖學(xué)西班牙語(yǔ),但是我放棄了,因?yàn)槲覍W(xué)計(jì)算機(jī),我拿出了谷歌翻譯。我跟他們說(shuō)北京的故宮和長(zhǎng)城……

圖片

△來(lái)源:清華招生 公眾號(hào)

在他看來(lái),這個(gè)時(shí)代,計(jì)算能和任何學(xué)科相結(jié)合,而世界很大,在清華可以做你想做的事。

說(shuō)完姚順雨,姚班還有哪些人在搞大模型?

爆火的大模型,姚班還有誰(shuí)在搞?

不得不提的有馬騰宇陳丹琦

圖片
圖片

倆人當(dāng)年是同班同學(xué),清華姚班2008級(jí)校友,并且之后都拿了具有“諾獎(jiǎng)風(fēng)向標(biāo)”之稱的斯隆獎(jiǎng)。

圖片

馬騰宇博士就讀于普林斯頓大學(xué),導(dǎo)師是理論計(jì)算機(jī)科學(xué)家、兩屆哥德?tīng)柂?jiǎng)得主Sanjeev Arora教授。

博士畢業(yè)后,MIT、哈佛、斯坦福等頂尖高校都給了他助理教授的Offer,馬騰宇最終選擇了斯坦福。

去年年底,馬騰宇還正式宣布大模型創(chuàng)業(yè)了——?jiǎng)?chuàng)立Voyage AI,透露將帶隊(duì)打造目前最好的嵌入模型,還會(huì)提供專注于某個(gè)領(lǐng)域或企業(yè)的定制化模型。

斯坦福人工智能實(shí)驗(yàn)室主任Christopher Manning、AI領(lǐng)域著名華人學(xué)者李飛飛等三名教授擔(dān)任Voyage AI的學(xué)術(shù)顧問(wèn)。

圖片

陳丹琦這邊,清華姚班完成本科學(xué)業(yè)后,2018年又在斯坦福大學(xué)拿下博士學(xué)位,主攻NLP,最終成為普林斯頓大學(xué)計(jì)算機(jī)科學(xué)系助理教授、普林斯頓語(yǔ)言與智能項(xiàng)目副主任,共同領(lǐng)導(dǎo)普林斯頓NLP小組。

其個(gè)人主頁(yè)顯示,“這些天主要被開(kāi)發(fā)大模型吸引”,正在研究主題包括:

  • 檢索如何在下一代模型中發(fā)揮重要作用,提高真實(shí)性、適應(yīng)性、可解釋性和可信度。
  • 大模型的低成本訓(xùn)練和部署,改進(jìn)訓(xùn)練方法、數(shù)據(jù)管理、模型壓縮和下游任務(wù)適應(yīng)優(yōu)化。
  • 還對(duì)真正增進(jìn)對(duì)當(dāng)前大模型功能和局限性理解的工作感興趣,無(wú)論在經(jīng)驗(yàn)上還是理論上。

圖片

陳丹琦團(tuán)隊(duì)的大模型工作,量子位也有持續(xù)關(guān)注。

比如,提出的大模型降本大法——數(shù)據(jù)選擇算法LESS, 只篩選出與任務(wù)最相關(guān)5%數(shù)據(jù)來(lái)進(jìn)行指令微調(diào),效果比用整個(gè)數(shù)據(jù)集還要好。

而指令微調(diào)正是讓基礎(chǔ)模型成為類ChatGPT助手模型的關(guān)鍵一步。

提出爆火的“羊駝剪毛”大法——LLM-Shearing大模型剪枝法,只用3%的計(jì)算量、5%的成本取得SOTA,統(tǒng)治了1B-3B規(guī)模的開(kāi)源大模型。

除了這兩位,業(yè)界、學(xué)術(shù)界姚班校友在搞大模型的還有很多。

之前火爆全網(wǎng)的大模型原生應(yīng)用《完蛋!我被大模型包圍了》及其續(xù)作《我把大模型玩壞了》,就是由姚班學(xué)霸帶隊(duì)開(kāi)發(fā)的。

游戲作者范浩強(qiáng),曠視6號(hào)員工。當(dāng)年以IOI金牌、保送清華姚班、高二實(shí)習(xí)等傳奇事跡被譽(yù)為天才少年。如今他已是曠視科技研究總經(jīng)理,谷歌學(xué)術(shù)h-index 32的行業(yè)大佬。

圖片

馬斯克xAI首個(gè)研究成果——Tensor Programs VI,共同一作中也有姚班校友的身影。

圖片

Tensor Programs VI是xAI創(chuàng)始成員、丘成桐弟子楊格(Greg Yang)之前Tensor Programs系列工作的延續(xù),論文重點(diǎn)探討了“如何訓(xùn)練無(wú)限深度網(wǎng)絡(luò)”。

據(jù)說(shuō)Tensor Programs相關(guān)成果,在GPT-4中已有應(yīng)用。為解讀論文,楊格本人當(dāng)時(shí)還專門在X上進(jìn)行了一場(chǎng)直播分享。

共同一作Dingli Yu,本科畢業(yè)于清華姚班,目前Dingli Yu也快要在普林斯頓計(jì)算機(jī)科學(xué)系博士畢業(yè)了。

圖片

還有很多很多…………

說(shuō)回這次姚順雨被挖到OpenAI,OpenAI這邊的招聘動(dòng)作還在繼續(xù)。

OpenAI工程師Karina Nguyen發(fā)布最新招聘帖:

OpenAI模型行為團(tuán)隊(duì)招人啦!這是一個(gè)集設(shè)計(jì)工程與訓(xùn)練后研究于一體的夢(mèng)想職位,也是世界上最稀有的工作??

我們使用諸如RLHF/RLAIF等對(duì)齊方法定義模型核心行為,以體現(xiàn)基本價(jià)值觀并提升AGI的創(chuàng)造性智能。通過(guò)這些成果,我們與產(chǎn)品+模型設(shè)計(jì)及工程團(tuán)隊(duì)共同開(kāi)創(chuàng)AI界面和交互新模式,這將影響數(shù)百萬(wàn)用戶……

圖片

有意思的是,Karina Nguyen其實(shí)之前是Anthropic AI(Claude團(tuán)隊(duì))研究員,去年五月還和思維鏈“開(kāi)山論文”一作、OpenAI的Jason Wei一同在X(原Twitter)上進(jìn)行提示詞決斗。

圖片

沒(méi)想到Karina Nguyen這么快就跳槽到了OpenAI……

順便提一嘴,就在昨天有消息爆料,谷歌DeepMind研究員Thibault Sottiaux也被挖到了OpenAI。

要知道,Thibault Sottiaux在Gemini初代和Gemini 1.5等論文中都是核心貢獻(xiàn)者。

圖片

由此可見(jiàn)大模型賽道目前火爆程度,各家搶賽道的搶賽道,搶人的搶人。

One More Thing

跟姚順雨同年從清華畢業(yè)的,還有2位姚順yu!

清華大學(xué)官方在2019年三位姚順yu畢業(yè)時(shí),發(fā)了一條微博,還曬了三人的合照。

除了現(xiàn)已加入OpenAI的姚順雨,還有一個(gè)姚順雨是來(lái)自人文學(xué)院日語(yǔ)專業(yè)的一位女生。

另一位姚順yu是姚順,來(lái)自物理系,他是2018年本科生特獎(jiǎng)得主,本科期間就以第一作者在物理頂刊PRL(Physical Review Letters)上發(fā)表論文兩篇、PRB(Physical Review B)一篇。

圖片

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-04-18 09:04:00

2025-05-06 00:00:55

OpenAI算法GPT-4

2022-06-20 09:10:00

AI計(jì)算機(jī)量子

2023-05-22 15:17:02

谷歌AI

2024-10-28 16:02:16

2012-08-02 16:18:10

普林斯頓結(jié)構(gòu)哈佛結(jié)構(gòu)架構(gòu)

2025-02-27 10:00:00

2024-12-03 13:40:31

2011-04-22 10:14:34

無(wú)線網(wǎng)絡(luò)DHCPAndroid

2022-07-26 09:56:48

模型AI

2025-02-11 09:15:00

AI模型訓(xùn)練

2024-11-04 14:26:14

2020-12-02 10:05:26

AI 數(shù)據(jù)人工智能

2021-02-20 09:01:05

網(wǎng)游仙劍姚壯憲

2025-01-16 09:20:00

AI論文模型

2023-09-18 11:25:00

2024-06-03 12:03:56

2023-05-23 09:56:14

機(jī)器人谷歌

2021-11-09 09:52:57

神經(jīng)網(wǎng)絡(luò)AI算法
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日韩在线不卡 | 亚洲精品免费视频 | 黄在线免费观看 | 亚洲国产成人精品一区二区 | 一区二区三区中文字幕 | 丁香婷婷综合激情五月色 | 成人在线播放网站 | 日本激情视频中文字幕 | 日韩中文字幕一区二区 | 精品www| 91久久精品| 九九视频在线观看 | 又爽又黄axxx片免费观看 | 欧美在线视频一区二区 | 亚洲视频一区二区三区 | 亚洲精品一区二区三区在线 | 国产无人区一区二区三区 | 日韩一区二区免费视频 | 国产成人一区二区三区精 | www.嫩草| 精品国模一区二区三区欧美 | www精品美女久久久tv | 日韩精品一区二区三区中文在线 | 亚洲二区精品 | 天天看天天摸天天操 | 亚洲va国产日韩欧美精品色婷婷 | 久久丝袜 | 日韩欧美在线视频 | 久热国产在线 | 黄色在线免费观看 | 秋霞在线一区二区 | 成人av观看| 99精品国产在热久久 | 国产精品久久 | 精品免费看 | 精品少妇v888av | 日本高清中文字幕 | 亚洲精品3 | 亚洲一区二区三区免费在线观看 | 久久久久无码国产精品一区 | 中文字幕视频在线观看免费 |