本科畢業(yè)加入谷歌,還寫了「思維鏈」開山之作,這位OpenAI新秀正為本科生答疑解惑
如果你仔細研究過「chain of thought(CoT)」這個概念,那么你大概聽過 Jason Wei 這個名字。
圖片
他是思維鏈概念開山之作 ——「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」的第一作者,本科畢業(yè)就加入了谷歌。在那里,他推廣了思維鏈提示概念,共同領(lǐng)導(dǎo)了指令調(diào)優(yōu)的早期工作,并和 Yi Tay、Jeff Dean 等人合著了關(guān)于大模型涌現(xiàn)能力的論文。
圖片
Jason Wei 等作者對思維鏈的定義是一系列的中間推理步驟,目的是為了提高大型語言模型進行復(fù)雜推理的能力(通過將一個較為復(fù)雜的推理問題分步拆解,一步步獲得最終答案)。Jason Wei 等人的論文是第一篇發(fā)現(xiàn)當(dāng)使用鏈式思維進行提示時,存在一個相變現(xiàn)象,表明大型模型在很大程度上優(yōu)于較小的模型,這進一步導(dǎo)致了涌現(xiàn)能力的發(fā)現(xiàn)(引自《復(fù)雜推理:大語言模型的北極星能力》)。目前,思維鏈提示已經(jīng)在大模型領(lǐng)域得到廣泛易用。
2023 年初,他選擇加入 OpenAI,與其他技術(shù)人員一起構(gòu)建 ChatGPT。
憑借這些硬核的學(xué)術(shù)成果,Jason Wei 的被引量已經(jīng)接近 8000。
圖片
作為一位年輕的學(xué)術(shù)新星,Jason Wei 最近收到了很多問題。這些問題大部分來自本科生,代表了他們對早期學(xué)術(shù)生涯的一些困惑。在一個 google 文檔中,Jason Wei 回答了其中一些。本文摘取了其中幾個問題,希望對抱有同樣困惑的同學(xué)有所幫助。
圖片
問:你在 AI 領(lǐng)域的旅程是如何開始的?
答:雖然你是通過我 2022 年的工作認識我的,但我從 2017 年開始就一直在從事 AI 領(lǐng)域的工作。
在達特茅斯學(xué)院讀本科時,我最初想成為華爾街的銀行家,這是我父母那一代的美國夢(也是我家鄉(xiāng)大多數(shù)朋友的選擇)。但是我在大一的時候(2017 年)很難找到金融實習(xí)機會,所以最后,我通過我媽媽的朋友結(jié)識了一家 AI 創(chuàng)業(yè)公司,然后和這家公司展開了合作。
那個夏天,我通過閱讀 Michael Neilson 的《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》第一次接觸了 AI。我了解了反向傳播算法,從任何類型的輸入和輸出數(shù)據(jù)中學(xué)習(xí)任意映射的想法吸引了我。我至今還記得,我對這個領(lǐng)域的熱情比我在學(xué)校學(xué)過的其他任何學(xué)科都要高出一個數(shù)量級。
2010 年代末流行發(fā)論文,所以我也在大學(xué)期間試圖這么做。我走了一條普通的路,參加了一門機器學(xué)習(xí)課程,并請求教這門課的教授指導(dǎo)我進行研究。我在醫(yī)學(xué)圖像分析的深度學(xué)習(xí)領(lǐng)域工作了兩年。我的研究成果還不錯,但也并非驚艷。達特茅斯學(xué)院沒有充滿活力的 AI 環(huán)境,很難找到志同道合的社區(qū)。所以我真的很感激那里真正對 AI 感興趣的少數(shù)幾個人,其中 Sam Greydanus 是我仰慕的人。
畢業(yè)臨近時,我同時申請了博士學(xué)位和軟件工程師職位。我有一篇被一家重要學(xué)術(shù)會議接受的優(yōu)秀論文,以為我會被所有的博士學(xué)位項目錄取。結(jié)果,幾乎所有學(xué)校都拒絕了我,除了南加州大學(xué)(USC)。大三的暑假,我在 Blend 和 DoorDash 實習(xí),但我不是一個出色的軟件工程師,對軟件也沒有那么大的熱情。
我差點就去南加州大學(xué)攻讀博士學(xué)位,但后來我改變了主意,因為我獲得了 Google AI Residency 項目的邀請,這是一個為沒有 AI 博士學(xué)位的人提供谷歌研究機會的項目,為期 18 個月。這個 AI 項目可能是我職業(yè)生涯迄今為止最大的跳板。我可能是憑借我寫的關(guān)于自然語言處理中數(shù)據(jù)增強的一篇相對受歡迎的論文被錄取的。那篇論文的影響對我來說是個驚喜 —— 我天真地將我在醫(yī)學(xué)圖像分析中使用的一種直覺應(yīng)用到了自然語言處理中,沒想到它會變得如此受歡迎。
因此,在 2020 年畢業(yè)后,我在谷歌工作了兩年多,從事大型語言模型研究。谷歌是一個進行研究的絕佳場所,許多著名的研究人員通過在谷歌的工作樹立了自己的聲譽。這個 AI 項目特別有效,因為表現(xiàn)優(yōu)秀的研究人員有機會繼續(xù)留在谷歌工作,大多數(shù)人都會為了能夠成為永久員工而努力。
我的故事至少包含兩個教訓(xùn),雖然都有些老生常談,但我還是想說一下:
- 第一,很多我當(dāng)時認為是失敗的事情實際上對我來說是好事。如果我當(dāng)初在金融或軟件工程實習(xí)方面更加成功,可能就錯過了我現(xiàn)在喜歡的 AI 職業(yè)生涯。
- 第二,運氣起到了很大的作用,但我也創(chuàng)造了很多機會來獲得好運。例如,我在撰寫一篇被廣泛引用的自然語言處理論文方面并沒有絕對的優(yōu)勢,但通過寫一篇關(guān)于它的博客,使用通俗易懂的語言,并在線上提供代碼,我為這篇論文贏得了受歡迎的機會。
問:我應(yīng)該選擇哪個研究方向?
答:顯然,這個問題沒有一個標準答案。
我個人認為,選擇一個你喜歡的研究方向很重要,因為從長遠來看,你會在這方面做得更好。如果你不知道自己喜歡什么樣的研究,可以廣泛閱讀幾周,或者詢問他人他們對哪些方向感興趣,然后選擇一個開始進行研究。
有時候,你可能需要在你想要從事的研究方向和其他因素之間做出權(quán)衡。例如,你可能有機會與一位優(yōu)秀的教授合作,但研究方向可能并非你首選的主題。我認為,如果你能從中學(xué)到很多東西,或者它能幫助你實現(xiàn)自己的目標,這樣做是可以接受的。但重要的是要記住你做事情的原因,并且對自己的意愿保持透明。
有一個研究方向,我會一概推薦給人們考慮,那就是「對齊」(alignment)。我認為「對齊」是一個很好的方向,有幾個原因支持這個看法:
- 將智能 AI 與人類價值觀對齊顯然非常重要。
- 對齊是一個相對新興的領(lǐng)域,因此早期從事對齊研究的人將有更大的機會產(chǎn)生影響。
- 對齊可能涉及多個學(xué)科,與倫理學(xué)等其他領(lǐng)域有關(guān),這可能會吸引一些人。
- 對齊研究人員的供應(yīng)少于需求,所以找到工作可能會更容易。
有一些人不從事對齊研究可能是因為這不是傳統(tǒng)的研究方向,缺乏很好的基準,不太容易入門。而且,對齊的目標并未得到所有人的一致認同。但我不認為這些原因會成為障礙;我發(fā)現(xiàn)從事對齊研究的人非常樂于和那些對對齊感興趣的人交流。
問:你大部分需要進行有效研究的知識是從哪里學(xué)來的?如果有有趣的想法,是花更多時間學(xué)習(xí),還是直接開始研究?
答:在研究中,有三種學(xué)習(xí)來源:
- 閱讀資料:其他研究論文、博客文章、推特等。
- 其他人告訴你:你的導(dǎo)師給你反饋,審稿人審查你的論文。
- 你嘗試做一些事情:你進行一項實驗,它有可能成功,也有可能失敗,你要深入挖掘原因。
在開始階段,閱讀資料是很有益的,因為進行第二和第三種學(xué)習(xí)會有更高的成本(涉及到他人的時間和你自己進行實驗所需的時間)。然而,你很快就希望盡早開始第二和第三種學(xué)習(xí)。原因是,當(dāng)你處于能力的邊界時,學(xué)習(xí)發(fā)生得最快,而且由于(2)和(3)是為你個性化定制的,它們將更快地加速你的學(xué)習(xí)過程。
問:你認為進行研究最重要的特質(zhì)是什么?
答:我認為研究,就像其他大多數(shù)技能一樣,可以通過實踐來學(xué)習(xí)(參見:https://www.jasonwei.net/blog/practicing-ai-research)。我們當(dāng)中很少有人能達到陶哲軒那種天賦水平。但我相信大多數(shù)人都有能力成為高水平的研究人員。因此,對于這個問題,我的簡短回答可能是「毅力」,因為毅力能夠促進實踐。
在研究中被嚴重低估的一個技能是從反饋中學(xué)習(xí)。你會驚訝于人們對反饋的忽視程度 —— 我發(fā)現(xiàn)大多數(shù)向我尋求建議的人并不聽取意見。我嘗試非常認真地對待別人給出的反饋,如果他們是行業(yè)的佼佼者更是如此。反饋就像是一個梯度,它告訴你成為更好的研究人員應(yīng)該往哪個方向前進。當(dāng)我有導(dǎo)師時,我每周都會向他們詢問我可以做得更好的地方,然后努力去做。在研究中,我們很幸運有著快速的反饋循環(huán)文化;并不是每個領(lǐng)域都是如此。
需要注意的是,我們也要懂得在何時忽略反饋。你的導(dǎo)師或老板在提供反饋時可能并不總是處于適宜的精神狀態(tài),而且他們對你的問題可能沒有像你那樣深入思考。但你仍然應(yīng)該仔細考慮他們說的話。
另一個被低估的技能是愿意做一些基礎(chǔ)性的工作,特別是查看數(shù)據(jù)。2019 年,我訓(xùn)練了一種用于肺癌分類的神經(jīng)網(wǎng)絡(luò),我對大部分數(shù)據(jù)進行了初步標注,然后請病理學(xué)家審查我的分類。這花費了我 40 多個小時,最后我能夠像臨床病理學(xué)家一樣對某種類型的肺癌進行分類。雖然花費了很多時間,但我從進行數(shù)據(jù)標注中獲得的直覺在此后的三篇論文中都得到了應(yīng)用,所以這是值得的。
研究中最后一個被低估的技能是成為一個良好的溝通者。良好的溝通使你更值得信賴,值得合作。例如,我有三個小忌諱,其他人可能也有:
- 很多人喜歡說「我明天把這個活兒干完」,然后事實上要等到幾周后才完成。我盡量避免說這樣的話,除非確實很重要,而且我確實能在明天之前完成(不只是開始做)。我希望在他人需要完成一項重要任務(wù)時,他們能相信我的承諾。
- 在項目的初期會議中,人們常常表現(xiàn)出很大的興趣參與,但后來卻不愿意付出與他們表達的興趣成比例的時間。同樣,我希望我的興趣對他人有所提示,所以我盡量說一些類似于「我不能保證會參與這個項目,但是 <X> 的想法對我來說真的很有趣」的話。
- 人們經(jīng)常會說「<X > 不起作用」,卻沒有提供足夠的細節(jié)。我試圖把陳述改成「在使用公式 F、模型 M 和數(shù)據(jù)集 D 時,<X > 沒有起作用」,這樣可以減少對方猜測我所說的具體內(nèi)容的心力消耗。
問:有效的想法(至少在你從事的領(lǐng)域)是否更傾向于在數(shù)學(xué)上有更深的內(nèi)涵,還是更具廣泛的創(chuàng)造力?如果數(shù)學(xué)深度很重要,在本科階段如何達到這種理解水平?是培養(yǎng)良好的數(shù)學(xué)直覺更重要,還是值得花時間深入研究這些數(shù)學(xué)主題?
答:很難說學(xué)更多數(shù)學(xué)知識是不好的,但我有點個人想法:在深度學(xué)習(xí)的歷史中,有兩個簡單的因素經(jīng)得起時間的考驗,并且?guī)缀蹩偸怯行У模焊蟮哪P秃透嗟臄?shù)據(jù)。這兩者都不涉及深奧的數(shù)學(xué)基礎(chǔ),甚至不算特別具有創(chuàng)造性。
因此,我不建議在數(shù)學(xué)上過于深入,原因有幾點:
- 目前在這個領(lǐng)域存在著很多機會和未開發(fā)的想法,這意味著時間的機會成本很高。因此,投入時間在數(shù)學(xué)上的相對價值較低。
- 即使你想花更多時間來培養(yǎng)長期技能,我認為有些能力比擅長數(shù)學(xué)更有優(yōu)勢。以下是一些建議:
- 當(dāng)今的人工智能領(lǐng)域在很大程度上與精通工程和發(fā)展良好的軟件工程技能有關(guān)。
- 當(dāng)前的瓶頸之一是 GPU,了解硬件以及如何高效使用 GPU 可能比學(xué)習(xí)數(shù)學(xué)更具回報。
- 努力成為一名優(yōu)秀的溝通者,會讓你更容易與人共事,幫助你更清晰地思考,更有條理。
鑒于大多數(shù)想法并非源于數(shù)學(xué)動機(雖然也有一些),在尋找工程解決方案時,過度依賴數(shù)學(xué)知識可能會使你產(chǎn)生錯誤的偏見(就像精通語言學(xué)并不能幫助你建立大型語言模型一樣)。
目前,這個問答帖還在更新,Jason Wei 也在陸續(xù)貢獻自己的答案,大家可以有選擇性地借鑒,或者提出自己的新問題。
完整文檔參見以下鏈接:https://docs.google.com/document/d/1QREmdzLwJ0CR3kdFeenJbBowT1IFFREd46y10tW6pog/edit