要有野心!創(chuàng)始人揭秘Claude4誕生:有點(diǎn)玄學(xué),很快接入測(cè)謊儀!26年出現(xiàn)單人獨(dú)角獸! 原創(chuàng)
編輯 | 云昭
上周五 Claude 4 的發(fā)布會(huì)上,Anthropic 的 CEO Dario Amodei 與Instagram聯(lián)合創(chuàng)始人、Anthropic 首席產(chǎn)品官 Mike Krieger 在 KeyNote 最后進(jìn)行了一場(chǎng)圍爐對(duì)話。
兩個(gè)人都是創(chuàng)業(yè)公司的創(chuàng)始人,又都參與了同一款 AI 產(chǎn)品的打磨與迭代。對(duì)于AI 編程,Anthropic 的產(chǎn)品路線圖將是什么樣子?未來 Claude 的技術(shù)走向如何?未來12個(gè)月? 兩人都在這次二十多分鐘的談話中,頻頻語出驚人。
有意思的是,作為很早就投身大模型的研發(fā)之中,Dario 坦承自己其實(shí)沒搞懂所有細(xì)節(jié),并強(qiáng)調(diào):模型開發(fā)過程中常常有種幾乎是“迷信”的過程,總是在關(guān)鍵時(shí)刻才能“齊活兒”。
Dario做了一個(gè)形象的比喻:做AI就像登上了一艘以相對(duì)論速度飛行的太空船。船上一天,地球三天。
同時(shí),Dario 認(rèn)為,很快就可以通過連接測(cè)謊儀來測(cè)試 Claude 是否說謊了。Mike 順勢(shì)調(diào)侃道:現(xiàn)在誰還需要“可解釋性”?用測(cè)謊儀就夠了。
再比如,提到多久才會(huì)出現(xiàn)單人公司而且估值超過 10 億美元?Dario 不假思索地回答:2026 年。
此外,Dario 還對(duì)于 Claude 4 的開發(fā)過程、大模型的后訓(xùn)練擴(kuò)展定律、MCP 的出圈、大模型和小模型的未來、五年后自己向往回歸生命醫(yī)學(xué)領(lǐng)域等等,都給出了自己的判斷和期許。
整體上看,猛料可圈可點(diǎn),建議大家自行收藏細(xì)讀。以下是談話全文整理。
1.Claude 4 的誕生有點(diǎn)“玄學(xué)”前期都不太行,但某個(gè)時(shí)刻突然就好了
Mike Krieger :
在節(jié)目的尾聲,我想深入探討一下Claude在我們研究方向上的角色,以及開發(fā)者接下來可以從Anthropic期待什么。讓我們歡迎Dario回來,進(jìn)行一對(duì)一的對(duì)談。歡迎回來,Dario。
Dario Amodei :
大家好,又見面了。
Mike Krieger :
這太棒了,就像是面對(duì)整個(gè)觀眾席的一對(duì)一對(duì)話。那么Claude Sonnet 4 和 Claude Opus 4 現(xiàn)在都已經(jīng)發(fā)布了。你對(duì)Claude 4模型最興奮的地方是什么?它如何改變了你對(duì)未來12個(gè)月可能實(shí)現(xiàn)目標(biāo)的看法?
Dario Amodei :
抽象地說,我最興奮的一點(diǎn)是:每當(dāng)我們有一代新的模型,就意味著可以實(shí)現(xiàn)更多新任務(wù)。所以,我們還會(huì)繼續(xù)推出后續(xù)的 Claude 模型,可能會(huì)有 Claude 4.1,就像我們當(dāng)初發(fā)布 Sonnet 3.5 一樣。我認(rèn)為我們才剛剛開始挖掘新一代模型的潛力。尤其是在自主性方面,它將比以往走得更遠(yuǎn)。你可以“放飛”模型,讓它長(zhǎng)時(shí)間完成某項(xiàng)任務(wù),這種能力才剛起步。
Dario Amodei :
我對(duì)模型在網(wǎng)絡(luò)安全任務(wù)中的應(yīng)用越來越感興趣。你可以把網(wǎng)絡(luò)安全看作編碼任務(wù)的一個(gè)子集,但它往往是更高端的那類任務(wù)。我覺得我們可能終于達(dá)到了應(yīng)對(duì)這類任務(wù)的門檻。 另外,作為前生物學(xué)家,我也很興奮看到模型在生物醫(yī)學(xué)和科學(xué)研究領(lǐng)域的應(yīng)用。我認(rèn)為 Opus 在這些方面會(huì)特別強(qiáng)大。
Mike Krieger :
這讓我想起那篇《Machines of Loving Grace》(充滿愛與優(yōu)雅的機(jī)器)。Claude 4如何契合這個(gè)技術(shù)發(fā)展路徑?我常開玩笑說,有人把那篇文章當(dāng)作隨筆看,我卻把它當(dāng)成未來幾年的產(chǎn)品路線圖。那么你覺得Claude在這個(gè)旅程中扮演什么角色?
Dario Amodei :
其實(shí)那像是一份我自己也不知道怎么實(shí)現(xiàn)的產(chǎn)品路線圖,我寫完后就說:“好了伙計(jì)們,這是你們的任務(wù)了。”我們?cè)絹碓蕉嗟卦谏镱I(lǐng)域思考,而軟件正是這個(gè)領(lǐng)域的一部分,因?yàn)樯镅芯吭絹碓揭蕾嚁?shù)據(jù)。
十年前我還是生物學(xué)家時(shí),數(shù)據(jù)已經(jīng)很重要了。現(xiàn)在,我們擁有這些懂得生物學(xué)的模型,它們可以幫助寫代碼。如果你是一名計(jì)算生物學(xué)家,這些模型能大幅加速你的研究。我們也已經(jīng)有不少客戶在嘗試將這些模型用于這類任務(wù)。
Mike Krieger :
我記得我們發(fā)布 MCP 后參與的第一個(gè)黑客馬拉松,有人把 MCP 接到了一個(gè)繪圖儀上。Claude 居然能自己畫圖,看到 Claude “為自己畫畫”真的很好玩。這也說明了 MCP 不只是能連接數(shù)字系統(tǒng),也能連接現(xiàn)實(shí)世界。所以我覺得用 Claude 驅(qū)動(dòng)實(shí)驗(yàn)室設(shè)備會(huì)很有趣。
Dario Amodei :
很快我們就可以通過連接測(cè)謊儀來測(cè)試 Claude了:“你在說謊嗎?”
Mike Krieger :
誰還需要可解釋性?我們有測(cè)謊儀就夠了!你之前提到有個(gè)瞬間你覺得Claude寫的內(nèi)容就像人類寫的一樣。還有其他那種讓你意識(shí)到“這模型不一樣了”的突破性瞬間嗎?
Dario Amodei :
我其實(shí)沒搞懂所有細(xì)節(jié),但在模型發(fā)布前幾周,有個(gè)同事說:“天啊,這模型居然一擊完成了一個(gè)極其復(fù)雜的性能優(yōu)化任務(wù)。”以前從來沒有哪個(gè)模型做到過。我想說的是,模型開發(fā)過程中常常有種幾乎是“迷信”的過程:就算訓(xùn)練流程早已規(guī)劃好,但某些能力總是在最后關(guān)頭才“齊活兒”。也許是人們與模型的互動(dòng),也許只是最后的微調(diào)特別關(guān)鍵。每次模型剛上線時(shí),人們都會(huì)摸索該怎么用,但某個(gè)時(shí)刻過后,他們就會(huì)說:“哇,這太好用了。”這種魔法,總是在最后一刻發(fā)生。
Mike Krieger :
《Creativity Inc》這本書里Ed Catmull也說過,動(dòng)畫電影也是這樣:上線前兩天還很糟糕,然后突然“開竅”了。我感覺我們做模型也是這樣:前期都不太行,但某個(gè)時(shí)刻突然就好了,讓人迫不及待地想發(fā)布。
Dario Amodei :
這真的沒法用理性解釋。你以為訓(xùn)練過程是線性的、可預(yù)測(cè)的,但現(xiàn)實(shí)不是這樣。
Mike Krieger :
是啊,完全不是。RL的曲線也沒有告訴你最后一刻會(huì)有這種“臨門一腳”。
Dario Amodei :
所有東西都在最后一刻拼到一起了,我也不知道為什么。那才是真正的時(shí)刻。
2.朝著更高模型自主性前進(jìn)
Mike Krieger :
在座的許多觀眾是開發(fā)者,我們內(nèi)部也常有人在討論一個(gè)問題:AI越來越強(qiáng),軟件工程中哪些部分會(huì)被它接管?在自主智能體可以執(zhí)行大量編程任務(wù)的世界中,什么會(huì)變得更重要?
Dario Amodei :
我跟很多人一樣,幾個(gè)月前認(rèn)真讀了Steve Yegge寫的那篇《初級(jí)程序員的復(fù)仇》。他以前也寫過類似文章,甚至來拜訪過我們。他對(duì)未來的描述比我還要準(zhǔn)確:我們正逐步朝著更高模型自主性邁進(jìn)。
Dario Amodei :
我們經(jīng)歷過“自動(dòng)補(bǔ)全”的階段,現(xiàn)在有了所謂的“vibe coding”,而接下來就是“派遣代理人去完成任務(wù)”。Claude Code 就是往這個(gè)方向發(fā)展的,我們也會(huì)有其他產(chǎn)品支持這種方式。我們正進(jìn)入一個(gè)開發(fā)者可以像“管理車隊(duì)”一樣指揮AI代理人工作的世界。但人類仍需參與質(zhì)量控制,確保AI做的正確、細(xì)節(jié)到位。
Dario Amodei :
所以,無論是模型本身還是產(chǎn)品界面,開發(fā)人機(jī)協(xié)同的細(xì)節(jié)會(huì)變得極其重要。
Mike Krieger :
這也讓我意識(shí)到,工作中那些低效的部分變得更痛苦了,因?yàn)樗鼈冏屓嗣撾x了“創(chuàng)造的流動(dòng)”。比如我們花太多時(shí)間在跨部門協(xié)調(diào)和排期上,其實(shí)本該投入到“造東西”上。
3.未來1~2年,大模型會(huì)成為人類的同行
Mike Krieger :
行業(yè)里有無休止的爭(zhēng)論:大模型架構(gòu)和小模型架構(gòu),到底誰才是未來?你因提出“擴(kuò)展規(guī)律”而出名,現(xiàn)在的看法如何?預(yù)訓(xùn)練是否仍然是一切的關(guān)鍵?后訓(xùn)練的作用又如何?
Dario Amodei :
我不談太多細(xì)節(jié),但Claude 4系列模型在預(yù)訓(xùn)練和后訓(xùn)練兩方面都有明顯進(jìn)展。預(yù)訓(xùn)練的擴(kuò)展規(guī)律依然成立,后訓(xùn)練也在持續(xù)進(jìn)步,這兩者是互補(bǔ)的。未來我們也會(huì)繼續(xù)擴(kuò)大模型規(guī)模。這些趨勢(shì)彼此疊加,會(huì)造成指數(shù)級(jí)增長(zhǎng),這也是為什么我認(rèn)為整個(gè)進(jìn)程會(huì)非常快。我喜歡Yegge的那篇文章,是因?yàn)樗麕臀艺f出了我常說的一句話:再過一兩年,這些模型就會(huì)成為我們的“同行”。
Mike Krieger :
太瘋狂了,Claude 3.7才是在二月發(fā)布的,但感覺像過了一年。
Dario Amodei :
對(duì)啊,其實(shí)只過了三個(gè)月,甚至不到2.5個(gè)月。時(shí)間在加速。我常打比方說:做AI就像登上了一艘以相對(duì)論速度飛行的太空船。你在船上過一天,地球就過兩天,再過一陣,船上一天,地球三天。你要迅速消化更多信息。這就是我們?cè)谶@趟旅程中的感覺。
4.后訓(xùn)練:大模型可以管理記憶
Mike Krieger :
這個(gè)比喻太貼切了。說到后訓(xùn)練,我特別興奮的一點(diǎn)是Claude 4加入了“記憶”能力。模型可以管理自己的記憶。這為什么重要?又能實(shí)現(xiàn)什么呢?
Mike Krieger :
我再重復(fù)一下問題:讓模型管理自己的記憶,并處理長(zhǎng)期任務(wù),這為什么很重要?
Dario Amodei 10:35 是的,我們發(fā)現(xiàn)這非常有用。比如有一個(gè)場(chǎng)景是玩《寶可夢(mèng)》,模型能記住狀態(tài)。但這種能力遠(yuǎn)不止用于游戲。對(duì)人類來說,我們會(huì)寫筆記,會(huì)在之后查閱,模型也應(yīng)該能這樣。有時(shí)候我會(huì)寫中間文檔、寫演示文稿——這些不可能全靠“記憶緩沖區(qū)”完成。 所以模型也一樣:它們需要?jiǎng)?chuàng)建文件、處理文件、加載數(shù)據(jù),在內(nèi)部“無縫處理”這些中間工作。
Dario Amodei : 我們新增的功能之一,是模型能在推理與行動(dòng)之間交替進(jìn)行。這些行動(dòng)有時(shí)包括存儲(chǔ)數(shù)據(jù)、調(diào)用數(shù)據(jù)等。這其實(shí)意味著,模型逐漸具備了類似人類的“行為能力”,我認(rèn)為這是應(yīng)有的發(fā)展方向。
5.安全性和能力可以并行發(fā)展MCP就是一個(gè)例子
Mike Krieger :
我在使用 Claude 4 時(shí)印象最深的一刻,是我們用 Claude Code 創(chuàng)建了一個(gè)待辦事項(xiàng)的草稿板,然后看著它一點(diǎn)點(diǎn)處理這些事項(xiàng)。當(dāng)它想到新的任務(wù)時(shí),就添加進(jìn)去,同時(shí)勾掉已完成的、劃掉不再相關(guān)的,整個(gè)過程特別像人類自己管理工作的方式。它在推理與工具使用上也表現(xiàn)出很強(qiáng)的交織能力。比如今天早上我看到一篇 Max Stories 的文章,說 Claude 在使用一個(gè)叫 MCP 的工具時(shí)遇到了服務(wù)端的速率限制,然后它自己判斷:“哦,我可能觸發(fā)了速率限制,我換個(gè)方法試試看。”這種邊推理邊補(bǔ)救的能力非常強(qiáng)大。
Mike Krieger :
我想回到“競(jìng)賽的頂端”這個(gè)話題。通常人們會(huì)認(rèn)為安全性和能力是對(duì)立的,而你們的觀點(diǎn)恰恰相反,認(rèn)為這兩者可以并行發(fā)展。我覺得這個(gè)想法非常鼓舞人心,也是我加入這里的原因之一。能不能談?wù)勀銈內(nèi)绾卫斫狻绊敿?jí)競(jìng)賽”的?
Dario Amodei :
我認(rèn)為這個(gè)觀點(diǎn)既適用于簡(jiǎn)單的商業(yè)場(chǎng)景,也適用于 AI 的宏大未來方向。我們有不少客戶非常在意他們的模型行為是否可預(yù)測(cè)、是否可信。這其實(shí)和我們長(zhǎng)期目標(biāo)是一致的——確保模型從更宏觀的層面上也能對(duì)齊人類意圖。這之間其實(shí)存在一種很好的協(xié)同效應(yīng)。每當(dāng)我們認(rèn)為合理且負(fù)責(zé)任的時(shí)候,我們都希望把工具分享給社區(qū),比如 MCP 就是個(gè)例子。
Dario Amodei :
我自己也驚訝于 MCP 被采納的速度。我們?nèi)ツ?11 月發(fā)布它時(shí),反響其實(shí)沒那么大。但三四個(gè)月之后,它幾乎就成了行業(yè)標(biāo)準(zhǔn)。這種感覺就像坐在飛船上離開地球,時(shí)間膨脹越來越大。你想想以前像 USB 那樣的標(biāo)準(zhǔn),90 年代一個(gè)標(biāo)準(zhǔn)可能要花幾年時(shí)間才能統(tǒng)一,而現(xiàn)在幾個(gè)月就可以。
6.AI與神經(jīng)科學(xué)是兩碼事
Mike Krieger :
是的,我跟業(yè)內(nèi)的其他人談 MCP 時(shí),他們都說“別拖慢 MCP 的發(fā)展節(jié)奏”,雖然也希望有點(diǎn)指導(dǎo)方向,但都覺得 MCP 抓住了關(guān)鍵,要確保它成為互操作代理的標(biāo)準(zhǔn)協(xié)議。也和“競(jìng)賽頂端”這個(gè)話題有關(guān)。我很喜歡你那篇關(guān)于可解釋性緊迫性的文章。你有神經(jīng)科學(xué)背景,能談?wù)勀阍趺纯纯山忉屝耘c機(jī)器智能的共同演進(jìn)嗎?
Dario Amodei :
十年前,很多人認(rèn)為神經(jīng)科學(xué)會(huì)告訴我們?cè)撛趺醋?AI。的確,有不少前神經(jīng)科學(xué)家加入了這個(gè)領(lǐng)域,不止我一個(gè),一些實(shí)驗(yàn)室負(fù)責(zé)人也有類似背景。我發(fā)現(xiàn),神經(jīng)科學(xué)確實(shí)提供了一些啟發(fā),但并不能直接遷移。你不能說“下丘腦的這個(gè)機(jī)制可以用來造模型”,我們幾乎是一切從零開始。
Dario Amodei :
有趣的是,反而是我們通過可解釋性技術(shù)看進(jìn)了模型內(nèi)部,盡管它們和人腦的結(jié)構(gòu)完全不同,但卻在概念層面上有些相似之處。比如,有團(tuán)隊(duì)通過可解釋性研究發(fā)現(xiàn)視覺模型中有高頻和低頻信號(hào)檢測(cè)機(jī)制,而幾年后神經(jīng)科學(xué)家在動(dòng)物大腦中也發(fā)現(xiàn)了類似的東西。
Dario Amodei :
比如說,視覺模型會(huì)把顏色處理和亮度、邊界處理分開成兩個(gè)路徑,這種劃分在現(xiàn)實(shí)世界中就很自然,不論是生物學(xué)習(xí)系統(tǒng)還是人工系統(tǒng),都會(huì)收斂到這些基本概念上。這真的很有趣。
7.一人獨(dú)角獸公司會(huì)出現(xiàn)在2026年要有野心!
Mike Krieger :
我也很好奇,Circuits 項(xiàng)目未來是否也會(huì)對(duì)神經(jīng)科學(xué)研究產(chǎn)生影響。那我們來聊聊五到十年的時(shí)間跨度——雖然在 AI 領(lǐng)域這幾乎不可能預(yù)測(cè)。我們現(xiàn)在像是在光速前進(jìn),也許五到十年其實(shí)就是現(xiàn)實(shí)世界中的一年時(shí)間。你覺得什么時(shí)候會(huì)出現(xiàn)第一個(gè)只有一個(gè)人類員工,但估值達(dá)十億美元的公司?
Dario Amodei :
2026 年。
Mike Krieger :
完全認(rèn)同。那么你有沒有建議給未來一年準(zhǔn)備基于 Claude 構(gòu)建產(chǎn)品的人?該怎么思考前沿構(gòu)建?
Dario Amodei :
當(dāng)然有很多具體的建議,但因?yàn)槲覀冋?jīng)歷“相對(duì)論時(shí)間膨脹”,一切發(fā)展太快,所有細(xì)節(jié)都可以用一句話總結(jié):要有野心。去構(gòu)建那些你本來以為做不到的東西。即使現(xiàn)在做不出來,下一個(gè)版本的模型可能就能實(shí)現(xiàn)了。目前模型發(fā)布的節(jié)奏是三個(gè)月一次,也許很快會(huì)變成兩個(gè)月、一個(gè)月,甚至未來你早上剛構(gòu)建的東西,晚上發(fā)布的新模型就已經(jīng)把它淘汰了。
Mike Krieger :
我認(rèn)識(shí)一位創(chuàng)業(yè)者,兩年前開始做 AI 編程代理,他試了所有模型都沒成功。直到 Claude 3.7,他說“我創(chuàng)業(yè)的點(diǎn)現(xiàn)在終于能實(shí)現(xiàn)了。”就像他之前一直很難,但現(xiàn)在突然就變成可能了。
Dario Amodei :
有時(shí)候“撞墻”反而有幫助,你把其他所有部分都準(zhǔn)備好了,就等模型到位。一旦模型成熟,你的產(chǎn)品就會(huì)非常扎實(shí),可能比實(shí)際需要的還強(qiáng)。這種超額設(shè)計(jì)反而變成了優(yōu)點(diǎn)。所以雖然我開玩笑說“等等下一代模型”,但如果你做的事情已經(jīng)“差不多快能實(shí)現(xiàn)了”,那繼續(xù)堅(jiān)持是值得的。
Mike Krieger :
我們?cè)趦?nèi)部做前沿研究時(shí)也有類似經(jīng)歷,我們的研究團(tuán)隊(duì)做出一個(gè)原型,但模型當(dāng)時(shí)不擅長(zhǎng)用工具。直到 Claude 3.7 出來,特別是在研究場(chǎng)景中它的表現(xiàn)非常出色。而正是我們之前那些“失敗的嘗試”鋪墊了這次成功。
Dario Amodei :
確實(shí),有點(diǎn)像你應(yīng)該把自己的創(chuàng)業(yè)項(xiàng)目當(dāng)成是對(duì)“下一個(gè)模型”的投機(jī)性執(zhí)行(speculative execution)。像是……
8.接下來的一到五年:軟件開發(fā)成本降到幾毛錢
Mike Krieger :
我太喜歡這個(gè)說法了,完全正確。那么最后一個(gè)問題,對(duì)于我們大多數(shù)人來說,現(xiàn)在 AI 的發(fā)展遠(yuǎn)超預(yù)期。你對(duì)未來一年,乃至五年最感興趣的是什么?
Dario Amodei :
未來一年,我覺得我們會(huì)在代碼領(lǐng)域看到非常驚人的進(jìn)展。從 Claude Code 到基于代理的系統(tǒng),軟件的生產(chǎn)成本會(huì)急劇下降。過去,只有你預(yù)期有幾萬人、幾十萬人用,才會(huì)去開發(fā)一款軟件。但未來,當(dāng)軟件開發(fā)成本降到幾毛錢,你可能就會(huì)臨時(shí)做一個(gè)小工具,用在某個(gè)會(huì)議或某個(gè)活動(dòng)上。軟件可以按需生成,幾秒鐘、一美元以內(nèi)搞定,整個(gè)世界會(huì)變得很不一樣。
Dario Amodei :
那時(shí)候開發(fā)者的角色是什么?企業(yè)和創(chuàng)業(yè)公司的角色又是什么?最終用戶的體驗(yàn)又該如何?這些我們還都不知道。
Dario Amodei :
至于五年后,我又回到生物醫(yī)學(xué)領(lǐng)域。雖然這一年不會(huì)有太多革命性變化,但我希望五年后我們能攻克一些今天仍然存在的重大疾病。
Mike Krieger :
太棒了,我們就以這個(gè)美好的愿景收尾吧。時(shí)間關(guān)系我們得結(jié)束了,其實(shí)我感覺還能聊上 40 分鐘。非常感謝 Dario 今天和我們分享!
Mike Krieger :
也感謝現(xiàn)場(chǎng)和線上觀眾的參與。差點(diǎn)忘了一個(gè)好消息——作為對(duì)大家參加 Code with Claude 線下活動(dòng)的特別感謝,我們將為每位到場(chǎng)觀眾提供 Claude Max 20x(最高等級(jí)套餐)三個(gè)月免費(fèi)使用資格,請(qǐng)留意后續(xù)通知。
Mike Krieger :
我個(gè)人也很喜歡在 Claude Code 上使用 Max 套餐,期待看到你們構(gòu)建出的精彩作品。祝你們今天在各個(gè)分會(huì)場(chǎng)玩得開心,再次歡迎大家來到 Code with Claude!
Dario Amodei :
謝謝大家的到來!
ok,文章到這里就結(jié)束了,各位看完有何感想呢?歡迎評(píng)論區(qū)交流。
參考鏈接:??https://www.youtube.com/watch?v=EvtPBaaykdo??
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:云昭
