GPT5基本玩崩了!谷歌和Meta勝算很大!AI投資人爆料:Meta承接谷歌搜索后,或收購某獨角獸 原創
編輯 | 言征
出品 | 51CTO技術棧(微信號:blog51cto)
臨近年尾,相信很多朋友都在盤點這一年。很多人都在有意無意地在圍觀大模型這場全明星球賽。
OpenAI、谷歌、Anthropic、Meta,還有馬斯克的 XAI,以及AI應用層面比如Perplexity等一眾新秀球員,究竟誰會技壓群雄,贏得接下來的2025?
這還得交給入局久的專業老球迷來做賽事的點評。12月初,在知名商業博客節目Invest Like The Best中,有兩位大模型領域的老球迷對這一賽事做了很犀利全面的點評。一位是投了25家大模型領域公司(4家基礎設施,21家AI應用)的Benchmark普通合伙人Chetan Puttagunta,另一位是基金操盤手Modest Proposal。
兩位都非常接近OpenAI、谷歌、Meta、Anthropic等公司的內幕,對各大球員的優勢軟肋遠比外界媒體了解的更多,這次給到了很多讓人驚掉下吧的言論,因為時間很長,這里摘選最為炸裂的幾點:
- 預訓練的擴展轉到了推理的擴展,但推理擴展也很快窮盡。
- GPT-5總體上發布崩潰了,2026年、2028年才有希望。
- 模型層的穩定對于應用層來說是一個巨大的福音。
- Llama 4 相對于 Llama 3 是否是階躍函數,這都不重要,重要的是他們是否突破了效率的界限。
- Meta應該收購Perplextity。
一、大模型2024現狀:預訓練轉向推理,測試時縮放
Patrick:
Chetan,或許你可以先從你的角度跟我們講講,在關于大型語言模型及其擴展的故事中,在技術方面當下最有趣的部分是什么。
Chetan:
是的,我認為我們現在處于這樣一個階段,即人們普遍認同或知曉,在過去的兩年里,所有實驗室在如何看待規模擴展方面都遇到了某種趨于平穩的效果,這特別是在預訓練領域。據規模擴展的規律,在預訓練中,計算能力增加得越多,得到的模型就越好。一切都以數量級來考慮。所以,在這個問題上增加 10 倍的計算能力,模型性能和智能就會有一個階躍函數式的提升。
這無疑在這里帶來了令人難以置信的突破,我們從所有實驗室看到的都是非常出色的模型。但這一切的陰影甚至從2022年底開始,在某個時候,我們將耗盡由人類生成的文本數據。
而且我們很快就要進入合成數據的世界了。世界上所有的知識實際上都已被標記化,并被這些模型所吸收。當然,存在小眾數據、私人數據以及所有這些尚未被標記化的小型存儲庫,但就數量級而言,這不會對這些模型的可用數據量產生特別顯著的增加。
在 2022 年展望未來時,你們看到了合成數據是否能讓這些模型繼續擴展這個重大問題。
正如你們看到的那條線,大家都認為這個問題會在 2024 年真正凸顯出來。而現在我們就在這里,我們身處當下,大型模型供應商都在努力用合成數據進行訓練。而現在,正如媒體所報道的,以及所有這些人工智能實驗室的領導者都公開表示,由于合成數據,我們現在遇到了限制。
由大型語言模型自身生成的合成數據無法使預訓練中的規模擴展得以持續。因此,我們現在轉向一種被稱為測試時計算的新范例。從非?;镜膶用鎭碚f,測試時計算就是你實際上讓大型語言模型審視這個問題,想出一系列可能的解決方案,并并行推進多種解決方案。你創建了這個叫做驗證器的東西,反復地對解決方案進行迭代處理,而這種新的擴展范例,可以說,在 X 軸上以對數刻度測量的時間,以及在 Y 軸上的智能。
這就是我們如今的處境,似乎幾乎所有人都在邁向這樣一個世界:在這個世界里,我們從基于預訓練和訓練的擴展,發展到基于如今被稱為推理的擴展,或者說推理時間、測試時間,無論你怎么稱呼它。這就是截至 2024年第四季度我們的現狀。
Patrick:
這是一個關于整體情況的后續問題。那么,先把資本支出以及我們稍后與大型公共科技公司討論的所有其他問題放在一邊,基于你現在所了解的情況,能否說,轉向以時間為變量的測試時縮放,就像“誰在乎呢?”只要這些東西變得越來越強大,這不就是最重要的嗎?而且我們是以一種不同于僅僅基于預訓練的方式來做這件事的,這一事實又如何呢?真的有人在乎嗎?這重要嗎?
二、就像大模型訓練撞墻一樣,推理也會很快撞墻
Chetan:
在測試時間或推理范例中,有兩件事很快就會凸顯出來,那就是大型語言模型(LLMs)會非常迅速地探索潛在解決方案的空間。作為模型開發者或從事模型工作的人員,很快就會意識到,用于測試時間計算的算法可能會很快耗盡有用的解決方案搜索空間。這是第一點。
第二點,存在一種被稱為驗證器的東西,它正在審視哪些可能是好的解決方案,哪些可能是壞的解決方案,應該追求什么,以及能夠辨別出哪些是好的解決方案,哪些是壞的解決方案,或者哪些是最佳路徑,哪些不是最佳路徑。目前尚不清楚這是否會隨著計算能力的無限增強而呈線性擴展。最后,任務本身可能是復雜的、不明確的,而限制因素可能是計算能力,也可能不是。
所以,思考這些問題總是非常有趣的,就好像你有無限的計算能力來解決這個問題,你能否做得更快?當然,在推理方面,肯定會有一些問題,如果你只是擴大計算規模就能做得更快。但很多時候,我們開始看到證據表明,在我們當今擁有的技術中,這不一定是能隨計算呈線性擴展的東西。
現在我們能夠解決所有這些問題嗎?當然,會有算法的改進,會有數據的改進,會有硬件的改進,這里會有各種各樣的優化改進。我們仍在發現的是,用于推理的基礎模型所擁有的固有知識或可用數據仍然有限。僅僅因為你在追求測試時間,并不意味著你就能通過在測試時間擴大計算規模來突破之前所有的數據限制。
所以,這并不是說我們在推理方面遇到了障礙,也不是說我們在測試時間遇到了障礙。這只是問題集、挑戰以及計算機科學問題開始演變。作為一名風險投資家,我非常樂觀,相信我們能夠解決所有這些問題。但它們是可以解決的。
三、GPT-5?至少得2026年,甚至2028年
Patrick:
那么,如果這就是研究實驗室的觀點,Modest,我很好奇你能給我們講講大型公共科技公司的悲觀看法,因為在這個話題上,很多內容都是關于支出資本、戰略定位、所謂的所有這些支出的投資回報率,以及他們將如何在這一巨額資本支出中獲取回報。你認為Chetan剛剛所說的一切都能很好地反映在公共科技公司的立場、定價和估值中嗎?
Modest:
我認為你必須從宏觀層面開始,然后再深入到微觀層面。為什么這很重要呢?因為大家都知道,如今在標準普爾 500 指數中,大型科技公司所占比例更大。但除此之外,我認為從主題上講,人工智能已經更廣泛地滲透到工業、公用事業領域,而且我認為,作為對這一領域的直接投資,其市值占比在 40%到 45%之間。
而且,如果你甚至將其擴展到世界其他地區,你就會把阿斯麥(ASML)、臺積電(TSMC)以及整個日本芯片行業都牽扯進來。
所以,如果你看看累計市值,這是當下對人工智能的直接投資,規模巨大。所以我認為,當你審視整個投資格局時,你幾乎被迫對此形成看法,因為幾乎所有人都會在某種形式上與一個指數進行對比,而該指數在微觀層面上將是人工智能的衍生投資。我認為這是一個令人著迷的時代,因為所有的公開市場投資都是對不同路徑進行情景分析和概率加權。如果你回想一下大概四個月前我們談論的時候,我想說,結果的分布已經發生了變化。
當時,在那個時間點,在那個層面上進行預訓練和擴大規模絕對是可行之道。當時我們就討論了其影響。我們談論過帕斯卡的賭注,也談論過囚徒困境。在我看來,當投入成本是 10 億美元或 50 億美元時,談論這些是容易的。但我們很快就要接近這樣一個時間點,屆時賭注將達到 200 億美元或 500 億美元。你可以看看這些公司的現金流量表。很難悄悄加入300億美元的交易額度。
因此,GPT-5 的發布總體上崩潰了。讓我們將其應用于所有不同的實驗室。我認為這原本會是關于投入資金量的一個重大證明點,因為這些都是三到四年的投入承諾。當時是在談論 Stargate,即假設的由 OpenAI 和微軟討論的 1000 億美元數據中心,那是在 2028 年的交付承諾。
但在接下來的六到九個月中的某個時候,要么行,要么不行。我們已經知道,30 萬到 40萬個芯片的超級集群將在明年年底到 2026 年初交付。但我們可能需要看到下一款機型取得一些成功的證據,才能獲得下一輪的承諾。所以,我認為所有這些都是背景。在微觀層面上,如果我們從預訓練轉向推理時間,這將是一個非常有力的轉變,并且有幾個重大影響。
其一,它能使收入生成與支出更好地協調一致。我認為這對于整個行業來說是一個非常非常有益的結果,因為在預訓練領域,情況并非如此。
將投入 200 億、300 億、400 億美元用于資本支出,在 9 到 12 個月內訓練模型,進行訓練后的工作,然后將其推出,然后希望通過推理從中獲得收入。在測試時間計算擴展的世界里,你現在正在使你的支出與模型的底層使用情況相匹配。因此,就純粹的效率和財務方面的可擴展性而言,對于超大規模企業來說,這要好得多。
我認為第二個重大影響在于,同樣,我們必須說,我們不知道預訓練的規?;欠駮V?。但如果你確實看到了這種向推理時間的轉變,我認為你需要開始思考如何重新設計網絡架構?你是否需要在能源低成本的陸地上建立數百萬個芯片超級集群,還是需要在全國范圍內分散布局更小、更低延遲、更高效的推理時間數據中心?而且當你重新設計網絡架構時,對電力利用率和電網設計的影響是什么?
我想說,支撐投資世界很大一部分的諸多敘述,我認為都得重新思考。而且我要說,由于這是一種相對較新的現象,如今公眾市場尚未開始著手應對這種潛在的新架構是什么樣子,以及它可能會如何影響一些潛在的支出。
四、無需大量算力和資源小團隊式創新造出一個DeepSeek
Patrick:
Chetan,我很好奇,或許能講講 DeepSeek 以及其他類似的情況,在這些情況中,你會看到小團隊用相對較少的資金構建新模型,在性能上與一些前沿模型相競爭。你能談談這種現象以及它讓你想到了什么,或者對整個行業有何影響嗎?
Chetan:
這真的令人驚嘆。在過去的,大概六周的時間里,我們在 Benchmark 這里見到的團隊,成員人數在兩到五人之間。Modest之前在你們的播客中談過這個,那就是技術創新的故事一直是,在帕洛阿爾托的某個車庫里,總是有兩到三個人在做一些事情,以非常非常迅速地趕上老牌企業。
我認為我們現在在模型層看到了這種情況,坦率地說,這是兩年來未曾見過的。具體而言,我認為我們仍然不能百分之百確定預訓練和訓練規模的回歸不會發生。
我們目前還不知道。但在當下這個趨于平穩的時期,我們開始看到這些小團隊趕上前沿。我所說的前沿是指最先進的模型在哪里,特別是在文本處理方面?我們看到這些小團隊,確切地說,只有兩到五個人,以遠低于大型實驗室投入多個數量級的資金躍上了前沿。
我認為部分原因在于開源模型的數量驚人地激增。具體來說,Meta 在 LLaMA 方面的所作所為在這里產生了巨大的影響。LLaMA 3.1 有三種版本,分別為 4050 億、700 億和80 億。而 LLaMA 3.2 則有 10 億、30 億、110 億和 900 億這幾種版本。
你可以獲取這些模型,下載它們,將它們放在本地機器上,你可以將其放入云端,可以將其放在服務器上,并且你可以使用這些模型來進行提煉,優化——調整、訓練、改進等等,等等,并憑借相當有趣的算法技術跟上前沿。
而且由于你不需要大量的計算資源,或者你不需要大量的數據,你就能夠在特定的垂直領域、特定的技術或者特定的用例方面展現出特別的聰明才智和創新能力,從而非常迅速地躍升至前沿。我認為這在很大程度上改變了我個人對模型層以及模型層潛在早期投資的看法。這里存在很多不確定性,很多依賴變量,而且實際上在六周內,這一切可能都不再成立了。
但如果這種狀態成立,即預訓練并非因合成數據而擴展,這僅僅意味著你現在可以做得更多,以最少的資金迅速跳到前沿,找到你的用例,找到你最強大的地方,然后從這一點出發,坦率地說,超級巨頭會成為最好的朋友。
因為在當今,如果你處于前沿領域,你正在推動一個用例,你不再受到 GPU 的特別限制。特別是如果你打算進行測試時推理、測試時計算之類的工作,并且你為比如說 10 家企業客戶提供服務?;蛘咭苍S這是一個針對特定用例優化的消費解決方案。
計算方面的挑戰已經不像2022年那么大了。在 2022 年,你會和這些開發者交流,這就變成了這樣一個問題:嗯,你能把十萬個集群拼湊在一起嗎?因為我們需要進行訓練,然后還得去買所有這些數據,即便你知曉所有技術,突然間你一算,就會說,要啟動第一次訓練運行我得花十億美元。而這可不是一種可行的模式。
從歷史上看,這就是風險投資模式。風險投資模式一直是能否組建一支非凡的團隊,實現技術突破,做到資本輕型化,迅速超越現有企業,然后以某種方式獲得分銷立足點并推進。在過去兩年的模式層面,這似乎絕無可能實現。但在過去的六、八周里,這種情況確實發生了改變。
5.大模型只是另一種工具
Modest:
我認為這很重要。關于 Meta 開源以及超大規模公司的開源推動前沿發展,小型模型能夠擴展到非常成功的程度,這是極其有益的,特別是對于沒有原生大型語言模型的 AWS 來說。但如果你退一步思考一下云計算的歷史,就會發現它為開發者和建設者提供了一套工具。AWS 率先清晰地闡述了這一愿景。
9 月份在高盛的一次會議上,馬特·加曼公開談到了此事。但他們的觀點顯然一直是,大型語言模型只是另一種工具,生成式人工智能是他們能夠為其企業客戶和開發者客戶提供以打造下一代產品的另一種工具。這種愿景面臨的風險是一個全能且具有普遍性的暴民。
所以,這再次讓你不得不重新思考,如果我們不構建這些大規模的預訓練實體,將訓練損失降至近乎為零,并以這樣或那樣的形式構建出那個隱喻中的上帝,那會怎樣。
相反,如果行業的重點是在測試階段、推理階段,并試圖在客戶需要的地方解決實際問題,我認為這再次重新設計并重新構建了這項技術如何推出的整個愿景。而且我認為我們需要謙遜,因為我們不知道 LlaMA 4 會是什么樣子。我們不知道Grok 3 即將推出。這是目前在有史以來最大的集群上進行訓練的兩個模型。
所以我們現在所說的一切可能在三個月內都是錯的。但我認為,當下的整個工作就是吸收所有可用的信息,并根據我們如今所知重新描繪各種情景路徑。如果這是正確的,我覺得人們還沒有更新他們對于這些路徑可能如何發展的先驗判斷。
Patrick:
我很好奇,Chetan,對于這種變化,也許現在你會投資一家模式公司,你怎么看。我記得兩年前我們一起吃晚餐的時候,你跟我說,作為一家公司,你們剛剛決定不投資這些公司。就像你說的,這不符合我們的模式。我們不會在首次試運行時就開出數十億美元的支票。
因此,我們不在那部分堆棧上進行投資。我們更多地投資于應用層,在這場討論中稍后我們會再次回到這個話題。但也許再多談談這種關于其如何運作的更新觀點,一個示例投資可能是什么樣子,以及即使 LLaMA 4 是預訓練縮放損失保持不變,這是否會改變,因為這似乎只是像 DeepSeek 那樣受益。好的,現在不是 3.2,而是 4,我們仍在做我們的事,而且仍然更好、更便宜、更快等等。
那么,是的,對于這種新觀點,即有可能投資于模式公司,而不僅僅是應用公司,你有何看法?
Chetan:
在 Meta 的上一次財報電話會議上,馬克·扎克伯格談到了他們開始開發 LLaMA 4,并表示 LLaMA 4 正在一個比以往他所見過的任何集群都大的集群上進行訓練。
所引用的數字表明,它比十萬臺 H100 還要強大,或者比我所看到的關于其他公司正在做的任何事情都要強大。而且他還說,你知道,較小的 Llama 4 型號應該會在 2025年初準備好。這真的很有趣,因為無論 Llama 4 相對于 Llama 3 是否是階躍函數,這都不重要,重要的是他們是否突破了效率的界限,達到了即使只是逐步提升的程度,這對開發者群體產生的影響也是相當深遠的,因為如今 Llama 的影響力有兩個方面,我認為這對 Meta 非常有利,其一。Llama 所使用的 Transformer 架構是一種標準架構,但它有自己的細微差別。
而且,如果構建于 Llama 之上的整個開發者生態系統開始僅僅假定 Llama 3 Transformer架構是基礎且某種標準的做法,那么這就有點像是將整個堆棧朝著 Llama 的思維方式標準化,從硬件供應商如何支持你的訓練運行,到超級巨頭等等,不一而足。因此,對 Llama 本身的標準化開始變得越來越普遍。
所以,如果你要創辦一家新的模式公司,最終的結果是,如今從 Llama 開始,不僅很棒,因為 Llama 是開源的,而且還極其高效,因為整個生態系統都在采用這種架構。所以你是對的,作為一家擁有 5 億美元資金的早期基金,我們試圖在每個基金周期進行 30 項投資,10 億美元的試運行基本上意味著你要投入兩筆資金來進行一次可能成功也可能不成功的試運行。
因此,這是一項資本高度密集型的業務。順便說一下,這些模型的折舊時間表令人望而生畏。蒸餾作為一種技術,使得這些模型的防御性和這些模型的注釋極其具有挑戰性。這實際上歸結為你在其之上進行的應用是什么,你的網絡效應是什么,你如何在那里獲取經濟效益等等。
我認為,就目前的情況而言,如果你是一個兩到五人的團隊,你可以以編程為例,通過在 Llama 的基礎上進行微調訓練,推動建立一個能更快生成更好編程答案的模型,然后提供一個應用程序,其中包含你自己的定制模型,這確實能為你的客戶(無論是開發者還是其他類似的人員)帶來非凡的效果。所以,我們這里的特定方法和策略一直是,從我們看到 OpenAI API 開始流行起的時候起,就大力投資于應用程序。
2022 年夏天,我們開始看到開發者談論這些 OpenAI API。從那時起,我們的很多努力就是尋找那些考慮利用這些 API 來開拓應用層的企業家,并真正開始思考在當前這波人工智能浪潮之前根本不可能存在哪些應用。
顯然,我們已經看到一些非常出色的成功公司從中脫穎而出,它們仍處于早期階段,但它們所展現出的發展勢頭、所提供的客戶體驗、所采用的生物識別技術等等,都非同凡響。幾周前,布雷特·泰勒(Brett Taylor)曾在你們的播客節目中,塞拉(Sierra)就是一個這樣的例子。在采購方面,我們有一個叫做 Levelpath 的項目。在整個投資組合中,在應用層還有許多其他例子,在那里,你可以審視每一個大型 SaaS 市場,用應用層的投資去開拓它,并開始思考如今哪些是兩年、三年、四年前還無法實現的事情。
六、大模型這場球賽,誰會勝出?OpenAI?谷歌?還是Meta?
Patrick:
我很好奇,想稍微談談我們談到的那些大型基礎模型參與者,比如 Llama,但不太想談 xAI、 Anthropic 和 OpenAI,也許還有 Meta。先從你說起,我很好奇你對于它們的戰略定位以及每家重要的方面的想法。
也許以 OpenAI 為例,也許這里的關鍵在于他們打造了一個多么出色的品牌,他們擁有龐大的用戶群體,他們有眾多出色的合作伙伴,人們知曉并使用他們的產品,有很多人為他們付費,比如 20 美元之類的。也許在這種模式中,分發渠道比產品本身更為重要。
我很好奇你對這三位球員的看法,到目前為止他們占據主導地位,但通過你目前的分析,似乎重要的是他們要不斷創新。
Modest:
所以我認為對 OpenAI 來說有趣的部分在于,他們剛剛完成了最近一輪融資,而且對于投資理由有一些相當公開的評論。沒錯,很多評論都圍繞著這樣一個觀點,即他們在消費端已經獲得了逃逸速度,ChatGPT 現在是認知的參考,隨著時間的推移,他們將能夠聚集巨大的消費需求端,并據此收取適當的費用,而他們在企業 API 和應用程序構建方面的投入要少得多。
如果你仔細想想我們所談論的內容,就會發現這超級有趣。
在他們的財務數據中,如果你剔除訓練費用,如果你剔除這筆巨大的前期支出需求,按照他們的預測,這實際上很快就會成為一家利潤豐厚的公司。所以從某種意義上說,這可能會更好。
那么現在問題變成了,一家不再在前沿領域呈階躍式推進的公司,其防御能力如何?在這方面,我認為這最終將歸結為一點,谷歌也在前沿推進,而且他們很可能會免費贈送產品,還有 Meta。
我認為我們或許可以花一整集來談論 Meta 以及他們在企業和消費者方面的嵌入式選擇權。但讓我們先談談消費者方面。
這是一家擁有超過 30 億消費者接觸點的企業。他們顯然正在將 Meta AI 應用于各種場景。不難看出,他們應該收購 Perplexity 公司。
但你剛剛還看到司法部站出來表示,谷歌應該被迫授權其搜索索引。我想不出還有誰比 Meta 更有利可圖,它有機會以極低的成本承接谷歌的搜索索引。但關鍵在于,我認為將會有兩個大規模的互聯網巨頭免費提供本質上類似于 ChatGPT 的產品。所以這將是一個引人入勝的案例研究,探討“這種產品能否在消費者心目中占據主導地位”。
我的孩子們知道 ChatGPT 是什么,他們不知道 Claude 是什么。我的家人知道 ChatGPT 是什么,他們不知道 Grok 是什么。所以我認為對于 OpenAI 來說,問題在于你能否超越免費?如果你能,而且訓練成本降低,這將是一家很快就能盈利的公司。
如果你去了解 Anthropic 公司,我認為他們面臨著一個有趣的困境,即人們認為 Sonnet 3. 5 可能是現有的最佳模型。他們擁有令人難以置信的技術人才。他們不斷吸納越來越多的 OpenAI 研究人員,我認為他們會構建出出色的模型,但他們有點受困。他們在消費者中的知名度不高。
在企業方面,我認為 Llama 會讓前沿的模型構建者很難試圖在那里創造巨大的價值。所以他們被困在中間。出色的技術專家,優質的產品,但并非真正可行的策略。而且你看,他們又籌集了 40 億美元。
對我來說,這表明預訓練的擴展效果不太好,因為 40 億美元遠遠達不到他們的需求。如果擴展的途徑是預訓練,那我對他們未來的戰略路徑就沒什么好的判斷力了。我認為他們陷入了困境。
關于 xAI,我就當不知道了。他(埃隆·馬斯克)是一位獨一無二的人才,他們將擁有一個 20 萬芯片集群,并且有一個面向消費者的接觸點,他們正在構建一個應用程序編程接口(API)。但我認為,如果預訓練是擴展的途徑,那么他們將面臨與其他所有人相同的數學難題,只不過可能因埃隆獨特的籌資能力而有所緩解。
但同樣,在接下來的四五年的時間里,數字會迅速變得如此龐大,甚至可能超過他。然后,如果到了測試階段,計算和算法改進以及推理,它們的差異在哪里,它們的市場切入點在哪里,當你有人在消費端站穩腳跟,而企業端又有一個同樣強大的開源實體時,情況會怎樣?
所以當你審視這三者時,我認為最容易看清的是 OpenAI 未來的發展方向是什么。
不過,關于 OpenAI,我要說的是諾姆·布朗,我發現他是研究領域最出色的溝通者之一。他最近上了紅杉資本的播客節目,當被問及通用人工智能時,他說,你看,我覺得我在 OpenAI 之外的時候,對整個通用人工智能的事情持懷疑態度。但實際上這是他們所關注的。
當我進入 OpenAI 工作時,我非常清楚他們對于通用人工智能(AGI)非常認真,這是他們的使命,其他一切都服務于 AGI。我們很容易坐在外面,清晰地闡述如果我們負責那里可能會采取的策略,但我認為我們需要意識到這樣一個事實,即他們之所以能走到今天這一步,部分原因在于他們肩負著使命。
該任務是開發通用人工智能,對于為其設定任何其他最終目標,我們都應該非常謹慎。
七、2025,AGI已經接近實現至少端到端時代已經到來
Chetan:
而我個人的看法是,通用人工智能已經非常接近實現了。
Patrick:
再多說幾句。那為什么它還沒到這兒?這些東西比我打交道的大多數人都聰明。
Chetan:
是的,我想是這樣。狹義定義的人工通用智能(AGI),或者也許是從廣義定義的角度來看,這取決于你的觀點,是一個高度自主的系統,在某些情況下在某些具有經濟價值的工作中超越了人類的表現。用這種視角很容易說 AGI 已經存在。我認為非常明確的是,如果你看看 OpenAI 發布的公告以及他們高管在最近幾周接受的采訪,其中一個例子是端到端的旅行預訂,這是我們可以期待在 2025 年看到的東西,在那里你可以提示系統為你預訂旅行,然后它就會去做。
這是一種新的思維方式,即端到端的任務完成或端到端的工作完成。這顯然涉及推理,涉及自主工作,涉及使用計算機,正如克勞德所闡述的那樣。而且你正在將這些大型語言模型與生態系統本身相互作用的多種方式結合起來,將其放入一個非常出色的組合中,從而能夠完成端到端的工作,并使其完全自動化,做得比人類更好。在我看來,從這個角度來看,我們已經非常非常接近了。
而且我設想,到 2025 年,我們將非常接近或達到通用人工智能的水平。鑒于當前的進展和創新,再加上現在轉向測試時的計算和推理,從這個角度來看,通用人工智能即將到來。
Modest:
這很有趣,因為我們有點像在溫水里煮的青蛙,我們相當輕松地通過了圖靈測試,然而再也沒有人坐在這里談論:天哪,我們通過了圖靈測試。它來了又過去了。所以,也許通用人工智能的宣告也是同樣的道理,就像,是的,當然模型能夠預訂端到端的旅行。這實際上沒那么難。
然而,兩年半以前,如果你說:“嘿,有一種算法,你可以告訴它你想做什么,它會從頭到尾安排好并給你發送一張收據。”你會說,
“沒門兒。”所以這可能有點像煮青蛙,突然有一天你醒來,一個實驗室說:“嘿,我們實現了通用人工智能。”大家可能有點像,“啊,酷?!辈贿^,實驗室宣布實現通用人工智能在更廣泛的意義上有趣,有一個特別的原因,那就是與微軟的關系。微軟去年夏天首次披露,在通用人工智能實現之前,他們擁有 OpenAI 知識產權的全部權利。
所以,如果 OpenAI 選擇宣稱已實現通用人工智能,我認為這將在他們和微軟之間引發一種非常有趣的動態,這將加劇當前已經在發揮作用的、本就非常有趣的動態。所以,這在明年肯定是值得關注的,不僅對公開市場的投資者而言是如此,對更廣泛的生態系統的影響也是如此。因為我再次認為,如果我們現在所走的道路是正確的,那么隨著我們向前推進,關系和商業伙伴關系將會有很多重新洗牌。
Patrick:
Chetan,Modest對大公司的評估中還有其他內容嗎?而且鑒于我們沒有特別談到谷歌,我們很希望聽聽你對谷歌的看法。有沒有他說的話你不同意或者想要進一步追問的?
Chetan:
不,我認為我們只是不知道的是,我們不知道所有這些房間里進行的潛在討論,我們可以推測并了解我們可能會怎么做。但我認為,歸根結底,每一家互聯網企業或科技企業最終都歸結為以下兩種情況。
在消費者方面,分銷隨后與某種網絡效應和鎖定效應相結合,然后你就能憑借這一點脫穎而出,在競爭中占據優勢。而在企業方面,這在很大程度上是一種由技術差異化以及以出色的服務級別協議、優質的服務以及非常獨特的解決方案交付方法所驅動的業務。所以,Modest對消費者的評論以及消費者將如何演變。
我認為這完全正確。Meta、谷歌和 XAI 都有面向消費者的接觸點。OpenAI 如今擁有出色的品牌,憑借 ChatGPT 以及大量的消費者接觸點。
而在企業方面,挑戰在于這些 API 迄今在很大程度上都不如開發者所期望的那樣可靠。
由于超大規模云服務提供商出色的工作,開發人員已經習慣,如果你為一款產品提供 API,那么這款產品應該是無限可擴展的,全天候可用的,API 失效的唯一原因是某個大型數據 中心停電之類的原因。很少有理由讓 API 失效。這已成為開發人員對企業解決方案的思維模式。在過去的兩年里,AI API 的質量對應用程序開發人員來說是一個巨大的挑戰。
因此,最終的結果是人們已經找到了變通方法,并通過純粹的創新解決了所有這些問題。但在這方面繼續推進,我們再次回到這一點上。如果預先訓練和擴展不是解決之道,而完全取決于測試時的計算能力,這就是我們再次回到超大規模運營商傳統方式的地方。我認為在這方面,AWS 具有極大的優勢,因為 Azure 和 Google 都有出色的云服務,但 AWS擁有最大的云。
它確實以一種非常獨特的方式構建了彈性。即使在今天,如果你運行 LLaMA 模型,你會希望在 AWS 上運行 LLaMA 模型,或者由于某些原因,如果你有一些非常特定的用例并且需要為本地客戶提供支持,你也可以在那些監管環境復雜或存在合規原因的大型金融機構中,如果你愿意,你可以在本地運行這些模型。
而且,AWS 甚至已經在這方面有所行動,比如 VPC(虛擬專用云)、GovCloud 以及諸如此類的東西。所以,如果我們假設預訓練和擴展工作已經完成,那么突然之間, AWS 就會變得極其強大,在過去幾年里,他們的策略就是與開發者生態系統中的所有人交朋友,而不是自行開展大型語言模型的工作。
嗯,他們正在推進,但并非以與其他公司相同的方式推進,這最終很可能會成為一個相當不錯的策略,因為突然間你就擁有了最好的 API 服務。我認為另一部分是谷歌,我們還沒談論到它,他們的云在某些方面非常出色。所以他們有企業業務。如果你看看最新的收益報告,會發現他們的企業業務實際上已經相當大規模了。顯然,他們的消費業務占主導地位,而且一直有一種看法認為他們如今受到了沖擊。
我認為這些力量對他們極具破壞性。但目前尚不清楚這種破壞是否已經發生。他們對此采取了什么行動?顯然他們正在努力嘗試,而且很明顯他們正在非常努力地嘗試。
但我認為這是一件值得關注的事情,也是我喜歡的那種,因為這是典型的創新者困境。顯然,作為現有企業,他們正努力站在不被創新者取代的有利一邊。他們非常努力。所以在商業史上,現有企業成功阻止創新者攻擊的情況非常少見。
而且如果他們在這個時代確實捍衛了自己的業務,那將是一項非凡的成就。
Modest:
是的,谷歌非常引人入勝,因為曾有一位出色的賣方分析師卡洛斯·基爾吉納(Carlos Kirjner),不幸的是,他去世了。但在 2015 年和 2016 年,他花了大量報告來寫谷歌在人工智能方面的進展,以及他們在 DeepMind 所做的基礎工作,實際上他非常喜歡這些工作,最終去了谷歌工作,但首先揭示了他們在神經網絡和深度學習方面所做的基礎工作這一想法。
顯然,他們被這種大規模的暴力擴展所震驚,推動這波技術的是實實在在地在計算上投入。但如果你閱讀過任何對那些預見到這堵數據墻的人的采訪,他們談到的其中一點是,自我對弈可能是克服數據不足的一種模式。而誰比 DeepMind 更擅長自我對弈呢?
如果你審視一下 DeepMind 在 Transformer 出現之前所擁有的成果,以及他們將 Transformer 與計算能力的擴展相結合所取得的成果,似乎他們已經具備了所有能取勝的條件。但我一直以來提出的問題都不是谷歌能否在人工智能領域取勝?而是,無論取勝是什么樣子,它是否有可能重現當前范例中取勝時的輝煌?這才是真正的問題所在。
正如Chetan所說,如果他們能克服困境并取得勝利,那將會令人驚嘆,但我認為他們具備這樣的條件。真正的問題在于,他們能否憑借現有的資產打造出一家企業,這家企業在任何方面都能像可以說是我們所見過的最偉大的商業模式——互聯網搜索那樣出色。所以我同樣很期待關注他們。我認為在企業方面,他們擁有令人難以置信的模式和資產。
我認為他們需要贏得很多信任。我覺得隨著時間的推移,他們在那個世界里起起落落,所以我認為這對他們來說是一個更難突破的方面。但在消費者方面,當然在模型構建方面,他們已經具備了所有獲勝的條件。
問題在于,那個獎項究竟是什么樣子?尤其是現在,看起來似乎不存在一兩個能稱霸的模型。
八、大模型越穩定,應用越有機會
Patrick:
Chetan,我很好奇,作為一名尋求回報的投資者,你個人希望走什么樣的道路?
Chetan:
我個人希望人工智能能持續很長時間。作為一名風險投資者,你需要巨大的顛覆來解鎖分銷。如果你看看互聯網或移動領域所發生的情況,以及價值在哪里產生,在這兩波浪潮中,價值主要在應用層產生。顯然,我們的假設,也是我的假設,是這一層由于人工智能應用層的創新,將再次非常有利于分銷的解鎖。我認為到目前為止這在很大程度上已經顯現出來了。雖然仍處于早期階段,但那些推出面向消費者和企業的人工智能應用產品的供應商發現,這些解決方案之所以能夠存在,完全是因為人工智能。它們正在以一種坦率地說在 SaaS 或面向專業消費者的 SaaS 等領域無法實現的方式解鎖分銷渠道。
我們將給你一個非常具體的例子,一個由人工智能驅動的應用程序。我們現在正向《財富》500 強企業的首席信息官展示這些演示。兩年前,確實有一些不錯的演示。如今,這是一個非常出色的演示,同時還結合了五個客戶參考案例,這些客戶都是同行,他們在生產中使用了它,并取得了巨大的成功。在那次交流中,有一點變得非常清晰,那就是我們所展示的并非是對現有 SaaS 解決方案的 5%的改進。而是關于我們能夠大幅削減軟件支出和人力資本支出,并將其轉移到這個人工智能解決方案上。而且你對軟件的 10 倍傳統投資回報率的定義很容易被認可,人們能在 30 分鐘內理解。
于是你開始看到,過去軟件即服務(SaaS)和人工智能應用通常有著非常漫長的銷售周期,而現在 15 分鐘就能做出決定,30 分鐘就能做出決定。而且對于企業來說,采購流程完全不穩定。現在首席信息官會說類似這樣的話:“咱們盡快把這個搞定?!蔽覀兇蛩氵M行為期 30 天的試點。一旦成功,我們就會簽訂合同并立即部署。這些情況在三年、四年前的軟件即服務領域是完全不可能的,因為當時你是在與老牌企業競爭,在與他們的分銷優勢、服務優勢以及所有這類東西競爭。而且很難證明你的特定產品是獨特的。
所以,自 2022 年以來,我可以說自 2022 年 11 月的 ChatGPT 以來,這在這個世界上似乎是一個非常好的前后界限。我們已經對人工智能公司進行了 25 項投資,對于一個由五個合作伙伴組成的 5 億美元基金來說,這是一個非凡的速度。上次我們達到這種速度是在 2009 年 App Store 推出的時候。然后,我們再次達到這種速度是在 1995 年、1996 年的互聯網時期。在這兩者之間,你們可以看到我們的投資步伐相當緩慢。
在非顛覆性時期,我們平均每年大概投資五到七次。顯然,現在我們的投資步伐大幅加快。如果你看看這 25 家公司,其中四家是基礎設施公司,其余的是應用公司。而且我們剛剛投資了我們的第一家模式公司,不過這還沒有公布。
但這是兩個人,兩個非凡的、才華橫溢的人,他們帶著很少的資金就投身于前沿領域。所以,我們顯然已經押注并預料到,在應用層會有巨大的創新和分發解鎖。我們已經看到這種情況正在發生。作為軟件投資者,這些產品確實令人驚嘆。
它們需要對這些事物的架構方式進行徹底的重新思考,從第一性原理出發。你需要統一的數據層,需要新的基礎設施,需要新的用戶界面以及諸如此類的東西。顯然,初創企業相對于老牌軟件供應商具有顯著的優勢。這并不是說老牌軟件供應商停滯不前,只是如今在企業軟件領域,創新者的窘境比在消費領域更激烈地在我們眼前上演。
我認為在消費領域,消費者參與者已經意識到了這一點,正在推動變革,并正在采取行動。然而,我認為在企業領域,即便你意識到了這一點,即便你有采取行動的愿望,解決方案的構建方式也無法響應大幅的重組架構。那么,我們能看到這種情況發生嗎?一家大型 SaaS 公司會暫停銷售兩年,然后徹底重新架構其應用堆棧嗎?
當然,但我就是覺得這不會發生。所以,如果你看看關于人工智能軟件支出正在發生什么的任何分析,比如僅純支出在 2023 年和 2024 年之間同比增長了 8 倍。在短短一年的時間里,就從幾億美元增長到了遠遠超過 10 億美元。你可以看到這種拉動,你能感受到這種拉動。
如果你身處這些人工智能應用公司中的任何一家,會發現這類公司更多地是受供應限制而非需求限制。我們與這些應用公司的首席執行官交流,他們只是會說類似這樣的話:“嗯,就我所能看到的情況,我看到了需求。”我只是沒有能力為所有對我表示同意的人提供服務。所以我打算對其進行細分,然后到他們所在的地方去。
作為一名投資者,我所希望的是這種情況能持續下去,我們能保持穩定,從而專注于這些方面。坦率地說,模型層的穩定對于應用層來說是一個巨大的福音,主要是因為作為應用開發者,你坐在那里看著模型層每年都實現階躍式的飛躍。
而且你在某種程度上不知道該構建什么,也不知道哪些是應該等待構建的,因為顯然你希望它與模型層完全一致,因為模型層現在正轉向推理。這對于應用程序開發人員來說是一個很好的地方。
作為應用程序開發者,你知道的一件事是人類是沒有耐心的。因此,你需要始終構建在性能和質量方面優化的解決方案。作為應用程序開發者,你不能對用戶說,比如,我打算提供一個高質量的響應。
本文轉載自??51CTO技術棧??,作者:言征
