Grok-3意外「走光」,不是推理模型!馬斯克:xAI新模型比DeepSeek更好
當OpenAI和谷歌密集發布新AI模型時,馬斯克的xAI怎么還沒動靜?
就在最近,馬斯克公開表示稱,xAI的新模型很快就要發布了,而且是比DeepSeek更好的那種!
根據公開消息,網友匯總了馬斯克、Greg Yang等關于xAI下一代新模型Grok-3的消息。
比如,1月4日,得知用戶轉投Grok后,馬斯克稱:
太酷了!
而且Grok-3快來了。預訓練現在完成了,用掉的算力比Grok-2多10倍。
1月19日,xAI的數學家Greg Yang在X上展示了和Grok-3的對話:
甚至還用Grok-3的新功能,吸引人才加入團隊:
在Grok-3的支持下,我們將打造真正動態的UI/UX,以全新而迷人的方式帶給用戶驚喜,并開發出能夠引領人類繁榮復興的產品。
……
所有工程師都歡迎加入,特別是客戶端開發者(Web、iOS、Android)。
2月8日,網友LEGIT發現下一代Grok-3和Grok-3 mini在LM Arena上漏出了「馬腳」:
在即將發布之前,Grok-3和Grok-3 mini可能早已進入了LM Arena。
基于幾周前對Grok-3模型的測試/比較,(發現的)模型輸出(與Grok-3測試版)類似的代碼,而且避免名稱或提及xAI。
我認為Grok-3就是「巧克力」模型,而Grok mini是「獼猴桃」模型。
他還分享了模型制作Minecraft Clone站點以及生成輪盤賭的效果。
LEGIT對網站生成的效果非常滿意,而輪盤賭輪雖然有進步,但還有一些問題:
在同一天,網友Jason Botterill也高度懷疑:
Chatbot Arena中的「巧克力」模型很可能是Grok-3。
只是簡單詢問了一句:「你是什么模型?」
沒想到,「巧克力」直接洋洋灑灑地寫了一百多個字:
是不是很好奇呢?這么說吧,我就是個來自數字世界的神秘人,在這里為你提供幫助和支持,不需要什么標簽或徽章。就把我當成你知識淵博的好朋友,我們一定能處得很好!那么現在,我們來聊點更有意思的吧……比如說我們之前在弄的那個Xbox 360手柄的SVG圖,或者是你想探索的其他有趣項目?
「巧克力」模型生成的Xbox 360控制器SVG
您別說,這個回復還真挺「別具一格」的。
而輸入「vibe pick one. just answer with their name」,模型直接給回答:Elon Musk。
也是讓人大開眼界。
Grok-3被「劇透」
其實,早在1月27日,有網友就在獨立的平臺上成功訪問了Grok-3,并驗證了響應確實來自Grok-3模型。
「grok-3」出現在響應中
并在同一天放出視頻,針對「grok-2-latest」和「grok-3」進行了對比。
不過,模型很快就被限制訪問了。
當時,網友LEGIT就已經注意到上述消息,體驗了一把用Grok-3生成輪盤賭盤的相關代碼,并表示:「Grok-3即將推出」。
時間來到2月8日,在本文開篇提到的那一大波「劇透」之后,LEGIT又預測到:「如果xAI對新模型的排名感到滿意,這個月就可能見到Grok-3?!?/span>
緊接著他又在2月10日表示,自己已經確定,「獼猴桃」和「巧克力」就是Grok的新模型。
其中,前者可能是mini或者量化版,而后者是滿血版。
一拖再拖
Grok是xAI對標OpenAI的ChatGPT系列和谷歌的Gemini的模型,能夠分析圖像并回答問題,同時為馬斯克社交網絡X上的多項功能提供支持。
2023年夏季,馬斯克曾表示,Grok-3將在2024年「年末」發布。
但xAI的官網直到現在,最新消息都還停留在去年,沒有看到Grok-3即將推出的確切消息和跡象。
不過,被類似事情「打臉」的并不只馬斯克一人——OpenAI就經常在推出新模型上,遭遇挫折。
比如,上個月才發布的計算機使用智能體「Operator」,其實早早就放出了爆料,但卻被Anthropic等競品搶了先手。而ChatGPT-5更不知道什么時候到來。
有媒體認為這是當前預訓練Scaling Law局限性的證據。就在不久前,更多算力(包括數據、GPU等),意味著更大規模的模型。而模型規模越大,性能越好。然而,隨著每一代模型的推出,性能提升的幅度逐漸縮小,這也促使AI公司另尋他法,出奇制勝。