Claude 4被曝發(fā)布在即!DeepSeek把大招都給逼出來了
終于!終于!Claude 4被曝將在未來幾周內(nèi)發(fā)布!
高亮重點(diǎn),最新的它采取了一個(gè)與之前模型路線不同的辦法:
是個(gè)混合型大模型。
簡(jiǎn)單來說,就是既帶有推理能力,會(huì)使用更多的算力來思考和解決難題;在面對(duì)簡(jiǎn)單問題的時(shí)候,又能像傳統(tǒng)大模型一樣短平快地輕巧處理,無需多費(fèi)不必要的功夫。
怎么樣,聽起來是不是和昨天奧特曼透露的GPT-5非常類似(doge)。
都是不再把傳統(tǒng)通用模型和推理模型分開推出,直接融合在一起。
據(jù)透露,Anthropic計(jì)劃在未來幾周內(nèi)發(fā)布該模型。
而翻遍互聯(lián)網(wǎng)發(fā)現(xiàn),4天前就有人按捺不住,在推特上劇透過:
Anthropic內(nèi)部員工告訴我,他們將在本周內(nèi)發(fā)布Claude 4,以及一個(gè)推理模型。
至于性能嘛,超過滿血o3!
俗話說得好:傳言有出入,期待需謹(jǐn)慎。
但還是禁不住狠狠期待一下!
下面一起來看更詳細(xì)的劇透——
Claude 4不走老路,可控制使用時(shí)的推理成本
如前所述,Claude 4與此前的通用大模型不同。
它把通用模型和推理模型融合到一起去了,會(huì)根據(jù)具體任務(wù),調(diào)整所需算力和所需功能:
遇到復(fù)雜的問題,就啟用推理能力;遇到簡(jiǎn)單的問題,就用通用模型處理。
而且用戶可以自行控制,每個(gè)問題需要耗費(fèi)多少token——表現(xiàn)出來就是我可以規(guī)定它在每個(gè)具體的問題上思考推理多長(zhǎng)時(shí)間。
具體操作,是使用者可以通過一個(gè)游標(biāo)刻度尺來調(diào)整,刻度上標(biāo)注的是“完成任務(wù)所需的token數(shù)”。
如果將游標(biāo)滑動(dòng)到“0”,那么Claude 4就是一個(gè)傳統(tǒng)的、不帶推理能力的AI大模型。
滑動(dòng)到的數(shù)值越大,所調(diào)用的算力就越多,思考推理過程就越長(zhǎng)。
其實(shí)呢,OpenAI現(xiàn)在的模型也有類似功能。
不過OpenAI只分了“低-中-高”三檔,供用戶選擇推理強(qiáng)度。
但講道理,很難預(yù)測(cè)模型在每一檔位實(shí)際上會(huì)用掉多少tokens,所以很多用戶反饋“三個(gè)檔位并不能很好地控制使用成本”。
不過,這可能和OpenAI和Anthropic的市場(chǎng)定位有關(guān)系。
OpenAI更多針對(duì)的是普通用戶和個(gè)人開發(fā)者,三檔式更簡(jiǎn)單易懂,方便操作。
而Anthropic更注重企業(yè)級(jí)市場(chǎng),相對(duì)來說toB一些,所以采用了游標(biāo)刻度尺來調(diào)整,讓使用者控制成本、速度等。
推理通用二合一,下一個(gè)大趨勢(shì)?
可以看到,國(guó)外大模型的兩個(gè)最強(qiáng)玩家,Anthropic和OpenAI,都明確了下一步道路:
讓通用模型和推理模型合二為一。
幾周內(nèi)將發(fā)布的Claude 4如此,數(shù)月內(nèi)將發(fā)布的GPT-5也是如此。
這或許是所有基座大模型玩家的下一步共同選擇也未可知——
當(dāng)傳統(tǒng)Scaling Law撞墻成為一個(gè)強(qiáng)共識(shí),而后訓(xùn)練、推理、CoT的重要性與日俱增時(shí),推理變成通用模型的必需技能,似乎是大勢(shì)所趨。
不過在這中間,Anthropic有屬于自己的牢固生態(tài)位,那就是它旗下的Claude系列,編程能力一直站在第一梯隊(duì)的頂尖。
而且它擅長(zhǎng)的是大廠工程師所需級(jí)別的編程任務(wù)。
舉個(gè)例子,Claude系列更擅長(zhǎng)理解由數(shù)千個(gè)文件組成的復(fù)雜代碼庫,并生成就能正常運(yùn)行的完整代碼,且一次成功。
這就非常有意思了~
因?yàn)樵诿鎸?duì)復(fù)雜編程問題時(shí),AI大模型往往會(huì)偷懶,僅提供注釋,而不是吐出實(shí)際代碼。
不過,現(xiàn)在還不清楚Claude 4將如何定價(jià)。
會(huì)比o3-mini便宜嗎?會(huì)比DeepSeek-R1便宜嗎?會(huì)比Google 2.0 Flash-Lite便宜嗎?
暫時(shí)還沒人知道。
不過有網(wǎng)友說出了大多數(shù)人的心聲:
如果花1000美元還解決不了我想解決的問題,那不是純純浪費(fèi)錢嗎。
說白了,如果不是在某項(xiàng)實(shí)用能力上有「傲視群雄的拔尖實(shí)力」,或許所有模型玩家在定價(jià)這一part上能做的,就是像DeepSeek和Google 2.0 Flash-Lite一樣。
(忍痛)對(duì)著價(jià)格先狠狠砍一刀,然后再砍一刀,再砍一刀……
本文轉(zhuǎn)自量子位 ,作者:量子位
