Claude 3.7 Sonnet重磅發(fā)布,Claude最牛逼的東西,還得是它的編程
cursor公認(rèn)的最強(qiáng)編程大模型Claude 3.5再次升級(jí)。
一、Claude 3.7 Sonnent發(fā)布
Anthropic 公司正式發(fā)布了其最新版本的人工智能模型Claude 3.7 Sonnet。
Claude 3.7 Sonnet 提高了單次會(huì)話的上下文長度,高達(dá) 128k tokens。我們可以一次性讀寫更多文本,修改更多的代碼,徹底消除會(huì)話長度焦慮。
該模型被設(shè)計(jì)為采用混合推理策略,其核心在于融合傳統(tǒng)的即時(shí)響應(yīng)技術(shù)與深層邏輯推理機(jī)制,以應(yīng)對(duì)復(fù)雜問題求解;在數(shù)學(xué)計(jì)算和編程任務(wù)中,其卓越表現(xiàn)已被充分驗(yàn)證。
近期編碼基準(zhǔn)測(cè)試中,SWE-bench Verified 的評(píng)測(cè)結(jié)果顯示,Claude 3.7 Sonnet 所獲得的得分明顯超越了前代產(chǎn)品 Claude 3.5 Sonnet 以及 OpenAI 的 o3-mini 與 DeepSeek R1 模型,這一成果彰顯了其在處理復(fù)雜代碼庫和高級(jí)工具應(yīng)用中的優(yōu)越性能。
在 TAU-bench 基準(zhǔn)測(cè)試中,該模型亦表現(xiàn)出顯著優(yōu)勢(shì),其性能超越了 Claude 3.5 Sonnet 與 OpenAI 的 o1 模型,進(jìn)一步驗(yàn)證了其在多模態(tài)信息處理和代理編碼技術(shù)方面的創(chuàng)新實(shí)力。
二、Claude最牛逼的東西,還得是它的編程
非推理模型下的Claude 3.5 Sonnent,就能和OpenAI 最新模式o3-mini-high、671B的滿血DeepSeek R1打的有來有回,甚至至今還是諸多大廠專家心中的編程N(yùn)o.1。
那么,深度思考加持的Claude 3.7,豈不是天下無敵,獨(dú)孤求敗了。
在只是問答、寫作、編程、數(shù)學(xué)、推理、多模態(tài)等諸多表現(xiàn)都很牛逼,特別是加了“深度思考”之后,最新模型Claude 3.7 Sonnet可謂是牛氣沖天,直接晉升大模型T0梯隊(duì)。
配合 Anthropic 這次新推出的 Claude Code 工具,更能讓開發(fā)者爽到飛起。它能直接幫你檢索和編輯文件、編譯運(yùn)行、甚至提交代碼到 GitHub,全程帶你邊玩邊寫。
三、編程專屬Claude Code
前不久,Anthropic 在社交媒體上發(fā)布了一條令人振奮的推文,大致內(nèi)容是:
Introducing Claude 3.7 Sonnet: our most intelligent model to date. It’s a hybrid reasoning model, producing near-instant responses or extended, step-by-step thinking. One model, two ways to think. We’re also releasing an agentic coding tool: Claude Code.
這則消息立刻引發(fā)了技術(shù)圈的熱烈討論。有網(wǎng)友在近期的網(wǎng)絡(luò)文章中興奮地形容:“Claude 3.7 Sonnet 就像升級(jí)版的 AI 導(dǎo)師,可以即刻回復(fù)你的小問題,也能深入剖析你的大疑惑,一次搞定兩種思維模式。”
Claude 3.7 Sonnet 最核心的亮點(diǎn),莫過于它的“混合推理”能力。簡(jiǎn)單來說,它可以在秒回模式和Thinking模式之間靈活切換:
秒回模式:適合處理那些不需要繁瑣思考的日常問題,Claude 3.7 Sonnet 會(huì)在極短時(shí)間內(nèi)給出答案,讓你宛如跟一位健談?dòng)謾C(jī)智的伙伴聊天。
Thinking模式:當(dāng)你需要更深層次的思考或系統(tǒng)化的推理時(shí),它又能像一位冷靜縝密的邏輯大師,給你提供條分縷析的解決方案,讓思路不再迷糊。
不少開發(fā)者在博客或技術(shù)論壇上分享了自己的“上手體驗(yàn)”,表示在面對(duì)復(fù)雜需求時(shí),Claude 3.7 Sonnet 的思考過程異常清晰,幾乎可以看作是一位加班不吃外賣、不打瞌睡的程序猿同事,真正讓人省心不少。
如果說“混合推理”功能是給普通用戶的高能助力,那么“Claude Code”就是程序員們的私人貼身外掛。它不僅能搜索、閱讀并編輯代碼,還能直接編寫、運(yùn)行測(cè)試,甚至一鍵提交并推送到 GitHub,連命令行工具都能熟練運(yùn)用。
據(jù)一些搶先體驗(yàn)的用戶分享:
感覺就像擁有了一個(gè)自動(dòng)化的研發(fā)團(tuán)隊(duì)。
遇到難纏的 bug,Claude Code 能提供清晰的解決思路和操作指令。
再也不用凌晨三點(diǎn)查漏補(bǔ)缺,我先睡了,Claude Code 你先扛著。
這種“代理式”編程輔助,不僅能大幅提高開發(fā)效率,還能讓團(tuán)隊(duì)協(xié)作更加順暢:有了 Claude Code 幫忙抓漏補(bǔ)缺,寫文檔、跑測(cè)試的瑣碎活兒就變得輕松許多,真正幫你把時(shí)間和精力釋放到更具創(chuàng)造性的工作上。
四、混合推理實(shí)測(cè)
開啟擴(kuò)展模式
一句話搞定一個(gè)游戲。
一句話搞定一個(gè)大數(shù)據(jù)大屏預(yù)覽。
在功能上,Claude Code 是一個(gè)積極的協(xié)作者,可以搜索和閱讀代碼、編輯文件、編寫和運(yùn)行測(cè)試、提交和推送代碼到 GitHub,以及使用命令行工具。
我們來看下它的幾個(gè)使用示例,比如解釋項(xiàng)目結(jié)構(gòu):
編寫測(cè)試:
構(gòu)建應(yīng)用:
五、如何使用Claude 3.7 Sonnent
推薦谷歌瀏覽器訪問:https://claude.nezhagpt.cloud
無需魔法、個(gè)人獨(dú)享、同時(shí)支持手機(jī)/電腦。