成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<track id="orszf"><table id="orszf"><optgroup id="orszf"></optgroup></table></track>

<track id="orszf"><table id="orszf"></table></track>

<blockquote id="orszf"><option id="orszf"></option></blockquote>

<output id="orszf"><samp id="orszf"><em id="orszf"></em></samp></output>

<blockquote id="orszf"><ruby id="orszf"></ruby></blockquote><output id="orszf"><ruby id="orszf"></ruby></output>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！精華

發布于 2025-2-26 14:08

瀏覽

0收藏

圣誕節在二月，Claude扔了個王炸！

看來爆料者的信息還挺準的：

明天：Claude 4沒等到，Claude 3.7 要來了？

不是嘛，哈哈哈。

Anthropic 官方有個毛病，他們通常不會做任何的預發布，大半夜他給你扔出來了個王炸：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

這次的新模型叫：Claude 3.7 Sonnet，它帶來了一種新的思維方式。它不再把快速回答和深度思考割裂開來，而是像人類大腦一樣，在同一個模型中實現兩種能力。

Claude 3.7 Sonnet既能快速回答問題，也能在需要時進行深度思考，給用戶帶來更流暢的體驗。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

這種統一的設計讓用戶在使用時感受到更自然的互動，兩種模式下的提示詞方式基本相同，仿佛在與一個真正的助手對話。

你可以選擇標準模式，快速得到答案；也可以切換到擴展思考模式，讓Claude在回答前自我反思，這樣在數學、物理、編碼等任務上表現會更好。在擴展思考模式下，Claude會花更多時間分析問題，從而提供更準確和深入的回答，特別是在復雜的學科領域。

如果你通過API使用Claude，還可以控制思考的預算，決定Claude可以思考多少個token，最高128K。這意味著你可以根據任務重要性，精確設定模型思考的深度。在速度、成本和答案質量之間找到最佳平衡點。與其他模型不同，Claude更注重實際商業應用，而非競賽題目。

Claude編程能力直接起飛！

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

看看這張圖，Claude 3.7 Sonnet在編程測試中拿到了70.3%的高分，把其他大模型全部甩在身后。

OpenAI的o1、o3-mini和DeepSeek R1都擠在49%左右打轉，Claude直接領先20個百分點。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

Sonnet 3.7顯然將重點放在編碼能力上，其他領域似乎并不是他們的主要關注點（你可以看到 Grok3 在MMMLU、AIME2024上是超過他的）。

雖然在其他知識測試上Claude只是小幅提升，但編程能力這一下子就上了一個臺階。

這表明，Anthropic希望將Sonnet定位為一款強大的編碼AI。

Anthropic這是明擺著要把Claude打造成編程專家啊。畢竟它本來就已經很擅長寫代碼了，現在更是實力大增。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

它絕對適合程序員。它將有助于創建應用程序和游戲。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

使用 API，128K最大輸出（VIBE 編碼萬歲）

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

這次的更新特別加強了編碼和前端開發的能力。

Claude 3.7 Sonnet現在在所有計劃中都可以使用，包括免費版、專業版、團隊版和企業版。

也能在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。不過免費用戶不提供擴展思維模式。

定價方面，與前代模型相同：每百萬輸入token 3美元，每百萬輸出token 15美元（包括思考token）。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

所以，還有個3.5超大大大杯呢？

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

此外，我們很早知道Claude 能夠處理復雜的代碼庫和高級工具使用。許多開發者發現，Claude在規劃代碼變更和處理全棧更新時，表現得比其他模型更為出色，極大地提高了工作效率。

在實際測試中，它的編程能力全面領先：Cursor發現它處理復雜代碼庫的能力顯著提升；Cognition認為它在規劃代碼變更和全棧更新方面遠超其他模型；Vercel強調了它在復雜工作流程中的精確性；Replit成功用它構建了其他模型無法完成的復雜應用；Canva則證實它能生成具有設計品味的生產級代碼。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

所以。現在Sonnet 3.7 這個代碼提升。。。刷卡吧 ~

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

網友：“ 感謝@cursor_ai提供所有訓練數據... ”

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

這一點確實需要關注，當一個LLM被作為主流模型用在最真實開發場景中時，這種珍貴數據帶來的能力提升可想而知。。。

就在Sonnet 3.7 凌晨2:30發布之后，有網友馬上催Cursor官方：該上號了！

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

而僅僅過了4分鐘。

凌晨 2:34 我就看到我的Cursor它更新了，集成了Sonnet 3.7。。。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

并且官方更新了推文：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

他們肯定是串通好的。。。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

官方建議啟用代理模式使用Sonnet 3.7。

我還看到了Cursor UI大更新，比較清爽簡潔了。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

是覆蓋各個小操作細節的清爽簡潔。

上次還在夸Trae的界面，這次Cursor似乎也往這個方向優化了。

還有現在跨聊天對話，你不需要通過復制上一個聊天窗口的內容作為上下文加入新窗口。

他現在有一個功能是總結整個聊天的摘要然后直接繼承到新開的聊天窗口中，所以這又是一個痛點被解決。

。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

還有網友建議Cursor 后續把 Sonnet 3.7 思維動態選擇加上，畢竟現在只更新了模型。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

好了，繼續看基準測試。

TAU-bench零售場景達81.2%，航空場景達58.4%，全面領先其他模型。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

TAU-bench 是一個框架，用于測試 AI 代理在復雜的現實任務中與用戶和工具交互。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

Claude 3.7 Sonnet幾乎是全能選手，它在指令理解、推理能力、多模態處理和代碼編寫上都表現出色。開啟擴展思考模式后，在數學和科學問題上更是突飛猛進。

Claude也玩起了寶可夢，還玩得挺溜！

有意思的是，它不僅在傳統測試中表現優秀，連玩寶可夢游戲都比之前的所有模型強：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

看看這張圖，太有意思了。Anthropic讓Claude玩起了經典的Game Boy游戲《寶可夢紅版》，還把不同版本的Claude放在一起比賽。

最老的Claude 3.0連主角家門都出不去，卡在游戲最開始的小鎮上。Claude 3.5稍微好點，能到達森林和第一個城市。

但Claude 3.7 Sonnet簡直是開掛，它不僅能探索多個城市，還打敗了三個道館館主，拿到了三個徽章。

秘訣在哪？研究人員給了Claude基本的記憶能力、屏幕像素輸入和按鍵功能，讓它能持續游戲數萬次交互。Claude 3.7會嘗試不同策略，質疑自己之前的假設，隨著游戲進行不斷提升自己的能力。

這不僅是個有趣的測試，也展示了Claude在復雜任務中的學習和適應能力。

長時間保持專注，完成沒有明確終點的任務。

這種能力放到實際工作中有多強？開發者可以用它來打造各種高級AI助手，處理那些需要持續思考和靈活應對的復雜任務。

游戲只是測試場，真正的價值在于現實世界的應用。

看看網友們的評價：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

關于為什么會有寶可夢這個基準測試，官方說的很清楚，想要詳細了解的看這里：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

https://www.anthropic.com/research/visible-extended-thinking

網上已經有了關于Sonnet 3.7的實際測試例子：

你在開玩笑吧，哥們？之測試非標準草莓單詞計數：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

網友辣評：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

這可真是真正的硬編碼種子選手啊。。。

還有解決復雜的3d布料模擬：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

三維可視化微分音樂：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

最好看的網站登陸頁：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

Sparks of AGI paper：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

UI很好看的心率綁定Snake 游戲：

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

C語言流體模擬器

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

同時，Anthropic還發布了智能編碼工具：Claude Code。專為開發者設計。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

自2024年6月以來，Sonnet已成為全球開發者的首選模型。Claude Code是首個主動協作的編碼工具，能夠搜索和閱讀代碼、編輯文件、編寫和運行測試、提交代碼到GitHub，并使用命令行工具。

你可以直接在終端里把工程任務交給Claude，省時省力。（你應該知道Aider）

在實際應用中，Claude Code在測試驅動開發、調試復雜問題和大規模重構中表現出色，完成任務的時間從45分鐘縮短到一次性完成。

未來，Anthropic 將持續改進Claude Code，增強工具調用的可靠性，支持長時間運行的命令，改進應用內渲染，并擴展Claude對自身能力的理解。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

限量預覽：https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview

And 。。。

我們這三天的時間線，可能是這樣的。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

以及Grok。。。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

關于Claude3.7 這個命名。。。claude-3-7-sonnet-20250219。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

One More Thing

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

根據圖表，Claude的發展路線圖顯示到2024年，它將幫助個人更好地完成當前工作，提升每個人的能力。

到2025年，Claude將開始與專家進行深入合作，獨立完成大量工作，擴展個人和團隊的能力。

而到了2027年，Claude將能夠找到突破性解決方案，解決那些需要團隊多年才能完成的復雜問題。

這意味著我們可能在接下來的幾年里，見證一個“幾乎”快速起飛的階段，朝著超人工智能（ASI）邁進。

這樣的進展確實令人興奮，未來的可能性似乎越來越近了！

大家如此深愛的一個模型，可能叫Claude吧。

沸騰了！新的推理模型編碼能力爆表！是的，那個王，他又回來了！-AI.x社區

參考鏈接：[1] https://x.com/AnthropicAI/status/1894092430560965029

本文轉載自??AI進修生??，作者： Aitrainee ????

標簽

贊

收藏

回復

舉報

回復

相關推薦

曾爆火的 InstantID又有了新玩法：風格化圖像生成，已開源

輕薄滴假象 ? 3279瀏覽 ? 0回復
又又又又翻車！谷歌新AI功能再遭公眾批評，稱前總統奧巴馬是穆斯林，“承認谷歌違反反壟斷法”

51CTO技術棧 ? 2644瀏覽 ? 0回復
技術最牛逼的阿里，又回來了！

51CTO技術棧 ? 2580瀏覽 ? 0回復
OpenAI o1推理模型基礎入門

51CTO內容精選 ? 2523瀏覽 ? 0回復
小模型界o1來了：微軟推出Phi-4，數學推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷

51CTO技術棧 ? 2460瀏覽 ? 0回復
清華&人大：search-o1 讓推理模型具有主動能力

鴻煊的學習筆記 ? 2137瀏覽 ? 0回復
Anthropic秘密「混合模型」 Claude 4首曝細節，硬剛GPT-5！深度推理模型來了

duhorse ? 2790瀏覽 ? 0回復
能"直播思考"的AI來了，推理能力吊打OpenAI？

Halo咯咯 ? 5010瀏覽 ? 0回復
英偉達蒸發的6000億又回來了：市場誤判了R1的影響，計算仍然重要！

51CTO技術棧 ? 1748瀏覽 ? 0回復
吳泳銘預告的旗艦推理模型更了！阿里重磅推出QwQ-Max預覽版，Agent或成正式版王炸！

51CTO技術棧 ? 2130瀏覽 ? 0回復
推理模型+Multi-Agent，可能就是Deep Research的全貌！

探索AGI ? 2464瀏覽 ? 0回復
全球首個混合推理模型Claude 3.7 Sonnet發布，編碼能力直接起飛！

AI博物院 ? 2756瀏覽 ? 0回復
Mistral殺回來了！Small 3.1開源發布，性能完勝Gemma 3，RTX 4090就能跑

老蛀蟲 ? 2617瀏覽 ? 0回復
理解什么是推理模型，看懂這篇就夠了

AIGC新知 ? 2033瀏覽 ? 0回復
Google Gemini 2.5 Pro：AI界的“全能王”來了！

Halo咯咯 ? 1785瀏覽 ? 0回復
大模型推理能力的局限性

JavaEdge1 ? 1542瀏覽 ? 0回復
OpenAI 深夜王炸！ o3 推理模型徹底顛覆認知，AGI真的來了？

算家計算 ? 1052瀏覽 ? 0回復
OpenAI 發布兩款新 AI 推理模型 o3 與 o4-mini，圖像推理及自主工具使用成最大亮點

Syrupup ? 1701瀏覽 ? 0回復
剛剛，Qwen3強勢登頂，成開源新王！國內首個混合推理模型，235B擊敗R1、o1!源神火力全開

51CTO技術棧 ? 2042瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

【一手實測】字節豆包 1.6 + Trae + 火山 MCP + FaaS：AI云原生 Agent 開發部署全流程體驗！ 2025-06-17 06:14:38發布
DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 2025-06-04 06:31:07發布

熱門推薦

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

【一手實測】字節豆包 1.6 + Trae + 火山 MCP + FaaS：AI云原生 Agent 開發部署全流程體驗！ 0回復

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

上一篇： Windsurf Wave3：MCP協議讓AI直接讀取控制臺錯誤，自動化網頁調試不用復制粘貼了！Tab智能跳轉、Turbo模式

下一篇：接入 Deepseek 能讓百度文庫煥發第二春嗎？

社區精華內容

目錄

主站蜘蛛池模板：浮生影院免费观看中文版 | 国产98色在线| 天天艹天天干天天 | 久久久精品一区二区 | 日日夜夜精品视频 | 日本高清视频在线播放 | 欧美日韩在线免费 | 久久久www成人免费无遮挡大片 | 国产网站在线播放 | 一区二区三区精品在线 | 亚洲欧美国产毛片在线 | 在线一级片 | 91精品国产乱码久久久久久久久 | a毛片| 中文字幕一级毛片视频 | 国产精品成人一区二区 | 国产精品久久久久aaaa | 亚洲精品一区二三区不卡 | av在线免费播放 | 久草成人 | 99精品国产一区二区三区 | www.久久| 粉嫩一区二区三区性色av | 亚洲精品在 | 91视频在线 | 99久久久国产精品免费消防器 | 欧美一级片在线观看 | 男人天堂国产 | 久久亚洲一区二区三区四区 | 亚洲高清一区二区三区 | 91一区 | 成人网在线看 | 国产精品69久久久久水密桃 | 成人高清视频在线观看 | 日本高清视频在线播放 | 精品1区| 日韩精品二区 | 日韩一区二区三区四区五区六区 | 夏同学福利网 | 欧美一级片在线观看 | 国产免费av在线 |

<tfoot id="cwmij"></tfoot>