從代碼助手到工程伙伴：Windsurf 的 SWE-1 開啟 AI 輔助開發(fā)新范式原創(chuàng)

發(fā)布于 2025-5-20 08:03

瀏覽

0收藏

如今，在許多 Vibe Coding 平臺(tái)通常會(huì)借助現(xiàn)有的大型語(yǔ)言模型 (LLMs) 來輔助編寫代碼。

不過，寫代碼僅僅是開發(fā)人員日常工作的一小部分。要想構(gòu)建一個(gè)完善的企業(yè)級(jí)生產(chǎn)平臺(tái)，還得用上各種工具來審查代碼、提交代碼，并進(jìn)行長(zhǎng)期的維護(hù)。這恰恰是 ??Windsurf?? 公司（它的前身是 Codeium）希望通過一系列新型先進(jìn) AI 模型來攻克的難題。在其 Wave 9 更新中，公司正式推出了這些模型，并將其命名為 SWE-1（可以理解為“軟件工程師 1 號(hào)”）。

就在這條消息發(fā)布前后，有報(bào)道稱 AI 領(lǐng)域的領(lǐng)頭羊 OpenAI 公司正計(jì)劃以 30 億美元的價(jià)格收購(gòu) Windsurf。目前這筆交易還沒最后敲定，Windsurf 方面也暫時(shí)不便公開置評(píng)。

SWE-1 是一系列頂尖的 AI 模型，它們的目標(biāo)是給整個(gè)軟件工程流程提速。和那些僅僅適配了編碼任務(wù)的通用 AI 模型不同，SWE-1 力求覆蓋軟件工程的方方面面。

這些新模型能夠通過多種交互界面，幫助開發(fā)人員處理那些未完成的工作和需要長(zhǎng)期跟進(jìn)的任務(wù)——這是真實(shí)軟件開發(fā)場(chǎng)景的常態(tài)。目前，SWE-1 已經(jīng)向 Windsurf 的用戶開放，這也意味著該公司正式邁入了尖端模型研發(fā)的行列。它的性能表現(xiàn)不輸于現(xiàn)有的一些基礎(chǔ)模型，而且更加聚焦于軟件工程的實(shí)際工作流程。

“我們的目標(biāo)很簡(jiǎn)單：讓所有軟件工程的效率提升 99%。”Windsurf 的產(chǎn)品與戰(zhàn)略主管 Anshul Ramachandran 這樣告訴 VentureBeat。

企業(yè)開發(fā)人員需要的，遠(yuǎn)不止會(huì)寫代碼的模型

SWE-1 的核心創(chuàng)新點(diǎn)在于，Windsurf 團(tuán)隊(duì)意識(shí)到，編碼其實(shí)只占軟件工程師實(shí)際工作量的一小部分。

這種思路恰好解決了目前 AI 編碼 LLM 所面臨的一個(gè)關(guān)鍵瓶頸。市面上確實(shí)有不少能寫應(yīng)用程序代碼的模型，比如 OpenAI 的 GPT-4.1、Anthropic 的 Claude 3.7，還有 Google 的 Gemini 2.5 Pro I/O 版本。

Windsurf 提供了模塊化的界面，用戶能夠靈活切換不同的模型。Ramachandran 提到，用戶的反饋顯示，現(xiàn)有的編碼模型在有人從旁指導(dǎo)時(shí)表現(xiàn)還行，可時(shí)間一長(zhǎng)，就容易顧此失彼，漏掉一些關(guān)鍵信息。

這個(gè)問題其實(shí)源于任務(wù)性質(zhì)的根本不同。代碼生成往往是一錘子買賣，而真正的軟件工程卻需要在不同的工具間來回切換，處理半成品代碼，并且在漫長(zhǎng)的項(xiàng)目周期里時(shí)刻把握上下文。

SWE-1 系列：為不同工程任務(wù)量身打造

Windsurf 并未試圖打造一個(gè)“萬金油”式的解決方案，而是針對(duì)性地開發(fā)了三款專業(yè)模型：

SWE-1：這是一個(gè)全尺寸模型，專為復(fù)雜的推理和工具調(diào)用而設(shè)計(jì)，所有付費(fèi)用戶均可使用。
SWE-1-lite：這是一款更小巧但同樣強(qiáng)大的模型，它將替代 Windsurf 目前的 Cascade Base，并向所有用戶（包括免費(fèi)版用戶）開放。
SWE-1-mini：這是一款輕量級(jí)模型，主要為 Windsurf Tab 中的代碼自動(dòng)補(bǔ)全功能提供支持，所有用戶都可以無限制使用。

SWE 系列模型的煉成，得益于 Windsurf 針對(duì)軟件工程任務(wù)進(jìn)行了大量?jī)?nèi)部專項(xiàng)訓(xùn)練。Ramachandran透露，公司采用了一種包含訓(xùn)練序列步驟的新型數(shù)據(jù)模型。

性能基準(zhǔn)：看看 SWE-1 的實(shí)力如何

盡管 SWE-1 的目標(biāo)并不是取代那些頂尖實(shí)驗(yàn)室的基礎(chǔ)模型，但 Windsurf 表示，在軟件工程相關(guān)的任務(wù)上，SWE-1 展現(xiàn)出了一流的性能水準(zhǔn)。根據(jù)公司發(fā)布的報(bào)告，它的表現(xiàn)顯著優(yōu)于中等規(guī)模的基礎(chǔ)模型以及一些開源 AI 大模型。

不過，對(duì)于這些初步的測(cè)試結(jié)果，Windsurf 表現(xiàn)得相當(dāng)審慎，并沒有大張旗鼓地宣傳。

“即便我們的基準(zhǔn)測(cè)試結(jié)果看起來很棒，但這并不意味著它就比市面上所有其他模型都強(qiáng)。”Ramachandran 坦誠(chéng)地說道。

實(shí)際上，他們更希望將 SWE-1 定位為邁向?qū)Ｓ媚Ｐ偷牡谝徊健＿@類專用模型最終有望在特定的工程任務(wù)中超越通用模型——而且，它們的成本或許還會(huì)更低。

從代碼助手到工程伙伴：Windsurf 的 SWE-1 開啟 AI 輔助開發(fā)新范式 -AI.x社區(qū)

Windsurf 方法在技術(shù)上的一個(gè)獨(dú)特之處，在于其實(shí)現(xiàn)了“流感知”(Flow-Awareness) 這一概念。

其基本邏輯是這樣的：企業(yè)級(jí)的軟件開發(fā)過程，往往包含了一連串的步驟。“流感知”并不僅僅是針對(duì)某個(gè)特定步驟編寫代碼，更重要的是能夠理解和把握整個(gè)流程的上下文。

“流感知”的核心，是在軟件開發(fā)過程中，建立起一套人類與 AI 共享的工作時(shí)間線。它的核心理念在于，通過判斷 AI 在哪些環(huán)節(jié)能最有效地提供幫助，從而逐步地將原先由人工承擔(dān)的任務(wù)移交給 AI。

這種方法為模型的持續(xù)進(jìn)步創(chuàng)造了一個(gè)良性循環(huán)。

“隨著我們不斷優(yōu)化模型，共享時(shí)間線上的更多步驟將會(huì)從人工操作轉(zhuǎn)向 AI 處理。”Ramachandran 解釋說，“AI 將能夠勝任更多以往必須依賴人工才能完成的工作，因?yàn)檫^去的 AI 可能還不夠精準(zhǔn)。”

這對(duì)技術(shù)決策者意味著什么？

對(duì)于那些正在構(gòu)建或維護(hù)軟件的企業(yè)而言，SWE-1 的出現(xiàn)代表著 AI 輔助開發(fā)領(lǐng)域的一大進(jìn)步。這種思路不再將 AI 編碼助手僅僅視為一個(gè)簡(jiǎn)單的自動(dòng)補(bǔ)全工具，而是致力于提升整個(gè)開發(fā)生命周期的效率。

它所帶來的潛在好處，遠(yuǎn)不止是寫代碼更快那么簡(jiǎn)單。充分認(rèn)識(shí)到應(yīng)用程序開發(fā)的復(fù)雜性，將有助于推動(dòng)此類 AI 輔助編碼范式走向成熟，使其能更好地適應(yīng)穩(wěn)定可靠的企業(yè)級(jí)軟件開發(fā)需求。

雖然 SWE-1 目前尚處于起步階段，但這一方向性的探索至關(guān)重要。如果 OpenAI 最終完成了對(duì) Windsurf 的收購(gòu)，這些新模型可能會(huì)扮演更重要的角色，因?yàn)樗鼈儗⒂袡C(jī)會(huì)整合更龐大的模型研究與開發(fā)資源。

技術(shù)負(fù)責(zé)人不妨思考一下，在自己的開發(fā)工作流程中，到底有多少環(huán)節(jié)能夠從這種超越簡(jiǎn)單代碼生成的 AI 輔助中獲益。那些需要花費(fèi)大量時(shí)間進(jìn)行代碼審查、調(diào)試以及管理技術(shù)債務(wù)的團(tuán)隊(duì)，相比那些主要精力放在生成新代碼的團(tuán)隊(duì)，或許能從 SWE-1 這類工具中挖到更大的價(jià)值。

原文標(biāo)題：?

?? Software engineering-native AI models have arrived: What Windsurf’s SWE-1 means for technical decision-makers??，作者：Sean Michael Kerner

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

大型語(yǔ)言模型

LLMs

SWE-1

贊

回復(fù)