從代碼助手到工程伙伴:Windsurf 的 SWE-1 開啟 AI 輔助開發(fā)新范式 原創(chuàng)
如今,在許多 Vibe Coding 平臺(tái)通常會(huì)借助現(xiàn)有的大型語(yǔ)言模型 (LLMs) 來輔助編寫代碼。
不過,寫代碼僅僅是開發(fā)人員日常工作的一小部分。要想構(gòu)建一個(gè)完善的企業(yè)級(jí)生產(chǎn)平臺(tái),還得用上各種工具來審查代碼、提交代碼,并進(jìn)行長(zhǎng)期的維護(hù)。這恰恰是 ??Windsurf?? 公司(它的前身是 Codeium)希望通過一系列新型先進(jìn) AI 模型來攻克的難題。在其 Wave 9 更新中,公司正式推出了這些模型,并將其命名為 SWE-1(可以理解為“軟件工程師 1 號(hào)”)。
就在這條消息發(fā)布前后,有報(bào)道稱 AI 領(lǐng)域的領(lǐng)頭羊 OpenAI 公司正計(jì)劃以 30 億美元的價(jià)格收購(gòu) Windsurf。目前這筆交易還沒最后敲定,Windsurf 方面也暫時(shí)不便公開置評(píng)。
SWE-1 是一系列頂尖的 AI 模型,它們的目標(biāo)是給整個(gè)軟件工程流程提速。和那些僅僅適配了編碼任務(wù)的通用 AI 模型不同,SWE-1 力求覆蓋軟件工程的方方面面。
這些新模型能夠通過多種交互界面,幫助開發(fā)人員處理那些未完成的工作和需要長(zhǎng)期跟進(jìn)的任務(wù)——這是真實(shí)軟件開發(fā)場(chǎng)景的常態(tài)。目前,SWE-1 已經(jīng)向 Windsurf 的用戶開放,這也意味著該公司正式邁入了尖端模型研發(fā)的行列。它的性能表現(xiàn)不輸于現(xiàn)有的一些基礎(chǔ)模型,而且更加聚焦于軟件工程的實(shí)際工作流程。
“我們的目標(biāo)很簡(jiǎn)單:讓所有軟件工程的效率提升 99%。”Windsurf 的產(chǎn)品與戰(zhàn)略主管 Anshul Ramachandran 這樣告訴 VentureBeat。
企業(yè)開發(fā)人員需要的,遠(yuǎn)不止會(huì)寫代碼的模型
SWE-1 的核心創(chuàng)新點(diǎn)在于,Windsurf 團(tuán)隊(duì)意識(shí)到,編碼其實(shí)只占軟件工程師實(shí)際工作量的一小部分。
這種思路恰好解決了目前 AI 編碼 LLM 所面臨的一個(gè)關(guān)鍵瓶頸。市面上確實(shí)有不少能寫應(yīng)用程序代碼的模型,比如 OpenAI 的 GPT-4.1、Anthropic 的 Claude 3.7,還有 Google 的 Gemini 2.5 Pro I/O 版本。
Windsurf 提供了模塊化的界面,用戶能夠靈活切換不同的模型。Ramachandran 提到,用戶的反饋顯示,現(xiàn)有的編碼模型在有人從旁指導(dǎo)時(shí)表現(xiàn)還行,可時(shí)間一長(zhǎng),就容易顧此失彼,漏掉一些關(guān)鍵信息。
這個(gè)問題其實(shí)源于任務(wù)性質(zhì)的根本不同。代碼生成往往是一錘子買賣,而真正的軟件工程卻需要在不同的工具間來回切換,處理半成品代碼,并且在漫長(zhǎng)的項(xiàng)目周期里時(shí)刻把握上下文。
SWE-1 系列:為不同工程任務(wù)量身打造
Windsurf 并未試圖打造一個(gè)“萬金油”式的解決方案,而是針對(duì)性地開發(fā)了三款專業(yè)模型:
- SWE-1:這是一個(gè)全尺寸模型,專為復(fù)雜的推理和工具調(diào)用而設(shè)計(jì),所有付費(fèi)用戶均可使用。
- SWE-1-lite:這是一款更小巧但同樣強(qiáng)大的模型,它將替代 Windsurf 目前的 Cascade Base,并向所有用戶(包括免費(fèi)版用戶)開放。
- SWE-1-mini:這是一款輕量級(jí)模型,主要為 Windsurf Tab 中的代碼自動(dòng)補(bǔ)全功能提供支持,所有用戶都可以無限制使用。
SWE 系列模型的煉成,得益于 Windsurf 針對(duì)軟件工程任務(wù)進(jìn)行了大量?jī)?nèi)部專項(xiàng)訓(xùn)練。Ramachandran透露,公司采用了一種包含訓(xùn)練序列步驟的新型數(shù)據(jù)模型。
性能基準(zhǔn):看看 SWE-1 的實(shí)力如何
盡管 SWE-1 的目標(biāo)并不是取代那些頂尖實(shí)驗(yàn)室的基礎(chǔ)模型,但 Windsurf 表示,在軟件工程相關(guān)的任務(wù)上,SWE-1 展現(xiàn)出了一流的性能水準(zhǔn)。根據(jù)公司發(fā)布的報(bào)告,它的表現(xiàn)顯著優(yōu)于中等規(guī)模的基礎(chǔ)模型以及一些開源 AI 大模型。
不過,對(duì)于這些初步的測(cè)試結(jié)果,Windsurf 表現(xiàn)得相當(dāng)審慎,并沒有大張旗鼓地宣傳。
“即便我們的基準(zhǔn)測(cè)試結(jié)果看起來很棒,但這并不意味著它就比市面上所有其他模型都強(qiáng)。”Ramachandran 坦誠(chéng)地說道。
實(shí)際上,他們更希望將 SWE-1 定位為邁向?qū)S媚P偷牡谝徊健_@類專用模型最終有望在特定的工程任務(wù)中超越通用模型——而且,它們的成本或許還會(huì)更低。
Windsurf 方法在技術(shù)上的一個(gè)獨(dú)特之處,在于其實(shí)現(xiàn)了“流感知”(Flow-Awareness) 這一概念。
其基本邏輯是這樣的:企業(yè)級(jí)的軟件開發(fā)過程,往往包含了一連串的步驟。“流感知”并不僅僅是針對(duì)某個(gè)特定步驟編寫代碼,更重要的是能夠理解和把握整個(gè)流程的上下文。
“流感知”的核心,是在軟件開發(fā)過程中,建立起一套人類與 AI 共享的工作時(shí)間線。它的核心理念在于,通過判斷 AI 在哪些環(huán)節(jié)能最有效地提供幫助,從而逐步地將原先由人工承擔(dān)的任務(wù)移交給 AI。
這種方法為模型的持續(xù)進(jìn)步創(chuàng)造了一個(gè)良性循環(huán)。
“隨著我們不斷優(yōu)化模型,共享時(shí)間線上的更多步驟將會(huì)從人工操作轉(zhuǎn)向 AI 處理。”Ramachandran 解釋說,“AI 將能夠勝任更多以往必須依賴人工才能完成的工作,因?yàn)檫^去的 AI 可能還不夠精準(zhǔn)。”
這對(duì)技術(shù)決策者意味著什么?
對(duì)于那些正在構(gòu)建或維護(hù)軟件的企業(yè)而言,SWE-1 的出現(xiàn)代表著 AI 輔助開發(fā)領(lǐng)域的一大進(jìn)步。這種思路不再將 AI 編碼助手僅僅視為一個(gè)簡(jiǎn)單的自動(dòng)補(bǔ)全工具,而是致力于提升整個(gè)開發(fā)生命周期的效率。
它所帶來的潛在好處,遠(yuǎn)不止是寫代碼更快那么簡(jiǎn)單。充分認(rèn)識(shí)到應(yīng)用程序開發(fā)的復(fù)雜性,將有助于推動(dòng)此類 AI 輔助編碼范式走向成熟,使其能更好地適應(yīng)穩(wěn)定可靠的企業(yè)級(jí)軟件開發(fā)需求。
雖然 SWE-1 目前尚處于起步階段,但這一方向性的探索至關(guān)重要。如果 OpenAI 最終完成了對(duì) Windsurf 的收購(gòu),這些新模型可能會(huì)扮演更重要的角色,因?yàn)樗鼈儗⒂袡C(jī)會(huì)整合更龐大的模型研究與開發(fā)資源。
技術(shù)負(fù)責(zé)人不妨思考一下,在自己的開發(fā)工作流程中,到底有多少環(huán)節(jié)能夠從這種超越簡(jiǎn)單代碼生成的 AI 輔助中獲益。那些需要花費(fèi)大量時(shí)間進(jìn)行代碼審查、調(diào)試以及管理技術(shù)債務(wù)的團(tuán)隊(duì),相比那些主要精力放在生成新代碼的團(tuán)隊(duì),或許能從 SWE-1 這類工具中挖到更大的價(jià)值。
原文標(biāo)題:?
?? Software engineering-native AI models have arrived: What Windsurf’s SWE-1 means for technical decision-makers??,作者:Sean Michael Kerner
