全靠Claude4!30年FAANG老工程師:AI幫我解決了四年老bug
AI 就像一頭野驢,跑起來就不停。人類花了幾百萬年才走上食物鏈頂端,而大模型只用了不到十年時間,已經能把你和劉亦菲 P 進一張自拍了。奧!最新進展是已經能自己生成音畫同步的超真實脫口秀了。
不過等人類回過味來,發現海的那邊好像是敵人,AI 導致的失業潮仿佛近在咫尺。還記得七年前(那時候 ChatGPT 都還沒發布)本科第一次班會上,老師問為什么要選這個專業,有同學回答因為這是最不容易被 AI 替代的職業之一(PS. 我學的是建筑,大家別笑得太大聲)。
不知是不是預料之內,AI 最先波及的,竟然是寫程序這件事本身。Anthropic 的創始人、CEO Dario Amodei 就曾預測,很快 90% 的代碼可能都會由 AI 來編寫。
先不說這個預言什么時候會實現,至少他家的產品確實在往這個方向發展。請問編程最厲害的大模型是哪個?雖然沒有定論,但 Claude 肯定榜上有名。
BigCodeBench 榜單
上個星期剛發布的 Claude 4,讓人們的「刻板印象」又加深了一層。
5 月 22 日,Anthropic 推出了全新一代 Claude 4 系列大模型,為代碼生成、高級推理和 AI 智能體樹立了全新標準。其中,Claude Opus 4 是一款全球領先的編碼模型,它在復雜、長時間運行任務和智能體工作流中擁有持續的高性能。
Anthropic 展示了 Claude 4 如何無縫融入人們整個工作日。它擁有三大高級功能:通過 Claude 應用中自定義集成進行深入研究,管理項目,并能在 Claude Code 中獨立解決代碼任務。
新版本的大模型已經上線,立即吸引了大量程序員前去使用,很多人表示效果出奇的好。
昨天,Reddit 上一位擁有 30 多年經驗的前 FAANG 高級工程師發帖表示,他被一個 C++ 的 Bug 困擾了 4 年,花了約 200 小時卻毫無進展。而 Claude Opus 4 竟然成功地解決了這個問題,并且是唯一能做到的 AI 智能體。
這篇帖子在 X 和 Reddit 引起了熱烈的討論,Anthropic 工程師 Alex Albert 表示,這樣的故事可能會越來越多。
有人展開了技術討論。
也有人認為,這根本就是個 Claude 推廣軟文。
假如這個故事是真的,我們該如何來看待這件事呢?
大家先別激動,等一等外行的朋友們,我們先來梳理一下要點,這里邀請 Gemini 老師場外援助(因為我也是外行)。
Bug 的來源和難度
這個 Bug 是在四年前一次大規模的代碼重構(Re-architecting refactor)中產生的。
- 代碼重構:你可以把它想象成對一棟老房子進行徹底的重新設計和裝修。原來的房子可能有很多問題(比如布局不合理、管道老化),裝修后解決了這些問題,但可能因為改變了結構,導致某個角落里以前能用的某個特殊電器(比如某個特定型號的燈,只有在特定開關下才用)現在用不了了。
- 6 萬行代碼:這說明這次「裝修」的規模非常大,非常復雜。
- 邊緣案例(Edge case):這指的是一個非常特殊、不常出現的情況。就像上面說的那個特殊電器,平時很少用,只有在特定條件下才會用到。
- 著色器(Shader):這是一種專門處理圖形和視覺效果的代碼。你可以理解為那個「特定型號的燈」。
- 問題所在:在這次大規模「裝修」后,那個「特定型號的燈」在「特定開關下」就不亮了。
Bug 的真正原因
AI 發現,這個問題不是因為「裝修」時工人犯了個簡單的錯誤(比如接錯了一根線,這叫邏輯 Bug)。而是因為:
- 那個「特定型號的燈」以前之所以能亮,僅僅是因為老房子舊結構下的一個「巧合」。可能有一根電線無意中搭在了某個地方,正好給它供電了。
- 在重新設計和裝修(改變了架構)時,大家并沒有意識到這個「巧合」的存在,也就沒有在新的設計里考慮進去。所以,當舊結構消失后,那個「巧合」也消失了,燈自然就不亮了。
- AI 的厲害之處在于,它不僅看懂了新舊兩套復雜的「圖紙」,還理解了那個「巧合」是怎么回事,并指出了新設計沒有考慮到這個隱藏的依賴關系。
很好!那我們現在來分析一下,AI 在這個過程中起到了什么作用呢?
首先,AI 可以輕松地加載、分析和比較新舊兩個版本共計數萬甚至數十萬行的代碼。它不會像人類那樣感到疲勞或遺忘細節,可以同時「看到」整個 picture。
像 Claude Opus 4 這樣的先進模型擁有巨大的「上下文窗口」,這意味著它可以一次性考慮非常多的信息,并追蹤它們之間的復雜關系。
同時,AI 不會帶有「它應該如何工作」的偏見。它只是客觀地分析舊代碼如何運行并產生結果,以及新代碼如何運行并產生不同結果,它能發現兩者之間最細微的差異。
別忘了,這個過程還需要人類的指導。程序員通過超過 30 個 prompt 來引導 AI。這說明人類的經驗和直覺與 AI 強大的分析能力相結合,才能發揮最大效果。人類設定目標、提供背景,AI 則執行繁重的分析工作。