整理 | 言征
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
近日,OpenAI 推出了 canvas,這是一個可以在 ChatGPT 中直接編寫和編碼項目的新界面。許多人想知道它是否比 Claude Sonnet 3.5 Artifacts 更好。
答案是否定的。
原因也很明顯:canvas 使用 GPT-4o,而4o模型的編碼并不比 Claude Sonnet 3.5 好。雖然 canvas 為開發(fā)人員提供了一些很好的功能,例如用戶協(xié)作和版本控制,但它缺乏代碼預(yù)覽等關(guān)鍵功能。
許多人現(xiàn)在都在使用 Claude 創(chuàng)建他們的第一個應(yīng)用程序。其中包括只有少數(shù)人需要的小眾應(yīng)用程序、小公司的內(nèi)部工具以及只是為了好玩的滑稽應(yīng)用程序。
圖片
例如,一位用戶最近嘗試可視化辦公桌的雙顯示器設(shè)置,并比較顯示器彼此相鄰的配合情況。Claude 在短短幾次交互中就為此目的創(chuàng)建了一個完全可用的應(yīng)用程序。
該款應(yīng)用程序雖然沒有特別令人興奮,但重點也恰恰在此——用戶看來,讓自己來編寫這樣一個沒吸引力的應(yīng)用的代碼,根本不值得去花費時間和精力,但交給 Claude ,在不到 5 分鐘的時間內(nèi)就可以創(chuàng)建它,使其成為一個有價值的工具。
因此,AI 輔助創(chuàng)建應(yīng)用程序,比拼的應(yīng)該是為誰更快、誰更能提供個性化的解決方案。
1.Canvas 雖好,但 Artifacts 更香
除了在幾分鐘內(nèi)構(gòu)建軟件外,用戶還報告了 Claude Artifacts 如何幫助他們學(xué)習(xí)編碼。一位努力學(xué)習(xí)如何編碼的開發(fā)人員說,通過能夠更徹底地看到項目實際上是如何組合在一起的,他開始獲得許多以前難以理解的概念。
“至少對我來說,最困難的事情之一是自學(xué),因為我是一個非常概念化的學(xué)習(xí)者。我需要能夠理解整個想法并深入研究它。或者,我從一個部分開始,然后像知識的滾雪球一樣構(gòu)建,這通常是一種協(xié)作方法,因此很難完全靠自己完成。
“然而,和 Claude 一起,我度過了一段美好的時光,唯一的限制是我在給定時間里被限制了回復(fù)次數(shù),”他補充道。
業(yè)內(nèi)媒體AIM還試驗了 Artifacts,我們能夠創(chuàng)建一個板球測驗游戲、Temple Run 和 Flappy Bird,所有這些都帶有一行英語提示。“按需軟件已經(jīng)到來,”醫(yī)療保健工具公司 Flexpa 的首席技術(shù)官 Joshua Kelly 說。使用 Artifacts,他在短短 60 秒內(nèi)就為他的跑步構(gòu)建了一個簡單的伸展時間應(yīng)用程序。
借助 Artifacts,現(xiàn)在每個人都可以創(chuàng)建簡單的應(yīng)用程序,并且這些應(yīng)用程序可以與用戶共享。這意味著,我們正在慢慢邁向一個階段,每個人都將成為應(yīng)用程序開發(fā)人員,這一切都歸功于 Artifacts。
即使我們不考慮 Artifacts,只考慮 Sonnet 3.5 進行編碼,它也被證明是比大多數(shù)模型更好的選擇。
2.Claude 3.5,開發(fā)者愛了
幾周前,一位沒有軟件開發(fā)經(jīng)驗的電工使用 Claude 3.5 Sonnet 構(gòu)建了一個多智能體JavaScript 應(yīng)用程序。開發(fā)人員將這個稱為 Panel of Expert (POE),它使用多個 AI 代理以多步驟的方式處理查詢,所有這些都是通過以高級方式定義提示來完成的。
這只是一個例子。有多個用戶稱贊 Claude Sonnet 3.5 的編碼功能。一位開發(fā)人員在 Reddit 上表示,這絕對是非凡的?!八木幋a能力給我留下了深刻的印象。感覺過去幾天我的工作效率提高了 3.5 倍。我對我設(shè)法運送的東西感到非常驚訝,這主要是由于 Claude,“他補充道。
擁有數(shù)十年經(jīng)驗的開發(fā)人員也稱贊 Claude 的編程能力以及它如何有助于緩解大腦疲勞。一位擁有 40 多年經(jīng)驗的開發(fā)人員表示,擁有像 Claude 這樣的設(shè)備是一個巨大的好處。
用戶還反饋說,Claude Sonnet 是為數(shù)不多的可以處理大型項目的模型之一。因此,Sonnet 經(jīng)常被比作具有無限內(nèi)存的中級工程師。
圖片
Claude Sonnet 不僅限于在幾次互動中給出工作代碼,而且在調(diào)試方面也被認為是最好的代碼之一。來自奧地利的數(shù)據(jù)科學(xué)家 Liu Grey 在 X 上提到,Sonnet 立即修復(fù)了一個錯誤,然后繼續(xù)改進她的渲染管道,并在不增加 CPU、GPU 或內(nèi)存使用率的情況下將更新速率提高了一倍。
3.推理方面,o1
OpenAI o1 模型通常被認為是最好的推理模型之一。但是,幾天前,一位在 Claude Sonnet 3.5 上使用反射技術(shù)的用戶在推理方面取得了比 o1 更好的結(jié)果,情況發(fā)生了轉(zhuǎn)變。
圖片
值得注意的是,開發(fā)人員也在盡可能地推動 Claude。一個很好的例子是 Claude 的開源 VSCode 擴展,稱為 Cline(以前稱為 Claude Dev)。此擴展會定期更新。一位用戶提到,在編碼知識為零的情況下,他在短短一天內(nèi)就成功地構(gòu)建了一個 Web 應(yīng)用程序。
現(xiàn)在情況很明朗。開發(fā)人員喜歡 Claude Sonnet,并正在圍繞它開發(fā)解決方案。當(dāng)然,OpenAI 也在努力為開發(fā)者受眾趕上 canvas 等工具,但我們還沒有看到影響。
另一方面,Anthropic 還專注于通過 Projects 和 Artifacts 等計劃為開發(fā)人員受眾帶來最佳體驗,使其成為開發(fā)人員和公司雙贏的局面。
4.寫在最后
Canvas 和 Artifacts 代表了 AI 聊天平臺和助手發(fā)展的下一階段。這場“界面大戰(zhàn)”接下來的看點是,其他平臺將開始探索如何將用戶留在平臺中,而非為不同的任務(wù)打開其他專用窗口。
參考鏈接:https://analyticsindiamag.com/developers-corner/claude-3-5-brushes-off-canvas-with-a-stroke-of-code/