成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

全球首個AI程序員誕生,碼農飯碗一夜被砸!10塊IOI金牌華人團隊震撼打造,996寫代碼訓練模型

人工智能 新聞
全球首位AI軟件工程師Devin誕生了,它掌握全棧技能,云端部署、底層代碼、改bug、訓練和微調AI模型都不在話下。最可怕的是,它完全不怕996,老黃的預言是徹底成真了!

就在剛剛,世界上第一位AI程序員Devin誕生。

一家叫Cognition的10人初創公司,才成立不到2個月,就給了全世界億點點震撼。

剛一放出,Devin就刷爆了全網。

它掌握了全棧技能,能自主學習不熟悉的技術,端到端地構建和部署應用程序,自己改bug,甚至還能訓練和微調自己的AI模型!

在SWE-bench上,它的表現遠遠超過Claude 2、Llama、GPT-4等選手,取得了13.86%的驚人成績!

也就是說,它已經能通過AI公司的面試了。

圖片圖片

就在前不久,英偉達CEO黃仁勛表示,自己相信就在不久的將來,人類再也不需要學習如何編碼了,孩子們應該停止編程課。

圖片圖片

誰能想到,才短短數月,他的預言就成真了!

更令人震驚的是,Devin背后擁有一支強大的金牌程序員團隊(規模不大,人才濟濟)。

據介紹,僅創始團隊已經狂攬了10個IOI金牌!

圖片圖片

圖片圖片

圖片圖片

首席執行官Scott Wu和弟弟Neal Wu獲獎情況

Cognition AI的首席執行官Scott Wu稱,自己從9歲開始學習編程,便愛上了將想法變成現實的能力。現在,這個夢想居然真的實現了。

圖片圖片

網友驚呼:碼農不存在了!?

看到Devin如此無敵的能力,網友驚呼,一切都完結了!

圖片圖片

Devin會搶走我的飯碗嗎?

圖片圖片

德撲AI之父,OpenAI的研究科學家Noam Brown表示,「2024年將是人工智能令人興奮的一年」。

圖片圖片

計算機科學家,AI創業公司CEOSilas Alberti評價到:

它是一個能夠獨立完成任務的自主系統,在快速原型設計、修復bugs和復雜數據的可視化上表現卓越。

大部分其他助手在進行四五步操作后就會偏離任務軌道,但Devin能夠在整個任務過程中準確地保持它的目標和方向不變。

投資了Cognition AI的硅谷大佬Peter Thiel更是認為,Cognition AI與Founders Fund之前投資過的DeepMind,現在的AI巨型獨角獸OpenAI,Scale AI等公司處于同一水平。

AI初創公司Unify創始人稱,Devin不僅搶走了我的工作,還搶走了我的名字,簡直是雪上加霜。

圖片圖片

圖片

美國著名開發者Brian Roemmele表示,自主編碼智能體Devin已現AGI雛形!它能在幾分鐘內自主編寫整個應用程序。這是真正無代碼未來的開始。

圖片圖片

Spotify工程師表示:「目前尚不清楚智能體會在幾年內取代軟件開發人員,但免費午餐已經不復存在。」

「從為期8周的訓練營畢業,然后找到一份價值 20 萬美元的工作,這樣的日子已經一去不復返了。做好磨練和深入學習的準備。熟練地引導人工智能取得好的結果可能才是未來程序員能體現出來的價值。」

圖片圖片

世界首位AI軟件工程師Devin

AI軟件工程師Devin的影響力,簡直堪比2023年全網炸鍋的智能體——AutoGPT。

Devin究竟有多強大?

圖片圖片

Devin可以規劃和執行需要數千項決策的復雜工程任務。

并且,它可以在每一步回憶相關的上下文,隨著時間的推移學習,并糾正錯誤。

研究人員還為Devin提供了常見的開發工具,包括shell、代碼編輯器、以及瀏覽器——皆是人類完成任務最需要的工具。

此外,Devin還具備主動與用戶協作的能力。

比如,實時報告進度,接受反饋,并根據需要與你一起完成設計選擇。

目前,Cognition AI還推出了一個Devin定制的Chrome插件——Tab Switcher。

圖片圖片

而Cognition的開發者們紛紛分享出了自己使用Devin的示例,簡直不要太驚艷!

學習如何使用陌生的技術

當你發給Devin一篇博文后,它會在幾分鐘內完成自主學習,從閱讀文章,運行代碼。

可以看到,Devin在Modal上運行了ControlNet,在寫代碼過程中,還會自我debug。

最后,人類程序員Sara想要帶有自己名字的桌面壁紙,就立刻生成了。

,時長00:54

構建和部署端到端的應用程序

當你想要玩一個「生命游戲」(the Game of Life),交給Devin做就好了。

Devin首先會用工具Shell,創建一個新的react應用程序,然后開始通過編輯器編寫代碼。

代碼完成后,它還會將應用自動部署到Netlify,一個初步的「生命游戲」就做好了。

圖片圖片

這個過程中,Devin還可以逐一根據用戶請求,完成功能的添加。

比如在初始屏幕上加上像素化的「Devin」一詞,然后希望這個字體再大一些,幀速率更快。

與此同時,人類程序員要求Devin修復一個bug——屏幕在3秒后凍結的錯誤。

圖片圖片

下一步,讓Devin在10秒后提高幀速率,讓網站能適應不同的窗口大小。

同時,一個游戲還得需要交互性,即在某處點擊鼠標時,應該生成一個新塊。

接下來,就是見證奇跡的時刻了!

,時長01:58

自行查找代碼庫錯誤,自行修復

這個名叫Andrew的開發者表示,自己維護了一個大型開源存儲庫,其中包含許多不同的算法,用于競爭性編程。

不久前有朋友告訴他:其中一個實現中有bug。Andrew插入了一個快速修復,但并沒有測試它,因為沒能抽出時間來編寫測試用例。

圖片圖片

既然如此,就給Devin來試試看!

小哥給了Devin存儲庫,讓它來檢查和處理這個存儲庫。然后,Devin就找到了正確的存儲庫,檢查了所有文件。

圖片圖片

接下來,在小哥的要求下,Devin還很輕易地就把測試寫了出來——只是看了一下測試應該是什么樣,接口是什么樣,就完成了這項任務。

挑戰還沒完,接下來,小哥要求Devin將對所有輸入進行測試,而不僅僅是測試這個輸入,也就是自己常用的「暴力測試」。

于是,Devin重寫了測試函數,使用了四個嵌套的循環,這一次,它發現了一個bug。

圖片圖片

接著,Devin開始調試。它在這里添加了一個print語句,來調試輸入和輸出,然后重新測試,發現了錯誤:代碼不應該返回負值。

于是Devin查看了正在測試的代碼,然后添加進了這行代碼,確保返回值是非負的。

現在Andrew可以確信,自己的代碼是完全正確的了!

訓練和微調AI模型

Devin能力也在一步一步進階。

最讓人興奮的是,它可以自己訓練、微調模型,AI訓AI成真了!

圖片

首先,給智能體Devin提供一個GitHub庫的鏈接(比如QLoRA——一種量化大模型的微調方法)。

Devin所做的就是,微調7B Llama模型。

接下來,就是獻技的時刻,Devin克隆了GitHub庫,了解如何使用readme運行,設置好所需pip的要求,查看所有的腳本語言,并開始運行。

圖片圖片

訓練過程中,Devin還遇到了Cuda問題(這是在開源庫中可以預料到的)。

不過這可難不倒Devin。它會自主查看英偉達環境,并找出如何重新安裝軟件包讓其成功運行。

接下來,模型訓練開始進行了。

可以看到損失率正在下降,程序員給出Devin正向反饋:「做的不錯」!

大約1小時后,Devin已經順利完成幾百步訓練,仍在進行中...

圖片圖片

解決開源代碼庫中的錯誤和功能請求

只要給出一個指向GitHub問題的鏈接,Devin就會執行所需的所有設置和上下文收集了!

這位叫Tony的工程師,想一次運行一堆命令,并且希望在一個屏幕上跟蹤它們的狀態,于是他找到了一個名為impro的開源工具,希望執行這個操作。

看起來雖然impro完成了任務,但狀態太模糊了。根本看不出來究竟哪些命令失敗了。

圖片圖片

Tony想改進這里的用戶體驗,但是自己根本不熟悉代碼,于是他想到去求助Devin。

他發現網上有人面臨同樣的問題,所以他把這個問題的鏈接給了Devin,讓它修復這個問題。

圖片圖片

在右邊,他很清晰地看到,Devin從一個工具跳轉到了另一個工具。

它首先使用了Shell Deon CLS存儲庫,然后閱讀了自述文件和編輯器,了解了子代碼,然后,它返回Shell,安裝了所需要的依賴項。另外,Devin還打開了一個Web瀏覽器。

圖片圖片

然后,Devin就開始編碼了!

在這個過程中,它甚至打開了一些R文檔來調試編譯器錯誤。最后,完成了任務,出了一份自己做了哪些改進的總結報告。

圖片圖片

所以,Devin的更改有效嗎?Tony發現,它成功了!第三個命令是成功的,他甚至可以看到狀態碼。

圖片圖片

為成熟的生產存儲庫做貢獻,修復系統錯誤

下面這個示例,是SWE-BENCH基準測試的一部分。Devin解決了Python代數系統中的一個錯誤。它會自行設置代碼環境、復制錯誤、自行編碼、測試修復程序!

這位叫Neil的開發者,分享了Devin幫自己改bug的示例。

他一直在用這個名為Senpai的存儲庫,它是一個用Python編寫的代數系統。

但Neil發現,取分數的對數時,我們會得到一個無窮大的Zoo,這是絕對不可能的。

于是,他試著讓Devin來解決這個問題。

圖片圖片

Devin在存儲庫中復現了Zoo的問題后,隨后,它找出了代碼中正確的那部分,添加了print語句,以便找出問題原因。

圖片圖片

可以看到,原因就在于,整數除法會得到0,就導致之前取了0的對數。因此,Devin用true除法替代了整數除法。

隨后,它開始測試,確保沒有其他問題。

圖片圖片

就這樣,Devin幫Neil節省了大量的時間。

勝任自由職業平臺Upwork的工作

Cognition的開發者You還試著在全球最大的綜合類自由職業平臺Upwork上,為Devin提供真正的工作。

沒想到,它竟可以完全勝任,看來智能體也能出來做副業了......

在Upwork上,他首先挑選了一個「用計算機視覺模型做推理」的工作。

先來看看這個任務的要求:

- 我希望利用該資源庫中的模型進行推斷。(https://github.com/mahdi65/roadDamageDetection2020)

- 你的交付成果將是關于如何在AWS的EC2實例中進行操作的詳細說明。

- 請提供你完成這項工作的評估報告。我不會回復沒有評估的報告。

圖片圖片

看起來很簡單一個任務,但開發者You表示,自己也不知道如何開始做。

但是交給Devin,這件事就變得容易得多了。

Devin收到請求后,先開始設置了存儲庫。然后運行中發現了版本控制問題,Devin自主處理并更新了代碼。

然后,Devin繼續加載并導入軟件包。它還從互聯網上下載了圖像,并運行模型。

接下來,Devin再次遇到了問題——關于打印調試,它自主修復了代碼。

圖片圖片

最后,Devin對數據結果進行抽樣,并編寫出一份報告。

它會一些標有損壞道路樣本的圖像,以及詳細的text文檔。

13.86%正確率,Devin碾壓GPT-4/Cluade 3

SWE-bench是一個要求AI智能體解決開源項目(例如Django和scikit-learn)中實際GitHub問題的測試。

在評估中,Devin能夠完整地正確處理13.86%的問題,這一成績大幅領先于之前技術水平的1.96%。

即便是在提供了具體需要修改的文件情況下,先前最優秀的模型也僅能處理4.80%的問題。

圖片圖片

華人金牌程序員團隊

Cognition AI這家正在改變世界的公司,才正式成立不到2個月,僅有10名員工,分散在紐約、硅谷,以及世界各地的Airbnb民宿中。

圖片圖片

就這樣一個連正式辦公場地都沒有的團隊,卻已經從硅谷大佬Peter Thiel領投的Funders Fund和其他知名的投資機構那里獲得了2100萬美元的投資,其中還包括前推特高管Elad Gil。

圖片圖片

在如此炸裂的產品的背后,團隊成員背景更是奪目耀眼。

Cognition AI的核心創始團隊包括3人:CEO Scott Wu,CTO Steven Hao,CPO Walden Yan。

圖片圖片

聯合創始人兼首席技術官Steven Hao,在AI系統方面有著豐富經驗,

圖片

他于2018年本科畢業于MIT計算機和數學專業。

圖片圖片

2018年加入由Alexandr Wang創辦的Scale AI,是一名資深的AI系統工程師。

圖片圖片

聯合創始人兼首席產品官Walden Yan,在加入Cognition AI之前他還是哈佛大學的一名在校大學生。

圖片

作為計算機和經濟專業本科大四在讀的學生,理論上應該今年本科畢業。

但實際情況卻處在「保密狀態」,因為他還沒有告訴父母自己輟學的事情。(手動狗頭)

圖片圖片

他在個人網站上,列出了3個自己認為最為重要的成就:

- 是MIT PRIMES Research團隊的成員

- 得過IOI金牌

- 創立DeepReason并開發了一款智能區塊鏈審計工具

圖片圖片

聯合創始人兼首席執行官Scott Wu,是一名連續創業者。

圖片

在成立Cognition之前,他曾經創立了一個用AI驅動的社交網絡平臺Lunchclub,并且也曾就讀于哈佛大學。

圖片圖片

圖片圖片

他的弟弟Neal Wu,也是公司的員工。

圖片

在加入Cognition AI之前也在包括谷歌等多家公司工作過,是一名經驗豐富的軟件工程師和銷售。

圖片圖片

本科同樣畢業于哈佛大學計算機專業。

圖片圖片

他們兄弟倆在非常青年時期就參加了很多國際編程比賽和科學奧賽,獲獎無數。

圖片圖片

圖片圖片

不僅如此,團隊的其他成員,也都是大佬級的存在。

圖片圖片

圖片圖片

圖片圖片

圖片圖片

還有一個nobody。

圖片

其中,Andrew He從6年級開始,參加了各種數學競賽。在2014年和2015年的國際信息學奧林匹克大賽上獲得了2枚金牌。

他就讀于MIT,并于2019年畢業,獲得了數學和計算機科學學士學位。

圖片圖片

如此豐富的編程競賽經歷,對于他們開發這個編程AI智能體有著非常大的幫助。

眾所周知,編程競賽的核心就是要迅速準確地解決編程難題,強調快速解決復雜問題的能力,而且對于創新的解決問題的思路有著很高的要求。

在CEO Scott Wu看來,團隊獨特的背景讓他們在這個領域有非常強大的優勢。

將AI培養成程序員,實際上是一個復雜的算法挑戰,這需要AI系統能夠做出復雜的決策,并能預見未來幾步,從而選擇正確的路徑。

這幾乎就是我們多年來一直在大腦進行的一場場比賽。現在,我們需要用AI系統來參加這些比賽。

圖片圖片

Cognition AI首款產品Devin的最大突破在于大大提升計算機推理和規劃能力。

它要求AI系統不僅要預測句子中的下一個詞或代碼行的下一個片段,還能像人類一樣進行思考,獲得解決最終問題最為合理的方法和路徑。

而行業共識也認為,AI的推理和規劃能力將是AI下一步產生最重要突破最有可能的方向。

Devin在接受用戶用自然語言提出的任務之后,不僅能夠自主開始工作并完成任務,還會向用戶報告其計劃,并實時展示正在使用的命令和代碼。

如果用戶發現過程中的問題,可以即時提供反饋。它會在任務進行中立即調整。

而Devin最大的亮點在于,大多數現有的AI系統在處理這類長期任務時往往難以保持一致性和專注,但它能夠在完成數百上千任務時始終不偏離目標。

其他計算機科學家或者資深程序員在試用過Devin之后認為,它已經不僅僅是一個編程助手,簡直是一個可以獨立工作的員工。

CEO Wu并沒有詳細說明他們的智能體背后使用的AI技術,只是籠統地解釋說,團隊找到了將大語言模型(例如OpenAI的GPT-4)與強化學習技術相結合的獨特方法。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-03-13 12:29:36

AI訓練

2024-03-13 10:07:33

2024-03-19 09:29:32

AI程序員

2024-04-01 00:35:00

AI數據

2024-03-18 09:26:15

微軟AI

2018-05-23 11:43:59

數據庫

2012-03-30 08:52:48

2023-05-25 14:28:47

DarkBERT自暗網AI

2012-08-29 15:49:50

2017-10-26 09:34:23

谷歌AI機器學習

2024-12-04 13:25:46

2019-04-12 14:14:09

碼農程序員職業

2014-12-04 10:02:55

2020-10-19 12:58:28

碼農編程開發

2023-03-23 13:33:58

AI代碼

2025-06-10 16:19:54

2025-03-06 10:52:02

2022-10-24 18:10:47

公益招聘程序員

2019-04-12 09:40:30

碼農科技開發

2023-01-28 13:31:01

OpenAIChatGPT碼農
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 特级生活片 | 亚洲一区二区三区在线播放 | 免费99精品国产自在在线 | 久久一日本道色综合久久 | 91中文| 午夜一区二区三区在线观看 | 九九精品在线 | 亚洲精品电影网在线观看 | 亚洲欧洲日韩精品 中文字幕 | 国产精品欧美一区二区三区 | 欧美一级在线观看 | 久草精品在线 | 亚洲一区二区三区在线免费 | 欧美激情国产精品 | 午夜精品久久 | 久久久久久久一区二区三区 | 精品毛片| 中文字幕在线观看第一页 | 精品国产一区二区 | 欧美一二区 | 久久国产精品无码网站 | 日韩中文字幕 | 天天拍天天射 | 免费一二区 | 久久成人精品视频 | 91九色porny首页最多播放 | 国产一区二区欧美 | 免费成人av | 羞羞视频网页 | 97久久久久久久久 | 国产高潮好爽受不了了夜色 | 91精品国产91久久久久久最新 | 久久精品视频免费观看 | 亚洲高清视频在线观看 | a黄视频| 成人国产精品免费观看 | 999热视频| 精品福利在线 | 亚洲成人自拍 | 中文字幕在线观看视频一区 | 欧美一区二区在线观看视频 |