Star量近8萬,大火AutoGPT星標超PyTorch,網友:看清它的局限性
仿佛一夜之間,AI 圈出現了一個新晉頂流:AutoGPT。
顧名思義,AutoGPT 為自主人工智能,一項任務交給它,它能自主地提出計劃,然后執行,完全不用人類插手的那種。此外其還具有互聯網訪問、使用 GPT-3.5 進行文件存儲和生成摘要等功能。
例如,用戶讓 AutoGPT 建立一個網站,提出的要求是讓其創建一個表單,并在表單上添加標題「Made with autogpt」,最后將背景更改為藍色,用時不到 3 分鐘,不用人類參與,AutoGPT 自己就搞定了,就像下面展示的那樣。期間 AutoGPT 采用的 React 和 Tailwind CSS,都是自己決定的。
一個示例看下來,AutoGPT 已經能夠自己上網查資料、使用第三方工具、操作你的電腦。從上線以來,項目熱度不減,截至今天,AutoGPT 的 GitHub Star 量達到 78k,馬上接近 80k,超過了 PyTorch 的 65k。
AutoGPT 地址:https://github.com/torantulino/auto-gpt
PyTorch 地址:https://github.com/pytorch/pytorch
要知道,AutoGPT 是一個剛上線沒幾天的項目,而 PyTorch 的最初版本可追溯到 2018 年。不僅如此,從推特網友的總結來看,AutoGPT 還超過了 Bitcoin、 Django 等項目的 Star 量。
圖源:https://twitter.com/MattPRD/status/1647653434760515584
就連前特斯拉 AI 總監、剛剛回歸 OpenAI 的 Andrej Karpathy 對此都評價道:「AutoGPT 是 prompt 工程的下一個前沿?!?/span>
不過,與看好 AutoGPT 發展不同的是,來自英偉達的 AI 科學家 Jim Fan 卻對此潑了一盆冷水。
Jim Fan 表示自己僅將 AutoGPT 視為一項有趣的實驗,僅此而已,而且這項研究雖然火爆但并不意味著可以投入生產,網上很多酷炫的演示都是精心挑選出來的。
隨后,Jim Fan 還表示,在其實驗中「AutoGPT 可以很好地解決某些簡單且定義明確的任務,但大多數時候對真正有用的、更難的任務,AutoGPT 并不可靠。
這種不可靠性可以歸因于 GPT-4 固有的局限性。如果不能訪問 GPT-4 權重或者更好的微調,我認為僅僅通過提示技巧無法從根本上解決問題。
就像沒有任何提示可以將 GPT-3 變成 GPT-4 的能力一樣,我不認為 AutoGPT + 凍結的 GPT-4 可以可靠地解決重要的復雜決策。當前的媒體炒作正在將該項目推向完全不切實際的期望。」
附和者眾:AutoGPT 局限大,無法解決任何商業問題
Jim Fan 的觀點獲得了很多人的贊同。有人認為,「誠然,AutoGPT 是一個偉大的實驗,并將引領通過智能體自主完成很多酷炫事情的浪潮。但它不能成為一個可以構筑解決任何商業問題基礎的產品,畢竟太不可預測了。」
光說不練沒有說服力,有人現身說法,表示自己整個周六都在讓 AutoGPT 打開一個 docx 文檔、打開其導出的 ChatGPT 對話以提供更多上下文(json)、瀏覽其他技術內容并重寫 docx 文檔。遺憾的是,AutoGPT 甚至都未能接近達成這些目標,還是放棄吧。
這類體驗例子還有很多,有人針對現實世界的問題嘗試大量 prompt,但 AutoGPT 總是朝著沒有任何意義的不同方向發展。
不同意見者:雖被夸大,其前景與 GPT 相當
在很多人贊同 Jim Fan 觀點的同時,也有人指出,雖然 AutoGPT 肯定被夸大了,并且現在非?!感U力」、不優雅。但它展示的前景仍然非常強大,幾乎與 GPT 模型相當。
有人從應用的角度剖析 AutoGPT 的不足,目前它雖然無法很好地解決很多事情,比如循環(loop)、切線、隨機完成不同的任務。但要弄清楚的是,AutoGPT 需要大量的腦力,預計它會變得越來越好。
持上述觀點的不是個例,「AutoGPT 肯定會隨時間推移而愈加完善。像這樣的項目兩年前就已經成為了可能,盡管在任意通用域上的可靠使用也許只能在數年而非數月內到來。」
機器之心的讀者們,你們認為 AutoGPT 會是曇花一現嗎?看不看好它的前景呢?請在評論區留下自己的觀點吧!