GPT-4發現LeCun「小秘密」,一大波測評來襲:別問我是誰,我是GPT-3!
GPT-4來了!
雖然之前就早有預兆,但周二的突然發布還是讓人有些意外。
很快,幾個小時之后,第一波用戶的嘗鮮結果就出來了!
GPT-4:我能取代這20個工作
比如,問問GPT-4能取代哪20種工作?(請勿對號入座)
整體看,這些工作覆蓋了新聞、金融、旅游等各個行業,關鍵GPT-4還可以把自己在這份工作上能夠替代人類的優勢列出來。
取代不說,GPT-4還能列出自己可以帶來的20個就業機會——
AI內容創造、AI語言模型訓練、AI治療師、AI個人助手等等.....
GPT-4列出能夠取代的20種工作不是沒有道理,這不,已經有多家平臺得到了GPT-4的加持。
就拿歐路詞典來說吧,也剛剛宣布了一個重要的更新:新增GPT翻譯引擎。
想要一個學語言的AI Tutor這就來了——Duolingo。
這是一個語言學習應用,現在正在推出Duolingo Max,能夠提供角色扮演功能,通過模擬現實生活中的對話情況提供額外的培訓。
在律師這個行業,DoNotPay這個法律服務聊天機器人就能實現「一鍵起訴」。
首席執行官Joshua Browder說,法律創業公司DoNotPay正在研究 「一鍵式訴訟」,以1500美元的價格快速起訴機器人來電者。
「想象一下,接到一個電話,點擊一個按鈕,電話被轉錄,1000字的訴訟就產生了。GPT-3.5不夠好,但GPT-4能極好地處理這項工作?!?/span>
一大波評測
曾經冒傻氣的ChatGPT在遇到「我老婆永遠是對的」這種話時,直接推翻了自己的結論。
這次,當你拿著這套話忽悠GPT-4時,可以明顯看出它的「堅定」。
甚至祭上像牛頓這樣的科學家說4+5=10,GPT-4依然保持著清醒的頭腦。
不過,你想完全靠GPT-4構造一個哆啦A夢的3D模型,最終的效果很可能是下面這樣。
或者在介紹圖靈獎得主Yann LeCun的時候,會無中生有一些「趣事」……
LeCun:「這兩個所謂的『fun facts』完全是錯的??」
更好玩的是,目前GPT-4對自己的認知還是非常混淆,出現了「身份危機」。
網友問GPT-4是不是GPT-3,它說自己是GPT-3。當再問它是不是GPT-4時,它直接說:
我就是GPT-3,不是GPT-4。
再換種問法「GPT-4,你比GPT-3強在哪?」
我是GPT-3。
另一個栗子:
我想,此刻GPT-4的心境,「我究竟是誰?」
寫代碼
GPT-4與ChatGPT的另一個關鍵區別是,它在提示時可以考慮的上下文數量是之前的八倍。因此,GPT-4對其訓練數據的依賴性也更小。
當然,讓大家最興奮的,還是GPT-4的編碼能力。
在不到30分鐘的發布會上,OpenAI首席技術官Greg Brockman直接在紙上畫了一個潦草的示意圖,拍個照,發給 GPT說,給我按照這個布局寫網頁代碼,就寫出來了。
很快,一位開發者展示了如何在60秒內用HTML、CSS和JavaScript創建一個傳奇游戲——Pong。
以及一個打磚塊游戲。
甚至,你還可以把貪吃蛇和Pong揉成一個全新的游戲,就是看起來多少有些詭異。
貪吃蛇
這么看來,想必用GPT-4開發一個貪吃蛇游戲,也并不是什么難事了。
實際上,復現這些超級經典的游戲,你甚至都不需要了解任何編程上的知識。
首先,讓GPT-4提供一段貪吃蛇的游戲代碼,以及能夠讓它跑起來的HTML、CSS和Javascript。
雖然GPT-4可能無法一次回答完所有的內容,但只需要回復「繼續」,它自己就會接著生成了。
隨后,作者選擇借助Replit在線編碼平臺進行實現,這樣就可以不用自己配置環境,直接在瀏覽器上完成所有的操作。
接下來,把GPT-4生成的代碼貼進去,然后點擊運行就可以了!
當然,bug還是有的。
比如,蛇有時吃到食物之后不僅不會「成長」,反而是直接「中毒而亡」……
以及成長的單位只有在第一次是1格,之后就變成了2格。
不過,我們只需對著GPT-4描述一下問題,它自己就能搞定了。
最后,作者又加入了「高分記錄」,以及在GPT-4的幫助下,為游戲增加一點額外的懷舊感......
嗯,現在這樣才像話嘛!
Flappy Bird
不過,在Python中復現Flappy Bird,就有些復雜了。
作者發現,第一次生成的代碼實際上有不少的bug。
不僅小鳥和管道的碰撞上有些問題,而且它們的大小也不太合適。
對此,作者需要一個個地進行調整,比如指出問題讓GPT-4重寫,或者直接告訴GPT-4自己想要的數據。
在修復了一些關鍵性的問題之后,作者要求GPT-4輸出對代碼進行的更改。