「視覺版」GPT-4 Turbo重磅升級!ChatGPT 40條消息限制或取消
趁著谷歌開大會,OpenAI果然又來定向狙擊了。
谷歌前腳剛官宣一系列更新,OpenAI立馬跟著拋出重大消息——
GPT-4 Turbo迎來「重大升級」!
OpenAI今天官宣稱,配備視覺能力的GPT-4 Turbo已經可以通過API調用了。
最新模型有128k上下文,訓練數據截止到2023年12月。同時,Vision請求也可以使用JSON模式和函數調用。
而現在,早已有開發者用上了最新的模型。
爆火全網的AI工程師Devin就是通過Vision來執行各種編碼任務。
Healthifyme團隊通過GPT-4 Turbo with Vision構建的應用Snap,可以對各種美食進行拍照識別,為你提供營養洞察。
還有更牛的應用Make Real,直接勾畫幾筆UI,就能構建出由真實代碼支持的網站。
顯然,新模型可以有助于簡化開發人員的工作流程,創造出更高效的應用程序。
但代碼能力變差了?
不過,有研究發現,GPT-4 Turbo with Vision在編碼方面較差。
尤其是,新模型似乎比現有的GPT-4 Turbo preview模型更加懶惰。
代碼編輯能力
Aider依靠代碼編輯基準來定量評估LLM對現有代碼進行更改的程度。
GPT-4 Turbo with Vision在這一基準上的得分僅為62%,是現有任何GPT-4型號中得分最低的。
其他模型的得分為63%-66%,因此這只代表了很微小的退步,與 gpt-4-0613 相比,在統計上可能微不足道。
懶惰編碼
GPT-4 Turbo preview版本因在編碼時「懶惰」而廣受吐槽。
經常省略所需的代碼,而是在注釋中留下「在此實現方法」之類的內容。
def some_complex_method(foo, bar):
# ... implement method here ...
新的GPT-4 Turbo with Vision模型在AIDER的重構基準上只得了34%的分數,成為所有GPT-4 Turbo模型中最懶惰的一個。
不過,有網友表示,在對新模型進行了一天的測試后,發現其并不懶惰而是更愿意輸出完整大量的代碼,甚至推理能力變強了。
每3小時40條消息限制取消了?
與此同時,有外媒報道稱,OpenAI已經將GPT-4每3小時40條消息的使用限制,變成了根據供需情況動態調整的靈活配額」。
簡單來說就是,OpenAI會根據系統當前的繁忙程度,來增加或減少用戶對GPT-4的請求次數。
然而,有不少Reddit網友表示,他們才剛發了10到17條消息,就被告知已經達到了上限。
但也有很「歐」的網友稱,自己不管怎么用都沒有觸及限額。
不管是遠低于40條的限制,還是近乎無限次的使用,OpenAI最大的問題在于——不僅從來不會告訴你已經使用的次數,也不會告訴你上限到底是多少。
據推測,這一調整是為了應對ChatGPT在「免注冊」之后,顯著增加的使用量。
對于OpenAI而言,這種變化提供了更大的靈活性,可以更好地分配有限而昂貴的計算資源給GPT-4。
但對于用戶來說,尤其是在需求高峰期,可能用著用著突然就被取消了GPT-4的使用資格……
對此,有不少網友表示:還是Claude 3香!
至少,諸如Anthropic這樣的平臺,會提供更清晰的使用配額,或者允許按消息計費。