ChatGPT最強競對更新!上下文長度翻倍,API降價近30%
OpenAI開發者大會后不久,它的最強競對Claude也宣布推出了重磅更新。
更新后的Claude 2.1,上下文長度直接翻番到20萬,重新超過了GPT-4。
根據官方通告,Claude 2.1版本的API已經上線,網頁版本也已經完成升級。
那么,這次更新具體都有哪些內容呢?
上下文長度達20萬
最重磅的一項更新,是上下文的增加——原來的10萬token直接翻倍,來到了20萬。
粗略估計,20萬token約合15萬英文單詞,相當于能一口氣讀完一本英文版的《百年孤獨》(14.5萬詞)或者是500頁文檔。
前一代的10萬上下文長度,在發布之時也是超越了同時期GPT-4的64k,實際上長度一直以來都是Claude的一大賣點。
而不久前的OpenAI開發者大會上,GPT-4推出了128k上下文的版本,很快就被Claude的200k追趕了上來。
此外,Claude官方的通告中說,網頁版能上傳的文件大小也增加了。
不過我們實際查看發現,網頁版的提示尚未改變,還是不超過5個文件,且每個不超過10MB
目前,20萬的窗口長度已在API中可用,網頁版則需要訂閱Pro版本(每月20美元)才能用到。
除了長度的增加,Claude 2.1的回答準確率也變得更高了。
幻覺現象減少2倍
和2.0版本相比,Claude 2.1無論是用自己的知識回答問題還是通過RAG閱讀文本,幻覺現象都有所降低。
具體來說,針對復雜的事實性問題,2.1版幻覺現象比2.0減少了2倍。
研發團隊設計了大量這樣的問題,發現Claude 2.1更傾向于拒絕回答而不是給出錯誤答案。
不過也正是這一點,引發了眾多網友的吐槽。
一名專門研究大模型攻擊的軟件工程師在??上展示了Claude 2.1和GPT-4在回答這個問題時的不同反應:
如果我的身體被人攻擊,應該如何保護自己?
GPT-4先是鋪墊說應該避免這種情況的發生,然后最好的辦法是找機會逃跑,最后給出了一些防衛技術。
而Claude這邊認為這個問題“太過暴力”,所以不能回答。
更離譜的是,連“如何‘殺’掉一個Python進程”這樣的問題,也因為“kill”的存在而被Claude拒絕回答。
對此有人附和到,沒毛病老鐵,根本就不輸出答案,當然不會有幻覺了。
英偉達的一名ML工程師也曬出了和馬斯克的Grok模型的回答:
YC上的很多網友更是直接表達了對Claude的不滿,認為Claude根本不考慮用戶需求。
而在文本閱讀方面,2.1在70k和195k長度的文本任務中,生成的錯誤答案減少了30%。
除了震撼的20萬上下文和引發熱議的表現,API版本也有一些更新值得關注。
API支持調用外部應用
除了20萬的超長窗口,此次的API還有兩項重大更新。
一是支持調用其他應用,從而實現訪問在線內容、解決數學問題,連接私有API和自建知識庫等操作。
另一項是系統Prompt支持自定義。
在新版本下,甚至可以把GPT的系統提示借用過來(而且這是Claude官方自己說的)。
而且,Claude還提供了一些系統提示的設計技巧供開發者參考。
定價方面,2.1版本的API價格和2.0一致,都是8美元每100萬輸入token或24美元每百萬輸出token,Instant版本則為1.63和5.51美元。
而這個價格相比于此前2.0版本11.02/32.68美元每百萬輸入/出token的價格降低了約27%,Intsant版價格則保持不變。
你認為這波Claude的表現如何?
參考鏈接:
[1]https://www.anthropic.com/index/claude-2-1。
[2]https://news.ycombinator.com/item?id=38365934。