Qwen深夜升級235B模型,重奪王座、全面超越Kimi K2!還預(yù)告了一個重磅更新
原創(chuàng)Qwen 深夜上新!
Qwen3-235B-A22B-2507 系列正式啟動,今天率先登場的是非思考模型 —— Qwen3-235B-A22B-Instruct-2507。
在最新基準(zhǔn)測試中,新模型全面超越 Kimi K2,開源王冠再度回到 Qwen 頭上!
四大關(guān)鍵升級:
1.在通用能力方面有顯著提升,包括:指令跟隨、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編程與工具使用等。
2.在多語言的長尾知識覆蓋方面取得了實質(zhì)性進展。
3.在主觀性強和開放式任務(wù)中,對用戶偏好的適配顯著改善,生成的回答更有幫助,文本質(zhì)量更高。
4.對 256K 超長上下文的理解能力也得到了增強。
值得注意的是,Qwen 官方宣布:“我們決定停止使用混合思維模式。”
這意味著,在 A22B-2507 系列中,Instruct 與 Thinking 模型將分別獨立訓(xùn)練與發(fā)布。盡管官方尚未詳細解釋背后原因,但混合思維一度被認為是行業(yè)趨勢,Qwen 此舉很可能是在技術(shù)層面有了新的發(fā)現(xiàn)。
有網(wǎng)友在評論區(qū)提到:看好這次更新,think模式會影響模型的指令遵循能力。不知道這個觀點是否與官方不謀而合,Qwen后續(xù)技術(shù)報告,值得期待!
Qwen 也放出預(yù)告:“今天只是一個小更新,更大的更新即將到來!”
看樣子,Thinking 模型或許才是真正的王炸!
Qwen 聊天:https://chat.qwen.ai
HF:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507