OpenAI公開了大模型o3-mini的推理思維鏈
2月8日消息,據外媒報道,OpenAI更新了o3-mini?AI模型的“思維鏈”功能,讓用戶可以看到模型的思考過程。這是在DeepSeek-R1發布之后發生的,DeepSeek-R1是一個競爭對手的推理模型,也顯示了其反應背后的思維過程。
推理模型旨在逐步分解其決策過程,因此需要更長的時間來生成響應。這樣的解釋可以更容易地理解為什么給出了特定的響應,允許用戶看到為什么他們的提示可能會或可能不會產生期望的答案。它們還允許人工智能研究人員識別潛在的偏見或錯誤,并提高其推理能力。
OpenAI在一篇文章中表示,該公司已經為免費和付費用戶發布了“更新的OpenAI?o3-mini思維鏈”,并為付費用戶發布了o3-mini-high思維鏈。“o3-mini-high是o3-mini的付費版本,具有更深入的推理能力和更詳細的思維過程,但代價是反應時間較慢。
在此更新之前,OpenAI模型o3-mini、o1和o1-mini只能讓用戶訪問思想鏈摘要,而不是完整的推理;該公司表示,這是為了“在速度和準確性之間提供一個平衡的權衡”,盡管它過去也提到“競爭優勢”是決定的一個因素。
然而,由于DeepSeek的開源R1展示了其反應背后的整個過程,OpenAI決定將該過程公布。在更新中,“模型的原始(思維鏈)仍然隱藏,因為它很難理解”,但以一種“易于閱讀”的方式呈現。
新的、更深入的推理總結將經過后處理步驟,簡化任何過于復雜的解釋,刪除任何“不安全”的推理解釋,并將其翻譯成用戶的母語。
OpenAI的首席產品官Kevin?Weil表示:“展示所有的思維鏈會帶來競爭的升華,但我們也知道人們需要它,所以我們會找到平衡它的正確方法。”這就是這種平衡的結果。