OpenAI發布推理模型o3及其精簡版o3-mini

作者：Yu 2024-12-24 16:15:04

據外媒報道，在為期12天的發布會上，OpenAI宣布了其新一代推理模型o3和精簡版o3-mini，專門設計用于在回答問題之前進行更深入的思考，以提高準確性。

12月23日消息，據外媒報道，在為期12天的發布會上，OpenAI宣布了其新一代推理模型o3和精簡版o3-mini，專門設計用于在回答問題之前進行更深入的思考，以提高準確性。

據介紹，o3模型在ARC-AGI基準上取得了優異的表現，成為第一個超越這一基準的AI模型，展示了接近人類水平的問題解決能力。o3系列在ARC-AGI基準上的最低性能可以達到75.7%，加上額外的計算資源，性能可以提高到87.5%。

o3-mini模型專注于提高推理速度和降低成本，同時保持模型性能，使其特別適合編程任務。OpenAI計劃在一月底推出o3-mini，隨后不久將推出完整的o3型號。雖然o3系列機型不會直接公開發布，而且會先進行安全測試，但OpenAI已經開始允許安全研究人員注冊o3和o3-mini的預覽訪問權限。

在編程和數學問題解決方面，o3模型顯示出了顯著的能力。在SWE-bench驗證基準上，o3模型的準確率約為71.7%，比o1模型高出20%以上。在衡量編程能力的Codeforces?Elo評分中，o3取得了2727的Elo評分，而o1評分僅為1891。此外，o3在競技數學上的準確率達到了96.7%，在GPQA?Diamond上的準確率達到了87.7%，比o1提高了近10%。

OpenAI在發布會上還介紹了一種新的安全評估方法——審議式對齊(deliberative?alignment)。這種方法通過直接教授模型安全規范，訓練模型在回答前明確回憶規范并準確地執行推理，從而實現對OpenAI安全政策的高度精確遵守。

目前，OpenAI正在推進外部安全測試，并在其網站上開放了早期訪問應用程序。申請人必須在網上填寫表格并提供相關信息。選定的研究人員將被授予訪問o3和o3-mini的權限，以探索它們的能力并為安全評估做出貢獻。

責任編輯：龐桂玉來源：比特網

OpenAI 推理模型o3

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI發布推理模型o3及其精簡版o3-mini