出品 | 51CTO技術棧(微信號:blog51cto)
AI 編碼模型的新王者登基了!今天,Google 旗下的 DeepMind AI 研究部門正式發布了 Gemini 2.5 Pro “I/O” 版,這是今年 3 月推出的 Gemini 2.5 Pro 多模態大語言模型(LLM)的更新版本。
DeepMind CEO Demis Hassabis 在 X 上表示:“這是我們迄今為止打造的最佳編碼模型!”
在 WebDev Arena 榜單(一個基于人類偏好、評估模型生成美觀且實用 Web 應用能力的第三方指標)上,Gemini 2.5 Pro Preview(05-06)現已超越 Anthropic 的 Claude 3.7 Sonnet,登頂第一。
此次更新的最大亮點,在于模型能僅通過一句提示生成完整、可交互的 Web 應用或模擬項目,根據草圖完成應用的編程等等。這正符合 DeepMind 一貫強調的“簡化原型開發流程”的愿景。
新版本模型進一步助力應用中的功能開發,能夠自動匹配組件的視覺風格,還能實現如將 YouTube 視頻轉換為功能齊全的學習應用、或用極少甚至無需 CSS 手動編輯就創建出響應式視頻播放器或動態語音 UI 等工作流。
這款新版本標識為 “gemini-2.5-pro-preview-05-06”,取代了之前的 03-25 版本,現在已面向獨立開發者開放(通過 Google AI Studio),也面向企業客戶上線(通過 Vertex AI 云平臺),同時普通用戶可在 Gemini App 中體驗。Google 在博客中指出,新模型還為 Gemini 移動端的 Canvas 畫布功能及其他組件提供支持。
該模型為閉源專有模式,企業需要付費使用,僅可通過 Google 的 Web 服務訪問。不過它并未改變價格或速率限制,當前 Gemini 2.5 Pro 用戶將自動切換至新版本。價格為每百萬輸入/輸出 token 分別為 $1.25 / $10(上下文長度為 200,000 token),而 Claude 3.7 Sonnet 的對應價格為 $3 / $15。