成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

剛剛,Gemini 2.5系列模型更新,最新輕量版Flash-Lite竟能實時編寫操作系統

人工智能
谷歌 CEO Sundar Pichai 發推表示新推出的 Gemini 2.5 Flash-Lite 是目前性價比最高的 2.5 系列模型。

剛剛,Gemini 系列模型迎來了一波更新:

  • Gemini 2.5 Pro 穩定版發布且已全面可用,其與 6 月 5 日的預覽版相比無變化。
  • Gemini 2.5 Flash 穩定版發布且已全面可用,其與 5 月 20 日的預覽版相比無變化,但價格有更新。
  • 新推出了 Gemini 2.5 Flash-Lite 并已開啟預覽。

谷歌 CEO Sundar Pichai 發推表示新推出的 Gemini 2.5 Flash-Lite 是目前性價比最高的 2.5 系列模型。

可以看到,谷歌對 2.5 Flash-Lite 的定位是適合用于「量大且注重成本效率的任務」。相較之下,2.5 Pro 適合編程和高復雜度任務,2.5 Flash 則居中,更適合需要較快速度的日常任務。

據官方博客介紹,Gemini 2.5 Flash-Lite 同樣是一個推理模型,同樣支持多模態輸入和 100 萬 token 上下文,并支持通過 API 參數動態控制思考預算。由于 Flash-Lite 針對成本和速度進行了優化,因此與谷歌 DeepMind 的其他模型不同,其「思考」功能默認處于關閉狀態。除了函數調用之外,2.5 Flash-Lite 還支持已有的所有原生工具,例如基于谷歌搜索查找依據、代碼執行和 URL 上下文。

性能上,Gemini 2.5 Flash-Lite 的整體表現自然會比 2.5 Flash 差一些,而開啟思考的版本也比沒開啟的更強。但在少量指標上,2.5 Flash-Lite 卻意外地具有少量分數優勢,比如 AIME 2025 和 FACTS Grounding。

價格方面,自然也是與性能掛鉤的。如上圖底部所示,2.5 Flash-Lite 的定價為每百萬輸入 / 輸出 token 0.1/0.4 美元,而如果是音頻輸入,則為每百萬輸入 token 0.5 美元。2.5 Flash 的價格為每百萬輸入 / 輸出 token 0.3/2.5 美元,音頻輸入的則為 1 美元。性能最佳的 2.5 Pro 價格沒有變化,還是貴得多:每百萬輸入 / 輸出 token 1.25/10 美元。

Gemini 2.5 Flash-Lite 的預覽版現已在 Google AI Studio 和 Vertex AI 上線,與 2.5 Flash 和 Pro 的穩定版本一同提供。用戶也可在 Gemini App 中使用 2.5 Flash 和 Pro。此外,谷歌還為 2.5 Flash-Lite 和 2.5 Flash 的定制版本引入了搜索功能。

另外,谷歌也發布了新版本的 Gemini 2.5 技術報告,從中我們可以看到有關 Gemini 2.5 Flash-Lite 的更多信息,比如在性價比方面,Gemini 系列共同組成了當前 LLM 的佩雷托前沿,是性價比最高的系列模型。

另外,該報告中還提到了一種名為「智能體恐慌(agent panic)」的現象,即在游戲過程中,Gemini 2.5 Pro 遇到了多種可能導致模型模擬「恐慌」的情況。

例如,當隊伍中的寶可夢生命值或能量值較低時,模型會反復提醒自己需要立即治療隊伍或逃離當前地牢。有趣的是,這種模型性能模式似乎與模型推理能力的定性可觀察到的下降相關——例如,在這種情況持續期間,在游戲過程中完全忘記使用探路工具。

報告地址:https://storage.googleapis.com/deepmind-media/gemini/gemini_v2_5_report.pdf

作為當今 AI 模型的頂流之一,Gemini 更新自然也吸引了萬眾矚目,很多用戶已經嘗試并分享了自己的體驗。

Datasette 開發者、著名技術博主 Simon Willison 用一篇博客分享了自己的體驗,下圖從左到右分別為 2.5 Pro、2.5 Flash 和 2.5 Flash-Lite 生成的鵜鶘騎自行車 SVG。

https://simonwillison.net/2025/Jun/17/gemini-2-5/

而輸出 token 數分別為 4,226、14,500、2,070,對應成本分別為 4.2274、3.6253、0.0829 美分。

另外,他還嘗試了將一個新的 Twitter Space 的錄音轉錄成文本。結果發現,2.5 Pro 的效果最好,總成本為 18.1 美分,時間 147.5 秒;2.5 Flash 也不錯,消耗 10 美分和 72.6 秒。但 2.5 Flash-Lite 卻遭遇了錯誤,中途卡住了。

DeepMind 研究 VP 和深度學習負責人 Oriol Vinyals 則通過一個更加亮眼的示例展示了 2.5 Flash-Lite,即所謂的 Neural OS / 神經操作系統。這看起來像是一個操作系統的 UI,但實際上里面的內容是用戶在點擊圖標后由 2.5 Flash-Lite 實時生成的!

可以說這是一種非確定性(non-deterministic)的操作系統 —— 當你退出一個文件夾再重新進入,里面的內容可能就已經完全不一樣了!

另外,谷歌開發者 ?? 帳號今天也分享了一些使用 Gemini 2.5 系列模型輔助開發的案例,比如 @splinetool 在其新的 Hana 工具中使用了 Gemini 2.5 Pro 來革新交互式 3D 設計。創作者可以使用自然語言生成對象和場景,并觀察它們如何栩栩如生地呈現,從而簡化復雜的工作流程。

機器之心也在 Google AI Studio 中簡單實驗了新推出的 2.5 Flash-Lite。

首先開啟 Thinking 模式,使用如下提示詞編寫一個小游戲:

編寫一個貪吃蛇小游戲,除了常規機制外,里面還要有障礙物。使用鮮艷多彩的顏色。

2.5 Flash-Lite 確實很快,僅用 17.1 秒就完成了任務,效果也還不錯,就是障礙物過多了。

接下來,關閉 Thinking 模式,丟給它今年上海高考的作文題:

請完成這道作文題:

有學者用 “?!薄稗D”“傳” 概括當下三類文章:“專” 指專業文章;“轉” 指被轉發的通俗文章;“傳” 指獲得廣泛傳播的佳作,甚至是傳世文章。他提出,專業文章可以變成被轉發的通俗文章,而面對大量 “轉” 文,讀者又不免期待可傳世的文章。

由 “?!?到 “傳”,必定要經過 “轉” 嗎?請聯系社會生活,寫一篇文章,談談你的認識與思考。

要求:(1)自擬題目;(2)不少于 800 字。

2.5 Flash-Lite 僅用 5.9 秒就完成了任務,至于結果,就交給你親自品鑒了:

最后,分享一個 Gemini 2.5 技術報告的貢獻者和致謝名單中隱藏的彩蛋:

你看出來了嗎?

參考鏈接:

  • https://developers.googleblog.com/en/gemini-2-5-thinking-model-updates/
  • https://blog.google/products/gemini/gemini-2-5-model-family-expands/
  • https://x.com/googleaidevs/status/1935103305581207923
責任編輯:趙寧寧 來源: 機器之心
相關推薦

2025-05-07 10:01:35

2025-06-23 00:00:01

2025-04-10 10:44:00

2025-06-18 14:18:23

谷歌模型技術

2009-04-11 15:12:24

vxworks操作系統

2025-04-10 06:16:33

2012-10-11 10:03:32

FedoraLinux

2013-05-22 14:59:26

Linux操作系統實時性

2010-03-01 13:05:52

2025-06-11 08:56:54

2022-02-09 19:31:41

Hi3861OpenHarmon鴻蒙

2021-06-22 09:09:34

V語言Vinix操作系統

2012-05-11 14:15:09

桌面操作系統最新排名

2012-05-29 10:53:22

FedoraLinux操作系統

2025-05-07 09:14:26

2022-04-15 14:31:02

鴻蒙操作系統

2019-03-25 22:20:36

操作系統WindowsUnix

2025-05-07 10:09:08

2011-08-19 10:17:53

2010-01-22 16:34:48

Windows7份額操作系統
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: www.日本在线观看 | 91久久夜色 | 国产美女高潮 | 日韩欧美一区二区三区四区 | 99久久久无码国产精品 | 国产精品自产拍在线观看蜜 | 午夜精品久久 | 人人种亚洲 | 蜜桃五月天 | 精品二 | 日韩a| 美女国内精品自产拍在线播放 | 成人免费小视频 | 欧美精品一二三 | 日韩精品中文字幕在线 | 日韩欧美亚洲 | 能看的av网站 | 午夜日韩视频 | 日韩中文字幕视频 | 精品91久久久 | 日本小电影在线 | 黄色在线免费观看 | 欧美一级艳情片免费观看 | 懂色av一区二区三区在线播放 | 精品99在线 | 日韩网站免费观看 | 美女在线观看国产 | 一级大片 | 久久久性色精品国产免费观看 | 91精品国产高清久久久久久久久 | 一区二区三区高清 | 国产在线资源 | 日韩中文字幕一区二区三区 | 欧美99久久精品乱码影视 | 久久久这里只有17精品 | 久草精品视频 | 国产欧美一区二区三区久久手机版 | 成人国产精品视频 | 亚洲毛片一区二区 | 国产欧美一区二区三区在线播放 | 亚洲人人 |