編輯 | 伊風
出品 | 51CTO技術棧(微信號:blog51cto)
DeepSeek的火熱,讓Google坐不住了!
深夜,Google推出了Gemini 2.0全家桶,一口氣推出了三個模型型號:Gemini 2.0 Flash、Gemini 2.0 Flash-LiteGemini 2.0 Pro。
圖片
看技術報告,2.0系列的三個模型在通用、代碼、推理、事實性、多語言等方面指標如下。比起此前Gemini 1.5系列著實有了多維度的進化,但明顯沒有性能的斷層式飛躍。
圖片
再來看最近AI圈關注的重中之重——推理。谷歌也在Gemini 2.0的技術報告里強調了一把,Gemini 2.0 Flash Thinking全面上線了!
圖片
外媒TechCruch,在報道中明說了谷歌不甘自家推理模型受冷落,想借2.0更新的檔口加一把火的意思:“Google 和 DeepSeek 都在去年 12 月發布了 AI 推理模型,但 DeepSeek 的 R1 模型受到了更多關注。如今,Google 可能希望通過廣受歡迎的 Gemini 應用,讓更多用戶接觸到其 Gemini 2.0 Flash Thinking 模型。”
其中最大的亮點,就是谷歌直接把推理放到了YouTube、Maps 和 Search里!也就是說,你可以直接讓Gemini 2.0 Flash Thinking幫你推理下油管近期的爆款視頻元素。
這點還是很讓人振奮的,感覺谷歌終于聰明了一把,應用們集體做推理的時代已經不遠了!
還有一個與DeepSeek相關的趣事,在AI界“拼多多”的影響下,谷歌也開始玩極致性價比了。
帶隊Gemini 2.0的大佬Logan都出來打了個廣告,稱Gemini 2.0 Flash是最“劃算”的大模型了,抓緊用吧!
圖片
Logan說得不錯,尤其是輕量的Gemini 2.0 Flash-Lite模型,其定價更低:
輸入:$0.075/百萬 tokens
輸出:$0.30/百萬 tokens
相比之下,市場上的其他 LLM:
OpenAI 4o-mini:$0.15(輸入) / $0.6(輸出)
Anthropic Claude:$0.8(輸入) / $4(輸出)
DeepSeek V3:$0.14(輸入) / $0.28(輸出)
看來AI圈的又一波降價促銷即將到來,不過,Gemini 2.0 與 DeepSeek-R1、OpenAI o3的推理還是有相當大的區別,就像是把“蘋果與橙子”放在一起比較。
1.多模態仍是谷歌核心優勢,多應用接入未來可期
從這張時間表來看,Google 的核心優勢仍然在多模態能力上。
圖片
此前,Google DeepMind 的 CTO Koray Kavukcuoglu 在公司博客中寫道:“這些模型在發布時將支持多模態輸入(文本輸出),并將在未來幾個月內開放更多模態的全面使用?!?/span>
在谷歌生態里,多模態能力發揮的空間很大。推特博主@Paul Couvert說,作為首個能夠訪問 YouTube 的推理模型,AI已經能幫你量身寫作短視頻腳本了,tips 如下:
- 搜索與您的主題相關的視頻
- 讓 Gemini 對視頻進行思考
- 您將在 10 秒內得到一個量身定制的結果!
而在map里,Gemini 2.0的支持讓地圖化身“地球探索器”,可以通過推理為用戶提供更多有趣的地方。
當用戶說:帶我去一個自然風光優美、綠意盎然的地方。
AI回復道:去也門的索科特拉群島怎么樣?這里獨特得仿佛踏上另一個星球。由于長期的與世隔絕,這里孕育出了奇特而美麗的植物,如龍血樹和多肉瓶樹。
相較而言,DeepSeek 和 OpenAI 等競爭對手專注在單一模態的大模型中,DeepSeek-R1 和 OpenAI 的 o3-mini 仍無法直接處理多模態輸入(即無法解析圖片、文件上傳或附件)。雖然 DeepSeek-R1 在其網站和移動端支持圖片上傳,但它僅使用 光學字符識別(OCR) 來提取圖片中的文本內容,而不是真正理解或分析圖片的其他信息。
不過,谷歌能否將應用中的AI推理做得真正實用,還需要時間的檢驗。
2.Gemini 2.0 Pro 秀肌肉:2百萬 token 超長上下文、最強大的編碼模型
Google 堅持走長上下文路線。Gemini 2.0 Pro 的實驗版本,更是達到了2百萬 tokens之大。
Google DeepMind 將其描述為最強大的編碼模型,可處理復雜提示詞,其特性如下:
- 2百萬 tokens 上下文窗口(比 Flash 和 Flash-Lite 翻倍);
- 改進的推理能力;
- 集成 Google Search 和代碼執行能力。
DeepMind首席科學家盛贊說,“它能寫出完整的代碼,包括所有正確的數據結構和搜索算法,根據一個相對簡單的提示,在 Boggle 棋盤上找到所有有效的單詞,這真是令人匪夷所思!”
圖片
此外, Gemini 2.0 Pro的編輯功能也大受好評,網友直接讓AI使用 Three.js,手搓了一個太陽系模擬。
圖片
對標DeepSeek,Gemini 2.0輕量模型開卷“極致性價比”!谷歌守住多模態陣地,油管、地圖應用們都要開始做推理了!
觀看更多轉載,對標DeepSeek,Gemini 2.0輕量模型開卷“極致性價比”!谷歌守住多模態陣地,油管、地圖應用們都要開始做推理了!51CTO技術棧已關注分享點贊在看已同步到看一看寫下你的評論 視頻詳情
3.寫在最后
這邊,Gemini 2.0 正在迎來高光時刻。
然而, OpenAI 卻突然放出大招,谷歌一夜醒來發現被偷家了。
ChatGPT正式開放了搜索功能,免注冊免費用,網友在評論中驚呼:“谷歌一下”可能要變成“AI 一下”了。
圖片
有了亮眼的Gemini 2.0,谷歌仍然不能喘一口氣:2025 年的 AI 之戰注定不會輕松。連 CEO 桑達爾·皮查伊都坦言:“今年將是一場硬仗?!?/span>
參考鏈接:
1.https://developers.googleblog.com/en/gemini-2-family-expands/?linkId=12807127
2.https://techcrunch.com/2025/02/05/google-launches-new-ai-models-and-brings-thinking-to-gemini/