成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

沖擊DeepSeek R1,谷歌發(fā)布新一代Gemini全型號刷榜,編程、物理模擬能力炸裂

人工智能 新聞
本周三,該公司全面發(fā)布 Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite 以及新一代旗艦大模型 Gemini 2.0 Pro 實驗版本。

在 DeepSeek 的強烈攻勢下,這次輪到谷歌坐不住了。

本周三,該公司全面發(fā)布 Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite 以及新一代旗艦大模型 Gemini 2.0 Pro 實驗版本,并且還在 Gemini App 中推出了其推理模型 Gemini 2.0 Flash Thinking。

下圖為三個模型在通用、代碼、推理、事實性、多語言、數(shù)學、長上下文、圖像、音頻和視頻等多領(lǐng)域任務中的性能指標。

在大模型排行榜上,Gemini 2.0-Pro 在 Chatbot Arena 所有類別中排名第一。Pro 版在代碼等復雜任務上表現(xiàn)突出,Gemini Advanced 用戶目前已經(jīng)可以在 App 上進行試用了。

與此同時,排名并列第三的 Gemini-2.0-Flash 已通過 Google AI Studio 和 Vertex AI 向開發(fā)人員廣泛開放(價格是 0.1 美元 / M token),F(xiàn)lash-lite 也以更低的成本進入了前十。谷歌還在 Gemini 應用程序中推出了旗下「推理」模型 Gemini 2.0 Flash Thinking。

新版本 Gemini 2.0 可以做到很多以前做不到的事。谷歌首席科學家 Jeff Dean 表示 Gemini 2.0 Pro 模型可以編寫完整的代碼,包括所有正確的數(shù)據(jù)結(jié)構(gòu)和搜索算法,一次嘗試就可以獲得正確的數(shù)據(jù)結(jié)構(gòu)。

更多第三方試用的結(jié)果也已陸續(xù)出現(xiàn)在社交網(wǎng)絡(luò)上,可見 Gemini 2.0 的性能提升明顯,可以生成代碼實現(xiàn)一些模擬物理規(guī)律的效果。

提示詞:創(chuàng)建一個自行動的貪吃蛇游戲,其中 100 條蛇相互競爭。(單次嘗試)

提示詞:編寫一個腳本,顯示一個球在旋轉(zhuǎn)的六邊形內(nèi)彈跳。球應該受到重力和摩擦力的影響,并且必須逼真地從旋轉(zhuǎn)的墻壁上彈起,在 p5.js 中實現(xiàn)。(單次嘗試)

提示詞:編寫一個 p5.js 腳本,模擬圓柱形容器真空空間中的 25 個粒子,它們在容器邊界內(nèi)彈跳。為每個球使用不同的顏色,并確保它們留下顯示其運動的軌跡。添加容器的緩慢旋轉(zhuǎn),以便更好地查看場景中發(fā)生的事情。確保創(chuàng)建適當?shù)呐鲎矙z測和物理規(guī)則,以確保粒子留在容器中。添加外部球形容器。為整個場景添加緩慢放大和縮小效果。

種種跡象表明,進入 2025 年之后,全球大模型領(lǐng)域的競爭烈度又上了一個臺階。谷歌正式發(fā)布 Gemini 2 系列的同時,OpenAI 立即作出回應,宣布將其 AI 搜索功能面向所有免費用戶開放。

值得注意的是,有媒體報道稱在谷歌發(fā)布新模型之際,科技界的注意力仍然集中在 DeepSeek 上。DeepSeek 的模型在性能上媲美甚至超越了美國科技公司提供的領(lǐng)先 AI 模型。與此同時,企業(yè)可以通過 DeepSeek 的 API 以相對低廉的價格使用其模型。

谷歌和 DeepSeek 都在去年 12 月發(fā)布了 AI 推理模型,但 DeepSeek 的 R1 模型獲得了更多關(guān)注。現(xiàn)在,谷歌可能正試圖通過其廣受歡迎的 Gemini app,讓更多人了解其 Gemini 2.0 Flash Thinking 模型。

至于 Gemini 2.0 Pro,作為谷歌去年 2 月推出的 Gemini 1.5 Pro 模型的繼任者,谷歌表示它現(xiàn)在是 Gemini AI 模型家族中的領(lǐng)先模型。

在價格方面,谷歌將繼續(xù)通過 Gemini 2.0 Flash 和 2.0 Flash-Lite 降低成本。兩者均采用單一輸入類型的定價模式,取消了 Gemini 1.5 Flash 中對短上下文和長上下文請求的區(qū)分。這意味著,盡管 2.0 Flash 和 Flash-Lite 在性能上有所提升,但在混合上下文工作負載下,兩者的成本可能低于 Gemini 1.5 Flash。

谷歌 Gemini 2.0 三大模型:全方位加強

Gemini 2.0 Pro 實驗版本

首次是新一代旗艦 Gemini 2.0 Pro 實驗版本,它是谷歌迄今為止在編碼和復雜指令任務中表現(xiàn)最好的模型。

在 Gemini 2.0 早期實驗版本中(如 Gemini-Exp-1206),開發(fā)人員已經(jīng)發(fā)現(xiàn)了這些模型的優(yōu)勢和最佳用例,比如編碼、復雜指令。

此次,Gemini 2.0 Pro 實驗版本進一步強化了這些功能,具備了最強大的編碼性能和處理復雜指令的能力,并且比谷歌此前發(fā)布的任何模型都具備更好的理解和推理世界知識的能力。

據(jù)介紹,該模型支持了谷歌最長的 200 萬 tokens 上下文窗口,可以處理 2 小時視頻、22 小時音頻、6 萬+ 行代碼和 140 萬 + 單詞,從而能夠全面分析和理解海量信息。同時,該模型還支持調(diào)用 Google 搜索和代碼執(zhí)行等工具。

目前,Gemini 2.0 Pro 已經(jīng)作為實驗模型提供給 Google AI Studio 和 Vertex AI 的開發(fā)人員使用,并且 Gemini Advanced 用戶在桌面和移動設(shè)備中也可以體驗。

Gemini 2.0 Flash

其次來看 Gemini 2.0 Flash,它是谷歌 Flash 系列模型的最新「成員」。

在 2024 年谷歌 I/O 大會上,Gemini 2.0 Flash(實驗版本)首次亮相,此后便作為強大的主力模型而深受開發(fā)者的喜愛,并最適合大規(guī)模處理高容量、高頻率任務,并能夠通過 100 萬 tokens 上下文窗口對海量信息進行多模態(tài)推理。

當前,Gemini 2.0 Flash 已經(jīng)在谷歌的 AI 產(chǎn)品中向更多人全面開放使用。據(jù)介紹,該模型提供了全面的功能,包括原生工具使用。目前支持文本輸出,并即將推出圖像生成與文本轉(zhuǎn)語音功能,未來幾個月還將提供多模態(tài) Live API。

目前,用戶既可以在 Gemini App 中試用該模型,也可以在 Google AI Studio 和 Vertex AI 中使用 Gemini API。

Gemini 2.0 Flash-Lite

最后是 Gemini 2.0 Flash-Lite,它是谷歌目前為止性價比最高的模型。該模型針對大規(guī)模文本輸出用例進行了成本優(yōu)化。

谷歌表示,他們收到了關(guān)于 Gemini 1.5 Flash 在價格和速度方面的積極反饋,并希望在保持成本與速度優(yōu)勢的同時繼續(xù)提升模型質(zhì)量。因此,Gemini 2.0 Flash-Lite 在性能上更強,在大多數(shù)基準測試中均優(yōu)于 1.5 Flash,并且速度和成本相當。

此外,與 2.0 Flash 一樣,Gemini 2.0 Flash-Lite 支持 100 萬 tokens 上下文窗口和多模態(tài)輸入。比如,該模型可以為大約 4 萬張不同的照片生成相關(guān)的單行字幕(或標題),在 Google AI Studio 付費套餐中僅花費不到 1 美元。

目前,Gemini 2.0 Flash-Lite 在 Google AI Studio 和 Vertex AI 中提供公開預覽版。

下圖為三個模型的一些參數(shù)匯總,可以看出圖像和音頻功能即將上線。

改變游戲規(guī)則?

Gemini 2.0 全面開放后,其領(lǐng)先能力在機器學習社區(qū)被熱烈討論。有評論認為,在這代模型推出后包括 OCR 等一些領(lǐng)域的游戲規(guī)則已被改變。

Gemin 2.0 在處理真實文檔時已經(jīng)可以做到極高的準確率和低成本,實測很少會出現(xiàn)具體數(shù)值被誤讀的情況。除了表格解析之外,Gemini 在 PDF 到 Markdown 轉(zhuǎn)換的所有其他方面可以始終提供近乎完美的準確性。所有特性結(jié)合在一起,你將獲得一個極其簡單、可擴展且便宜的索引流程。

我們一直在等的大模型技術(shù)革命,已經(jīng)在很多領(lǐng)域出現(xiàn)了。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2012-07-02 16:39:26

谷歌電視

2013-01-04 16:15:08

微軟ERPDynamics AX

2016-12-11 10:35:52

2009-03-11 13:02:20

存儲虛擬化數(shù)據(jù)中心

2025-01-27 12:30:07

2011-08-19 13:26:54

IBM芯片

2020-03-19 10:31:14

AI 數(shù)據(jù)人工智能

2011-07-07 10:35:29

華為智真系統(tǒng)通信領(lǐng)域

2018-03-29 15:50:48

華為

2022-08-22 08:05:17

Fresh框架Remix

2019-06-13 15:38:34

甲骨文OracleExadata

2012-03-08 09:15:04

蘋果iPad

2014-10-13 14:25:35

葡萄城JavaScriptWijmo 5

2025-02-20 15:32:28

2011-12-07 12:00:06

ibmdw

2013-05-03 09:49:38

ASICSDN可編程ASIC

2011-12-18 21:31:09

RIM

2024-12-12 08:18:50

2010-12-10 14:25:24

QNXBlackBerryRIM
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 免费久| 午夜影院在线免费观看视频 | 久久久精品一区二区 | 久久久久久久久久性 | 日韩成人性视频 | 久久综合爱 | 亚洲免费在线观看av | 美女黄色在线观看 | 一区二区影视 | 国产精品18hdxxxⅹ在线 | 日韩精品中文字幕一区二区三区 | 亚洲国产一区二区三区在线观看 | www.久草| 亚洲欧美另类在线 | 国产乱码精品一区二区三区中文 | 91青娱乐在线 | 日韩 欧美 二区 | 国产成人a亚洲精品 | av黄色在线 | 国产极品91 | 99福利视频导航 | 日韩亚洲视频在线 | 在线免费观看a级片 | 久久精品小视频 | 国产综合网站 | 欧美区日韩区 | 日韩成人av在线 | 久久麻豆精品 | 日本免费视频在线观看 | 精品视频一区二区三区 | 日韩欧美综合在线视频 | 蜜臀网 | 亚洲成人av在线播放 | 久久精品视频在线观看 | 亚洲精品久久久 | 在线一区二区三区 | 精品一区二区三区在线观看国产 | 亚洲日韩中文字幕一区 | 在线免费观看毛片 | 成年人网站在线观看视频 | 国产91久久久久久 |