谷歌性價(jià)比之王 Gemini 2.5 Flash-Lite發(fā)布:最快輕量版AI模型! 原創(chuàng)
今天凌晨,谷歌更新了 Gemini 2.5 系列模型:Gemini 2.5 Pro、Gemini 2.5 Flash發(fā)布正式版并進(jìn)入穩(wěn)定運(yùn)行階段,并推出Gemini 2.5 Flash-Lite預(yù)覽版。
?
?
Gemini 2.5 Flash Lite在在編程、數(shù)學(xué)、科學(xué)、推理和多模態(tài)基準(zhǔn)測(cè)試中,全面超越了 2.0 Flash-Lite,廣泛任務(wù)延遲低于2.0 Flash-Lite和2.0 Flash。谷歌稱這一模型為其最經(jīng)濟(jì)實(shí)惠、速度最快的2.5系列模型。
?
?
并且,它在翻譯和分類等高容量、延遲敏感的任務(wù)中表現(xiàn)尤為出色。在翻譯工作中,不僅能夠快速給出翻譯結(jié)果,而且保證了高準(zhǔn)確性和流暢度。
?
與 2.0 Flash-Lite 和 2.0 Flash 相比,它在廣泛任務(wù)樣本中的延遲更低,縮短了首個(gè) token 的獲取時(shí)間,實(shí)現(xiàn)了更高的每秒 token 解碼速度,這使得它在處理任務(wù)時(shí)反應(yīng)迅速,幾乎能做到即時(shí)響應(yīng)。
?
同時(shí),Gemini 2.5 Flash-Lite允許通過 API 參數(shù)動(dòng)態(tài)控制思考預(yù)算,雖然 “思考” 功能默認(rèn)處于關(guān)閉狀態(tài),但開發(fā)者可根據(jù)實(shí)際需求靈活開啟,以應(yīng)對(duì)不同復(fù)雜程度的任務(wù)。
?
DeepMind研究副總裁Oriol Vinyals展示了一個(gè)應(yīng)用示例——Neural OS(神經(jīng)操作系統(tǒng))。這個(gè)看似普通的操作系統(tǒng)界面,實(shí)際上所有內(nèi)容都是用戶點(diǎn)擊圖標(biāo)后由Gemini 2.5 Flash-Lite實(shí)時(shí)生成的。
?
“這本質(zhì)上是一個(gè)非確定性操作系統(tǒng)”,Vinyals解釋道,“當(dāng)你退出文件夾再重新進(jìn)入時(shí),里面的內(nèi)容可能已經(jīng)完全改變。”這種實(shí)時(shí)生成能力展示了Flash-Lite在低延遲場(chǎng)景下的卓越性能。
?
Gemini 2.5 Flash-Lite擁有 100 萬個(gè) token 的上下文長(zhǎng)度,能夠處理長(zhǎng)篇幅、復(fù)雜的內(nèi)容,充分理解前后文的邏輯關(guān)系,從而給出更貼合需求的回答。
?
在數(shù)學(xué)方面,Gemini 2.5 Pro的表現(xiàn)略遜色于OpenAI o4-mini,圖像理解方面分?jǐn)?shù)略低于OpenAI-o3 high。
?
?
在價(jià)格方面,Gemini 2.5 Flash-Lite 展現(xiàn)出了超高的性價(jià)比。它比 Gemini 2.5 Flash 便宜 30%-60%,輸入價(jià)格僅為 0.1 美元(折合人民幣約 0.7 元)/ 百萬 tokens,輸出價(jià)格為 0.4 美元(折合人民幣約 2.9 元)/ 百萬 tokens 。
?
目前,Gemini 2.5 Flash-Lite 預(yù)覽版已在谷歌 AI Studio 和 Vertex AI 中上線,開發(fā)者們可以第一時(shí)間體驗(yàn)它的強(qiáng)大功能。
?
同時(shí),Gemini 2.5 Flash 和 Pro 穩(wěn)定版也已全面可用,并且谷歌還為谷歌搜索功能引入了 2.5 Flash-Lite 和 Flash 的定制版本,讓廣大用戶在日常搜索中也能感受到 AI 技術(shù)帶來的高效與便捷。
?
Gemini2.5系列的發(fā)布,標(biāo)志著谷歌在推理速度和經(jīng)濟(jì)性方面取得了新的突破。
?
大家怎么看?歡迎在評(píng)論區(qū)留言討論~
