成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟發(fā)布了 Phi-4-mini-flash-reasoning 模型 原創(chuàng)

發(fā)布于 2025-7-15 08:53
瀏覽
0收藏

微軟剛剛發(fā)布了 Phi-4-mini-flash-reasoning 模型:

?基于全新的混合架構(gòu)構(gòu)建

?吞吐量提升 10 倍,延遲降低 2-3 倍

?在不犧牲推理性能的前提下顯著加速推理

微軟將大部分繁重的計(jì)算工作轉(zhuǎn)移到精簡的 SambaY 架構(gòu)上,配合小型門控模塊,讓同樣的 38 億參數(shù)模型思考更快、響應(yīng)更迅速。

Phi-4-mini-flash-reasoning 保持了 38 億參數(shù)的緊湊規(guī)模,但重新設(shè)計(jì)了信息流動方式。全新的解碼器-混合-解碼器架構(gòu) SambaY 讓輕量級循環(huán)組件處理上下文,單個全注意力層負(fù)責(zé)全局連接,而小巧的門控記憶單元(GMU)將這些工作在整個架構(gòu)中循環(huán)利用。

相比 Phi-4-mini-reasoning,該模型在長上下文生成和對延遲敏感的推理任務(wù)中表現(xiàn)出顯著更低的延遲和更高的吞吐量。

Phi-4-mini-flash-reasoning 的核心是全新的解碼器-混合-解碼器架構(gòu) SambaY,其關(guān)鍵創(chuàng)新是門控記憶單元(GMU)——一種簡單而有效的層間表示共享機(jī)制。SambaY 架構(gòu)的主要優(yōu)勢包括:

?增強(qiáng)解碼效率

?保持線性預(yù)填充時間復(fù)雜度

?提升可擴(kuò)展性和長上下文性能

?吞吐量提升高達(dá) 10 倍

解碼器前半部分運(yùn)行 Mamba + 滑動窗口注意力,保持線性成本。一個全注意力層計(jì)算并存儲鍵值,然后后半部分通過交叉注意力獲取這些鍵值。每隔一個交叉注意力層被替換為 GMU,僅對早期的隱藏狀態(tài)進(jìn)行門控,從而消除了一半的查找操作。


微軟發(fā)布了 Phi-4-mini-flash-reasoning 模型-AI.x社區(qū)圖片

在單個 A100-80GB GPU 上,vLLM 測試顯示:對于 2K 提示詞加 32K 生成的場景,吞吐量比 Phi-4-mini-reasoning 提升高達(dá) 10 倍。各種提示詞長度下的端到端延遲平均降低約 2-3 倍。


微軟發(fā)布了 Phi-4-mini-flash-reasoning 模型-AI.x社區(qū)圖片

即使使用 256 個 token 的小滑動窗口,SambaY 在 Phonebook 32K 和 RULER 等困難檢索數(shù)據(jù)集上仍然超越了純 Transformer 基線。門控記憶單元保持新鮮的局部信息,而單個全注意力層提供全局覆蓋能力。


微軟發(fā)布了 Phi-4-mini-flash-reasoning 模型-AI.x社區(qū)圖片

邊緣設(shè)備教學(xué)應(yīng)用、離線數(shù)學(xué)助手,以及任何需要快速響應(yīng)且在嚴(yán)格內(nèi)存限制下運(yùn)行的設(shè)備端智能體,現(xiàn)在都有了一個即插即用的模型,能夠處理 64K token 和長鏈推理,無需服務(wù)器集群支持。

鏈接:?????https://huggingface.co/microsoft/Phi-4-mini-flash-reasoning???

?

本文轉(zhuǎn)載自??AI帝國???????,作者:無影寺

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 亚洲乱码国产乱码精品精98午夜 | 久热9| 综合色播 | 国产成人免费视频网站视频社区 | 一区二区不卡视频 | 亚洲www. | 国产精品久久久久久久久久免费 | 国产成人精品免费 | 亚洲精品中文字幕 | 亚洲巨乳自拍在线视频 | 毛片毛片毛片毛片毛片 | 成人精品系列 | 日韩在线免费视频 | 天天操天天干天天曰 | 国产一区二区三区在线看 | 黑人一级片视频 | 91久久精品一区二区二区 | 免费午夜剧场 | a级片网站| 日韩色图在线观看 | 亚洲欧美日韩网站 | 久久久一区二区 | 黄色国产在线视频 | 国产毛片久久久久久久久春天 | 久久精品视频一区二区三区 | 精品乱码一区二区 | 国产精品久久久久无码av | 一区二区三区小视频 | 欧美日韩国产精品激情在线播放 | 国产成人99久久亚洲综合精品 | 超碰天天| av影音在线 | 男人天堂网站 | 欧美一区2区三区4区公司二百 | 精品欧美一区二区精品久久 | 日本韩国电影免费观看 | 一区二区三区日韩精品 | 日本字幕在线观看 | 一区二区三区四区国产 | 国产精品久久久久久久免费大片 | 日韩在线看片 |