成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<li id="kaamg"><tbody id="kaamg"></tbody></li>

<center id="kaamg"></center>

<rt id="kaamg"><delect id="kaamg"></delect></rt>

<code id="kaamg"></code>

<cite id="kaamg"></cite>

<li id="kaamg"><tbody id="kaamg"></tbody></li>

<rt id="kaamg"><acronym id="kaamg"></acronym></rt>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

剛剛，DeepSeek開(kāi)源FlashMLA，推理加速核心技術(shù)，Star量飛漲中

作者：機(jī)器之心 2025-02-24 12:22:13

人工智能新聞

北京時(shí)間周一上午 9 點(diǎn)，剛一上班（同時(shí)是硅谷即將下班的時(shí)候），DeepSeek 兌現(xiàn)了自己的諾言，開(kāi)源了一款用于 Hopper GPU 的高效型 MLA 解碼核：FlashMLA。

上周五，DeepSeek 發(fā)推說(shuō)本周將是開(kāi)源周（OpenSourceWeek），并將連續(xù)開(kāi)源五個(gè)軟件庫(kù)。

第一個(gè)項(xiàng)目，果然與推理加速有關(guān)。

北京時(shí)間周一上午 9 點(diǎn)，剛一上班（同時(shí)是硅谷即將下班的時(shí)候），DeepSeek 兌現(xiàn)了自己的諾言，開(kāi)源了一款用于 Hopper GPU 的高效型 MLA 解碼核：FlashMLA。

該項(xiàng)目上線才 45 分鐘就已經(jīng)收獲了超過(guò) 400 star！并且在我們截圖時(shí)，Star 數(shù)量正在瘋狂飆升。

項(xiàng)目地址：https://github.com/deepseek-ai/FlashMLA

眾所周知，MLA是DeepSeek大模型的重要技術(shù)創(chuàng)新點(diǎn)，主要就是減少推理過(guò)程的KV Cache，從而實(shí)現(xiàn)在更少的設(shè)備上推理更長(zhǎng)的Context，極大地降低推理成本。

此次 DeepSeek 直接開(kāi)源了該核心技術(shù)的改進(jìn)版本，可以說(shuō)是誠(chéng)意滿滿。

接下來(lái)，就讓我看下這個(gè)開(kāi)源項(xiàng)目的核心內(nèi)容。

據(jù)介紹，F(xiàn)lashMLA 是適用于 Hopper GPU 的高效 MLA 解碼內(nèi)核，針對(duì)可變長(zhǎng)度序列服務(wù)進(jìn)行了優(yōu)化。

目前已發(fā)布的內(nèi)容有：

BF16
塊大小為 64 的分頁(yè) kvcache

其速度非常快，在 H800 SXM5 GPU 上具有 3000 GB/s 的內(nèi)存速度上限以及 580 TFLOPS 的計(jì)算上限。

在部署這個(gè)項(xiàng)目之前，你需要的有：

Hopper GPU
CUDA 12.3 及以上版本
PyTorch 2.0 及以上版本

快速啟動(dòng)

安裝

python setup.py install

基準(zhǔn)

python tests/test_flash_mla.py

使用 CUDA 12.6，在 H800 SXM5 上，在內(nèi)存綁定配置下實(shí)現(xiàn)高達(dá) 3000 GB/s，在計(jì)算綁定配置下實(shí)現(xiàn) 580 TFLOPS。

用法

from flash_mla import get_mla_metadata, flash_mla_with_kvcache

tile_scheduler_metadata, num_splits = get_mla_metadata (cache_seqlens, s_q * h_q //h_kv, h_kv)

for i in range (num_layers):
...
o_i, lse_i = flash_mla_with_kvcache (
q_i, kvcache_i, block_table, cache_seqlens, dv,
tile_scheduler_metadata, num_splits, causal=True,
)
...

該項(xiàng)目發(fā)布后也是好評(píng)如潮。

甚至有網(wǎng)友打趣地表示：「聽(tīng)說(shuō)第五天會(huì)是 AGI」。

最后，還是那句話：這才是真正的 OpenAI

責(zé)任編輯：張燕妮來(lái)源：機(jī)器之心

DeepSeek 開(kāi)源模型

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板： 91免费小视频| 蜜月va乱码一区二区三区 | 91免费视频观看 | 国产精品日韩欧美一区二区三区 | 欧美a在线看 | 亚洲中文欧美日韩在线观看 | 狠狠操狠狠色 | 青娱乐av| 日韩欧美三级在线 | 国产精品毛片无码 | 看羞羞视频免费 | 一区二区三区四区在线 | 欧美亚洲综合久久 | 免费在线视频精品 | 久久久久久九九九九九九 | 日韩精品一区二区三区 | av影音资源| 国产成人高清成人av片在线看 | 精品在线一区二区 | 国产在线高清 | 国产精品99久久久久久宅男 | 国产最新精品视频 | 日韩视频免费看 | 欧美日日 | 亚洲视频一区在线观看 | 一区二区三区国产 | 韩国理论电影在线 | 精品视频一区二区三区在线观看 | 国产精品99久久久久久www | 久久成人免费视频 | 亚洲国产精品成人 | 一区二区三区欧美在线观看 | 成人精品一区二区 | 一区二区三区视频在线免费观看 | 国产精品一区二区在线免费观看 | 久久男女视频 | 久久久久久国产 | 中文字幕一区二区三区在线乱码 | 成人二区 | 在线一区二区国产 | 国产一级在线视频 |

<cite id="wecyu"></cite>

<center id="wecyu"></center>

<center id="wecyu"><acronym id="wecyu"></acronym></center><center id="wecyu"></center>

<cite id="wecyu"></cite>

<button id="wecyu"></button>

<button id="wecyu"></button>

<cite id="wecyu"></cite>

<center id="wecyu"><acronym id="wecyu"></acronym></center>

<strike id="wecyu"></strike>