成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

剛剛,DeepSeek開(kāi)源FlashMLA,推理加速核心技術(shù),Star量飛漲中

人工智能 新聞
北京時(shí)間周一上午 9 點(diǎn),剛一上班(同時(shí)是硅谷即將下班的時(shí)候),DeepSeek 兌現(xiàn)了自己的諾言,開(kāi)源了一款用于 Hopper GPU 的高效型 MLA 解碼核:FlashMLA。

上周五,DeepSeek 發(fā)推說(shuō)本周將是開(kāi)源周(OpenSourceWeek),并將連續(xù)開(kāi)源五個(gè)軟件庫(kù)。

第一個(gè)項(xiàng)目,果然與推理加速有關(guān)。

北京時(shí)間周一上午 9 點(diǎn),剛一上班(同時(shí)是硅谷即將下班的時(shí)候),DeepSeek 兌現(xiàn)了自己的諾言,開(kāi)源了一款用于 Hopper GPU 的高效型 MLA 解碼核:FlashMLA。

該項(xiàng)目上線才 45 分鐘就已經(jīng)收獲了超過(guò) 400 star!并且在我們截圖時(shí),Star 數(shù)量正在瘋狂飆升。

image.png

項(xiàng)目地址:https://github.com/deepseek-ai/FlashMLA

眾所周知,MLA是DeepSeek大模型的重要技術(shù)創(chuàng)新點(diǎn),主要就是減少推理過(guò)程的KV Cache,從而實(shí)現(xiàn)在更少的設(shè)備上推理更長(zhǎng)的Context,極大地降低推理成本。

此次 DeepSeek 直接開(kāi)源了該核心技術(shù)的改進(jìn)版本,可以說(shuō)是誠(chéng)意滿滿。

接下來(lái),就讓我看下這個(gè)開(kāi)源項(xiàng)目的核心內(nèi)容。

據(jù)介紹,F(xiàn)lashMLA 是適用于 Hopper GPU 的高效 MLA 解碼內(nèi)核,針對(duì)可變長(zhǎng)度序列服務(wù)進(jìn)行了優(yōu)化。

目前已發(fā)布的內(nèi)容有:

  •  BF16
  •  塊大小為 64 的分頁(yè) kvcache

其速度非常快,在 H800 SXM5 GPU 上具有 3000 GB/s 的內(nèi)存速度上限以及 580 TFLOPS 的計(jì)算上限。

在部署這個(gè)項(xiàng)目之前,你需要的有:

  •  Hopper GPU
  •  CUDA 12.3 及以上版本
  •  PyTorch 2.0 及以上版本

快速啟動(dòng)

  • 安裝
python setup.py install
  • 基準(zhǔn)
python tests/test_flash_mla.py

使用 CUDA 12.6,在 H800 SXM5 上,在內(nèi)存綁定配置下實(shí)現(xiàn)高達(dá) 3000 GB/s,在計(jì)算綁定配置下實(shí)現(xiàn) 580 TFLOPS。

  • 用法
from flash_mla import get_mla_metadata, flash_mla_with_kvcache

tile_scheduler_metadata, num_splits = get_mla_metadata (cache_seqlens, s_q * h_q //h_kv, h_kv)

for i in range (num_layers):
...
o_i, lse_i = flash_mla_with_kvcache (
q_i, kvcache_i, block_table, cache_seqlens, dv,
tile_scheduler_metadata, num_splits, causal=True,
)
...

該項(xiàng)目發(fā)布后也是好評(píng)如潮。

image.png

甚至有網(wǎng)友打趣地表示:「聽(tīng)說(shuō)第五天會(huì)是 AGI」。

image.png

最后,還是那句話:這才是真正的 OpenAI

image.png

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-02-24 10:07:04

2025-02-25 14:07:25

2025-02-26 00:02:59

2025-02-25 12:08:26

2025-02-18 15:13:13

2025-02-21 09:30:00

DeepSeekAI

2011-03-29 10:00:49

開(kāi)源技術(shù)雅虎

2025-03-26 09:00:00

AIDeepSeek軟件架構(gòu)

2025-03-31 08:15:00

LLM大型語(yǔ)言模型人工智能

2022-05-07 14:31:46

物聯(lián)網(wǎng)

2025-06-03 08:45:25

2025-03-07 09:57:01

2025-04-07 07:30:00

模型AI訓(xùn)練

2011-12-20 13:46:16

Facebook開(kāi)源服務(wù)器數(shù)據(jù)中心

2011-05-18 09:32:14

java

2010-06-29 09:06:39

Java思想Java虛擬機(jī)

2009-06-15 17:54:50

Java核心技術(shù)

2022-05-09 08:21:29

Spring微服務(wù)Sentinel

2017-03-08 10:06:11

Java技術(shù)點(diǎn)注解
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 91免费小视频| 蜜月va乱码一区二区三区 | 91免费视频观看 | 国产精品日韩欧美一区二区三区 | 欧美a在线看 | 亚洲 中文 欧美 日韩 在线观看 | 狠狠操狠狠色 | 青娱乐av| 日韩欧美三级在线 | 国产精品毛片无码 | 看羞羞视频免费 | 一区二区三区四区在线 | 欧美亚洲综合久久 | 免费在线视频精品 | 久久久久久九九九九九九 | 日韩精品一区二区三区 | av影音资源| 国产成人高清成人av片在线看 | 精品在线一区二区 | 国产在线高清 | 国产精品99久久久久久宅男 | 国产最新精品视频 | 日韩视频免费看 | 欧美日日 | 亚洲视频一区在线观看 | 一区二区三区国产 | 韩国理论电影在线 | 精品视频一区二区三区在线观看 | 国产精品99久久久久久www | 久久成人免费视频 | 亚洲国产精品成人 | 一区二区三区欧美在线观看 | 成人精品一区二区 | 一区二区三区视频在线免费观看 | 国产精品一区二区在线免费观看 | 久久男女视频 | 久久久久久国产 | 中文字幕一区二区三区在线乱码 | 成人二区 | 在线一区二区国产 | 国产一级在线视频 |