成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

三分鐘學(xué)會(huì)計(jì)算DeepSeek的顯存內(nèi)存配置

人工智能
讓我們的程序也能借船出海搭上AI的快車,那么問題來了。如果我需要本地部署一個(gè)大模型需要什么配置的電腦呢?

DeepSeek本地部署

前段時(shí)間DeepSeek震驚了全世界。

不容易啊!終于國(guó)內(nèi)有了自己的精品。

圖片圖片

但訪問過程中頻繁的 “服務(wù)器繁忙”,也讓很多人嘗而不得作為技術(shù)人員都在考慮如何充分利用開源的價(jià)值。

讓我們的程序也能借船出海搭上AI的快車,那么問題來了。如果我需要本地部署一個(gè)大模型需要什么配置的電腦呢?

顯卡、顯存怎么選配

模型的大小,決定了對(duì)硬件的需求。以 DeepSeek-R1 為例,1.5b、7b、32b、70b、671b 之間差距非常大。

圖片圖片

很多人埋怨說:我的大模型就是個(gè)“人工智障”,但你得反過來檢視一下是不是用的模型參數(shù)太少了?

我們談?wù)揂模型比B模型強(qiáng)大前提都是在同一個(gè)體量上,拿 7b 模型 對(duì)比 405b 模型本身就不是一個(gè)級(jí)別體量的。

官方給了一個(gè)模型版本和配置的對(duì)應(yīng)表:

如下:

參數(shù)量

FP16 顯存占用

INT8 顯存占用

INT4 顯存占用

1.5B

3.0GB

1.5GB

0.75GB

7B

14.0GB

7.0GB

3.5GB

8B

16.0GB

8.0GB

4.0GB

14B

28.0GB

14.0GB

7.0GB

32B

64.0GB

32.0GB

16.0GB

70B

140.0GB

70.0GB

35.0GB

671B

1342.0GB

671.0GB

335.5GB

比較直觀是吧!前幾天看到梁斌博士自己搭建了一個(gè)滿血版DeepSeek 671b 最強(qiáng)模型花了多少錢呢?

配置如下:

CPU
    AMD EPYC 9534 
    64核 128線程,2.5 GHz
    一共 2塊CPU 共128核
GPU
    AMD MI300X
    192 G
    一共 8塊GPU 共 1536 G 顯存
內(nèi)存
    1526 G

效果如下:

圖片圖片

這么一臺(tái)服務(wù)器下來250萬打底,還只是AMD的配置。畢竟 MI300 系列還是數(shù)據(jù)高性價(jià)比的產(chǎn)品換成 NVEDIA 的 H100 或者 A100價(jià)格至少上升 50%。

普通使用需要什么配置

我們大部分人都不追求極限,你們大佬用 671b 的我用個(gè) 7b 或者 32b 的就差不多了,但要如何計(jì)算配置?

網(wǎng)上有各種各樣的教材需要你理解 int8、fp16、float32 等等專業(yè)術(shù)語和公式。

圖片圖片

最簡(jiǎn)單的方法

直接抄我的答案:用 參數(shù)量 ?? 系數(shù) 即可。常見的有int4 代表4位 系數(shù)0.5, int8 代表 8位 系數(shù)為1,fp16 代表16位 系數(shù)為2, float32 代表 32位 系數(shù)為4。

怎么看系數(shù)?如果我們是通過ollama下載的模型,打開下載頁。

圖片圖片

在 model 欄目會(huì)寫一個(gè)參數(shù):

quantization Q4_K_M

Q4 代表4位量化版本可以對(duì)標(biāo) int4,實(shí)際略高于 int4。如果按 int4 的系數(shù)取 0.5,這里可以估算在 0.7 ~ 0.8 左右,如果估算 DeepSeek 的 Q4 量化版本型數(shù)據(jù)推理以及10個(gè)線程的并發(fā)請(qǐng)求,我們系數(shù)取 0.8。所以,比如 計(jì)算 DeepSeek 14b 版本默認(rèn) fp16,則顯存需求為 14 ?? 0.8 = 11.2 G。

在滿足顯存的同時(shí)內(nèi)存用量最好為顯存的2倍用于加載模型和計(jì)算緩沖。以下給出幾個(gè)計(jì)算好的顯存數(shù)值,都是以 DeepSeek-R1 Q4量化版 為例的最低配置。

參數(shù)量

顯存

671B

536 GB

70B

56 GB

14B

11.2 GB

7B

5.6 GB

1.5B

1.2 GB

所以哪怕我們就是個(gè)普通的電腦跑個(gè)乞丐版 1.5b 通常問題不大,需要注意這里做了減法只包含基礎(chǔ)運(yùn)行和1個(gè)線程本地調(diào)用,如果需要更多訪問推理請(qǐng)適當(dāng)增加系數(shù)。

當(dāng)然我給的方法只是粗算:

可以進(jìn)入 https://huggingface.co/spaces/hf-accelerate/model-memory-usage

這個(gè)網(wǎng)站有個(gè)在線計(jì)算器,如圖:

圖片圖片

只要提供各項(xiàng)參數(shù)即可計(jì)算出配置要求,需要的朋友們可以自己嘗試一下。

責(zé)任編輯:武曉燕 來源: Java面試教程
相關(guān)推薦

2024-04-01 09:59:08

消息隊(duì)列通信微服務(wù)

2009-11-17 10:13:29

PHP正則表達(dá)式

2009-10-26 19:09:50

VB.NET轉(zhuǎn)換形態(tài)

2024-03-07 07:38:59

微服務(wù)HTTP客戶端

2021-10-22 09:09:43

Windows 11操作系統(tǒng)微軟

2024-03-28 08:07:42

RabbitMQ訂閱模式

2024-03-11 09:03:12

客戶端負(fù)載均衡Ribbon

2021-04-20 13:59:37

云計(jì)算

2024-04-02 08:27:19

異步任務(wù)抽象

2020-06-29 07:42:20

邊緣計(jì)算云計(jì)算技術(shù)

2024-05-16 11:13:16

Helm工具release

2009-11-09 12:55:43

WCF事務(wù)

2024-12-18 10:24:59

代理技術(shù)JDK動(dòng)態(tài)代理

2024-08-30 08:50:00

2022-02-17 09:24:11

TypeScript編程語言javaScrip

2024-01-16 07:46:14

FutureTask接口用法

2023-12-27 08:15:47

Java虛擬線程

2020-06-30 10:45:28

Web開發(fā)工具

2013-06-28 14:30:26

棱鏡計(jì)劃棱鏡棱鏡監(jiān)控項(xiàng)目

2024-08-05 09:05:44

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 精品视频在线免费观看 | 欧美日韩电影一区二区 | 先锋资源站| 中文字幕二区 | 国产视频福利在线观看 | 三级在线视频 | 日本黄色影片在线观看 | 嫩草视频在线看 | 在线观看成人小视频 | 久久国产成人精品国产成人亚洲 | 国产免费av在线 | 久久久久久黄 | 欧美日韩视频 | 久久久免费观看视频 | 看片国产 | 欧美日本韩国一区二区三区 | 久久久五月天 | 中文字幕亚洲区一区二 | 久久久久久高潮国产精品视 | 久久91| 三级高清 | 欧美一区二区三区久久精品视 | 国产99久久精品一区二区永久免费 | 成人三级在线观看 | 日本人爽p大片免费看 | 色888www视频在线观看 | 国产精品久久99 | 欧美一级片 | 欧美日韩精品国产 | 日韩视频在线一区 | 国产日韩av一区二区 | 亚洲精品一区二区三区在线 | 久久久女女女女999久久 | 国产午夜精品久久 | 免费毛片网站在线观看 | 九九热免费看 | 精品国产精品三级精品av网址 | www.日韩 | 日韩欧美精品在线 | 国产成人免费视频 | 91视频进入 |