GPU利潤率545%!DeepSeek成本公開:還值得自建算力嗎?
算力成本,大模型時代的“生死線”近日,國產(chǎn)大模型廠商DeepSeek罕見披露了其推理系統(tǒng)DeepSeek-V3/R1的核心架構(gòu)與成本細節(jié):單日GPU租賃成本超8.7萬美元,理論利潤率卻高達545%。這一數(shù)據(jù)讓行業(yè)再次聚焦大模型的核心命題——當(dāng)云廠商提供“水電煤”般的算力時,自建集群是否還有必要?
一、DeepSeek的“吞吐量革命”:專家并行如何顛覆效率?
Diagram of DeepSeek's Online Inference System
DeepSeek-V3/R1的核心目標直指大模型推理的痛點:用更低的延遲,榨出更高的吞吐量。其殺手锏是大規(guī)模跨節(jié)點專家并行(EP):
?專家“分而治之”:每層256個專家中僅激活8個,通過跨節(jié)點分散計算,單卡負載銳減,矩陣乘法效率飆升。
?雙Batch流水線:Prefill階段用雙Batch交替掩蓋通信耗時;Decode階段拆解Attention實現(xiàn)5級流水,通信與計算“無縫銜接”。
?動態(tài)負載均衡:針對不同GPU的請求長度、專家熱度差異,實時平衡計算量、通信量、KVCache內(nèi)存占用,避免“短板效應(yīng)”。
結(jié)果如何? 單臺H800 GPU的吞吐量達到:
- ?輸入73.7k tokens/s(Prefill,含56.3%緩存命中)
- ?輸出14.8k tokens/s(Decode),支撐日均7760億token處理。
二、云上推理的“成本真相”:租賃竟比自建更賺?
Cost And Theoretical Income
DeepSeek的成本賬本揭開了一個反直覺結(jié)論:租用云GPU,反而比自建集群更“暴利”。
- ?成本結(jié)構(gòu):日均租賃278節(jié)點(2222塊H800),成本8.7萬美元;理論收入達56.2萬美元,利潤率545%。
- ?彈性優(yōu)勢:白天流量高峰全節(jié)點推理,夜間縮容用于訓(xùn)練研究,無需為閑置算力買單。
- ?定價策略:按需使用云廠商的運維、網(wǎng)絡(luò)、故障冗余能力,邊際成本近乎為“零”。
- 行業(yè)啟示錄:云廠商的規(guī)模化效應(yīng),已讓自建集群的“重資產(chǎn)模式”失去性價比。正如DeepSeek所暗示——“33%毛利的生意不值得做,不如白嫖云廠商的基建”。
三、自建VS租賃:大廠的兩難選擇
盡管云租賃經(jīng)濟性占優(yōu),但大廠仍有兩大“難言之隱”:
1.可用性焦慮:高峰期搶不到資源?核心業(yè)務(wù)宕機損失遠超成本。
2.數(shù)據(jù)安全心結(jié):即便有“專機專用”“數(shù)據(jù)不出域”方案,領(lǐng)導(dǎo)仍可能認為“機器搬進自家機房才安心”。
現(xiàn)實魔幻一幕:某算力平臺為說服客戶,最終將服務(wù)器拆下直接送到甲方辦公室——這本質(zhì)上仍是“變相自建”,卻折射出行業(yè)對數(shù)據(jù)安全的極致偏執(zhí)。
四、未來展望:算力會像電力一樣“即插即用”嗎?
DeepSeek的實踐指向一個未來:
- ?算力電網(wǎng)化:廠商只需關(guān)注“接網(wǎng)能力”,無需自建發(fā)電廠(GPU集群)。
- ?云廠商“工具化”:提供標準化、高彈性的算力單元,成為大模型時代的“基建底座”。
但有一個前提:云服務(wù)的穩(wěn)定性、安全性必須無限接近“自建體驗”,否則巨頭們?nèi)詴鹤⒖煽匦愿叩乃接屑骸?/p>
結(jié)語:成本與控制的博弈,遠未終局
DeepSeek的案例證明,云租賃已是大模型商業(yè)化的最優(yōu)解。但對巨頭而言,是否交出算力控制權(quán),仍是戰(zhàn)略級抉擇。或許未來的答案不在“二選一”,而在于混合云——讓核心數(shù)據(jù)留在本地,邊緣計算擁抱云端。這場博弈,才剛剛開始。
引用鏈接
??[1]?
?? deepseek-ai/open-infra-index: ???https://github.com/deepseek-ai/open-infra-index??
本文轉(zhuǎn)載自??云原生AI百寶箱??,作者:云原生AI百寶箱
