DeepSeek Coder V2開源發布,首超GPT4-Turbo代碼能力
去年11月,最強開源代碼模型 DeepSeek-Coder 亮相,大力推動開源代碼模型發展。
今年5月,最強開源 MoE 模型 DeepSeek-V2 發布,悄然引領模型結構創新潮流。
今天,全球首個在代碼、數學能力上與GPT-4-Turbo爭鋒的模型,DeepSeek-Coder-V2,正式上線和開源。
全球頂尖的代碼、數學能力
DeepSeek-Coder-V2 沿用 DeepSeek-V2 的模型結構,總參數 236B,激活 21B,在代碼、數學的多個榜單上位居全球第二,介于最強閉源模型 GPT-4o 和 GPT-4-Turbo 之間。
國內第一梯隊的通用能力
在擁有世界前列的代碼、數學能力的同時,DeepSeek-Coder-V2 還具有良好的通用性能,在中英通用能力上位列國內第一梯隊。
DeepSeek-Coder-V2 和 DeepSeek-V2 的差異
雖然 DeepSeek-Coder-V2 在評測中綜合得分更高,但在實際應用中,兩個模型各有所長。DeepSeek-V2 是文科生,DeepSeek-Coder-V2 是理科生,精通的技能點不同:
全面開源,兩種規模
一如既往,DeepSeek-Coder-V2 模型、代碼、論文均開源,免費商用,無需申請。
模型下載:
??https://huggingface.co/deepseek-ai??
代碼倉庫:
??https://github.com/deepseek-ai/DeepSeek-Coder-V2??
技術報告:
??https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf???
開源模型包含236B和16B兩種參數規模
- DeepSeek-Coder-V2:總參 236B(即官網和 API 版模型),單機 8*80G 可部署,單機 8*80G 可微調(需要技巧)
- DeepSeek-Coder-V2-Lite:總參 16B,激活 2.4B,支持 FIM,代碼能力接近 DeepSeek-Coder-33B(V1),單卡 40G 可部署,單機 8*80G 可訓練。
API服務
DeepSeek-Coder-V2 API 支持 32K 上下文,價格和 DeepSeek-V2 一致,還是大家熟悉的低價:
DeepSeek 提供本地私有化部署服務,標準化成品交付,開箱即用,輕松升級。
價格 45 萬/套/年,支持靈活的商務方案(登錄官網,聯系客服)。
價格包含:
- 一臺推理訓練一體化的高性能服務器(Nvidia H20、Huawei 910B 或其它同級別顯卡,8 顯卡互聯)。
- 模型:DeepSeek-V2-236B、Coder-V2-236B、后續其它模型。
- 一站式軟件套件:推理、微調、運維等。
- 對每個客戶,DeepSeek 均會針對應用場景,使用公開數據、脫敏數據進行訓練和調優。客戶可以使用私有數據進一步微調。
- 不低于 5 人日/年的技術支持。
預期性能:
- ?輸入:20000 tokens/s
- 輸出:5000~10000 tokens/s
官網已上線 DeepSeek-Coder-V2
?
訪問對話官網:coder.deepseek.com,與 DeepSeek-Coder-V2 永久免費暢聊。
訪問開放平臺:platform.deepseek.com,使用最新 DeepSeek-Coder-V2 API。
DeepSeek 當下與未來
上月 DeepSeek-V2 發布后,深度求索以其卓越的性價比贏得贊譽。但我們的終極目標,始終是打造性能最強大的模型,Coder-V2 的推出,正是向這一愿景邁進的關鍵一步。我們相信,只有強大的模型能力、普惠的技術應用,才能開啟人工智能發展的新篇章。
我們共同的星辰大海是 AGI。
敬請期待,下次發布,未來已來!
本文轉自 AIGC開放社區 ,作者:AIGC開放社區
