成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一

發(fā)布于 2024-5-7 13:32
瀏覽
0收藏

最新國產開源MoE大模型,剛剛亮相就火了。


DeepSeek-V2性能達GPT-4級別,但開源、可免費商用、API價格僅為GPT-4-Turbo的百分之一。


因此一經發(fā)布,立馬引發(fā)不小討論。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

從公布的性能指標來看,DeepSeek-V2的中文綜合能力超越一眾開源模型,并和GPT-4-Turbo、文心4.0等閉源模型同處第一梯隊。


英文綜合能力也和LLaMA3-70B同處第一梯隊,并且超過了同是MoE的Mixtral 8x22B。

在知識、數學、推理、編程等方面也表現出不錯性能。并支持128K上下文。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

這些能力,普通用戶都能直接免費使用?,F在內測已開啟,注冊后立馬就能體驗。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

API更是是骨折價:每百萬tokens輸入1元、輸出2元(32K上下文)。價格僅為GPT-4-Turbo的近百分之一。


同時在模型架構也進行創(chuàng)新,采用了自研的MLA(Multi-head Latent Attention)和Sparse結構,可大幅減少模型計算量、推理顯存。


網友感嘆:DeepSeek總是給人帶來驚喜!

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

具體效果如何,我們已搶先體驗!

實測一下

目前V2內測版可以體驗通用對話代碼助手

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

在通用對話中可以測試大模型的邏輯、知識、生成、數學等能力。


比如可以要求它模仿《甄嬛傳》的文風寫口紅種草文案。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

還可以通俗解釋什么是量子糾纏。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

數學方面,能回答高數微積分問題,比如:

使用微積分證明自然對數的底e 的無窮級數表示。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

也能規(guī)避掉一些語言邏輯陷阱。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

測試顯示,DeepSeek-V2的知識內容更新到2023年。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

代碼方面,內測頁面顯示是使用DeepSeek-Coder-33B回答問題。


在生成較簡單代碼上,實測幾次都沒有出錯。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

也能針對給出的代碼做出解釋和分析。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

不過測試中也有回答錯誤的情況。


如下邏輯題目,DeepSeek-V2在計算過程中,錯誤將一支蠟燭從兩端同時點燃、燃燒完的時間,計算成了從一端點燃燒完的四分之一。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

帶來哪些升級?

據官方介紹,DeepSeek-V2以236B總參數、21B激活,大致達到70B~110B Dense的模型能力。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

和此前的DeepSeek 67B相比,它的性能更強,同時訓練成本更低,可節(jié)省42.5%訓練成本,減少93.3%的KV緩存,最大吞吐量提高到5.76倍。


官方表示這意味著DeepSeek-V2消耗的顯存(KV Cache)只有同級別Dense模型的1/5~1/100,每token成本大幅降低。


專門針對H800規(guī)格做了大量通訊優(yōu)化,實際部署在8卡H800機器上,輸入吞吐量超過每秒10萬tokens,輸出超過每秒5萬tokens。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

在一些基礎Benchmark上,DeepSeek-V2基礎模型表現如下:

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

DeepSeek-V2 采用了創(chuàng)新的架構。


提出MLA(Multi-head Latent Attention)架構,大幅減少計算量和推理顯存。

同時自研了Sparse結構,使其計算量進一步降低。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

有人就表示,這些升級對于數據中心大型計算可能非常有幫助。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

而且在API定價上,DeepSeek-V2幾乎低于市面上所有明星大模型。

國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一-AI.x社區(qū)

團隊表示,DeepSeek-V2模型和論文也將完全開源。模型權重、技術報告都給出。


現在登錄DeepSeek API開放平臺,注冊即贈送1000萬輸入/500萬輸出Tokens。普通試玩則完全免費。


感興趣的童鞋,可以來薅羊毛了~

體驗地址:??https://chat.deepseek.com???
API平臺:
platform.deepseek.com

GitHub:???https://github.com/deepseek-ai/DeepSeek-V2?tab=readme-ov-file??


本文轉自 量子位 ,作者:量子位


原文鏈接:??https://mp.weixin.qq.com/s/UIZEjY908gP7B4osWoOLgw??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 欧美国产日韩精品 | 久久一级 | 亚洲精品视频二区 | 欧美日韩精品在线免费观看 | 欧美日韩一区在线播放 | 国产成人99久久亚洲综合精品 | 欧美精品成人一区二区三区四区 | 国产91av视频 | 精品亚洲一区二区三区四区五区 | 日日人人 | 激情一区 | 在线91| 中文字幕在线免费 | 天天看逼 | 性做久久久久久免费观看欧美 | 成av在线 | 成人小视频在线观看 | 欧美簧片 | 国产精品性做久久久久久 | 日韩欧美在线观看 | 免费的av网站 | 91高清视频在线 | 综合色在线 | 亚洲欧洲日本国产 | 日韩免费一区二区 | 免费看淫片 | 91九色porny首页最多播放 | 91毛片在线观看 | 欧美在线一二三 | 欧美黄色一区 | 中文字幕乱码视频32 | 亚洲一区二区久久 | 黄色综合 | 国产成人免费 | 99精品观看 | 拍拍无遮挡人做人爱视频免费观看 | 国产乱码精品一区二区三区五月婷 | 九九热在线视频观看这里只有精品 | 精品国产aⅴ | 人操人免费视频 | 视频一区在线播放 |