一手實測DeepSeek-V3-0324,AI編程大躍進
DeepSeek悄悄更新了他們的基座模型。
版本號DeepSeek-V3-0324,參數685B(上一個版本671B)。一如既往,DeepSeek繼續在Hugging Face上開源發布,而且是MIT許可(也就是任何人都可以免費使用、修改、分發和商用這塊模型)。
新模型發布后,很快就成為了Hugging Face上最熱門的開源模型。
體驗地址(關掉深度思考):https://chat.deepseek.com/
我在看到這條消息后,一直猶豫到底要不要寫稿。最后還是決定先睡一覺,讓子彈飛一會兒。
在過去12個小時里,很多同行將它與Claude sonnet 3.7的代碼能力媲美。我覺得這是不對的,從實測來看,DeepSeek-V3-0324的代碼能力與Claude 3.7還有差距,大致與Claude 3.5水平相當。
1.怎么體驗DeepSeek-V3-0324?
首先,訪問DeepSeek官網chat.deepseek.com。
然后,關掉深度思考,會默認啟用DeepSeek-V3-0324基礎模型,就可以體驗了。
比如,我們輸入提示詞:幫我制作一個抽獎頁面,從1-100中隨機抽取。這個頁面叫“沃垠AI抽獎頁面”。畫面背景:全屏Canvas實現的二進制數字瀑布流動畫;熒光綠(#00FF00)配色方案與CRT顯示器視覺效果。
然后,等它生成完整的代碼。根據需求不同,生成時間不同。比如我這個case,DeepSeek大概跑了2分鐘。
生成好后,在html代碼塊的右下角,有一行提示“運行HTML”。
點擊這個圖標,就會進入代碼預覽頁面。
比如,我制作的這個抽獎頁面。
點擊“開始抽獎”,直接就可以使用了。
你也可以將代碼保存為HTML文件,然后在瀏覽器里打開進行預覽;也可以部署到自己的網站上使用。
使用方法:新建一個txt文檔,把代碼復制進來,保存txt文檔,然后將txt文檔的后綴改為.html格式,一份HTML文件就得到了。
這里,我給大家錄了一個演示視頻,你看一眼就明白。
一句話總結:關閉深度思考,即可體驗到DeepSeek-V3-0324模型;點擊“運行HTML”,即可預覽代碼效果。
2.更多實測
在后續使用中,我還測了這些case。
勾選聯網功能,輸入提示詞:查詢成都未來5天的天氣,用代碼寫一張擬態風格的天氣卡片。
今天,我們用DeepSeek-V3-0324模型來做一個中獎展示頁面。
上傳附件,輸入提示詞:這是一個中獎名單,幫我寫一個中獎結果公示頁面,整體風格參考Linear App的簡約現代設計,使用清晰的視覺層次結構,配色專業、和諧。
一起來看下DeepSeek生成的網頁。
Nice,這審美真好看。
也可以生成網站,比如DeepSeek自己的官網。
提示詞:為DeepSeek生成一個官方網站(html),展示公司的發展沿革,科技風,添加適當的微交互效果。
然后,它就自己去寫代碼了。寫了……總共有10來分鐘吧,才終于把完整代碼寫出來,保守估計消耗了10多萬的tokens。
既然花了10分鐘,我倒要看看你到底寫了個啥。
當我點開預覽的那一刻,我驚呆了。。
首頁有粒子特效,發展沿革是時間軸交互,還有導航欄滾動、懸浮、平滑、漸顯動畫以及漸變式標題等各種微交互效果。
這整個網頁,放到任何技術團隊,它不得開發個把周才能上線???
太強了,真的太強了。
這里,也推薦給大家一個做可視化網頁的提示詞(作者:歸藏),大家可根據不同需求進行修改。
我會給你一個文件,分析內容,并將其轉化為美觀漂亮的中文可視化網頁:
## 內容要求
- 所有頁面內容必須為簡體中文
- 保持原文件的核心信息,但以更易讀、可視化的方式呈現
- 在頁面底部添加作者信息區域,包含:
* 作者姓名: [作者姓名]
* 社交媒體鏈接: 至少包含GitHub、Twitter/X、LinkedIn等主流平臺
* 版權信息和年份
## 設計風格
- 整體風格參考Linear App的簡約現代設計
- 使用清晰的視覺層次結構,突出重要內容
- 配色方案應專業、和諧,適合長時間閱讀
## 技術規范
- 使用HTML5、TailwindCSS 3.0+(通過CDN引入)和必要的JavaScript
- 實現完整的深色/淺色模式切換功能,默認跟隨系統設置
- 代碼結構清晰,包含適當注釋,便于理解和維護
## 響應式設計
- 頁面必須在所有設備上(手機、平板、桌面)完美展示
- 針對不同屏幕尺寸優化布局和字體大小
- 確保移動端有良好的觸控體驗
## 圖標與視覺元素
- 使用專業圖標庫如Font Awesome或Material Icons(通過CDN引入)
- 根據內容主題選擇合適的插圖或圖表展示數據
- 避免使用emoji作為主要圖標
## 交互體驗
- 添加適當的微交互效果提升用戶體驗:
* 按鈕懸停時有輕微放大和顏色變化
* 卡片元素懸停時有精致的陰影和邊框效果
* 頁面滾動時有平滑過渡效果
* 內容區塊加載時有優雅的淡入動畫
## 性能優化
- 確保頁面加載速度快,避免不必要的大型資源
- 圖片使用現代格式(WebP)并進行適當壓縮
- 實現懶加載技術用于長頁面內容
## 輸出要求
- 提供完整可運行的單一HTML文件,包含所有必要的CSS和JavaScript
- 確保代碼符合W3C標準,無錯誤警告
- 頁面在不同瀏覽器中保持一致的外觀和功能
請根據上傳文件的內容類型(文檔、數據、圖片等),創建最適合展示該內容的可視化網頁。
3.寫在最后
剛剛(兩小時前),DeepSeek還在Hugging Face上公布了最新模型的評測結果。
給大家簡單介紹下這張圖:
- 在MMLU-Pro基準的語言理解能力上,DeepSeek-V3-0324優于Claude 3.7,僅次于GPT-4.5。
- 在GPQA Diamond基準的圖形問題(幾何)能力上,DeepSeek-V3-0324同樣優于Claude 3.7,僅次于GPT-4.5。
- 在MATH-500基準的數學能力上,DeepSeek-V3-0324是目前最好的模型。以及測數學競賽的AIME 2024基準,DeepSeek-V3-0324更是遙遙領先。
- 最后,在LiveCodeBench基準的編程能力上,DeepSeek-V3-0324也超過了Claude 3.7和GPT-4.5。
簡單說就是:這次更新,DeepSeek大幅優化了自己的代碼能力和數學能力,其網頁設計美感和代碼質量大幅提升。在語言理解能力上(尤其是中文),DeepSeek則繼續保持著自己的優勢。
可以這么說,目前,DeepSeek-V3-0324就是世界前三的基礎模型。
我們知道,有了基礎模型才會有其他,比如推理模型,或者基于基礎模型的一些模型微調、蒸餾等。
DeepSeek此次基模更新,無疑是在為接下來的R2打基礎。
期待“源神”又一次的華麗登臺。
本文轉載自??沃垠AI??,作者:冷逸
