新版DeepSeek R1你得這樣用,太爽啦~
昨天下午下班后,DeepSeek R1更新了
然而他們就只是悄悄在微信群里面發布了這個消息。
說是一個小版本試升級
于是我帶著強烈的好奇走上了這條一波三折的測評之路。
心情真的是起起伏伏
我一開始測試了好幾個Case,有寫作的,有代碼的,有數學的。
初步覺得效果確實有提升,程度比官方說的高一點,但是離頂尖模型Claude4還是有明顯差距。
比如測試生成的城市智慧交通大數據可視化監控平臺
上邊是新版DeepSeek R1,下邊是Claude4
圖片
又比如下面這個,全球氣候變化數據分析平臺
上邊是新版DeepSeek R1,下邊是Claude4
圖片
圖片
是不是看起來還是有明顯差距捏,而且Claude生成的網頁是真的有數據交互的,會變化。新版DeepSeek R1的幾乎沒有
當時看到其他幾位博主發的文章都是在吹DeepSeek的,瞬間感覺他們吹的有點過了?
測著測著,才發現不太對勁,DeepSeek R1是推理模型,我不應該給跟Claude4一樣的復雜提示詞呀!
比如下面這樣:
臥槽!才想起來DeepSeek R1是不需要結構化復雜提示詞的。
簡單一句話就能搞定
于是我立馬換一句話提示詞重跑了剛才的那些Case
果然,生成效果簡直是質的飛躍~
比如下面這個天氣數據分析平臺,一句話搞定
我吶個豆,這提示詞搞復雜了是得多限制R1的發揮呀,改成一句話之后效果提升非常多。
為了防止是偶然現象,我又跑了城市智慧交通大數據可視化監控平臺的Case,還是一句話
對比一下之前的生成效果,這檔次和審美是不是瞬間都上去了
而且生成一個這種大魚吃小魚的游戲,也是手拿把掐
提示詞同樣是一句話
請為我開發一個簡單但有趣的"大魚吃小魚"HTML5網頁游戲
最近都去用gemini2.5 Pro和Claude4去了,好久沒用DeepSeek R1,把R1的這個提示詞平權能力忘了。
一句話搞定,真滴太爽了,說多了反而限制它的發揮。
這對大部分普通人來說簡直是福音。
雖然是一句話,但也要盡量表達清楚需求哦
實測下來我的結論是代碼能力大幅提升,確實不輸Claude4了,可能還差那么一丟丟,但是已經非常接近。
大概率是用3月新發布的DeepSeek-V3-0324升級的R1,V3的0324就是代碼能力大幅增強,所以這次的新版R1,代碼和審美上的增強非常明顯。
寫作能力感覺有小幅提升,然后數學能力貌似提升不大,因為給了之前測過的一些比較難的奧數題,跑了半天還是沒有給出正確答案。
不過,說實話,拿一個推理模型跟人家的基座模型Claude4比,其實已經輸了...
但是我相信DeepSeek不久之后還會再創輝煌,靜靜等待R2的到來吧~
本文轉載自??袋鼠帝 AI 客棧??,作者:袋鼠帝 AI 客棧
