DeepSeek官方發布R1模型推薦設置,這才是正確用法
自春節以來,DeepSeek 就一直是 AI 領域最熱門的關鍵詞,甚至可能沒有之一,其官方 App 成為了史上最快突破 3000 萬日活的應用。最近一段時間,各家 AI 或云服務廠商更是掀起了部署 DeepSeek-R1 服務的狂潮,甚至讓薅羊毛的用戶們都有點忙不過來了。
就在剛剛,DeepSeek 官網 X 帳號終于更新了(上一次更新還是在 1 月 28 日),官方下場推薦了部署 DeepSeek-R1 的設置。DeepSeek 強調官方部署的版本跟開源版本模型完全一致。
剛剛發出,就吸引了全網圍觀。
內容不多,分為四項。
第一項是:不要使用系統提示詞。這個建議其實已經被很多開發者提出過了。
第二項是:溫度參數設置為 0.6。至于原因,DeepSeek-R1 項目中寫到:「將溫度設置在 0.5-0.7 范圍內(建議為 0.6),以防止無休止的重復或不連貫的輸出。」
第三項,DeepSeek 分享了用于搜索和文件上傳的官方提示詞。
對于文件上傳,建議用戶按照模板創建提示,其中 {file_name}、{file_content} 和 {question} 是參數。
filetemplate = \ """[file name]: {filename} [file content begin] {file_content} [file content end] {question}"""
對于網頁搜索,參數包括 {search_results}、{cur_data} 和 {question} 。
對于中文查詢,使用的提示詞是:
對于英文查詢,使用的提示詞是:
第四項則是一個指南,說明了可以如何緩解模型繞過思考的問題。DeepSeek 寫到:「我們觀察到 DeepSeek-R1 系列模型在響應某些查詢時傾向于繞過思考模式(即輸出 <think>\n\n</think>),這可能會對模型的性能產生不利影響。為了確保模型進行徹底的推理,我們建議強制模型對每個輸出都以 <think>\n 為其響應的開頭。」
雖然這一次實際上就只是更新了 DeepSeek-R1 項目的 README.md 文件,但依然收獲了不少好評。
當然,也有用戶對 DeepSeek 官方推薦的設置有所困惑:
最后,雖然這種開源奉獻精神令網友們感動,不過,大家當前最大的痛還是這個: