比OpenAI官方提示詞指南更全，這26條黃金準則讓LLM性能飆升50%以上

作者：機器之心 2024-02-05 13:09:00

今天，穆罕默德?本?扎耶德人工智能大學 VILA Lab 帶來了一項關于如何更好地為不同規模的大模型書寫提示詞（prompt）的研究，讓大模型性能在不需要任何額外訓練的前提下輕松提升 50% 以上。該工作在 X (Twitter)、Reddit 和 LinkedIn 等平臺上都引起了廣泛的討論和關注。

論文地址: https://arxiv.org/abs/2312.16171
Github地址: https://github.com/VILA-Lab/ATLAS
論文標題：Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4

在以 ChatGPT 為首的大模型出來之后，為大語言模型設計提示詞的研究已經成為一個重要的研究方向，包括 OpenAI 官方也出品了針對 ChatGPT 用戶的提示工程指南 [1] ，其包含了六條書寫準則：1）寫出清晰的指令；2）提供參考文本；3）將復雜的任務拆分為更簡單的子任務；4）給模型時間「思考」；5）使用外部工具；6）系統地測試更改。

由此可見，提示詞對于如何更好地使用大模型以及得到滿意的回答都具有重要的意義。然而可以看到的是，OpenAI 提供的這些準則都是比較寬泛和保守的，并沒有涉及到一些具體的操作和技巧。

今天要介紹的這篇文章提供了更多也更加接地氣的提示工程指南，足足有 26 條之多，內容涵蓋了：1）回答內容和語言風格的控制；2）提示詞結構和清晰度；3）復雜任務和代碼提示；4）回答特異性和信息量；5）用戶交互和參與等多個方面。

下面讓我們來逐條討論一下這些提示詞準則：

1) 如果您更喜歡更簡潔的答案，則無需對 LLM 保持禮貌，因此無需添加諸如「請」、「如果你不介意」、「謝謝」、「我愿意」等，直奔主題即可。

2) 在提示中融入目標受眾，例如該領域的專家。具體而言，當你告訴大模型你的目標受眾是一個孩子，它的回答會更加通俗易懂，當你告訴它受眾是這個領域的專家，它會提供更加專業和深入的解釋。

3) 在交互式對話中將復雜的任務分解為一系列更簡單的提示。

4) 使用肯定的指令，如「做」，同時避免使用「不要」等否定性語言。

5) 當您需要簡單清晰或更深入地了解某個主題、想法或任何信息時，請利用以下提示：

用簡單的術語解釋 [插入特定主題]。
像我是 11 歲一樣向我解釋這個問題。
向我解釋，就好像我是 [領域] 的初學者一樣。
用簡單的英語寫 [文章 / 文本 / 段落]，就像你在向一個 5 歲的孩子解釋一些事情一樣。

6) 添加「我要給 $xxx 小費以獲得更好的解決方案！」這種提示詞會帶來提升的原因可能是：在訓練數據中，當涉及到回答是有獎勵的，回答的人往往會更加準確細致，小心謹慎地提供答案，大模型從這些網絡數據中學到了這些結構和方式。

7) 實現示例驅動的提示（使用少樣本提示）。

8) 格式化提示時，以「###Instruction###」開頭，然后是「###Example###」或「###Question###」（如果相關）。隨后展示您的內容。使用一個或多個換行符用于分隔指令、示例、問題、上下文和輸入數據。

9) 在你的提示詞里面加入以下短語：「你的任務是」和「你必須」。

10) 在你的提示詞里面加入以下短語：「你會受到懲罰」。

11) 在提示中使用「以自然、類似人類的方式回答問題」這句話。

12) 使用引導性詞語，例如寫「一步一步地思考」。

13) 在提示中加上以下短語：「確保你的回答是公正的，避免依賴刻板印象」。

14) 讓模型通過向你提問來引出你精確的細節和要求，直到他得到足夠的信息來提供所需的輸出（例如，「從現在開始，我希望你問我......」提問）。

15) 要詢問特定主題或想法或任何信息，并且您想測試您的理解，您可以使用以下短語：「教我任何 [定理 / 主題 / 規則名稱]，并在末尾包含一個測試，并讓我知道是否在我回答后，我的答案是正確的，不要事先提供答案。」

16) 為大型語言模型分配角色。

17) 使用分隔符。

18) 在提示中多次重復特定單詞或短語。

19) 將思維鏈（CoT）與 few-Shot 提示相結合。

20) 使用輸出引導，包括用所需輸出的開頭結束提示。利用輸出引導，以預期響應的開頭結束提示。

21) 如果任務是寫一篇文章 / 文本 / 段落或任何類型的文本，同時需要盡可能的詳細，可以添加提示詞：「寫一篇詳細的 [論文 / 文本 / 段落]，通過添加所有必要的信息從而使我能詳細了解 [主題]。」

22) 在不改變其樣式的情況下更正 / 更改特定文本：嘗試修改用戶發送的每個段落。你應該只提高用戶的語法和詞匯量，并確保它聽起來很自然。您應該保留原始寫作風格，確保正式段落保持正式。

23) 當您有一個復雜的編程提示時，該提示可能位于不同的文件中：「從現在開始，每當您生成跨越多個文件的代碼，生成一個可以自動運行的 [編程語言 ] 腳本，創建指定的文件或對現有文件進行更改以插入生成的代碼。[你的問題]」。

24) 當您想使用特定單詞、短語或句子開始或繼續文本時，請使用以下方法提示：

我為你提供開頭 [歌詞 / 故事 / 段落 / 散文...]：[插入歌詞 / 單詞 / 句子]。根據提供的單詞完成它。保持內容風格一致。

25) 明確說明模型必須遵循的要求去生成內容，以關鍵字、規定、提示或說明的形式。

26) 如果要編寫任何文本，例如文章或段落，并且需要與提供的示例相似，請包括下面提示語句：

根據提供的段落使用相同的語言 [/title/text/essay/answer]。

以下是一些具體的提示詞例子和對應的 GPT-4 輸出結果：

1. 當我們詢問 GPT-4 問題的時候，最后可以加上一句「提供公正的解釋，突出科學證據和不同觀點。」可以看到加上該提示詞之后 GPT-4 的回答明顯會更加豐富和有深度。

2. 我們可以提供一些示例讓模型更好的理解我們的目標和出發點。

3. 我們可以告訴模型用簡單的方法來回答問題，就像是在向一個 5 歲的孩子解釋一些事情。可以看到加上和不加這個提示詞，模型的回復在理解困難程度上有明顯的差別。

4. 我們可以通過給模型小費的方式，讓模型更加嚴謹完善的回答問題。

定量實驗結果：

1. 模型回答質量提升比例：該指標表示在使用提示詞原則后，問題的回答質量提高的百分比。

可以看到所有提示詞原則在人工評測中都取得了或多或少的提升，其中原則 14 獲得了 100% 的提升，意味著所有問題通過使用該提示原則都獲得了提升。與此同時，原則 1 得到的提升相對較少。

2. 回復正確性提升：正確性指模型輸出或回答的精度，判斷標準是回答是否準確、相關且沒有錯誤的。本文同時考慮了不同模型的絕對正確性和相對正確性提升兩個指標。

上圖結果為加入提示原則后，大模型回復質量的相對正確性提升。「small」表示 7B 模型，「medium」表示 13B 模型，「large scale」表示 70B 和 GPT-3.5/4 模型。可以看到大模型在使用提示詞原則后，提升幅度相對于小模型和中等模型會更加顯著。

3. 單獨每個模型準確度提升比例：

上圖是每個不同大小的模型相對提升幅度，可以看到類似的現象，模型越大，對于提示詞的響應和回復也越加敏銳，準確性提升也相對越大。

4. 下圖是不同大小模型對于每條提示詞原則準確度提升大小具體結果：

提示詞準則數據集：

本文在介紹 26 條提示詞準則的同時，還附帶發布了一個基于準則提示詞的基準，其中每條準則作者準備了 20 個不同的問題，每個問題同時包含帶有準則和不帶準則兩種對應的大模型回復。

該數據集可以用在：1）大語言模型對于提示詞響應的性能評測；2）偏好驅動的大模型微調。

數據集鏈接：https://github.com/VILA-Lab/ATLAS。

更多提示詞原則使用方法和說明，歡迎閱讀原文。

責任編輯：張燕妮來源：機器之心

AI 數據

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

比OpenAI官方提示詞指南更全，這26條黃金準則讓LLM性能飆升50%以上