成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<rt id="wua00"><pre id="wua00"></pre></rt>

<sup id="wua00"></sup>

<nav id="wua00"></nav>

<center id="wua00"><acronym id="wua00"></acronym></center>

<li id="wua00"><tbody id="wua00"></tbody></li>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

提示工程：更好地釋放LLM的能力

作者：greencoatman 2024-11-27 10:23:31

雖然大模型知識(shí)豐富，但它并不是無所不知的，尤其是它對(duì)我們要完成的工作甚至是一無所知的。這時(shí)，我們只要給它一些例子，幫助它理解我們的工作內(nèi)容，它就能很好地進(jìn)行推理。

提示工程，正如其名，主要聚焦于探究如何創(chuàng)作提示詞。

存在提示工程的一個(gè)關(guān)鍵緣由在于，大模型在不同人群的視角下所發(fā)揮的作用差異顯著。普通使用者往往僅將大模型視作聊天機(jī)器人，他們著重關(guān)注的是大模型能否迅速且精準(zhǔn)地予以反饋。就像我們之前提及的提示詞公式，其足以應(yīng)對(duì)絕大多數(shù)日常使用情境。

然而在開發(fā)者的視野里，他們期望大模型具備處理復(fù)雜任務(wù)場(chǎng)景的能力。例如當(dāng)下眾多 Agent 背后所依托的技術(shù)，便是借助大模型的推理能力推斷出下一步行動(dòng)，而這一過程高度依賴提示詞的精心編寫。

多數(shù)人是先知曉 ChatGPT，而后才了解提示詞，進(jìn)而認(rèn)識(shí)提示工程。實(shí)際上，提示工程并非在 GPT 風(fēng)靡之后才出現(xiàn)的新技術(shù)。它最早源自自然語言處理（Natural Language Processing，簡(jiǎn)稱為 NLP）領(lǐng)域。當(dāng)時(shí)人們就察覺到，在任務(wù)執(zhí)行進(jìn)程中，若能給予 AI 適宜的引導(dǎo)，AI 便能更為精準(zhǔn)地領(lǐng)會(huì)我們的意圖，并遵循指令作出響應(yīng)。于是，怎樣對(duì) AI 進(jìn)行有效引導(dǎo)便成為眾多研究者的探索方向，提示工程也就此應(yīng)運(yùn)而生。

在 GPT 廣泛流行之后，人們驚喜地發(fā)現(xiàn)相同的技術(shù)對(duì)大模型同樣行之有效，所以越來越多的人開始將目光投向提示工程。

從技術(shù)本質(zhì)來講，為大模型提供的背景信息越豐富，就越有利于大模型理解我們的意圖，而我們向大模型傳遞信息的主要途徑便是借助提示詞。從某種程度而言，之前所闡述的提示詞公式可被視為提示詞工程的一個(gè)典型示例，依據(jù)此公式，我們能夠?yàn)榇竽Ｐ吞峁┢渫评硭匦璧母黝愋畔ⅰ?/span>

至此，大家應(yīng)該已經(jīng)對(duì)提示工程有了一個(gè)初步的認(rèn)知。接下來，就讓我們一同來了解幾個(gè)提示工程中的典型技術(shù)。

零樣本提示（Zero-Shot Prompting）

前面我們說過，大模型的一個(gè)特點(diǎn)是知識(shí)豐富，所以，大模型本身是知道很多東西的。我們就可以利用這個(gè)特點(diǎn)，讓它幫我們做一些通用的事情。在這種情況下，我們不需要給大模型過多的信息提示，這種提示詞的寫法稱為零樣本提示（Zero-Shot Prompting）。

我們來看一個(gè)例子：

圖片

在當(dāng)前這個(gè)實(shí)例當(dāng)中，我們期望大模型執(zhí)行一項(xiàng)文本分類的任務(wù)，即判定文本內(nèi)容究竟屬于中性、負(fù)面還是正面類別?？梢悦黠@看出，大模型自身已然知曉分類的概念，并且清楚應(yīng)當(dāng)如何依據(jù)文本內(nèi)容來評(píng)判其情感傾向。因此，在這個(gè)特定的例子里，即便我們未額外提供更多的提示信息，大模型也能夠出色地完成分類任務(wù)。

零樣本提示在提示工程領(lǐng)域?qū)儆谙鄬?duì)易于理解的一項(xiàng)技術(shù)，它尤其適用于較為簡(jiǎn)單的任務(wù)場(chǎng)景。舉例來說，某些簡(jiǎn)單的查詢操作便能夠運(yùn)用零樣本提示來達(dá)成。在此過程中，我們所需做的僅僅是對(duì)提示詞加以適當(dāng)調(diào)整，從而使大模型能夠更為精準(zhǔn)地返回我們所期望的內(nèi)容。

不過，在某些情況下，我們所面臨的任務(wù)并非具有普遍通用性，此時(shí)零樣本提示便難以發(fā)揮作用。于是，我們可以向大模型提供一些具體的例子，以此助力大模型更好地理解任務(wù)要求，而這便是我們接下來即將探討的另一項(xiàng)提示技術(shù) —— 少樣本提示。

少樣本提示（Few-Shot Prompting）

雖然大模型知識(shí)豐富，但它并不是無所不知的，尤其是它對(duì)我們要完成的工作甚至是一無所知的。這時(shí)，我們只要給它一些例子，幫助它理解我們的工作內(nèi)容，它就能很好地進(jìn)行推理。下面是一個(gè)例子：

圖片

在該示例中，老師需要依據(jù)學(xué)習(xí)成績(jī)來規(guī)劃學(xué)生的假期活動(dòng)，而活動(dòng)的詳細(xì)內(nèi)容大模型預(yù)先無從知曉。在此情形下，我們運(yùn)用了少樣本提示方法，即提供了若干具體實(shí)例：對(duì)于成績(jī)?cè)?85 分及以上的學(xué)生，安排預(yù)習(xí)下學(xué)期課程；成績(jī)處于 60 至 85 分區(qū)間的，要求完成假期作業(yè)；成績(jī)低于 60 分的，則需復(fù)習(xí)本學(xué)期課程內(nèi)容。

有了這些示例后，我們便可向大模型提出具體問題：小剛的期末成績(jī)?yōu)?74 分，那么他的假期活動(dòng)應(yīng)當(dāng)是什么？大模型參照我們給出的實(shí)例進(jìn)行推理，進(jìn)而得出結(jié)論：小剛的期末成績(jī)是 74 分，其假期活動(dòng)應(yīng)為完成假期作業(yè)。

或許看到此例，你會(huì)心生疑惑，我們?yōu)楹螘?huì)以這樣的方式與大模型交流呢？實(shí)際上，這并非我們?nèi)粘５牧奶炷Ｊ?，而是一種應(yīng)用的構(gòu)建方式。我們會(huì)將前面的示例作為提示詞的固定組成部分，而后面的問題則依據(jù)用戶的實(shí)際提問進(jìn)行拼接。在后續(xù)講解 LangChain 時(shí)，會(huì)涉及一個(gè)名為提示詞模板（PromptTemplate）的概念，其用途便是用于拼接提示詞。此刻，你應(yīng)該能夠明白為何我們強(qiáng)調(diào)本講所涉及的提示工程內(nèi)容均屬于技術(shù)范疇了。

少樣本學(xué)習(xí)在簡(jiǎn)單分類場(chǎng)景中頗為有效，但它也存在顯著的局限性。例如，在一些復(fù)雜的推理任務(wù)里，它就難以應(yīng)對(duì)。于是，便有了下一項(xiàng)提示詞技術(shù) —— 思維鏈。

思維鏈提示（Chain-of-Thought Prompting）

大模型本質(zhì)上屬于語言模型，其優(yōu)勢(shì)顯著體現(xiàn)在語言處理能力方面。然而，換個(gè)視角審視，大模型在數(shù)學(xué)與推理等領(lǐng)域確實(shí)存在短板。我們常常會(huì)察覺到，大模型在面對(duì)一些簡(jiǎn)易數(shù)學(xué)問題時(shí)容易出錯(cuò)，就像判斷 3.8 和 3.11 的大小這種基礎(chǔ)問題（值得一提的是，各個(gè)大模型都在持續(xù)努力修正已發(fā)現(xiàn)的此類問題）。

依我之見，大模型的表現(xiàn)往往是言語反應(yīng)快于思考過程，常常未經(jīng)深思熟慮就給出回應(yīng)。為促使大模型更出色地履行任務(wù)，我們有必要引導(dǎo)它放緩回應(yīng)速度，避免僅憑直覺作答，而是要激發(fā)其理性思維，使其能夠更加嚴(yán)謹(jǐn)、準(zhǔn)確地處理問題并提供答案。

圖片

在這一實(shí)例中，左右兩側(cè)均旨在獲取數(shù)學(xué)題的答案，并且所采用的樣例題目相同。二者的區(qū)別在于，標(biāo)準(zhǔn)提示的樣例回答是徑直給出答案，而運(yùn)用思維鏈提示的樣例回答則呈現(xiàn)出完整的推導(dǎo)流程。由此可見，由于樣例的差異，模型的回答也產(chǎn)生了不同結(jié)果。標(biāo)準(zhǔn)提示因直接給出答案，屬于 “未加思索” 的回應(yīng)，最終答案錯(cuò)誤；而思維鏈提示給出的答案伴有完整的思考進(jìn)程，是一種 “深思熟慮”“慢下來” 的答案，所以得出了正確答案。

至此，大家應(yīng)該能夠明白，所謂思維鏈，實(shí)際上就是這樣的思考步驟。此例中的思維鏈因列舉了示例，故而可被視作一種少樣本提示?；蛟S有人會(huì)思考，既然存在少樣本思維鏈，那么是否存在零樣本思維鏈呢？答案是肯定的。只需在提示詞里添加 “Let’s think step by step” 即可，其目的顯而易見，是告知大模型要放慢節(jié)奏，逐步思考。

無論是上述實(shí)例，還是零樣本思維鏈，若自行測(cè)試，效果極有可能存在差異。原因在于大模型的推理能力處于持續(xù)提升的狀態(tài)，可能前一天表現(xiàn)欠佳，后一天便有所進(jìn)步。所以，在實(shí)際開發(fā)大模型應(yīng)用時(shí)，務(wù)必基于特定模型展開測(cè)試，以此確保提示詞的有效性。

就在撰寫這段文字后不久，OpenAI 推出了 o1，其核心原理便是將思維鏈融入大模型的處理流程之中，從而極大地增強(qiáng)了模型的推理能力。倘若能夠領(lǐng)會(huì)思維鏈的內(nèi)涵，即便我們使用的是推理能力稍弱一些的大模型，依然能夠收獲較為理想的推理成效。

ReAct 框架

前面提到的這些提示技術(shù)都是在說大模型自身的推理過程，不過，很多人對(duì)大模型的預(yù)期可不僅僅局限于“文字游戲”。那如果大模型能夠跳脫自說自話，和周邊做更多結(jié)合，是不是就可以做更多的事情了呢？

ReAct 框架就是在這個(gè)想法下誕生的。ReAct 實(shí)際上是兩個(gè)單詞的縮寫：Reasoning + Acting，也就是推理 + 行動(dòng)。下面是這個(gè)例子來自引入 ReAct 框架的論文，其原始問題是：

除了蘋果遙控器，還有哪些設(shè)備可以控制蘋果遙控器最初設(shè)計(jì)用來交互的程序?Aside from the Apple Remote, what other devices can control the program Apple Remote was originally designed to interact with?

下面就是回答這個(gè)問題涉及到的不同的步驟：

圖片

于該實(shí)例當(dāng)中，大模型若要達(dá)成一個(gè)宏大目標(biāo)，便需持續(xù)執(zhí)行一系列任務(wù)。每個(gè)任務(wù)都會(huì)歷經(jīng)思考（Thought）、行動(dòng)（Action）、觀察（Observation）這三個(gè)關(guān)鍵階段。思考環(huán)節(jié)能夠確定下一步的行動(dòng)方向；行動(dòng)則意味著切實(shí)完成某一具體動(dòng)作；而觀察，是對(duì)行動(dòng)所產(chǎn)生的結(jié)果予以評(píng)估，進(jìn)而判定是否終止這一處理流程。

雖說推理部分大模型自身便可完成，然而行動(dòng)所涉及之事，大模型恐難以獨(dú)自應(yīng)對(duì)。例如搜索蘋果遙控器，這顯然需要借助其他手段，來輔助大模型完成此搜索行為。實(shí)際上，這便是 ReAct 技術(shù)被稱作框架的根源所在，因其在執(zhí)行過程中需要融入一些其他的動(dòng)作才能順利推進(jìn)。

如果單看這個(gè)例子，你還可能會(huì)有些困惑，那下面的例子可以幫助你更好地理解 ReAct 是一個(gè)框架。這是來自 LangChain 社區(qū)的一個(gè)提示詞模板，后面我們會(huì)講到 LangChain，這里我們先把注意力放到提示詞本身：

Answer the following questions as best you can. You have access to the following tools:　{tools}　Use the following format:Question: the input question you must answerThought: you should always think about what to doAction: the action to take, should be one of [{tool_names}]Action Input: the input to the actionObservation: the result of the action… (this Thought/Action/Action Input/Observation can repeat N times)　Thought: I now know the final answerFinal Answer: the final answer to the original input question　Begin!　Question: {input}Thought:{agent_scratchpad}

此提示詞模板的核心用途在于借助特定工具來達(dá)成具體任務(wù)。在此處能夠看到與之前相似的思考（Thought）、行動(dòng)（Action）、觀察（Obsuation）等階段。關(guān)鍵之處在于行動(dòng)階段，在此階段我們能夠運(yùn)用不同的工具，而這些工具正是可以被整合進(jìn)執(zhí)行流程的關(guān)鍵要素。大模型會(huì)依據(jù)問題以及工具的特性來抉擇下一步的行動(dòng)策略，例如告知我們應(yīng)選用何種工具來完成任務(wù)，隨后便能夠執(zhí)行對(duì)應(yīng)的工具代碼。需要注意的是，這里的工具代碼屬于本地代碼，其所能實(shí)現(xiàn)的功能更為豐富多樣，能夠突破大模型自身能力的局限。倘若你能夠透徹理解這個(gè)提示詞模板，那么便意味著你已經(jīng)初步具備了構(gòu)建一個(gè) Agent 的基礎(chǔ)條件。

責(zé)任編輯：武曉燕來源：二進(jìn)制跳動(dòng)

LLM 提示詞模板

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：四虎影院免费在线播放 | 91国内产香蕉 | 日韩在线视频一区 | 久久精品中文字幕 | 国产精彩视频 | 久久成人一区二区三区 | 99reav| 日韩一区在线视频 | 在线观看视频一区 | 欧美成人手机在线 | 亚洲一二三区精品 | 欧美性一区二区三区 | 伊人一二三 | 成人综合在线视频 | 中文字幕一区二区三区四区 | 久久久久综合 | 精品国模一区二区三区欧美 | 欧美成人一区二区三区 | 91av在线免费 | 一级在线观看 | 午夜小视频免费观看 | 波多野结衣av中文字幕 | h肉视频 | 久久成人av | 熟女毛片 | 一本一道久久a久久精品综合蜜臀 | 看羞羞视频 | 欧美第一区| 成人免费看黄网站在线观看 | 日日爽| 男女国产网站 | 久久亚洲国产精品日日av夜夜 | 日韩欧美一级精品久久 | 欧美成人二区 | 日本网站免费在线观看 | 日韩精品福利 | 成人黄色电影在线播放 | 国产大毛片 | 亚洲精品日韩视频 | av在线免费网 | 国产成人精品区一区二区不卡 |

<option id="s06io"><wbr id="s06io"></wbr></option>

<button id="s06io"></button>

<dl id="s06io"><acronym id="s06io"></acronym></dl>