成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<code id="66666"><dl id="66666"></dl></code>

<blockquote id="66666"></blockquote>

<tt id="66666"><meter id="66666"><strike id="66666"></strike></meter></tt>

<s id="66666"><delect id="66666"></delect></s>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

曾經火出圈的提示工程要死了嗎？危！大模型能自己優化Prompt了

發布于 2024-3-27 13:56

瀏覽

0收藏

2022 年底，ChatGPT 上線，同時引爆了一個新的名詞：提示工程（Prompt Engineering）。

簡而言之，提示工程就是尋找一種編輯查詢（query）的方式，使得大型語言模型（LLM）或 AI 繪畫或視頻生成器能得到最佳結果或者讓用戶能繞過這些模型的安保措施?，F在的互聯網上到處都是提示工程指南、快捷查詢表、建議推文，可以幫助用戶充分使用 LLM。在商業領域，現在也有不少公司競相使用 LLM 來構建產品 copilot、自動化繁瑣的工作、創造個人助理。

之前在微軟工作過的 Austin Henley 最近采訪了一些基于 LLM 開發 copilot 產品或服務的人：「每一家企業都想將其用于他們能想象到的每一種用例?！惯@也是企業會尋求專業提示工程師幫助的原因。

但一些新的研究結果表明，提示工程干得最好的還是模型自己，而非人類工程師。

這不禁讓人懷疑提示工程的未來 —— 并且也讓人越來越懷疑可能相當多提示工程崗位都只是曇花一現，至少少于當前該領域的想象。

01 自動微調的提示很成功，也很怪

當面對奇怪的提示工程技術時，LLM 的表現常常很怪異又不可預測。加州的云計算公司 VMware 的 Rick Battle 和 Teja Gollapudi 也為此感到困惑。舉個例子，人們發現如果讓模型自己一步步地解釋自己的推理過程（即思維鏈技術），其在許多數學和邏輯問題上的性能都能得到提升。

更奇怪的是，Battle 發現，如果為模型提供正向的 prompt，比如「這會很有趣」或「你和 ChatGPT 一樣聰明」，有時候模型的性能也會提升。

Battle 和 Gollapudi 決定系統性地測試不同的提示工程策略會如何影響 LLM 解決小學數學問題的能力。他們使用 60 種不同的 prompt 組合分別測試了 3 種不同的開源語言模型。

曾經火出圈的提示工程要死了嗎？危！大模型能自己優化Prompt了-AI.x社區

論文題目：

The Unreasonable Effectiveness of Eccentric Automatic Prompts

論文鏈接：

??https://arxiv.org/pdf/2402.10949.pdf??

他們得到的結果呈現出了驚人的不一致性。甚至思維鏈 prompt 設計方法也不總是好的 —— 有時候有用，有時候卻有害。

「唯一的趨勢就是沒有趨勢，」他們寫道：「對于任意給定模型、數據集和提示工程策略的某個特定組合而言，最好的方法很可能都非常具有針對性。」

有一種方法可以替代這種常常導致不一致結果的試錯風格的提示工程：讓語言模型自己設計最優的 prompt。最近，人們已經開發出了一些自動化這一過程的新工具。給定一些示例和定量的成功指標，這些工具可迭代式地找到輸送給 LLM 的最優語句。

Battle 及同事發現，在幾乎所有案例中，這種自動生成的 prompt 的表現都優于通過試錯方法找到的最佳 prompt。而且自動方法的速度還快得多 —— 只需一兩個小時，而不是好幾天。

另外，算法輸出的這些最優 prompt 往往非常怪異，人類基本不可能想出來。Battle 說：「我簡直不敢相信它生成的一些東西。」

舉個例子，有一個 prompt 就是直接把《星際迷航》的說話風格搬過來了：「指揮官，我們需要您繪制一條穿過這股湍流的路線并定位異常源。使用所有可用數據和您的專長引導我們度過這一困境。」很顯然，如果以對待柯克艦長的態度對待這個特定的 LLM，就可以幫助它更好地解答小學數學問題。

Battle 表示，以算法方法優化 prompt 在原理上是可行的，畢竟語言模型本就是模型?！负芏嗳藢⑦@些東西擬人化，因為它們『說英語』，」Battle 說，「不，它不是說英語，而是做大量數學運算?！?/span>

事實上，根據其團隊的研究成果，Battle 表示：人類再也不應該人工優化 prompt。

「你就坐在那里，試圖找到單詞的某種神奇組合，從而讓你的模型在你的任務上得到最佳的可能表現。」Battle 說，「但這個研究結果卻會告訴你『別費心了』。你只需開發一個評分指標，讓系統可以自己判斷一個 prompt 是否比另一個好，然后讓模型自己去優化就行了?！?/span>

02 自動微調的提示也能讓圖像變好看

圖像生成算法也能受益于自動生成的 prompt。

近日，Vasudev Lal 領導的一個英特爾實驗團隊做了一個類似的研究項目，不過他們是優化圖像生成模型 Stable Diffusion 的 prompt?！溉绻荒茏寣＜襾碜鎏崾竟こ?，那看起來就更像是 LLM 和擴散模型的一個 bug，而不是功能?！筁al 說，「所以，我們想看看能否自動化這種提示工程。」

Vasudev Lal 的團隊開發了一種工具：NeuroPrompts。

曾經火出圈的提示工程要死了嗎？危！大模型能自己優化Prompt了-AI.x社區

論文題目：

NeuroPrompts: An Adaptive Framework to Optimize Prompts for Text-to-Image Generation

論文鏈接：

??https://arxiv.org/pdf/2311.12229.pdf??

該工具可以自動改進簡單的輸入 prompt，比如「騎馬的男孩」，從而得到更好的圖像。為此，他們一開始使用了一些人類提示工程專家設計的 prompt。然后訓練了一個語言模型來將簡單 prompt 轉換成這些專家級 prompt。

在此基礎上，他們繼續使用強化學習來優化這些 prompt，從而得到更加美觀的圖像。這里的美觀程度又是由另一個機器學習模型 PickScore 判斷的（PickScore 是近期出現的一個圖像評估工具）。

曾經火出圈的提示工程要死了嗎？危！大模型能自己優化Prompt了-AI.x社區

▲ 左圖是使用一般的 prompt 生成的圖像，右圖是 NeuroPrompt 優化 prompt 之后再生成的圖像。

這里也一樣，自動生成的 prompt 的表現優于人類專家給出的 prompt（用作起點），至少根據 PickScore 指標是這樣的。Lal 并不認為這出人意料。「人類只會使用試錯方法來做這件事?！筁al 說，「但現在我們有了這種完全機器式的、完整回路的方法，再輔以強化學習…… 因此我們可以超過人類提示工程?！?/span>

由于審美是非常主觀的，因此 Lal 團隊希望讓用戶可以在一定程度上控制 prompt 優化的方式。在他們的工具中，用戶除了可以指定原始 prompt（比如騎馬的男孩），也能指定想要模仿的藝術家、風格、格式等。

Lal 相信隨著生成式 AI 模型的發展，不管是圖像生成器還是大型語言模型，對提示工程的奇怪依賴就會消失?！肝艺J為研究這些優化方法非常重要，最后它們可以被整合進基礎模型本身之中，這樣你就無需復雜的提示工程步驟了?！?/span>

03 提示工程將以某種形式繼續存在

Red Hat 軟件工程高級副總裁 Tim Cramer 表示：就算自動微調 prompt 變成了行業規范，某種形式的提示工程崗位依然不會消失。能夠滿足行業需求的自適應生成式 AI 是一個非常復雜、多階段的工作，在可預見的未來里都需要人類的參與。

「我認為提示工程師將會存在相當長一段時間，還有數據科學家?！笴ramer 說，「這不僅僅只是向 LLM 提問并確保答案看起來不錯。提示工程師其實要有能力做很多事情?！?/span>

「做出一個原型其實很容易?！笻enley 說，「難的是將其產品化?！笻enley 表示，當你在構建原型時，提示工程就是拼圖中的相當大一部分，但當你開始構建商業產品時，還需要考慮其它許多因素。

開發商業產品的難題包括確?？煽啃裕ū热缭谀Ｐ碗x線時得體地應對）；將模型的輸出調整成合適的格式（因為很多用例需要文本之外的輸出）；進行測試以確保 AI 助理不會在少數情況下做出有害的事情；還要確保安全、隱私與合規。Henley 表示，測試與合規尤其困難，因為傳統的軟件開發測試策略不適合非確定性的 LLM。

為了完成這大量的任務，許多大公司都正在推出一個新的工作崗位：大型語言模型運營（LLMOps）。該崗位的生命周期中就包含提示工程，但也包含其它許多部署產品所需的任務。Henley 表示，機器學習運營工程師（MLOps）是最適合這個崗位的，這是 LLMOps 的前身。

不管這個職位是叫提示工程師、LLMOps 工程師還是其它新名詞，其特性都會不斷快速變化?！敢苍S我們現在是叫他們提示工程師，」Lal 說，「但我認為其互動的本質會不斷變化，因為 AI 模型就在不斷變化?！?/span>

「我不知道我們是否會將其與另一類工作或工作角色結合起來，」Cramer 說，「但我認為這些崗位不會很快消失。現在這一領域實在太瘋狂了。每個方面都變化很大。我們無法在幾個月內就搞明白這一切。」

Henley 表示，在某種程度上，現在正處于該領域的早期階段，唯一壓倒性的規則似乎就是沒有規則。他說：「現在這個領域有點像是狂野西部?！?/span>

本文轉載自PaperWeekly

原文鏈接：??https://mp.weixin.qq.com/s/Q956HyGpZxp0HS1dVgraug??

標簽

模型提示工程

已于2024-3-27 14:02:00修改

贊

收藏

回復

舉報

回復

相關推薦

生成式AI大模型之提示詞工程實踐

數字化助推器 ? 3557瀏覽 ? 0回復
谷歌定義了新搜索，殺死了Perplexity？

51CTO技術棧 ? 3044瀏覽 ? 0回復
大模型的提示工程：提示是對程序的搜索

lintoms ? 2774瀏覽 ? 0回復
如何為軟件工程優化ChatGPT和其他大模型

51CTO內容精選 ? 2569瀏覽 ? 0回復
提示工程策略：利用【慢思考】的雙過程理論減少模型有害輸出

大語言模型論文跟蹤 ? 4214瀏覽 ? 0回復
什么是提示詞工程(prompt engineering)？為什么需要提示詞工程？

AI探索時代 ? 7121瀏覽 ? 0回復
大語言模型在不同自然語言處理任務中的提示工程方法綜述

sbf_2000 ? 3559瀏覽 ? 0回復
OpenAI前研究科學家開源面向未來的提示工程庫 ell，重新定義提示工程

Syrupup ? 2886瀏覽 ? 0回復
能打造自己的聊天數據庫了

Aceryt ? 2739瀏覽 ? 0回復
關于大模型的使用——提示詞工程

AI探索時代 ? 3520瀏覽 ? 0回復
OpenAI o1 模型到來后，談談提示詞工程的未來

Baihai_IDP ? 2382瀏覽 ? 0回復
大模型面試實戰！Prompt調優

ermulong ? 3017瀏覽 ? 0回復
微軟開源PromptWizard，摔碎了提示工程師的飯碗

PaperAgent ? 2922瀏覽 ? 0回復
面向開發人員的 ChatGPT 提示工程

sulu637 ? 2968瀏覽 ? 0回復
DeepSeek 爆了，普通人如何3小時完全從0訓練自己的大模型

玄姐聊AGI ? 7177瀏覽 ? 0回復
提示詞工程對大模型應用的重要性

AI探索時代 ? 1787瀏覽 ? 0回復
如何優化AI提示詞？掌握這5個技巧，讓你的大模型交互更高效！

Halo咯咯 ? 3482瀏覽 ? 0回復
提示詞工程對大模型應用的重要性

AI探索時代 ? 1321瀏覽 ? 0回復
為什么MCP能爆火，但ChatGPT插件之流全都死了？神貼斷言：MCP吞噬一切！

51CTO技術棧 ? 576瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

熱門推薦

CVPR`25 | 感知性能飆升50%！JarvisIR：VLM掌舵,為自動駕駛裝上“火眼金睛”,不懼惡劣天氣 1回復

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

下一篇：能否在追問中堅持判斷？揭秘大語言模型的判斷一致性挑戰

社區精華內容

目錄

主站蜘蛛池模板：久久久99国产精品免费 | 欧美三区在线观看 | 久久久久无码国产精品一区 | 玖玖色在线视频 | 日韩中文一区二区 | 久久久久www| 国产精品久久久久久久久久免费看 | 久久久新视频 | 天天色图 | 欧美日韩中文字幕在线 | 91精品免费视频 | 日日操日日舔 | 91久久精品一区二区二区 | 懂色tv| 男女羞羞视频大全 | 91在线免费视频 | 日韩一区二区三区av | 欧美激情一区 | 欧美久久久久久久 | 免费看一区二区三区 | 免费在线毛片 | 热久久国产 | 国产在线看片 | 偷拍自拍网址 | 亚洲天堂免费 | 久久成人精品视频 | 激情福利视频 | 日本精品视频 | 欧美成人在线免费 | 欧美日韩视频在线第一区 | 四虎最新| 一级毛片免费视频 | 免费国产一区二区 | 欧美综合视频在线 | 欧美日韩精品综合 | 在线观看视频h | 毛片网站在线观看 | 91精品国产综合久久福利软件 | 亚洲黄色国产 | 伊人免费网 | 成人欧美一区二区三区黑人孕妇 |

<sub id="66661"></sub>

<video id="66661"></video>

<tfoot id="66661"><s id="66661"></s></tfoot>