成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何通過提示工程訓(xùn)練您的聊天機器人?

譯文
人工智能
雖然大多數(shù)大型語言模型(比如OpenAI的GPT-4)都預(yù)先填充有大量信息,但“提示工程”讓生成式AI可以為特定行業(yè)甚至特定組織的使用量身定制。

譯者 | 布加迪

審校 | 重樓

近幾個月來于人工智能(AI)的聊天機器人風(fēng)靡全球一個原因是它們可以為各種用途生成完善文本,無論策劃廣告活動還是撰寫簡歷。

這些聊天機器人基于大型語言模型LLM算法,算法可以模仿人類智能創(chuàng)建文本內(nèi)容以及音頻、視頻、圖像和計算機代碼。LLM是一種AI,接受大量文章、書籍或網(wǎng)上資源及其他輸入的訓(xùn)練,對自然語言輸入給出類似人類的答復(fù)

越來越多的科技公司已推出了基于LLM的生成式AI工具,用于企業(yè)自動化處理應(yīng)用任務(wù)。比如,微軟上周向數(shù)量有限的用戶推出了一款基于OpenAIChatGPT的聊天機器人,它嵌入在Microsoft 365中,可以自動化執(zhí)行CRMERP應(yīng)用軟件的功能。

圖1. 生成式AI通過用戶提示創(chuàng)建軟件代碼的示例。在這個例子中SalesforceEinstein聊天機器人通過使用OpenAIGPT-3.5大型語言模型被啟用

比如說,新的Microsoft 365 Copilot可以在Word中用來創(chuàng)建文檔的初稿,可能會節(jié)省數(shù)小時的撰寫溯源和編輯時間。Salesforce還宣布計劃發(fā)布一個基于GPT的聊天機器人,用于CRM平臺結(jié)合使用

OpenAIGPT-4等大多數(shù)LLM都被預(yù)先訓(xùn)練成預(yù)測下一個單詞或內(nèi)容引擎大多數(shù)企業(yè)使用它們的方式,即所謂的“開箱即用”。雖然基于LLM的聊天機器人也會出現(xiàn)一些錯誤,但經(jīng)過預(yù)先訓(xùn)練的LLM比較擅長饋送總體上準(zhǔn)確和引人注目的內(nèi)容,這些內(nèi)容至少可以作為點。

然而,許多行業(yè)需要更多定制的LLM算法,理解他們的行話,并生成針對用戶的內(nèi)容。比如說,面向醫(yī)療保健行業(yè)的LLM可能需要處理和解釋電子健康記錄(EHR),建議治療方案,或根據(jù)醫(yī)生筆記或語音記錄創(chuàng)建患者醫(yī)療保健摘要。面向金融服務(wù)行業(yè)的LLM可以總結(jié)收益電話會議創(chuàng)建會議文字記錄,并執(zhí)行欺詐分析以保護消費者。

綜觀眾多行業(yè),確保答復(fù)有很準(zhǔn)確性至關(guān)重要。

大多數(shù)LLM都可以通過應(yīng)用編程接口API)來訪問,該接口允許用戶創(chuàng)建參數(shù)或者調(diào)整LLM答復(fù)方式。發(fā)送給聊天機器人的問題或請求就叫提示(prompt)原因在于用戶提示答復(fù)。提示可以是自然語言問題、代碼片段或命令,但若要LMM準(zhǔn)確地完成工作,提示必須切題。

這種必要性催生了一種新技能:提示工程

提示工程詳解

提示工程是制作和優(yōu)化文本提示,以便大型語言模型達到預(yù)期結(jié)果的方法SambaNova Systems是一家生產(chǎn)AI半導(dǎo)體的硅谷初創(chuàng)公司,該公司產(chǎn)品高級副總裁Marshall Choy表示:“提示工程幫助LLM實現(xiàn)產(chǎn)品原型和探索快速迭代,因為它可以定制LLM,以便快速輕松地與任務(wù)定義保持一致。

Hugging Face是一個創(chuàng)建和托管LLM的社區(qū)驅(qū)動平臺,該平臺的機器學(xué)習(xí)工程師Eno Reyes表示,可能對用戶來說同樣重要的是,提示工程有望成為IT和商業(yè)專業(yè)人士的一項重要技能。

Reyes在回復(fù)美國《計算機世界》雜志的郵件中說:“我認(rèn)識的很多從事軟件、IT和咨詢業(yè)的人一直將提示工程用于個人工作。隨著LLM日益融入到眾多行業(yè),它們大有提高生產(chǎn)的潛力。

Reyes表示,如果有效地提示工程,企業(yè)用戶可以優(yōu)化LLM,更高效準(zhǔn)確地執(zhí)行客戶支持內(nèi)容生成數(shù)據(jù)分析特定任務(wù)。

目前最名的LLMOpenAI的GPT-3是廣受歡迎的ChatGPT聊天機器人的基礎(chǔ)。GPT-3 LLM工作在一個1750億參數(shù)的模型上,可以用簡短的書面提示生成文本和計算機代碼。OpenAI的最新版本GPT-4估計有多達2800億個參數(shù),因而極有可能給出正確的答復(fù)

了OpenAI的GPT LLM,流行的生成式AI平臺還包括一些開放模型,比如Hugging Face的BLOOM和XLM-RoBERTa、英偉達的NeMO LLMXLNet和GLM-130B。

由于提示工程是一門新興學(xué)科,企業(yè)依靠提示指南來確保其AI應(yīng)用程序最佳答復(fù)。甚至出現(xiàn)了新興的提示市場平臺,比如ChatGPT的100個最佳提示https://beebom.com/best-chatgpt-prompts/

Gartner Research杰出副總裁分析師Arun Chandrasekaran說:“有人甚至在提示建議。他補充道,最近對生成式AI的大量關(guān)注突顯了市場需要更好的提示工程。

他說:“這是一個比較新的領(lǐng)域。生成式AI應(yīng)用常常依賴自我監(jiān)督的大型AI模型,因此從它們那里獲得最佳答復(fù)需要更多的專業(yè)知識、試驗和額外的努力。我確信,隨著技術(shù)日趨成熟,我們可能會從AI模型創(chuàng)建者那里得到更好的指導(dǎo)和最佳實踐,以便有效地發(fā)揮AI模型和應(yīng)用軟件的最大功效

好的輸出來自好的輸入

LLM的機器學(xué)習(xí)組件自動從數(shù)據(jù)輸入中學(xué)習(xí)。除了最初用于創(chuàng)建GPT-4等LLM的數(shù)據(jù)外,OpenAI還創(chuàng)建了名為強化學(xué)習(xí)人類反饋(RLHF)的機制,人訓(xùn)練模型如何給出類似人類的答復(fù)

比如說,用戶向LLM提出問題,然后寫出理想的答案。隨后用戶再次模型提出同樣的問題,模型會提供其他許多不同的回答。如果這是基于事實的問題,我們希望答案保持不變如果這是開放式問題,目的給出多個類似人類的創(chuàng)造性答復(fù)

比如說,如果用戶ChatGPT生成一首關(guān)于一個人在夏威夷海灘上的詩,就會期望它每次成一首不同的詩。Chandrasekaran說:“因此,訓(xùn)練人員所做的就是將答復(fù)從最好到最差進行評分。這是饋給模型的輸入,以確保它給出更人類或最佳的答復(fù),同時試圖盡量減少糟糕的答復(fù)。但提問題的方式對于從模型得到的輸出有很大影響。

組織可以通過攝取公司內(nèi)部的自定義數(shù)據(jù)集來訓(xùn)練GPT模型。比如說它們拿來企業(yè)數(shù)據(jù)后可以進行標(biāo)記和注釋以提高數(shù)據(jù)質(zhì)量,然后饋入到GPT-4模型中。這需要對模型進行微調(diào),以便它能夠回答該組織所特有的問題。

也可以針對特定行業(yè)進行微調(diào)。已經(jīng)出現(xiàn)了一新興初創(chuàng)企業(yè),它們使用GPT-4,攝取金融服務(wù)等垂直行業(yè)所特有的大量信息。

Chandrasekaran說:“它們可能會攝取Lexus-Nexus和彭博的信息,可能攝取證券交易委員會(SEC的信息,比如8K和10K報告。但關(guān)鍵是,模型在學(xué)習(xí)該領(lǐng)域的大量語言或信息。因此,微調(diào)可能在行業(yè)層面或組織層面進行

比如說,Harvey是一家與OpenAI合作的初創(chuàng)公司,為法律專業(yè)人士創(chuàng)建所謂的律師領(lǐng)航員”或ChatGPT版本。律師可以使用定制的ChatGPT聊天機器人來查找任何法律判例,以便某些法官為下一個案做準(zhǔn)備。

Chandrasekaran說:“我認(rèn)為出售提示的價值與其說在語言上,不如說在圖像上。生成式AI領(lǐng)域有各種各樣的模型,包括文本轉(zhuǎn)換成圖像的模型。

比如說,用戶可以要求生成AI模型生成吉他手在月球上彈奏的圖像。Chandrasekaran 說:“我認(rèn)為文本轉(zhuǎn)換成圖像的模型這個領(lǐng)域在提示市場更受重視。

Hugging Face作為一站式LLM中心

雖然Hugging Face創(chuàng)建了一些自己的LLM,包括BLOOM,但該組織的主要角色是充當(dāng)第三方機器學(xué)習(xí)模型的中心,就像代碼界的GitHub那樣。Hugging Face目前擁有超過10萬個機器學(xué)習(xí)模型,包括來自初創(chuàng)公司和科技巨頭的眾多LLM

于新模型是開源的,它們通常在中心上向公眾開放,為新興的開源LLM創(chuàng)建了一站式目的地。

要使用Hugging Face為特定的公司或行業(yè)LLM進行微調(diào),用戶可以利用組織的“Transformers”API和“Datasets”庫。比如說,在金融服務(wù)業(yè),用戶可以導(dǎo)入預(yù)先訓(xùn)練好的LLM(比如Flan-UL2,加載金融新聞文章數(shù)據(jù)集,然后使用Transformer訓(xùn)練器對模型進行微調(diào),以生成這些文章的摘要。與AWS、DeepSpeed和Accelerate的集成進一步簡化和優(yōu)化了訓(xùn)練

據(jù)Reyes聲稱,整個過程可以不到100行代碼完成。

另一種開始入手提示工程的方法需要用到Hugging Face的Inference API據(jù)Reyes聲稱,這是一個簡單的HTTP請求端點,支持80000Transformer模型。Reyes說:“這個API允許用戶發(fā)送文本提示,并接收來自我們平臺上的開源模型包括LLM)的答復(fù)。如果您還想更簡單一點,可以通過使用Hugging Face中心的LLM模型上的推理窗口組件實際發(fā)送文本,無需代碼。

少樣本和零樣本學(xué)習(xí)

LLM提示工程通常兩種形式:少樣本學(xué)習(xí)和零樣本學(xué)習(xí)或訓(xùn)練

樣本學(xué)習(xí)需要輸入簡單的指令作為提示,以便從LLM生成預(yù)期的響應(yīng)目的是教LLM執(zhí)行新的任務(wù),而不使用這些特定任務(wù)的標(biāo)記數(shù)據(jù)。零樣本學(xué)習(xí)好比是強化學(xué)習(xí)。

反過來少樣本學(xué)習(xí)使用少量的樣本信息或數(shù)據(jù)來訓(xùn)練LLM以獲得所需的響應(yīng)。少樣本學(xué)習(xí)主要由三個部分組成

  • 任務(wù)描述簡短地描述模型應(yīng)該什么事,比如“把英語翻譯成法語”。
  • 例子幾個例子模型表明了期望做什么比如說“sea otter => loutre de mer”。
  • 提示例子的開頭,模型應(yīng)該通過生成缺失的文本來完成該例比如:“cheese =>”。

據(jù)Gartner的Chandrasekaran聲稱實際上,目前很少有組織擁有定制的訓(xùn)練模型來滿足需求,因為大多數(shù)模型仍處于開發(fā)的早期階段。雖然少樣本和零樣本學(xué)習(xí)有所幫助,但學(xué)習(xí)提示工程這種技能很重要,IT用戶和業(yè)務(wù)用戶來說都很重要

Chandrasekaran說:“提示工程是如今應(yīng)該擁有的一項重要技能,因為基礎(chǔ)模型擅長少樣本和零樣本學(xué)習(xí),但它們的性能或表現(xiàn)在很多方面受到我們?nèi)绾斡袟l不紊地設(shè)計提示的影響。這些技能對IT用戶和業(yè)務(wù)用戶都很重要,具體視用例和領(lǐng)域而定

大多數(shù)API允許用戶運用自己的提示工程技術(shù)。據(jù)Reyes聲稱,每當(dāng)用戶向LLM發(fā)送文本,都有機會完善提示以實現(xiàn)特定的結(jié)果。

Reyes說:“然而,這種靈活性也為惡意用例打開了大門,比如提示注入。像微軟必應(yīng)的Sydney這樣的事件表明,人們可以利用提示工程實現(xiàn)意想不到的用途。作為一個新興的研究領(lǐng)域,解決惡意用例和紅隊滲透測試中的提示注入對未來至關(guān)重要,確保在各種應(yīng)用場合下負(fù)責(zé)任安全地使用LLM

原文標(biāo)題:How to train your chatbot through prompt engineering,作者:Lucas Mearian

責(zé)任編輯:華軒 來源: 51CTO
相關(guān)推薦

2022-07-05 06:42:01

聊天機器人人工智能

2017-03-28 12:21:21

機器人定義

2022-07-03 10:23:06

機器人場景個性化

2016-10-29 10:44:51

工具機器人聊天

2018-03-23 09:35:54

機器人業(yè)務(wù)成長

2023-03-01 14:59:58

2020-02-02 09:19:14

聊天機器人機器人智能

2016-02-16 14:46:33

聊天機器人機器學(xué)習(xí)自然語言

2023-05-18 10:06:00

聊天機器人醫(yī)療保健

2019-12-19 16:08:40

人工智能機器人數(shù)據(jù)

2019-01-25 16:30:34

機器人機器學(xué)習(xí)人工智能

2023-10-13 09:00:00

2025-06-04 08:21:28

2023-06-29 15:04:21

微軟ChatGPT

2023-12-18 19:05:34

2017-08-21 13:31:44

AI聊天機器人facebook

2019-06-04 08:00:00

機器人聊天機器人人工智能

2023-10-30 11:22:19

聊天機器人云計算

2021-03-08 08:00:00

人工智能機器人醫(yī)療
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产粉嫩尤物极品99综合精品 | 亚洲精品久久久 | 免费一区二区在线观看 | 欧美999| 黑人精品欧美一区二区蜜桃 | 精品九九| 国产高清在线精品 | 综合一区二区三区 | 毛片网站在线观看视频 | jlzzjlzz欧美大全 | www.久草.com | 一级全黄少妇性色生活免费看 | 四虎最新地址 | 色视频在线观看 | 日本天堂一区 | 中文字幕在线观看成人 | 久久精品色欧美aⅴ一区二区 | 欧美亚洲第一区 | 美女久久久 | jⅰzz亚洲| 91精品久久久久久综合五月天 | 热久久999| 国产精品高清一区二区三区 | 国产福利在线播放 | 国产精品v | 在线一级片 | 亚洲综合色网站 | 国产高清精品一区二区三区 | 亚洲成人自拍 | 中文字幕日韩专区 | 81精品国产乱码久久久久久 | 黄色国产在线播放 | 久久久久国产精品人 | 天天操天天拍 | 国产线视频精品免费观看视频 | 国色天香成人网 | 成人三级在线播放 | 99久久精品免费看国产四区 | 国产三区视频在线观看 | 婷婷久久综合 | 国产欧美在线一区 |