成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

「上下文工程」硅谷爆火,Karpathy親自站臺!提示工程瞬間失寵

人工智能 新聞
繼提示工程之后,「上下文工程」又紅了!這一概念深得Karpathy等硅谷大佬的喜歡,堪稱「全新的氛圍編程」。而智能體成敗的關鍵,不在于精湛的代碼,而是上下文工程。

硅谷如今炙手可熱的,不再是提示詞工程,而是上下文工程(Context Engineering)!

就連AI大神Karpathy,都為「上下文工程」投下了一票。

圖片

還有Shopify CEO Tobias Lütke稱,自己更喜歡「上下文工程」,因其準確描述了一個核心技能——

通過為任務提供完整的背景信息,讓大模型能夠合理解決問題的藝術。

圖片

一夜之間,「上下文工程」紅遍全網(wǎng),究竟是為什么?

圖片

上下文工程,一夜爆紅

這背后原因,離不開AI智能體的興起。

OpenAI總裁Greg Brockman多次公開表示,「2025年,是AI智能體的元年」。

圖片

決定智能體成功或失敗最關鍵的因素,是提供的「上下文質(zhì)量」。也就是說,加載到「有限工作記憶」中的信息愈加重要。

大多數(shù)AI智能體失敗的案例,不是模型的失敗,而是上下文的失敗!

那么,什么是上下文?

圖片

要理解「上下文工程」,首先需要擴展「上下文」的定義。

它不僅僅是你發(fā)送給LLM的單一提示,可以將其視為「模型再生成響應之前,看到的所有內(nèi)容」,如下:

  • 指令/系統(tǒng)提示:定義模型在對話中行為的初始指令集,可以/應該包括示例、規(guī)則等。
  • 用戶提示:用戶的即時任務或問題。
  • 狀態(tài)/歷史(短期記憶):當前對話,包括用戶和模型的響應,截至此刻。
  • 長期記憶:跨多次之前對話收集的持久知識庫,包含學習到的用戶偏好、過去項目的摘要或要求記住以備將來使用的事實。
  • 檢索信息(RAG):外部、實時的知識,來自文檔、數(shù)據(jù)庫或API的相關信息,用于回答特定問題。
  • 可用工具:模型可以調(diào)用的所有功能或內(nèi)置工具的定義,比如check_inventory、send_email。
  • 結構化輸出:模型響應格式的定義,例如JSON對象。

可以看出,與專注于在單一本文字符串中,精心構建完美指令的「提示詞工程」不同,「上下文工程」的范疇要廣泛得多。

圖片

簡單來說:

「上下文工程」是一門學科,它致力于設計和構建動態(tài)系統(tǒng)。  

這些系統(tǒng)能夠在恰當?shù)臅r機、以恰當?shù)母袷?,提供恰當?shù)男畔⒑凸ぞ?,從而讓LLM擁有完成任務所需的一切。

以下是「上下文工程」的所有特點

· 它是一個系統(tǒng),而非一個字符串:上下文并非一個靜態(tài)的提示詞模板,而是一個系統(tǒng)的輸出,這個系統(tǒng)在對LLM進行主調(diào)用之前就已經(jīng)運行。

· 它是動態(tài)的:上下文是即時生成的,為當前任務量身定制。比如,某個請求可能需要的是日歷數(shù)據(jù),而另一個請求則可能需要電子郵件內(nèi)容或網(wǎng)絡搜索結果。

· 它強調(diào)在恰當時機提供恰當信息與工具:其核心任務是確保模型不會遺漏關鍵細節(jié)(謹記「垃圾進,垃圾出」原則)。這意味著只在必要且有益的情況下,才向模型提供知識(信息)和能力(工具)。

· 它注重格式:信息的呈現(xiàn)方式至關重要。一份簡潔的摘要遠勝于原始數(shù)據(jù)的羅列;一個清晰的工具接口定義也遠比一條模糊的指令有效。

圖片

是一門科學,也是一門藝術

Karpathy長文點評中,同樣認為「上下文工程」是藝術的一種。

人們往往將提示詞(prompt),聯(lián)想為日常使用中——發(fā)給LLM的簡短任務描述。

然而,在任何一個工業(yè)級的 LLM 應用中,上下文工程都是一門精深的科學,也是一門巧妙的藝術。

其核心在于,為下一步操作,用恰到好處的信息精準填充上下文窗口。

圖片

說它是科學,是因為要做好這一點,需要綜合運用一系列技術,其中包括:

任務描述與解釋、少樣本學習示例、RAG(檢索增強生成)、相關的(可能是多模態(tài)的)數(shù)據(jù)、工具、狀態(tài)與歷史記錄、信息壓縮等等。

信息太少或格式錯誤,LLM就沒有足夠的上下文來達到最佳性能;  

信息太多或關聯(lián)性不強,又會導致LLM的成本上升、性能下降。  

要做好這一點是頗為復雜的。

說它是藝術,則是因為其中需要依賴開發(fā)者對大模型「脾性」的直覺把握和引導。

除了上下文工程本身,一個LLM應用還必須做到:

  • 將問題恰到好處地拆解成控制流
  • 精準地填充上下文窗口
  • 將調(diào)用請求分派給類型和能力都合適的LLM
  • 處理「生成-驗證」的UIUX流程
  • 以及更多——例如安全護欄、系統(tǒng)安全、效果評估、并行處理、數(shù)據(jù)預取等等…

因此,「上下文工程」只是一個正在興起的、厚重且復雜的軟件層中的一小部分。

這個軟件層負責將單個的LLM調(diào)用,以及更多其他操作整合協(xié)調(diào),從而構建出完整的LLM應用。

Karpathy表示,把這類應用輕率地稱為「ChatGPT的套殼」,這種說法不僅老掉牙了,而且大錯特錯。

有網(wǎng)友對此調(diào)侃道,上下文工程,是全新的「氛圍編程」。

Karpathy回應稱,「我倒不是想自創(chuàng)個新詞什么的。我只是覺得,大家一提到「提示詞」,就容易把一個其實相當復雜的組件給想簡單了」。

你會用一個提示詞去問LLM「天空為什么是藍色的」。但應用程序呢,則是需要為大模型構建上下文,才能解決那些為它量身定制的任務。

圖片

智能體成敗,全靠它了

其實,打造真正高效的AI智能體秘訣,關鍵不在于編寫的代碼有多復雜,而在于你所提供的上下文有多優(yōu)質(zhì)。

一個效果粗糙的演示產(chǎn)品,同一個表現(xiàn)驚艷的智能體,其根本區(qū)別就在于提供的上下文質(zhì)量。

想象一下,一個AI助理需要根據(jù)一封簡單的郵件來安排會議:

嘿,想問下你明天有空簡單碰個頭嗎?

「粗糙的演示」智能體獲得的上下文很貧乏。它只能看到用戶的請求,別的什么都不知道。

它的代碼可能功能齊全——調(diào)用一個LLM并獲得響應,但輸出的結果卻毫無幫助,而且非常機械化:

感謝您的消息。我明天可以。請問您想約在什么時間?

接下來,再看看由豐富的上下文加持的驚艷智能體。

其代碼的主要任務并非是思考如何回復,而是去收集LLM達成目標所需的信息。在調(diào)用LLM之前,你會將上下文擴展,使其包含:

代碼的主要工作,不是決定如何響應,而是收集LLM完成目標所需的信息。

在調(diào)用LLM之前,你會擴展上下文,包括:

  • 日歷信息:顯示你全天都排滿了  
  • 與此人的過去郵件:用來判斷應該使用何種非正式語氣  
  • 聯(lián)系人列表:用來識別出對方是一位重要合作伙伴  
  • 用于send_invite或send_email的工具

然后,你就可以生成這樣的回復:

嘿,Jim!我明天日程完全排滿了,會議一個接一個。周四上午我有空,你看方便嗎?邀請已經(jīng)發(fā)給你了,看這個時間行不行哈。

這種驚艷的效果,其奧秘不在于模型更智能,或算法更高明,而在于為正確的任務提供了正確的上下文。

這正是「上下文工程」將變得至關重要的原因。

所以說,智能體的失敗,不只是模型的失敗,更是上下文的失敗。

要構建強大而可靠的 AI 智能體,我們正逐漸擺脫對尋找「萬能提示詞」,或依賴模型更新的路徑。

這一點,深得網(wǎng)友的認同。

圖片

其核心在于對上下文的工程化構建:即在恰當?shù)臅r機、以恰當?shù)母袷?,提供恰當?shù)男畔⒑凸ぞ摺?/span>

這是一項跨職能的挑戰(zhàn),它要求我們深入理解業(yè)務用例、明確定義輸出,并精心組織所有必要信息,從而使LLM能夠真正「完成任務」。

最后,借用網(wǎng)友一句話,「記憶」才是AGI拼圖的最后一塊。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-06-26 07:00:00

上下文工程AI智能體

2025-07-02 12:10:50

2025-07-07 09:10:29

2025-07-08 08:34:04

2017-05-11 14:00:02

Flask請求上下文應用上下文

2024-02-19 00:12:50

AI代碼

2012-12-31 10:01:34

SELinuxSELinux安全

2022-09-14 13:13:51

JavaScript上下文

2022-09-15 08:01:14

繼承基礎設施基礎服務

2024-09-30 14:10:00

2022-10-28 16:24:33

Context上下文鴻蒙

2025-03-18 08:14:05

2017-12-17 17:01:23

限界上下文系統(tǒng)模型

2023-07-11 10:02:23

2021-07-26 07:47:36

Cpu上下文進程

2020-07-24 10:00:00

JavaScript執(zhí)行上下文前端

2025-06-06 08:00:00

上下文管理器Python開發(fā)

2010-02-25 17:04:54

WCF實例上下文

2025-04-07 01:02:00

GoAPI語言

2019-05-06 14:36:48

CPULinux寄存器
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美色性 | 精品一区二区在线看 | 国产精品国产三级国产aⅴ原创 | 国内精品免费久久久久软件老师 | 日本成人免费网站 | 久久国产精品-国产精品 | 久久成人精品一区二区三区 | 亚洲人在线观看视频 | 国产视频一区在线观看 | 国产欧美精品一区二区色综合朱莉 | 蜜桃综合在线 | 一区视频在线 | 欧美日韩视频在线第一区 | 国产成人精品免费视频大全最热 | 亚洲毛片一区二区 | 国产福利视频在线观看 | www国产成人免费观看视频,深夜成人网 | 亚洲精品乱码久久久久v最新版 | 91久久久久 | 成人小视频在线观看 | 欧美大片久久久 | 一区二区三区四区视频 | 国产在线一区二区三区 | 国产精品久久久久久妇女6080 | 中文字幕一区二区三区不卡 | 精品国产一区久久 | 九九免费 | 免费一区 | 激情综合五月 | 在线亚州| 色资源在线 | 午夜精品久久 | 天天操天天操 | 91成人在线视频 | 国产高清精品一区二区三区 | 久久久久久高潮国产精品视 | 精品欧美一区二区在线观看视频 | 在线一区二区三区 | 国产精品免费在线 | 免费在线一区二区 | 中文字幕伊人 |