影響大模型能力表現的因素,以及提示詞在其中扮演的角色和工程化的作用和方法 原創
“ 影響大模型能力的因素有很多,但我們需要具體問題具體分析,不能希望一個技術解決所有問題?!?/strong>
在人工智能應用場景中,可以說大模型扮演著至關重要的角色,因為大模型是人工智能應用的基座;因此這里就涉及到一個很重要的概念——大模型的能力。
即大模型的能力范圍有多大,也就是大模型的能力圈;所以,這里就提出一個問題,大模型的能力是由哪些因素決定的?也可以說怎么提升大模型的能力?而提示詞能提升大模型的能力嗎?
大模型的能力和提示詞工程
大模型的能力是大模型應用中非常關鍵的一個因素,但很多人可能并不清楚一個模型的能力是由哪些因素決定的;以及怎么開發出一個功能強大的模型。
從大模型的能力范圍來說,我們應該從兩個角度來區分;一個是怎么激發大模型的能力,另一個是怎么提升大模型的能力。
大模型從被訓練出來之后,它的能力圈基本上已經確定了,不會再有太大的變化;但訓練完成的大模型就像一個有非常潛力的人,雖然他的能力圈已經確定了,但我們在使用的過程中可能并沒有完成激活大模型的能力。
這就類似于我們人類的大腦一樣,普通人的大腦開發程度也就僅僅只有10%左右;而被公認為天才的愛因斯坦的大腦也就被開發百分之二十不到。
因此,我們就需要一種方式來激活大模型的能力,這種方法就叫做——提示詞工程。
對大部分人來說,一個好的提示詞能解決大模型應用過程中百分之八十的問題。
比如說現在網絡上有很多關于提示詞的模板,本質上就是通過提示詞工程的方式來激發大模型的潛力,讓大模型在具體問題上表現的更好。
常見的提示詞工程方法有角色扮演,目標指定,指定輸出格式,增加約束等;而且在不同的場景下,提示詞模板也不盡相同。但不管采用哪種提示詞模板,其目的只有一個,那就是激發大模型的潛力。
如果說第一種方式是不斷激發大模型的潛力,那么第二種方式就是怎么提升大模型的潛力;簡單來說就是,人類可以通過學習提升自己的能力和潛力,大模型同樣如此。
那怎么提升大模型的潛力呢?
提升大模型的潛力同樣涉及多個方面,比如說模型的架構,使用的算法,訓練數據的質量等等。
所以總的來說,提升大模型的潛力主要有以下幾個方面:
- 神經網絡技術的發展
- 訓練數據的選擇和質量
- 模型結構的固有缺陷
- 模型微調
神經網絡技術的發展
神經網絡技術的發展主要指的是模型架構,算法,學習方式等;比如說Transformer架構的出現使得其神經網絡模型在自然語言處理領域得到了跨越式的進步;而強化學習,蒸餾技術等使得模型能力得到巨大提升,不但效果更好,而且成本更低。
訓練數據的選擇和質量
對同一個神經網絡模型,使用不同的訓練數據和不同質量的訓練數據,會得到不同的效果;比如同一個模型,使用醫療領域的訓練數據和使用司法領域的訓練數據是完全不同的結果,這就是模型的知識邊界。
而同一個模型,都使用醫療領域的訓練數據,但由于數據集質量的異同,同樣會導致模型效果不一。
模型結構的固有缺陷
大模型不是萬能的,神經網絡技術也不是萬能的;因此不同的神經網絡結構只能解決特定領域的問題;因此不同的模型結構在不同領域具有其固有的缺陷,比如說推理模型和生成模型,雖然生成模型也具有推理的能力,但推理模型具備更強的“邏輯思維”能力。
模型微調
模型微調的原理是在訓練模型的基礎之上,在某個方面進行特定增強;比如說,都是圖片生成的模型,但如果使用古風的圖片進行微調,那么這個模型在古風生成領域就具備更好的性能和效果。
當然,雖然以上幾個方面決定了模型的能力范圍,但我們同樣可以通過其它方式來提升模型在應用過程中的表現;
除了提示詞工程之外,我們還可以使用參數控制,比如溫度會影響模型的發揮;其次,也可以通過一些工程化技術來提示模型的表現,比如說多模型協作,RAG增強檢索等方式。
大模型使用的真正核心:多要素協同
要素 | 作用 | 與提示詞的關系 |
模型基座能力 | 決定知識廣度、推理深度、生成質量 | 提示詞只能“激發”已有能力,無法創造新能力 |
訓練數據 | 影響模型的知識覆蓋領域和時效性 | 提示詞無法彌補數據缺失(如2024年事件) |
微調(Fine-tuning) | 針對特定任務優化模型參數 | 可減少對提示詞的依賴(如法律合同生成) |
推理策略 | 控制生成方式(如溫度參數、束搜索) | 需與提示詞配合(如“創造性”需高溫+開放提示) |
系統工程 | 多模型協作、知識庫檢索、后處理流程 | 提示詞是系統中的一個輸入環節 |
在不同的業務場景下,我們不應該癡迷于某一項特定的技術,而是應該選擇合適的技術;比如說在通用問答方面,提示詞可能會比微調的效果更好,成本更低;而在專業領域,微調模型的效果要比提示詞更好。
而在復雜領域,應該使用工程化的方式,把多種技術相結合;比如說RAG檢索中,使用語義檢索,重排序,比單純的語義檢索效果要更好;而如果再加上精心設計的提示詞,可能效果會出乎意料。
提示詞與其他技術的協同
- RAG(檢索增強生成):先用提示詞檢索相關知識庫,再生成答案,突破模型記憶限制。
- ReAct框架:通過提示詞引導模型“思考-行動-觀察”循環(如調用計算器解決數學問題)。
- 多模態擴展:圖文混合提示詞可激發多模態模型能力(如“根據這張電路圖寫維修指南”)。
結論
大模型的使用核心是“模型基座能力 × 提示詞工程 × 系統設計”的三元協同:
- 模型基座是基礎能力的天花板(如GPT-4 vs. 小模型);
- 提示詞是挖掘模型潛力的核心工具;
- 系統工程是應對復雜需求的關鍵保障。
在實際應用中:
- 對于普通用戶,掌握提示詞技巧足以解決80%的問題;
- 對于企業級應用,需同時關注模型選型、微調、RAG和流程設計;
- 未來趨勢:隨著模型能力趨同,提示詞優化和系統集成能力將成為差異化競爭焦點。
本文轉載自公眾號AI探索時代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/eMOs60fLEhzgrCR087MAZg??
