OpenAI在RAG技術上的最佳實踐與策略原創

發布于 2024-7-10 07:01

瀏覽

0收藏

隨著人工智能技術的不斷演進，大型語言模型（LLM）的性能優化已成為AI領域的熱點問題。OpenAI的技術專家團隊分享了他們在檢索增強生成（RAG）技術、提示工程和微調方面的最佳實踐，為提升模型性能提供了寶貴的經驗和策略。

OpenAI在RAG技術上的最佳實踐與策略 -AI.x社區

John Allard深入介紹了OpenAI在微調領域的最新進展，包括：

Colin細致討論了優化大型語言模型的挑戰，包括：

RAG技術通過結合Embeddings技術和向量數據庫，顯著提升了信息檢索的效率和準確性。案例分析包括：

OpenAI在RAG技術上的最佳實踐與策略 -AI.x社區

直接將PDF和docx文件嵌入，準確率是45%。
2. 經過20次調優迭代，解決細節小Bug - 準確率到65%
3. 基于規則進行優化，譬如先判斷問題屬于什么領域（退一步思考），然后再回答，效果提升到85%
4. 發現數據里有一些是結構化數據（如表格），為此定制提取解決，準確率提升到98%
總結：通過直接嵌入文件、迭代調優、規則優化和結構化數據的定制提取，逐步提升檢索準確率。

首先，我們用最簡單的方法，比如余弦相似性，尋找類似問題的SQL查詢，進行問題相似性搜索。我們測試了不同的嵌入和提示工程，但結果不太好。后來，我們意識到不同的數據庫模式對問題的答案可能完全不同。
所以針對一個問題進行相似性搜索意義不大，但用預設答案進行搜索可能效果更好。我們使用預設的文檔嵌入，生成一個假設的SQL查詢進行相似性搜索，性能大大提升。對于這個特定問題，我們嘗試了上下文檢索通過簡單過濾將問題按難度排名，只帶回同等難度的例子，這帶來了改進。
我們還嘗試了一些先進技術，比如鏈式推理，讓系統識別列、表，最后構建查詢。但我們決定采用更簡單的方法進行自我一致性檢查，讓系統構建查詢并運行，出錯時給出提示，再次嘗試。

OpenAI在RAG技術上的最佳實踐與策略 -AI.x社區

我們從69%開始，然后添加了一些示例，得到了幾個改進點，這表明RAG可以進一步改進。我們嘗試這個問題，看到性能提升了3%，然后使用答案，假設的文檔嵌入使我們進一步提升了5%。
我們決定試試微調，看能否更進一步。先建立了我們的基線，與上圖里的69%基線一樣，使用簡單的提示工程技術。然后，用簡單的提示工程對GPT-4進行微調，結果模型準確率提升到接近82%。
再稍微調整模型使用um rag技術，把一些示例動態注入上下文窗口，準確率達到83.5%。這些都很簡單，沒有復雜的數據預處理或后處理。結果顯示簡單的微調和提示工程也能接近最先進的技術。

OpenAI在RAG技術上的最佳實踐與策略 -AI.x社區