成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型也有“漂移(Drift)”現象?應引起AI應用開發者警惕

人工智能
不僅如此,由于當前很多大模型應用,如RAG,Agent,在使用大模型構建應用時會多次使用到大模型,形成復雜的嵌套和組合的情況。而一旦發生“漂移”,就會引發級聯(Cascading)現象,它指的是在一個處理流程的連鎖過程中,如果一個環節出現問題或偏差,這個問題通常會在后續的環節被無意中放大。這意味著每個環節的輸出都會進一步偏離最初的預期結果。

熟悉數據中心機器學習項目開發的讀者應該知道,數據漂移和概念漂移是導致機器學習模型效果衰退的一個常見原因。漂移產生的關鍵原因是因為模型會隨著時間而衰退,因此為了對抗這樣的問題就必須要定期優化訓練方案及定期重訓模型。

那么大模型會不會有“漂移”現象呢,答案是肯定的。大致分為兩類:

1)大模型漂移(LLM Drift)

大模型漂移(LLM Drift)是指在較短時間內,LLM在處理相同問題時給出的答案發生了顯著變化。這種變化并不僅僅是因為大語言模型本質上的不確定性,或者問題提示的輕微變化,還有可能是LLM本身發生了變化。

斯坦福和伯克利有一項聯合研究《How Is ChatGPT’s Behavior Changing over Time?》,對GPT-4 和 GPT-3.5 在回答問題的準確性進行跟蹤,研究發現,無論是 GPT-3.5 還是 GPT-4,它們的表現都出現了大幅波動,有的任務甚至出現了性能退化。下圖展示了四個月內模型準確度的波動情況,在某些情況下,準確度的下降相當嚴重,損失了超過60%。

圖片圖片

https://arxiv.org/pdf/2307.09009.pdf

而其發生漂移的原因,對于應用開發者本身并不透明,比如模型發生變化等因素,但至少需要讓開發者知道持續監控和評估LLM 隨著時間推移模型性能變化的必要性,進而保證應用的穩定性。

該研究對應的代碼庫:https://github.com/lchen001/LLMDrift

2)提示漂移(Prompt Drift)

提示漂移是指在推理過程中,由于模型變化、模型遷移或提示注入數據的變化,提示產生的響應隨時間推移而不同的現象。

由于大模型的特點,其每次回答是非確定性的,即使是相同的問題,在不同時間點可能會得到不同的答案。本質上,這并不一定是問題,甚至是一個特點,并且即便用詞不同,核心內容可能依舊能保持一致。但在發生提示漂移時,LLM可能會有不合預期的回答。

市面上針對于Prompt drift提供了一些提示管理和測試工具,例如 ChainForge,LangSmith等。

由于模型在整個應用中起重要作用,因此,迫切需要一種機制,來確保在大規模遷移或淘汰大語言模型(LLM)之前,能夠對基于LLM的生成應用(Gen-Apps)進行充分測試。如果能有一種模型,在很大程度上對所使用的大語言模型不敏感,那自然是更理想的。要實現這一目標,一種可能的方法是利用大語言模型的上下文學習能力。

級聯放大

不僅如此,由于當前很多大模型應用,如RAG,Agent,在使用大模型構建應用時會多次使用到大模型,形成復雜的嵌套和組合的情況。而一旦發生“漂移”,就會引發級聯(Cascading)現象,它指的是在一個處理流程的連鎖過程中,如果一個環節出現問題或偏差,這個問題通常會在后續的環節被無意中放大。這意味著每個環節的輸出都會進一步偏離最初的預期結果。

考慮下面的情形:

1.用戶可能提出的問題是出乎意料的或者沒有預先計劃的,這可能會導致鏈式處理中出現意料之外的回答。

2.前一個環節可能會出現不準確的輸出或某種程度的偏差,在后續環節中被加劇。

3.大語言模型(LLM)的回答可能也會出現意外,這是因為大語言模型本身就具有不確定性。提示漂移或大語言模型漂移可能就是在這里引入的。

4.然后上一個環節的輸出就被傳遞到下一個環節,導致了偏差的進一步“級聯”。

從某種角度看,一個基于大模型構建的應用,會放大因LLM漂移和提示漂移帶來的問題,越復雜的應用這樣的問題越突出,因此,如何避免這樣的問題發生或者降低這類情況的影響,比如類似微服務里的故障隔離等措施,也成了一個新的研究方向。

責任編輯:武曉燕 來源: AI工程化
相關推薦

2020-05-15 07:47:01

機器學習模型漂移模型

2016-05-18 09:38:47

開發者職業規劃錯誤

2024-09-24 07:31:52

2016-05-24 10:48:59

移動·開發技術周刊

2024-01-23 18:53:04

PostgreSQL關系數據庫

2014-03-13 16:59:11

獨立開發者刷榜排名

2024-10-25 19:32:58

ChatGPT

2023-05-19 14:01:47

AI模型

2019-08-16 10:55:37

開發者技能AI

2018-10-29 10:08:01

2024-04-17 14:44:49

2013-12-31 10:29:51

2025-04-25 13:11:37

2013-08-08 10:26:08

前端開發Web

2013-10-08 10:42:27

前端開發開發

2019-07-03 18:19:57

AI百度AI開發者大會百度

2015-03-30 11:06:12

AppleWatch開發Swift

2024-08-02 13:40:00

2010-10-19 11:14:06

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 奇米av| 日本一区二区高清不卡 | 亚洲天堂一区二区 | 国产综合久久 | 成人中文字幕在线观看 | 国产精品 亚洲一区 | 成人黄色av网址 | 在线四虎 | 欧美中文字幕 | 国产亚洲精品久久久久动 | 久久69精品久久久久久久电影好 | 国产精品久久久久久久久久 | 成人av网页 | 少妇一区二区三区 | 99精品欧美一区二区三区综合在线 | 一级做受毛片免费大片 | 欧美一级二级视频 | 黑人巨大精品欧美黑白配亚洲 | 国产成人在线播放 | 亚洲欧美精品 | 国产综合一区二区 | 精品一区二区三区不卡 | 国产精品一区视频 | 免费特级黄毛片 | 九九热这里只有精品在线观看 | av片在线免费看 | 午夜在线观看视频 | 久久久久亚洲精品 | 国产综合视频 | 精品国产伦一区二区三区观看方式 | 亚洲精品中文字幕 | 日韩精品一区二区三区中文在线 | 91视视频在线观看入口直接观看 | 国产精品麻 | 午夜精品视频在线观看 | 久久精品亚洲 | 国产精品久久久久久久午夜片 | 亚洲视频在线一区 | 国产免费xxx | 综合久久综合久久 | 久久久久久久91 |