成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

GPT4技術原理:大模型的幻覺,解鈴還須系鈴人

發布于 2024-6-12 11:03
瀏覽
0收藏

阿爾伯特·愛因斯坦曾經說過:

像我們這樣相信物理學的人都知道,過去、現在和未來之間的區別只是一種頑固執著的幻覺。換句話說,時間是一種幻覺。

筆者覺得,此種意義上說,光也是一種幻覺,你能看到可見光,卻對紅外光和紫外光“熟視無睹”。而這一切不過是同一種形式的波或者粒子。

人類的幻覺

人類的幻覺無處不在,無時不有。只是絕大多數情境下,你覺察不到而已,像紅紫外光。

幻覺(Hallucination)是一種在沒有外部刺激的情況下的感知,具有真實感知的特性?;糜X是生動的、實質的,并且被認為位于外部客觀空間。

幻覺可以發生在任何感官模式中—視覺、聽覺、嗅覺、味覺、體感、本體感覺、平衡覺、傷害感受、溫度感受和時間知覺等等。

“感覺是外部和內部共同驅動的世界。” 一如柏拉圖的洞穴寓言中的先民,將其看到的墻上的影子,認知為事物的外部真實存在。

150年前,馮 · 亥姆霍茲(1867)提出了感知的"無意識推理"概念。2005年Karl Friston將這種亥姆霍茲感知概念數學形式化。

知覺的原理

Friston假設大腦構建了一個世界模型,其中先驗的“信念”(即概率分布)用以指導概率推理:從大腦接收到的嘈雜和模糊的感官輸入中,推斷出其蘊含的外部原因。

將“先驗”與新的感官輸入(“似然”)相結合,產生感知(“后驗”),是大腦對內外部兩個信息源的整合,并按其相對精度(逆不確定性)進行了加權。這是知覺的基本原理。

換句話說,一個人的先驗信念相對于感官輸入的精度越高,感知(后驗)就越受先驗支配。這意味著先驗信念或感覺數據在神經元上的精確表達方式的生物異常會導致異常的知覺推理。這是人類幻覺的本質。

Friston 的感知概念數學形式如下,反映了大腦的感知其實是在做變分推斷。

F(s,u) = - log(p(s|m)) + Dkl [ q(Φ|u) || p(Φ|s,m) ]

變分推斷

p(s|m) 是客觀世界導致感官輸入s 的概率,也是客觀的,因而該項是常數;Dkl [ q(Φ|u) || p(Φ|s,m) ] 是 q 和 p 的散度,也稱為 q,p的KL距離,衡量 q, p 之間的逼近程度。

大腦會不斷從 u 中采樣出 q, 逼近p,從而使得 p, q 距離最小化,即自由能 F(s,u) 最小化。反過來看,如果我們找到 F(s,u)最小化,此時的 Φ* 就是對Φ 的最佳近似。

在”漂亮國的核潛艇與深度學習的內卷“文中,筆者總結過:變分推斷核心思想是將求解概率分布問題,轉換成距離最小化的優化問題。

Friston 的這個感知概念數學形式,也被稱為貝葉斯大腦。

貝葉斯大腦

“ChatGPT是第一個真正意義的人工通用智能” 文中,筆者首先總結了大腦的工作方式:

大腦不斷從外部世界接收感官信息,用來更新其內部世界模型,并對未來事件做出預測。內部世界模型是關于外部世界的先驗信念或假設;

大腦的主要目標是預測和控制外界的信息,以最大限度地降低不確定性和內部熵。信息熵代表大腦關于世界的內部模型的隨機性或不確定性;

大腦努力將其內部模型與基于感官輸入的預測誤差最小化,減少信息熵可以對世界做出更準確的預測,這等于使系統的自由能最小化。

大模型認知框架

本系列“GPT4技術原理”的文章:學習語言需要相變,相變與涌現,重整化群與生成式AI,重整化群流作為最優輸運,已經梳理出來大模型認知框架:

GPT4技術原理:大模型的幻覺,解鈴還須系鈴人-AI.x社區

海量的文本或者多模態語料組成了大模型需要認知的外部世界的基本信息;嵌入構建高維概率化的語言空間,用來建模語言文字圖像以及音視頻,并對連續變量做離散化;

預訓練以重整化群流的方式進行,在不同尺度上提煉語料數據中的信息概率分布;重整化群流的每一步流動(自回歸預測逼近訓練語料概率分布),都沿著最優輸運的成本最低方向進行;

重整化群在不動點附近因新語料帶來微擾而發生對稱性破缺,滑入不同的相空間;不同的相空間,對應某種意義上的范疇,可形象化為信息的結晶;這是大模型從語料中學到的內部世界模型;

在外部感官輸入下(被提示置于某種上下文),大模型內部將限定在相應的高維語言概率空間的子空間內推理;推理是在子空間中采樣,類比時跨范疇采樣;

采樣不斷進行,基于內部概率化了的世界模型(預訓練獲得的先驗),針對感官輸入(提示),做變分推斷,最小化自由能,獲取最佳采樣分布q*,作為對導致感官輸入的外部后驗的預測。

大模型的認知框架,看起來十分接近Friston 描繪的貝葉斯大腦(維基百科上的示意圖):

GPT4技術原理:大模型的幻覺,解鈴還須系鈴人-AI.x社區

大模型幻覺

先驗信念或感覺數據在神經元上的精確表達方式的生物異常會導致異常的知覺推理。這導致了人類的幻覺。大模型不僅也有類似的幻覺,而且成了實用的最大障礙。

當模型生成的文本不遵循原文(Faithfulness)或者不符合事實(Factualness),人們就可以認為模型出現了幻覺的問題。參考 Survey of Hallucination in Natural Language Generation ( arxiv.org/abs/2202.03629 )。

有研究(結論見下圖)凸顯了這個問題的嚴重性,以及解決大模型中幻覺的緊迫性和重要性,以確保負責任的大模型技術應用。

GPT4技術原理:大模型的幻覺,解鈴還須系鈴人-AI.x社區

幻覺的來源

大模型的幻覺又來自哪里呢?從上文大模型的認知框架不難分析,框架中每一個關鍵環節都可能導致大模型產生幻覺。

語料中的偏差與錯誤,讓大模型學的就是扭曲的外部信息;嵌入構建高維概率語言空間,精度不足會導致概率向量混淆;

重整化提煉語料信息概率分布,無法確保自由能不變,因而是有損提取;自回歸預測僅僅是逼近訓練語料概率分布,籍此構建的內部概率先驗不完全精確;

重整化群因微擾而發生對稱性破缺,內部模型發生相變,目前沒有預知與控制的方法,帶來內部世界模型結構的不確定性;

寬泛模糊的提示語,加之上下文的關聯影響下,大模型內部采樣選取的用于推理的子空間會存在某些偏差;

推理采樣在有偏差的子空間進行,可能偏離最佳采樣分布q*很遠;變分推斷獲取的嚴重有偏采樣分布,成了對外部后驗的預測。

如何管控幻覺

解鈴還須系鈴人,有針對性的為幻覺來源對癥下藥,將是今后管控幻覺的關鍵措施。這里沒用“消除”一詞,從上文認知框架筆者推斷,可將幻覺降低到“不可見”范圍,但很難消除為零。

針對語料中的偏差與錯誤,語料的全面數據治理十分必要,既要豐富詳實,又要不偏不倚;加大算力提高模型精度,增強嵌入及后續訓練的信息區分度;

改進Transformer-Attention歸一化算法,優化降低自由能損失,最大程度降低信息折損;自回歸預測將受益于歸一化優化,從而提升內部概率先驗精確性;

構建重整化流的數學公式,推導出其流動的方向,并計算可能的不動點,從而借助新語料,對不動點做微擾,促進其進入更有序的相空間,實現可控的可預測的涌現;

RLHF訓練結合提示工程探索不同上下文有效提示語,改進decoder模型,促進大模型內部采樣使用Wasserstein距離作為概率分布近似的度量;

探測研究內部世界模型結構,進而可以控制模型溫度,指導動態Bayes推理更貼切的采樣概率分布,進一步亦可通過檢索增強生成(RAG)效果,提高自一致自評估能力。

還可以做整體解決方案的安全架構與治理設計,請參考此篇:復雜企業的生成式人工智能解決方案架構,做最終的人工審核與確認。?

寫在最后

因博弈論獲得諾獎的數學家約翰納什,曾因為幻聽、幻覺被確診為嚴重的精神分裂癥,多次診治多次復發,最后得以徹底治愈。

精神分裂癥是一種可能以貝葉斯腦推理異常為特征的疾病。貝葉斯腦認知框架,范式優雅,建模方法強大,可用以分析診斷感知推理的多種潛在異常,成為當前重要的精神分裂診療理論參考。

筆者梳理的大模型認知框架,與Friston 的感知概念數學形式即貝葉斯腦神似,為分析與管控大模型幻覺,找到了系統的探索途徑。大模型幻覺未來必定可控。

大名鼎鼎的哲學家和數學家笛卡爾有個經典的問題:如果我們的感覺不能總是被信任,那如何區別幻覺與現實?

大模型如何作答呢?如何發揮人們的想象力,駕馭大模型這種特殊的"想象力",安全放心的應用于關鍵性質的任務呢?

本文轉載自??清熙??,作者: 王慶法 ????

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 色天堂影院 | 91亚洲欧美| 精品国产乱码久久久久久闺蜜 | 99热播精品 | 国产高潮av | 在线视频一区二区 | 国产精彩视频在线观看 | 羞羞网站在线观看 | 成人国产精品久久 | 蜜月aⅴ免费一区二区三区 99re在线视频 | 国产97人人超碰caoprom | 天天碰日日操 | 日韩欧美在线视频观看 | 97精品久久 | 色爱综合网 | 成人中文字幕在线观看 | 欧洲高清转码区一二区 | 久国久产久精永久网页 | 在线激情视频 | 久久久久国产一区二区三区四区 | 久久精品免费 | 亚洲精品国产成人 | av毛片| 国产高清精品在线 | 天天插天天射天天干 | 成人精品区 | 日韩有码一区 | 天天综合久久 | 久久夜色精品国产 | 亚洲精品视频二区 | 懂色中文一区二区在线播放 | 在线观看亚洲 | 欧美人人 | 成人免费av在线 | 亚洲福利在线观看 | 成人午夜网站 | 国内在线视频 | 中文字幕一区二区三区乱码在线 | 日韩成人免费av | 国产精品久久久久久 | 午夜精品一区二区三区在线观看 |