成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<kbd id="rvoha"></kbd>

<form id="rvoha"><label id="rvoha"></label></form>

<form id="rvoha"></form>

<s id="rvoha"></s><tfoot id="rvoha"><source id="rvoha"></source></tfoot>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

GPT4技術原理：大模型的幻覺，解鈴還須系鈴人

發布于 2024-6-12 11:03

瀏覽

0收藏

阿爾伯特·愛因斯坦曾經說過:

像我們這樣相信物理學的人都知道，過去、現在和未來之間的區別只是一種頑固執著的幻覺。換句話說，時間是一種幻覺。

筆者覺得，此種意義上說，光也是一種幻覺，你能看到可見光，卻對紅外光和紫外光“熟視無睹”。而這一切不過是同一種形式的波或者粒子。

人類的幻覺

人類的幻覺無處不在，無時不有。只是絕大多數情境下，你覺察不到而已，像紅紫外光。

幻覺（Hallucination）是一種在沒有外部刺激的情況下的感知，具有真實感知的特性?；糜X是生動的、實質的，并且被認為位于外部客觀空間。

幻覺可以發生在任何感官模式中—視覺、聽覺、嗅覺、味覺、體感、本體感覺、平衡覺、傷害感受、溫度感受和時間知覺等等。

“感覺是外部和內部共同驅動的世界。” 一如柏拉圖的洞穴寓言中的先民，將其看到的墻上的影子，認知為事物的外部真實存在。

150年前，馮 · 亥姆霍茲(1867)提出了感知的"無意識推理"概念。2005年Karl Friston將這種亥姆霍茲感知概念數學形式化。

知覺的原理

Friston假設大腦構建了一個世界模型，其中先驗的“信念”（即概率分布）用以指導概率推理：從大腦接收到的嘈雜和模糊的感官輸入中，推斷出其蘊含的外部原因。

將“先驗”與新的感官輸入（“似然”）相結合，產生感知（“后驗”），是大腦對內外部兩個信息源的整合，并按其相對精度（逆不確定性）進行了加權。這是知覺的基本原理。

換句話說，一個人的先驗信念相對于感官輸入的精度越高，感知（后驗）就越受先驗支配。這意味著先驗信念或感覺數據在神經元上的精確表達方式的生物異常會導致異常的知覺推理。這是人類幻覺的本質。

Friston 的感知概念數學形式如下，反映了大腦的感知其實是在做變分推斷。

F(s,u) = - log(p(s|m)) + Dkl [ q(Φ|u) || p(Φ|s,m) ]

變分推斷

p(s|m) 是客觀世界導致感官輸入s 的概率，也是客觀的，因而該項是常數；Dkl [ q(Φ|u) || p(Φ|s,m) ] 是 q 和 p 的散度，也稱為 q,p的KL距離，衡量 q, p 之間的逼近程度。

大腦會不斷從 u 中采樣出 q, 逼近p，從而使得 p, q 距離最小化，即自由能 F(s,u) 最小化。反過來看，如果我們找到 F(s,u)最小化，此時的 Φ* 就是對Φ 的最佳近似。

在”漂亮國的核潛艇與深度學習的內卷“文中，筆者總結過：變分推斷核心思想是將求解概率分布問題，轉換成距離最小化的優化問題。

Friston 的這個感知概念數學形式，也被稱為貝葉斯大腦。

貝葉斯大腦

“ChatGPT是第一個真正意義的人工通用智能” 文中，筆者首先總結了大腦的工作方式：

大腦不斷從外部世界接收感官信息，用來更新其內部世界模型，并對未來事件做出預測。內部世界模型是關于外部世界的先驗信念或假設；

大腦的主要目標是預測和控制外界的信息，以最大限度地降低不確定性和內部熵。信息熵代表大腦關于世界的內部模型的隨機性或不確定性；

大腦努力將其內部模型與基于感官輸入的預測誤差最小化，減少信息熵可以對世界做出更準確的預測，這等于使系統的自由能最小化。

大模型認知框架

本系列“GPT4技術原理”的文章：學習語言需要相變，相變與涌現，重整化群與生成式AI，重整化群流作為最優輸運，已經梳理出來大模型認知框架：

GPT4技術原理：大模型的幻覺，解鈴還須系鈴人-AI.x社區

海量的文本或者多模態語料組成了大模型需要認知的外部世界的基本信息；嵌入構建高維概率化的語言空間，用來建模語言文字圖像以及音視頻，并對連續變量做離散化；

預訓練以重整化群流的方式進行，在不同尺度上提煉語料數據中的信息概率分布；重整化群流的每一步流動（自回歸預測逼近訓練語料概率分布），都沿著最優輸運的成本最低方向進行；

重整化群在不動點附近因新語料帶來微擾而發生對稱性破缺，滑入不同的相空間；不同的相空間，對應某種意義上的范疇，可形象化為信息的結晶；這是大模型從語料中學到的內部世界模型；

在外部感官輸入下（被提示置于某種上下文），大模型內部將限定在相應的高維語言概率空間的子空間內推理；推理是在子空間中采樣，類比時跨范疇采樣；

采樣不斷進行，基于內部概率化了的世界模型（預訓練獲得的先驗），針對感官輸入（提示），做變分推斷，最小化自由能，獲取最佳采樣分布q*，作為對導致感官輸入的外部后驗的預測。

大模型的認知框架，看起來十分接近Friston 描繪的貝葉斯大腦（維基百科上的示意圖）：

GPT4技術原理：大模型的幻覺，解鈴還須系鈴人-AI.x社區

大模型幻覺

先驗信念或感覺數據在神經元上的精確表達方式的生物異常會導致異常的知覺推理。這導致了人類的幻覺。大模型不僅也有類似的幻覺，而且成了實用的最大障礙。

當模型生成的文本不遵循原文（Faithfulness）或者不符合事實（Factualness），人們就可以認為模型出現了幻覺的問題。參考 Survey of Hallucination in Natural Language Generation ( arxiv.org/abs/2202.03629 ）。

有研究（結論見下圖）凸顯了這個問題的嚴重性，以及解決大模型中幻覺的緊迫性和重要性，以確保負責任的大模型技術應用。

GPT4技術原理：大模型的幻覺，解鈴還須系鈴人-AI.x社區

幻覺的來源

大模型的幻覺又來自哪里呢？從上文大模型的認知框架不難分析，框架中每一個關鍵環節都可能導致大模型產生幻覺。

語料中的偏差與錯誤，讓大模型學的就是扭曲的外部信息；嵌入構建高維概率語言空間，精度不足會導致概率向量混淆；

重整化提煉語料信息概率分布，無法確保自由能不變，因而是有損提取；自回歸預測僅僅是逼近訓練語料概率分布，籍此構建的內部概率先驗不完全精確；

重整化群因微擾而發生對稱性破缺，內部模型發生相變，目前沒有預知與控制的方法，帶來內部世界模型結構的不確定性；

寬泛模糊的提示語，加之上下文的關聯影響下，大模型內部采樣選取的用于推理的子空間會存在某些偏差；

推理采樣在有偏差的子空間進行，可能偏離最佳采樣分布q*很遠；變分推斷獲取的嚴重有偏采樣分布，成了對外部后驗的預測。

如何管控幻覺

解鈴還須系鈴人，有針對性的為幻覺來源對癥下藥，將是今后管控幻覺的關鍵措施。這里沒用“消除”一詞，從上文認知框架筆者推斷，可將幻覺降低到“不可見”范圍，但很難消除為零。

針對語料中的偏差與錯誤，語料的全面數據治理十分必要，既要豐富詳實，又要不偏不倚；加大算力提高模型精度，增強嵌入及后續訓練的信息區分度；

改進Transformer-Attention歸一化算法，優化降低自由能損失，最大程度降低信息折損；自回歸預測將受益于歸一化優化，從而提升內部概率先驗精確性；

構建重整化流的數學公式，推導出其流動的方向，并計算可能的不動點，從而借助新語料，對不動點做微擾，促進其進入更有序的相空間，實現可控的可預測的涌現；

RLHF訓練結合提示工程探索不同上下文有效提示語，改進decoder模型，促進大模型內部采樣使用Wasserstein距離作為概率分布近似的度量；

探測研究內部世界模型結構，進而可以控制模型溫度，指導動態Bayes推理更貼切的采樣概率分布，進一步亦可通過檢索增強生成（RAG）效果，提高自一致自評估能力。

還可以做整體解決方案的安全架構與治理設計，請參考此篇：復雜企業的生成式人工智能解決方案架構，做最終的人工審核與確認。?

寫在最后

因博弈論獲得諾獎的數學家約翰納什，曾因為幻聽、幻覺被確診為嚴重的精神分裂癥，多次診治多次復發，最后得以徹底治愈。

精神分裂癥是一種可能以貝葉斯腦推理異常為特征的疾病。貝葉斯腦認知框架，范式優雅，建模方法強大，可用以分析診斷感知推理的多種潛在異常，成為當前重要的精神分裂診療理論參考。

筆者梳理的大模型認知框架，與Friston 的感知概念數學形式即貝葉斯腦神似，為分析與管控大模型幻覺，找到了系統的探索途徑。大模型幻覺未來必定可控。

大名鼎鼎的哲學家和數學家笛卡爾有個經典的問題：如果我們的感覺不能總是被信任，那如何區別幻覺與現實？

大模型如何作答呢？如何發揮人們的想象力，駕馭大模型這種特殊的"想象力"，安全放心的應用于關鍵性質的任務呢？

本文轉載自??清熙??，作者：王慶法 ????

標簽

贊

收藏

回復

舉報

回復

相關推薦

深入理解Sora技術原理

卓勝微wjp ? 3800瀏覽 ? 0回復
揭秘AI幻覺：GPT-4V存在視覺編碼漏洞，清華聯合NUS提出LLaVA-UHD

輕薄滴假象 ? 2467瀏覽 ? 0回復
超越GPT4的Agent，我用代碼實現了！

ermulong ? 3417瀏覽 ? 0回復
全球開發者用GPT4都在做什么？這28種方法值得一看

51CTO技術棧 ? 3038瀏覽 ? 0回復
超越GPT-4！騰訊AI新研究打破長文本生成模型限制，序列并行技術再突破

AI論文解讀 ? 6260瀏覽 ? 0回復
GPT-4o與SQL：大模型改變自身架構的能力有多強？

51CTO技術棧 ? 2462瀏覽 ? 0回復
GPT-4o背后可能的語音技術

魚蟲子 ? 3407瀏覽 ? 0回復
多模態大模型的實現原理，以及技術難點

AI探索時代 ? 5555瀏覽 ? 0回復
訓練模擬人形機器人的五種強化學習技術大PK

51CTO內容精選 ? 3900瀏覽 ? 0回復
超越GPT-4！LoRA技術引領大型語言模型新革命

AI論文解讀 ? 3309瀏覽 ? 0回復
TOT(Tree of Thought) | 讓GPT-4像人類一樣思考

arnoldzhw ? 2970瀏覽 ? 0回復
MarketSenseAI：GPT4選股，收益率高達72.87%

大語言模型論文跟蹤 ? 3460瀏覽 ? 0回復
RARE：通過檢索增強推理增強打造一個媲美GPT4的RAG系統

大語言模型論文跟蹤 ? 2649瀏覽 ? 0回復
ACL2024 ｜利用GPT4構建的多Agent系統自動發現科學假設

arnoldzhw ? 2725瀏覽 ? 0回復
大模型底座之向量化，以及向量化的原理

AI探索時代 ? 5441瀏覽 ? 0回復
DeepSeek-R1技術大揭秘：論文核心原理拆解與模型性能突破關鍵

arnoldzhw ? 3617瀏覽 ? 0回復
DeepSeek R1 & R2 技術原理

ceesoft ? 3708瀏覽 ? 0回復
奧特曼自曝：改版后的GPT-4o諂媚過頭了，系情緒價值拉滿后的結果，實測：大廠薅開源羊毛有錯嗎？沒錯！

51CTO技術棧 ? 1360瀏覽 ? 0回復
大模型蒸餾技術的演進歷史與實現原理

AI探索時代 ? 1216瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

Nature: 精度不受熱力學第二定律限制 2天前發布
Nvidia的具身推理模型還缺什么？ 2025-05-29 07:20:59發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇： Nature：進化會重復發生

下一篇： ChatGPT是第一個真正意義的人工通用智能

社區精華內容

目錄

主站蜘蛛池模板：色天堂影院 | 91亚洲欧美| 精品国产乱码久久久久久闺蜜 | 99热播精品 | 国产高潮av | 在线视频一区二区 | 国产精彩视频在线观看 | 羞羞网站在线观看 | 成人国产精品久久 | 蜜月aⅴ免费一区二区三区 99re在线视频 | 国产97人人超碰caoprom | 天天碰日日操 | 日韩欧美在线视频观看 | 97精品久久 | 色爱综合网 | 成人中文字幕在线观看 | 欧洲高清转码区一二区 | 久国久产久精永久网页 | 在线激情视频 | 久久久久国产一区二区三区四区 | 久久精品免费 | 亚洲精品国产成人 | av毛片| 国产高清精品在线 | 天天插天天射天天干 | 成人精品区 | 日韩有码一区 | 天天综合久久 | 久久夜色精品国产 | 亚洲精品视频二区 | 懂色中文一区二区在线播放 | 在线观看亚洲 | 欧美人人 | 成人免费av在线 | 亚洲福利在线观看 | 成人午夜网站 | 国内在线视频 | 中文字幕一区二区三区乱码在线 | 日韩成人免费av | 国产精品久久久久久 | 午夜精品一区二区三区在线观看 |