成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

讓模型預見數(shù)據(jù)分布變化,東京大學等提出時態(tài)域泛化全新框架

人工智能 新聞
東京大學等高校的研究人員提出了名為Koodos的新框架,可以基于在一些隨機時間點觀測的數(shù)據(jù)分布,在任意時刻生成當下適用的神經(jīng)網(wǎng)絡。

在數(shù)據(jù)分布持續(xù)變化的動態(tài)環(huán)境中,如何進行連續(xù)模型泛化?

東京大學等高校的研究人員提出了名為Koodos的新框架,可以基于在一些隨機時間點觀測的數(shù)據(jù)分布,在任意時刻生成當下適用的神經(jīng)網(wǎng)絡。 

盡管數(shù)據(jù)隨時間持續(xù)發(fā)生變化,但是泛化的模型能在連續(xù)時間中與數(shù)據(jù)分布始終保持協(xié)調一致

圖片

Koodos將模型的復雜非線性動態(tài)轉化為可學習的連續(xù)動態(tài)系統(tǒng),同時利用先驗知識以確保泛化過程的穩(wěn)定性和可控性

實驗表明,Koodos顯著超越現(xiàn)有方法,為時域泛化開辟了全新的研究方向。

模型泛化面臨三大難題

在實際應用中,數(shù)據(jù)集的數(shù)據(jù)分布往往隨著時間而不斷變化,預測模型需要持續(xù)更新以保持準確性。

時域泛化旨在預測未來數(shù)據(jù)分布,從而提前更新模型,使模型與數(shù)據(jù)同步變化。

領域泛化(Domain Generalization, DG)作為一種重要的機器學習策略,旨在學習一個能夠在未見目標領域中也保持良好表現(xiàn)的模型。

近年來研究人員發(fā)現(xiàn),在動態(tài)環(huán)境中,領域數(shù)據(jù)(Domain Data)分布往往具有顯著的時間依賴性,這促使了時域泛化(Temporal Domain Generalization, TDG)技術的快速發(fā)展。

時域泛化將多個領域視為一個時間序列而非一組獨立的靜態(tài)個體,利用歷史領域預測未來領域,從而實現(xiàn)對模型參數(shù)的提前調整,顯著提升了傳統(tǒng)DG方法的效果。

然而,現(xiàn)有的時域泛化研究集中在“離散時間域”假設下,即假設領域數(shù)據(jù)在固定時間間隔(如逐周或逐年)收集。

基于這一假設,概率模型被用于預測時域演變,例如通過隱變量模型生成未來數(shù)據(jù),或利用序列模型(如LSTM)預測未來的模型參數(shù)。

然而在現(xiàn)實中,領域數(shù)據(jù)的觀測并不總是在離散、規(guī)律的時間點上,而是隨機且稀疏地分布在連續(xù)時間軸上。

例如在下圖展示的示例中,與傳統(tǒng)TDG假設的領域在時間軸上規(guī)律分布不同,實際情況下人們只能在特定事件發(fā)生時獲得一個域,而這些事件的發(fā)生時間并不固定。

同時,概念漂移(Concept Drift)在時間軸上發(fā)生,即領域數(shù)據(jù)分布隨著時間不斷演變:如活躍用戶增加、新交互行為形成、年齡與性別分布變化等。

理想情況下,每個時態(tài)域對應的預測模型也應隨時間逐漸調整,以應對這種概念漂移。

最后,由于未來的域采集時間未知,作者希望泛化預測模型到未來的任意時刻。

圖片

此外,傳統(tǒng)方法也難以保證泛化過程在整個時間流中保持穩(wěn)定和可控。

為了應對這些場景中的模型泛化,作者提出了“連續(xù)時域泛化”(Continuous Temporal Domain Generalization, CTDG)任務,其中觀測和未觀測的領域均分布于連續(xù)時間軸上隨機的時間點。

CTDG關注于如何表征時態(tài)領域的連續(xù)動態(tài),使得模型能夠在任意時間點實現(xiàn)穩(wěn)定、適應性的調整,從而完成泛化預測。

CTDG任務的挑戰(zhàn)遠超傳統(tǒng)的TDG方法。

CTDG不僅需要處理不規(guī)律時間分布的訓練域,更重要的是,它旨在讓模型泛化到任意時刻,即要求在連續(xù)時間的每個點上都能精確描述模型狀態(tài)。

而TDG方法則僅關注未來的單步泛化:在觀測點優(yōu)化出當前模型狀態(tài)后,只需將其外推一步即可。

這使得CTDG區(qū)別于TDG任務——

CTDG的關鍵在于如何在連續(xù)時間軸上同步數(shù)據(jù)分布和模型參數(shù)的動態(tài)演變,而不是僅局限于未來某一特定時刻的模型表現(xiàn)。

具體而言,與TDG任務相比,CTDG的復雜性主要來自以下幾個尚未被充分探索的核心挑戰(zhàn):

  • 如何建模數(shù)據(jù)動態(tài)并同步模型動態(tài)
  • 如何在高度非線性模型動態(tài)中捕捉主動態(tài)
  • 如何確保長期泛化的穩(wěn)定性和可控性

接下來具體分析一下這三大挑戰(zhàn)。

如何建模數(shù)據(jù)動態(tài)并同步模型動態(tài)

CTDG要求在連續(xù)時間軸上捕捉領域數(shù)據(jù)的動態(tài),并據(jù)此同步調整模型狀態(tài)。

然而,數(shù)據(jù)動態(tài)本身難以直接觀測,需要通過觀測時間點來學習。

此外,模型動態(tài)的演變過程也同樣復雜。理解數(shù)據(jù)演變如何驅動模型演變構成了CTDG的首要挑戰(zhàn)。

如何在高度非線性模型動態(tài)中捕捉主動態(tài)

領域數(shù)據(jù)的預測模型通常依賴過參數(shù)化(over-parametrized)的深度神經(jīng)網(wǎng)絡,模型動態(tài)因此呈現(xiàn)出高維、非線性的復雜特征。

這導致模型的主動態(tài)嵌藏在大量潛在維度中。

如何有效提取并將這些主動態(tài)映射到可學習的空間,是CTDG任務中的另一重大挑戰(zhàn)。

如何確保長期泛化的穩(wěn)定性和可控性

為實現(xiàn)未來任意時刻的泛化,CTDG必須確保模型的長期穩(wěn)定性。

此外,在許多情況下,人們可能擁有數(shù)據(jù)動態(tài)的高層次先驗知識。

如何將這些先驗知識嵌入CTDG的優(yōu)化過程中,進而提升泛化的穩(wěn)定性和可控性,是一個重要的開放性問題。

模型與動態(tài)聯(lián)合優(yōu)化

數(shù)學問題建模

設計思路

作者提出的方法通過模型與數(shù)據(jù)的同步、動態(tài)簡化表示,以及高效的聯(lián)合優(yōu)化展開。

具體思路如下:

  • 同步數(shù)據(jù)和模型的動態(tài):作者證明了連續(xù)時域中模型參數(shù)的連續(xù)性,而后借助神經(jīng)微分方程(Neural ODE)建立模型動態(tài)系統(tǒng),從而實現(xiàn)模型動態(tài)與數(shù)據(jù)動態(tài)的同步。
  • 表征高維動態(tài)到低維空間:作者將高維模型參數(shù)映射到一個結構化的庫普曼空間(Koopman Space)中。該空間通過可學習的低維線性動態(tài)來捕捉模型的主要動態(tài)。
  • 聯(lián)合優(yōu)化模型與其動態(tài):作者將單個領域的模型學習與各時間點上的連續(xù)動態(tài)進行聯(lián)合優(yōu)化,并設計了歸納偏置的約束接口,通過端到端優(yōu)化保證泛化的穩(wěn)定性和可控性。

圖片

數(shù)據(jù)動態(tài)建模與模型動態(tài)同步

也就是說,模型參數(shù)會隨數(shù)據(jù)分布的變化而平滑調整

用庫普曼算子簡化模型動態(tài)

在實際任務中,預測模型通常依賴于過參數(shù)化的深度神經(jīng)網(wǎng)絡,使得模型動態(tài)h呈現(xiàn)為在高維空間中糾纏的非線性動態(tài)。

直接對h建模不僅計算量大,且極易導致泛化不穩(wěn)定。

然而,h受數(shù)據(jù)動態(tài)f的支配,而數(shù)據(jù)動態(tài)通常是簡單、可預測的。

這意味著在過參數(shù)化空間中,模型的主動態(tài)(Principal Dynamics)可以在適當轉換的空間內進行更易于管理的表示。

受此驅動,作者引入了庫普曼理論(Koopman Theory)來簡化復雜的模型動態(tài)。

庫普曼理論在保持動態(tài)系統(tǒng)特征的同時將復雜的非線性動態(tài)線性化。

最終,通過庫普曼算子的引入,作者實現(xiàn)了對模型動態(tài)的簡化,保證了泛化過程的穩(wěn)健性。

聯(lián)合優(yōu)化與先驗知識結合

作者對多個組件同時施加約束確保模型能穩(wěn)定泛化,其中包含以下關鍵項:

  • 預測準確性:通過最小化預測誤差,使預測模型在每個觀測時間點都能準確預測實際數(shù)據(jù)。
  • 泛化準確性:通過最小化預測誤差,使泛化模型在每個觀測時間點都能準確預測實際數(shù)據(jù)。
  • 重構一致性:確保模型參數(shù)在原始空間與庫普曼空間之間的轉換具有一致性。
  • 動態(tài)保真性:約束庫普曼空間的動態(tài)行為,使得映射后的空間符合預期的動態(tài)系統(tǒng)特征。
  • 參數(shù)一致性:確保泛化模型參數(shù)映射回原始空間后與預測模型參數(shù)保持一致。
    引入庫普曼理論的另一優(yōu)勢在于,可以通過庫普曼算子的譜特性來評估模型的長期穩(wěn)定性。

此外,還可以在庫普曼算子中施加約束來控制模型的動態(tài)行為。

通過觀察庫普曼算子的特征值,可以判斷系統(tǒng)是否穩(wěn)定:

  • 若所有特征值實部為負,系統(tǒng)會穩(wěn)定地趨向于一個平衡狀態(tài)。
  • 若存在特征值實部為正,系統(tǒng)將變得不穩(wěn)定,模型在未來可能會崩塌。
  • 若特征值實部為零,系統(tǒng)可能表現(xiàn)出周期性行為。

通過分析這些特征值的分布,可以預測系統(tǒng)的長期行為,識別模型在未來是否可能出現(xiàn)崩潰的風險。

此外,還可以通過對庫普曼算子施加顯式約束來調控模型的動態(tài)行為。例如:

  • 周期性約束:當數(shù)據(jù)動態(tài)為周期性時,可將庫普曼算子K設為反對稱矩陣,使其特征值為純虛數(shù),從而使模型表現(xiàn)出周期性行為。
  • 低秩近似:將K表示為低秩矩陣,有助于控制模型的自由度,避免過擬合到次要信息。

通過這些手段,不僅提高了泛化的長期穩(wěn)定性,還增強了模型在特定任務中的可控性。

實驗

實驗設置

為驗證算法效果,作者使用了合成數(shù)據(jù)集和多種真實世界場景的數(shù)據(jù)集:

合成數(shù)據(jù)集包括 Rotated 2-Moons 和 Rotated MNIST 數(shù)據(jù)集,通過在連續(xù)時間區(qū)間內隨機生成時間戳,并對 Moons 和 MNIST 數(shù)據(jù)按時間戳逐步旋轉生成連續(xù)時域。

真實世界數(shù)據(jù)集則包括以下三類:

  • 事件驅動數(shù)據(jù)集Cyclone:基于熱帶氣旋的衛(wèi)星圖像預測風力強度,氣旋發(fā)生日期對應連續(xù)時域。
  • 流數(shù)據(jù)集Twitter和House:分別從任意時間段抽取推文和房價數(shù)據(jù)流構成一個領域,多次隨機抽取形成連續(xù)時域
  • 不規(guī)則離散數(shù)據(jù)集Yearbook:人像圖片預測性別,從 84 年中隨機抽取 40 年數(shù)據(jù)作為連續(xù)時域。

定量分析

作者首先對比了Koodos方法與各基線方法的定量性能。

下表顯示,Koodos方法在所有數(shù)據(jù)集上展現(xiàn)了顯著的性能提升。

在合成數(shù)據(jù)集上,Koodos能夠輕松應對持續(xù)的概念漂移,而所有基線方法在這種場景下全部失效。

在真實世界數(shù)據(jù)集上,盡管某些基線方法(如 CIDA、DRAIN和DeepODE)在少數(shù)場景中略有表現(xiàn),但其相較于簡單方法(如Offline)的改進非常有限。

相比之下,Koodos顯著優(yōu)于所有現(xiàn)有方法,彰顯出在時域泛化任務中考慮分布連續(xù)變化的關鍵作用。

圖片

決策邊界

為直觀展示泛化效果,作者在Rotated 2-Moons數(shù)據(jù)集上進行了決策邊界的可視化。

該任務具有極高難度:模型需在0到35秒左右的35個連續(xù)時域上訓練,隨后泛化到不規(guī)律分布在35到50秒的15個測試域。而現(xiàn)有方法通常只能泛化至未來的一個時域(T+1),且難以處理不規(guī)律的時間分布。

下圖展示了從15個測試域中選取了7個進行可視化測試的結果(紫色和黃色表示數(shù)據(jù)區(qū)域,紅線表示決策邊界)

結果清晰地表明,基線方法在應對連續(xù)時域的動態(tài)變化時表現(xiàn)不足。隨著時間推進,決策邊界逐漸偏離理想狀態(tài)。

尤其是最新的DRAIN方法(ICLR23)在多步泛化任務中明顯失效。

相比之下,Koodos在所有測試域上展現(xiàn)出卓越的泛化能力,始終保持清晰、準確的決策邊界,與實際數(shù)據(jù)分布變化高度同步。

這一效果突顯了Koodos在時域泛化任務中的優(yōu)勢。

圖片

模型演變軌跡

為更深入地分析模型的泛化能力,作者通過t-SNE降維,將不同方法的模型參數(shù)的演變過程(Model Evolution Trajectory)在隱空間中可視化。

可以看出,Koodos的軌跡呈現(xiàn)出平滑而有規(guī)律的螺旋式上升路徑,從訓練域平滑延伸至測試域。

這一軌跡表明,Koodos能夠在隱空間中有效捕捉數(shù)據(jù)分布的連續(xù)變化,并隨時間自然地擴展泛化。

相比之下,基線模型的軌跡在隱空間中缺乏清晰結構,隨著時間推移,逐漸出現(xiàn)明顯的偏離,未能形成一致的動態(tài)模式。

圖片


時域泛化的分析與控制

在 Koodos 模型中,庫普曼算子為分析模型動態(tài)提供了有效手段。

作者對Koodos在2-Moons數(shù)據(jù)集上分析表明,庫普曼算子的特征值在復平面上分布在穩(wěn)定區(qū)和不穩(wěn)定區(qū)。

這意味著Koodos在中短期內能穩(wěn)定泛化,但在極長時間的預測上將會逐漸失去穩(wěn)定性,偏離預期路徑(下圖b)

為提升模型的穩(wěn)定性,作者通過將庫普曼算子配置為反對稱矩陣(即Koodos版本),確保所有特征值為純虛數(shù),使模型具有周期性穩(wěn)定特性。

在這一配置下,Koodos展現(xiàn)出高度一致的軌跡,即使在長時間外推過程中依然保持穩(wěn)定和準確,證明了引入先驗知識對增強模型穩(wěn)健性的效果(下圖c)

圖片

(a:部分訓練域數(shù)據(jù);b:不受控,模型最終偏離預期;c:受控,模型始終穩(wěn)定且準確。)

時域泛化與生成式模型任務有天然的關聯(lián),Koodos所具備的泛化能力能夠為神經(jīng)網(wǎng)絡生成技術帶來新的可能。

Koodos的應用并不局限于時域泛化,它也可以適用于其他分布變化的任務中。

作者計劃探索其在非時態(tài)領域的應用。

同時,作者也將探索時域泛化在大模型中的集成,幫助LLM在復雜多變的分布中保持魯棒性和穩(wěn)定性。

論文地址:https://arxiv.org/pdf/2405.16075
GitHub:https://github.com/Zekun-Cai/Koodos/

責任編輯:張燕妮 來源: 量子位
相關推薦

2010-06-28 09:27:58

Tsubame 2.0超算

2022-12-14 14:55:51

模型數(shù)字

2024-12-02 14:35:01

2024-09-04 10:20:00

自動駕駛模型

2025-01-20 10:36:00

訓練模型AI

2023-10-29 22:35:28

模型AI

2022-05-31 10:34:04

研究訓練模型

2024-04-28 12:43:49

5G6G

2023-08-11 14:18:52

谷歌研究

2024-12-26 15:30:00

模型深度學習AI

2024-06-19 12:57:34

AI訓練

2022-12-26 13:55:31

模型框架

2021-10-11 17:27:50

框架計算機開發(fā)

2022-05-26 14:04:13

GPT-3機器學習AI

2024-12-30 07:10:00

RID人物圖片保護模型人工智能

2023-07-27 13:58:19

2024-01-12 21:18:22

負樣本大模型蒸餾

2023-10-13 13:12:44

2023-02-22 15:01:23

神經(jīng)網(wǎng)絡框架

2024-06-27 13:20:50

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 操操操日日日 | 久久亚洲一区二区三区四区 | 在线观看日本高清二区 | 久久精品国产a三级三级三级 | 成人免费视频网站在线看 | 国产亚洲精品精品国产亚洲综合 | 亚洲一在线| 91麻豆产精品久久久久久 | 精品国产一区一区二区三亚瑟 | 成年人在线视频 | 国产精品一区二区在线 | 在线视频91| 免费毛片网站在线观看 | 精品国产黄色片 | 国产午夜精品久久久 | www.com久久久 | 一级片av | 成人午夜在线视频 | 91精品国产乱码久久久久久久 | 91n成人| 99精品视频免费观看 | 蜜桃综合在线 | 久久视频精品 | 国产欧美性成人精品午夜 | 亚洲欧美日韩国产综合 | 在线国产视频观看 | 日韩精品一区二区三区在线播放 | 亚洲视频二区 | 男女视频在线免费观看 | 亚洲视频在线观看一区二区三区 | 亚洲精品99 | 三级在线视频 | 国产一区二区三区网站 | 四虎成人在线播放 | 国产97久久| 一级毛片视频在线 | 超碰操| 精品人伦一区二区三区蜜桃网站 | 欧洲精品码一区二区三区免费看 | 国产片侵犯亲女视频播放 | 中文字幕av一区 |