成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

新視角設計下一代時序基礎模型,Salesforce推出Moirai-MoE

人工智能 新聞
近期,來自 Salesforce、新加坡國立大學、香港科技大學(廣州)的研究者以模型專家化這一全新視角作為抓手,設計并提出了下一代時序預測基礎模型 Moirai-MoE。

本文由 Salesforce、新加坡國立大學、香港科技大學(廣州)共同完成。其中,第一作者柳旭是 Salesforce 亞洲研究院實習生、新加坡國立大學計算機學院四年級博士生。通訊作者劉成昊是 Salesforce 亞洲研究院高級科學家。該工作的短文版本已被 NeurIPS 2024 Workshop on Time Series in the Age of Large Models 接收。

時間序列預測是人類理解物理世界變化的重要一環。自去年底以來,時序預測領域正在經歷重大轉型,從傳統的「單一數據集訓練單一模型」的模式逐步轉向「通用預測基礎模型」。目前雖然有不少基礎模型已經提出,但如何有效地在高度多樣化的時序數據上訓練基礎模型仍是一個開放問題。

近期,來自 Salesforce、新加坡國立大學、香港科技大學(廣州)的研究者以模型專家化這一全新視角作為抓手,設計并提出了下一代時序預測基礎模型 Moirai-MoE。該模型將模型專業化設計在 token 這一細粒度運行,并且以完全自動的數據驅動模式對其賦能。模型性能方面,不同于僅在少量數據集上進行評估的已有時序基礎模型,Moirai-MoE 在一共 39 個數據集上進行了廣泛評估,充分驗證了其優越性。

圖片

  • 論文標題:Moirai-MoE: Empowering Time Series Foundation Models with Sparse Mixture of Experts
  • 論文地址:https://arxiv.org/abs/2410.10469
  • 代碼倉庫:https://github.com/SalesforceAIResearch/uni2ts

研究動機

訓練通用基礎模型的一大挑戰在于適應時間序列數據的高度異質性,這種時序數據的獨特特性凸顯了設計專業化模塊的必要性。現有的解決方案主要分為兩種。第一種是通過基于語言的提示來識別數據源,從而實現非常粗粒度的數據集級別模型專業化。第二種方案利用了時序數據的頻率這一元特征實現了更細粒度的專業化:該方法為特定頻率設計單獨的輸入 / 輸出投影層,從而實現特定頻率的模型專業化。

作者認為,這種人為強加的頻率級專業化缺乏普適性,并引入了一些局限性。(1)頻率并不總是一個可靠的指標,無法有效地捕捉時序數據的真實結構。如下圖所示,具有不同頻率的時間序列可以表現出相似的模式,而具有相同頻率的時間序列可能顯示出多樣且不相關的模式。這種人為強加的頻率和模式之間的不匹配削弱了模型專業化的有效性,從而導致性能下降。(2)現實世界的時間序列本質上是非平穩的,即使在單個時間序列的短窗口內也會顯示出不同的分布。顯然,頻率級專業化的粒度無法捕捉這種程度的多樣性,這凸顯了對更細粒度的建模方法的需求。

圖片

為了解決上述問題,作者提出了全新的時間序列統一訓練解決方案 Moirai-MoE,其核心思想是利用單個輸入 / 輸出投影層,同時將各種時間序列模式的建模委托給 Transformer 層中的稀疏混合專家。通過這些設計,Moirai-MoE 的專業化以數據驅動的方式實現,并在 token 級別運行。

基于稀疏混合專家的時序基礎模型

Moirai-MoE 構建在它的前序工作 Moirai 之上。雖然 Moirai-MoE 繼承了 Moirai 的許多優點,但其主要改進在于:Moirai-MoE 不使用多個啟發式定義的輸入 / 輸出投影層來對具有不同頻率的時間序列進行建模,而是使用單個輸入 / 輸出投影層,同時將捕獲不同時間序列模式的任務委托給 Transformer 中的稀疏混合專家。此外,Moirai-MoE 提出了一種新型的利用預訓練模型中知識的門控函數,并采用自回歸的訓練目標來提高訓練效率。下面簡要介紹 Moirai-MoE 的模塊。

圖片

1. 時序 Token 構造

Moirai-MoE 采用切塊(patching)技術將時間序列輸入切成沒有重疊的小塊,而后對小塊進行標準化來緩解分布遷移的問題。為了在自回歸模型中獲取準確、魯棒的標準化統計值,作者引入掩蔽率 r 作為超參數,它指定整個序列中專門用于正則化器計算的部分,不對這些 patch 計算預測損失。最后,一個輸入投影層來負責把 patch 投影到和 Transformer 一樣的維度,生成時序 token。

2. 稀疏混合專家 Transformer

通過用 MoE 層替換 Transformer 的每個 FFN 來建立專家混合層。該 MoE 層由 M 個專家網絡和一個門控函數 G 組成。每個 token 只激活一個專家子集,從而允許專家專注于不同模式的時間序列數據并確保計算效率。在 Moirai-MoE 中,作者探索了不同的門控函數。首先使用的是最流行的線性投影門控函數,它通過一個線性層來生成專家子集的分配結果。此外,作者提出了一種新的門控機制,利用從預訓練模型的 token 表示中得出的聚類中心來指導專家分配。這一方法的動機是,與隨機初始化的線性投影層相比,預訓練 token 表示的聚類更接近數據的真實分布,可以更有效地實現模型專業化。

3. 訓練目標

為了同時支持點預測和概率預測兩種預測模式,Moirai-MoE 的訓練目標設定為優化未來混合分布的對數似然函數。

實驗效果

作者在 39 個數據集上的進行了廣泛測試評估來驗證 Moirai-MoE 的有效性。

圖片

上圖展示了在 Monash 基準中 29 個數據集上進行的分布內預測評估。結果表明,Moirai-MoE 擊敗了所有競爭對手。相比前序工作 Moirai,Moirai-MoE 的提升幅度達到了 19%。與 Moirai 無法超越的基礎模型 Chronos 相比,Moirai-MoE 成功彌補了差距,并相比它少 65 倍激活參數,這帶來了巨大的推理速度的優勢。

圖片

上表展示了在零樣本預測設定時,Moirai-MoE 在 10 個數據集上的點預測和概率預測的表現。Moirai-MoE-Base 取得了最佳的零樣本性能,甚至超越了 Google 的 TimesFM 和 Amazon 的 Chronos(他們在預訓練語料庫中已包含了部分評估數據,因此存在數據泄露)。與所有規模的 Moirai 相比,Moirai-MoE-Small 在 CRPS 方面提高了 3%-14%,在 MASE 方面提高了 8%-16%。考慮到 Moirai-MoE-Small 只有 11M 激活參數(比 Moirai-Large 少 28 倍),這些進步是非常顯著的。

圖片

在這篇研究中,作者還對時序 MoE 基礎模型的內部工作機制進行了首次探索。上圖是對 Moirai-MoE 的專家分配分布進行的可視化。基于此,作者總結了以下觀點:

1. 在淺層中,不同頻率的數據在專家選擇的分布上呈現多樣化。隨著層數的加深,模型將重點轉移到更通用的時間依賴性,例如更廣泛的趨勢和長期模式,這些依賴性可以在不同頻率之間共享。到最后一層(第 6 層),專家分配在所有頻率上變得幾乎相同,表明模型已將時間序列抽象為與頻率基本無關的高級表示。這一證據表明 Moirai-MoE 學習到了頻率不變的隱層表示,這對于模型泛化至關重要。

2. 隨著層數增加專家選擇逐漸收斂的行為與 Large Language Models 中觀察到的模式完全相反。這種分歧可能源于時間序列 token 的動態和噪聲特性,它們是由小時間窗口生成的,不像從固定詞匯表中派生的語言 token。研究結果表明,隨著層數增加,模型實際上是在進行逐步去噪過程。這一觀察結果與 GPT4TS 的結論一致:隨著層深度增加,token 會被投影到輸入的低維頂部特征向量空間中。

更多實驗結果,可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-07-27 21:28:44

2010-12-10 09:45:46

SalesforceRuby云計算語言

2015-03-09 14:24:59

TeradataAppCenterAster

2025-03-25 10:54:08

2013-06-27 11:21:17

2010-05-12 17:05:07

2020-09-27 17:27:58

邊緣計算云計算技術

2020-09-16 10:28:54

邊緣計算云計算數據中心

2025-01-03 09:24:10

模型架構論文

2017-11-13 15:25:02

2011-05-11 12:57:14

NexusAndroid 2.4谷歌

2009-02-24 19:39:56

CommVaultSimpana 8數據管理

2016-01-26 11:58:12

2013-09-09 16:28:36

2013-05-21 13:04:45

云計算網絡融合

2015-09-28 16:24:34

YARNHadoop計算

2018-09-25 07:00:50

2018-09-27 18:47:45

AIOpsDevOps

2013-07-27 21:41:14

APT攻擊下一代威脅

2009-04-06 08:42:18

Firefox瀏覽器
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91在线影院 | 久草欧美视频 | 午夜在线精品偷拍 | 国产精品福利网站 | 国产精品亚洲一区二区三区在线 | 奇色影视| 亚洲精品2区 | 农夫在线精品视频免费观看 | 亚洲精品在线国产 | 亚洲免费在线观看av | 日韩有码在线播放 | 国产美女视频一区 | 久久国产精品视频 | 日韩精品在线观看一区二区 | 久久免费精品 | 欧美精品在欧美一区二区少妇 | 精品欧美一区免费观看α√ | 成人在线免费电影 | 国产成人一区二区三区久久久 | 人人擦人人干 | a级大片免费观看 | 欧美13videosex性极品 | 亚洲国产成人精品女人久久久 | 国产精品成人一区二区三区吃奶 | 国产一区二区三区四区 | 伊人久操 | 成人精品视频在线观看 | 国产成人免费一区二区60岁 | 国产在线精品一区二区 | 美女福利视频一区 | 中文字幕精品一区二区三区在线 | 亚洲精品自拍视频 | 国产日韩精品在线 | 免费簧片视频 | 久久精品一级 | 黄网免费| 国产精品明星裸体写真集 | 成人国产在线观看 | 免费看的黄网站 | 成人性视频免费网站 | 日本免费在线观看视频 |