成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

重新定義自監督學習!LeCun團隊讓MMCR再進一步

人工智能 新聞
近日,來自斯坦福、MIT、紐約大學和Meta-FAIR等機構的研究人員,通過新的研究重新定義了最大流形容量表示法(MMCR)的可能性。

多視圖自監督學習(MVSSL,或稱為聯合嵌入自監督學習)是一種強大的無監督學習方法。它首先創建無監督數據的多個轉換或視圖,然后以類似監督的方式使用這些視圖來學習有用的表示。

圖片

實現MVSSL的具體方法有很多,但大致可以分為四類:對比、聚類、蒸餾/動量、冗余減少。

在這眾多的方法中,最大流形容量表示(Maximum Manifold Capacity Representation,MMCR)是與眾不同的一類。

圖片

MMCR不明確使用對比,不執行聚類,不利用蒸餾,也不明確減少冗余,但效果卻可以媲美甚至超越其他領先的MVSSL方法。

而來自斯坦福、MIT、紐約大學和Meta-FAIR等機構的研究人員,正在通過新的研究重新定義這個框架的可能性。

圖片

論文地址:https://arxiv.org/pdf/2406.09366

作為論文作者之一,LeCun也發推表達了自己的觀點:

圖片

除非使用預防機制,否則使用SSL訓練聯合嵌入架構會導致崩潰:系統學習到的表示信息不夠豐富,甚至是恒定不變的。


人們設計了多種方法來防止這種崩潰。

一類方法是樣本對比:確保不同的輸入產生不同的表示。

另一類是維度對比:確保表示的不同變量對輸入的不同方面進行編碼。


兩種類型的方法都可以從信息最大化參數中派生出來:確保表示形式盡可能多的編碼有關輸入的信息。


方差-協方差正則化、MMCR和MCR2(來自伯克利大學馬毅團隊)都是infomax維度對比方法。

信息最大化維度對比方法的核心思想,是推動編碼器學習輸入的表示,使其盡可能充分地利用表示空間,就像在有限的畫布上盡可能展現豐富的細節。

為了更好地理解MMCR,研究人員利用高維概率工具證明了,MMCR可以激勵學習嵌入的對齊和均勻性。

同時,這種嵌入最大化了視圖之間的互信息的下界,從而將MMCR的幾何視角與MVSSL中的信息論視角聯系起來。

為了更好地利用MMCR,研究人員對預訓練損失的非單調變化進行數學預測和實驗確認,發現了類似于雙下降的行為。

此外,研究人員還發現了計算上的scaling law,可以將預訓練損失預測為梯度步長、批量大小、嵌入維度和視圖數量的函數。

最終,作者證明了這個最初應用于圖像數據的MMCR方法,在多模態圖像文本數據上同樣表現優異。

MMCR

MMCR由紐約大學數據科學中心(NYU Center for Data Science,CDS)的研究人員于2023年提出。

該方法源于神經科學中的有效編碼假說:生物感覺系統通過使感覺表征適應輸入信號的統計數據來優化,例如減少冗余或維度。

最初的MMCR框架通過調整「流形容量」(衡量給定表示空間內可以線性分離的對象類別數量的指標)將這一想法從神經科學擴展到了人工神經網絡。

許多MVSSL方法要么明確源自信息論,要么可以從信息論的角度來理解,但MMCR不同。

MMCR指出估計高維互信息已被證明是困難的,且逼近互信息可能不會改善表示。MMCR的基礎在于數據流形線性可分性的統計力學表征。

不過LeCun等人的這篇工作,將MMCR的幾何基礎與信息論原理聯系起來,探索了MMCR的更深層次機制,并將其應用擴展到了多模態數據,例如圖像文本對。

圖片

理論基礎

MMCR源自有關線性二元分類器性能的經典結果。考慮D維度中的P點(數據),具有任意分配的二進制類標簽;線性二元分類器能夠成功對點進行分類的概率是多少?

統計力學計算表明,在熱力學極限下,容量α= 2時會發生相變。MMCR將此結果從點擴展到流形:

圖片

圖片

最小化MMCR損失意味著最大化平均矩陣的核范數。

直觀上,完美重建意味著同一數據的所有視圖都被網絡映射到相同的嵌入,完美均勻性意味著嵌入均勻分布在超球面周圍。

圖片

具有完美重建和完美均勻性的嵌入實現了盡可能低的MMCR損失

基于對MMCR嵌入分布的新認識,我們如何將MMCR的統計力學幾何觀點與信息論觀點聯系起來?

答案是,MMCR激勵表示的最大化,對應于同一數據的兩個視圖的兩個嵌入共享的互信息的下限。

考慮某些輸入數據兩個不同視圖的嵌入之間的互信息。兩個視圖之間的互信息必須至少與兩項之和一樣大:一個嵌入重建另一個的能力,再加上嵌入的熵:

圖片

MMCR的雙下降

通過高維概率分析可知,預測最大流形容量表示的預訓練損失,也應該在其預訓練損失中表現出非單調雙下降樣行為。

(雙下降:測試損失作為數據總數和模型參數數量的函數表現出非單調變化 )。

然而,本文的分析也表明,這種類似雙下降的行為應該發生在非典型參數(流形的數量P和維數D)上,而不是數據的數量和模型的參數量。

具體來說,理論預測最高的預訓練誤差應該恰好發生在閾值P = D處,預訓練誤差落在閾值的兩側。

圖片

為了比較不同超參數對的點數P和數據維度D之間的損失,這里使用MMCR預訓練界限來定義預訓練百分比誤差:

圖片

研究人員在STL-10上預訓練了ResNet-18,STL-10是一個與CIFAR-10類似的數據集,但分辨率更高 (96x96x3),并且包含100000張圖像的附加未標記分割。

掃描范圍P:{64, 128, 256, 512, 1024} × D:{64, 128, 256, 512, 1024} × K:{2, 4, 8}(K為視圖數),結果如上圖所示。

Compute Scaling Laws

在許多MVSSL方法中,更改超參數通常會導致預訓練損失不相稱,從而使運行之間的比較變得困難。

然而,MMCR預訓練百分比誤差產生的數量介于0和1之間,因此可以將不同超參數(P和D)時的訓練情況放在一起比較。

執行這樣的比較會產生有趣的經驗現象:計算MMCR預訓練百分比誤差中的神經縮放定律。

圖片

通過繪制在STL-10上預訓練的ResNet-18網絡,我們可以清楚地看到預訓練百分比誤差的冪律縮放與所有點數P 、嵌入維度D和視圖數量K的計算量的關系。

一個關鍵細節是這些神經縮放曲線突出了類似雙下降的行為:對角線子圖(P = D時)具有較高的預訓練百分比誤差和較小的預訓練百分比斜率。

MMCR與多模態

考慮OpenAI的對比語言圖像預訓練模型CLIP的設置,兩個不同的網絡在圖像文本標題對上進行預訓練,從兩個不同的數據域X和Y獲取數據。

X和Y是配對的,使得X中的每個示例在Y中都有對應的正對,反之亦然。從MMCR角度來看,X和Y可以理解為同一底層對象的兩個視圖。

因此,最優變換嵌入f(X)和g(Y)應映射到同一空間,并且我們可以利用對MMCR的改進理解來訓練這些最優網絡。

與常見的MVSSL不同,這里的X和Y在實踐中可能代表極其不同的分布。

圖片

在上圖的圖像-文本對齊實驗中,作者將多模態MMCR應用于DataComp-Small,并將零樣本Imagenet性能與標準CLIP目標進行比較。

可以發現,多模態MMCR在小批量(< 512)下表現優于CLIP。

責任編輯:張燕妮 來源: 新智元
相關推薦

2020-12-10 20:00:04

數字貨幣比特幣區塊鏈

2010-05-07 14:22:43

SpringSourcGemStoneSpring

2021-04-27 11:20:20

機器學習骨科醫療

2015-10-23 10:53:54

OpenStackNFV網絡功能虛擬化

2015-10-19 14:57:51

2015-03-10 10:43:26

微波無線輸電

2020-12-17 09:48:35

人工智能開發醫療

2011-07-27 12:58:43

Android MarAndroid應用商店

2015-12-14 11:42:27

指紋安全指紋掃描指紋識別

2013-11-07 09:07:58

Windows PhoWindows8開發者

2023-09-01 18:20:43

Chrome代碼測試版

2019-03-22 10:20:39

加速Windows 10啟動

2023-02-06 14:50:41

2011-07-29 15:02:22

LifeSize視頻協作

2009-11-30 18:35:05

BizSparkDreamSparkWebSiteSpar

2014-01-08 10:22:28

思科Videoscape

2009-12-28 10:08:07

OracleSQLDevelope開發框架

2009-08-26 14:48:05

C#委托與事件

2024-05-10 15:09:34

2010-03-15 09:40:19

Windows 8研發
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91精品免费视频 | 一区二区三区欧美在线 | 毛片一级片| 国产91久久久久蜜臀青青天草二 | 国产成人一区二区 | 国产91一区 | 天天久 | 成人在线一区二区三区 | 中国毛片免费 | 一级二级三级在线观看 | 精品国产一区二区国模嫣然 | 九色91视频 | 久久综合欧美 | 国产精品成人免费 | 日韩成人免费视频 | 国产偷录叫床高潮录音 | 日韩久久久久久久久久久 | 搞av.com| 成人自拍视频 | 黄色一级电影在线观看 | 国产精品久久久亚洲 | av中文在线播放 | 成人性视频免费网站 | 在线观看日韩av | a黄视频 | 亚洲欧洲视频 | 欧美a在线看 | 在线观看视频亚洲 | 羞羞视频在线观看免费观看 | 成人午夜免费网站 | 久久男人 | 日韩电影在线一区 | 中文字幕一区二区三区精彩视频 | 国产精品mv在线观看 | 拍戏被cao翻了h承欢 | 一区二区三区中文字幕 | 日韩免费一区二区 | 91精产国品一二三区 | 欧美视频一区 | 国产一区二区在线免费播放 | 久久久久欧美 |