成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

打入AI底層!NUS尤洋團隊用擴散模型構建神經網絡參數,LeCun點贊

人工智能 新聞
研究團隊提出了一種用于生成神經網絡參數的擴散模型p(arameter)-diff。用它來生成網絡參數,速度比直接訓練最多提高44倍,而且表現毫不遜色。

擴散模型,迎來了一項重大新應用——

像Sora生成視頻一樣,給神經網絡生成參數,直接打入了AI的底層!

這就是新加坡國立大學尤洋教授團隊聯合UCB、Meta AI實驗室等機構最新開源的研究成果。

圖片

具體來說,研究團隊提出了一種用于生成神經網絡參數的擴散模型p(arameter)-diff。

用它來生成網絡參數,速度比直接訓練最多提高44倍,而且表現毫不遜色。

這一模型一經發布,就迅速在AI社區引發強烈討論,圈內人士對此的驚嘆,毫不亞于普通人看到Sora時的反應。

甚至有人直接驚呼,這基本上相當于AI在創造新的AI了。

圖片

就連AI巨頭LeCun看了之后,也點贊了這一成果,表示這真的是個cute idea。

圖片

而實質上,p-diff也確實具有和Sora一樣重大的意義,對此同實驗室的Fuzhao Xue(薛復昭)博士進行了詳細解釋:

Sora生成高維數據,即視頻,這使得Sora成為世界模擬器(從一個維度接近AGI)。

而這項工作,神經網絡擴散,可以生成模型中的參數,具有成為元世界級學習器/優化器的潛力,從另一個新的重要維度向AGI邁進。

圖片

言歸正傳,p-diff到底是如何生成神經網絡參數的呢?

將自編碼器與擴散模型結合

要弄清這個問題,首先要了解一下擴散模型和神經網絡各自的工作特點。

擴散生成過程,是從隨機分布到高度特定分布的轉變,通過復合噪聲添加,將視覺信息降級為簡單噪聲分布。

而神經網絡訓練,同樣遵循這樣的轉變過程,也同樣可以通過添加噪聲的方式來降級,研究人員正是在這一特點的啟發之下提出p-diff方法的。

圖片

從結構上看,p-diff是研究團隊在標準潛擴散模型的基礎之上,結合自編碼器設計的。

研究者首先從訓練完成、表現較好的網絡參數中選取一部分,并展開為一維向量形式。

然后用自編碼器從一維向量中提取潛在表示,作為擴散模型的訓練數據,這樣做可以捕捉到原有參數的關鍵特征。

訓練過程中,研究人員讓p-diff通過正向和反向過程來學習參數的分布,完成后,擴散模型像生成視覺信息的過程一樣,從隨機噪聲中合成這些潛在表示。

最后,新生成的潛在表示再被與編碼器對應的解碼器還原成網絡參數,并用于構建新模型。

圖片

下圖是通過p-diff、使用3個隨機種子從頭開始訓練的ResNet-18模型的參數分布,展示了不同層之間以及同一層不同參數之間的分布模式。

圖片

為了評估p-diff所生成參數的質量,研究人員利用3種類型、每種兩個規模的神經網絡,在8個數據集上對其進行了測試。

下表中,每組的三個數字依次表示原始模型、集成模型和用p-diff生成的模型的測評成績。

結果可以看到,用p-diff生成的模型表現基本都接近甚至超過了人工訓練的原始模型。

圖片

效率上,在不損失準確度的情況下,p-diff生成ResNet-18網絡的速度是傳統訓練的15倍,生成Vit-Base的速度更是達到了44倍。

圖片

額外的測試結果證明,p-diff生成的模型與訓練數據有顯著差異。

從下圖(a)可以看到,p-diff生成的模型之間的相似度低于各原始模型之間的相似度,以及p-diff與原始模型的相似度。

而從(b)和(c)中可知,與微調、噪聲添加方式相比,p-diff的相似度同樣更低。

這些結果說明,p-diff是真正生成了新的模型,而非僅僅記憶訓練樣本,同時也表明其具有良好的泛化能力,能夠生成與訓練數據不同的新模型。

圖片

目前,p-diff的代碼已經開源,感興趣的話可以到GitHub中查看。

論文地址:https://arxiv.org/abs/2402.13144

GitHub:https://github.com/NUS-HPC-AI-Lab/Neural-Network-Diffusion

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-02-26 08:25:00

模型訓練

2020-03-06 15:25:23

網絡神經人工智能數據

2024-03-18 09:53:40

GPD神經網絡模型

2024-02-29 11:56:10

AI模型

2024-11-05 16:19:55

2023-08-23 12:59:35

2023-12-20 13:34:56

2017-03-22 12:13:36

AI神經網絡模型算法

2023-09-03 14:17:56

深度學習人工智能

2024-12-09 07:15:00

世界模型AILLM

2019-01-05 08:40:17

VGG神經網絡

2023-05-12 14:58:50

Java神經網絡深度學習

2018-03-22 13:34:59

TensorFlow神經網絡

2020-03-25 09:48:10

AI芯片神經網絡

2021-03-05 12:58:31

AISEER模型

2022-03-16 18:38:06

AI特斯拉神經網絡

2024-01-18 15:18:48

數據模型

2021-10-15 10:32:42

神經網絡AI算法

2024-11-08 14:10:00

模型視頻生成

2024-06-05 19:26:01

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 九九色综合 | 伊人精品一区二区三区 | 91视频免费黄 | 久久久精品一区二区 | 米奇7777狠狠狠狠视频 | 国产精品精品视频一区二区三区 | 宅男伊人 | 精品在线一区二区 | 黄网站涩免费蜜桃网站 | 手机看片169| 久久久久成人精品免费播放动漫 | 综合色婷婷 | 天天亚洲 | 午夜在线影院 | 999re5这里只有精品 | 在线日韩欧美 | 国产成人综合久久 | 国产成人精品一区二区三区 | 久久激情五月丁香伊人 | 婷婷毛片| 久久久久久高潮国产精品视 | 亚洲一区二区三区在线视频 | 欧美精品一区二区在线观看 | 久久久久91 | 欧美视频免费在线 | 涩爱av一区二区三区 | 天天做日日做 | 一级黄色片在线看 | 欧美九九九 | 99re在线视频观看 | 国产精品毛片一区二区三区 | 久久99精品久久久久久国产越南 | 免费看的黄网站 | 亚洲一区二区中文字幕 | 日韩精品视频在线免费观看 | 亚洲激情综合 | 91精品国产欧美一区二区 | 国产精品一区二区在线观看 | 一区二区三区在线观看免费视频 | 精品国产91 | 精品视频一区二区三区在线观看 |