成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

視頻生成1.3B碾壓14B、圖像生成直逼GPT-4o!港科&快手開源測試時擴展新范式

人工智能 新聞
最近香港科技大學聯合快手可靈團隊推出?Evolutionary Search (EvoSearch)方法,通過提高推理時的計算量來大幅提升模型的生成質量,支持圖像和視頻生成,支持目前最先進的 diffusion-based 和 flow-based 模型。

論文第一作者為何浩然,香港科技大學二年級博士,他的研究方向包括強化學習、生成流模型(GFlowNets)以及具身智能,通訊作者為香港科技大學電子與計算機工程系、計算機科學與工程系助理教授潘玲。

測試時擴展(Test-Time Scaling)極大提升了大語言模型的性能,涌現出了如 OpenAI o 系列模型和 DeepSeek R1 等眾多爆款。那么,什么是視覺領域的 test-time scaling?又該如何定義?

為了回答這一問題,最近香港科技大學聯合快手可靈團隊推出 Evolutionary Search (EvoSearch)方法,通過提高推理時的計算量來大幅提升模型的生成質量,支持圖像和視頻生成,支持目前最先進的 diffusion-based 和 flow-based 模型。EvoSearch 無需訓練,無需梯度更新,即可在一系列任務上取得顯著最優效果,并且表現出良好的 scaling up 能力、魯棒性和泛化性。

隨著測試時計算量提升,EvoSearch 表明 SD2.1 和 Flux.1-dev 也有潛力媲美甚至超過 GPT4o。對于視頻生成,Wan 1.3B 也能超過 Wan 14B 和 Hunyuan 13B,展現了 test-time scaling 補充 training-time scaling 的潛力和研究空間。

目前,該項目的論文和代碼均已開源。

圖片

  • 論文標題:Scaling Image and Video Generation via Test-Time Evolutionary Search
  • 項目主頁:https://tinnerhrhe.github.io/evosearch/
  • 代碼:https://github.com/tinnerhrhe/EvoSearch-codes
  • 論文:https://arxiv.org/abs/2505.17618

圖片

我們來看 EvoSearch 與其他一些方法的效果對比:

1.Test-Time Scaling 的本質

這里團隊將測試時擴展(Test-Time Scaling)和 RL post-training 分開來看,定義前者無需參數更新,后者需要計算資源進行后訓練。Test-time scaling 和 RL post-training 本質都是為了激發預訓練模型的能力,使其與人類偏好(獎勵)對齊。給定一個預訓練模型和獎勵函數,目的是擬合如下的目標分布:

圖片

其中是獎勵函數代表(人類)偏好,KL 距離(圖片)防止預訓練模型的分布與目標分布偏離太遠,避免知識遺忘。該目標分布可以重新寫成如下形式:

圖片

其中是歸一化常數,需要遍歷整個狀態空間來計算。這是不可行的,因為 diffusion 和 flow 模型的狀態空間都是高維的。這導致直接從目標分布采樣不可行。

2. 當前方法的局限性

諸如 RL 的后訓練方法雖然也能從目標分布采樣,但需要構造數據以及大量計算資源重新更新模型參數,導致代價很大并且很難 scale up。目前在視覺領域,最有效的 test-time scaling 方法包括 Best-of-N,它基于重要性采樣(Importance Sampling)來擬合目標分布采樣。Best-of-N 隨機采樣多個樣本,并篩選出獎勵最高的 N 個。在基于 diffusion 和 flow 模型的圖像和視頻生成任務上,Best-of-N 的樣本通常是初始噪聲。

最近的一些工作提出了更高級的采樣方法,可以統一稱為 Particle Sampling。這類方法將搜索空間拓展為整條去噪軌跡,在去噪過程中不斷保留好的樣本,并丟掉表現差的樣本(類似 beam search)。這類方法雖然也能表現出 scaling up 性質,但缺少探索新的狀態空間能力,并且會減少生成樣本的多樣性。

團隊做了一個小實驗,當目標分布和預訓練分布不一致(甚至可能是 o.o.d.),基于學習的 RL 方法會出現獎勵過優化的現象(reward over-optimization)。諸如 best-of-N 和 particle sampling 的搜索方法也不能找到目標分布所有的模態。但團隊的方法 EvoSearch 成功擬合了目標分布,并且取得了最高的獎勵值。

圖片

3. EvoSearch 解讀

團隊將圖像和視頻生成的 test-time scaling 問題重構成演化搜索問題。

具體來說,受生物的自然選擇和演化所啟發,團隊將 diffusion 和 flow 模型中的去噪軌跡看成演化路徑,每個去噪步的樣本都可以進行變異演化來探索更高質量的子代,最后得到最優的符合目標分布的去噪樣本圖片(圖片或者視頻)。

不同于一般的演化方法,樣本空間局限于一個固定的狀態空間進行演化,團隊提出的 EvoSearch 的演化空間沿著去噪軌跡動態前移,即起始于高斯噪聲,終止于圖片

圖片

EvoSearch 框架圖

團隊的方法受如下的洞見啟發:他們發現在整個去噪軌跡中,高質量的樣本往往會聚集在一起。因此,當搜索到高質量的父代,則可以在父代周圍的空間進行探索從而有效找到更高質量的樣本。從下圖可以看到去噪軌跡中的樣本在低維空間的分布與獎勵空間具有強相關性。

圖片

基于此,團隊設計了如下兩種變異模式:

  • 初始噪聲變異:EvoSearch 通過如下正交操作保持初始噪聲仍然符合高斯分布

圖片

其中圖片是變異率來控制探索強度。

  • 中間去噪狀態變異:由于中間去噪狀態的分布是復雜的且在搜索過程中不可知。團隊受 SDE 方程啟發,設計如下變異模式:

圖片

其中圖片是 SDE 去噪過程中的擴散系數。

這些變異方式一方面加強了對于新的狀態空間探索,另一方面又避免了偏離去噪軌跡的預訓練分布。

我們定義了 evolution schedule 和 population size schedule 來進行演化搜索,這兩種 schedule 的設置取決于可用的測試時計算量大小。

  • Evolution Schedule 定義為圖片,用于指定應該在哪些時間步驟進行 EvoSearch。該調度模式避免了冗余去噪步數,節省了計算開銷。
  • Population Size Schedule 定義為圖片 ,其中圖片代表了初始噪聲樣本的種群大小,后續每個圖片規定了在時間步的演化子代種群大小。

EvoSearch 算法偽代碼如下:

圖片

圖片

4.EvoSearch 實驗結果

(1)對于圖片生成任務,在 Stable Diffusion 2.1 和 Flux.1-dev 上,EvoSearch 展示了最優的 scaling up 性質。即使測試時計算量擴大了 1e4 量級,仍能保持上升勢頭。對于視頻生成任務,EvoSearch 在 VBench,VBench2.0 以及 VideoGen-Eval 中的 prompts 上也能達到最高的 reward 提升幅度。

圖片

(2)EvoSearch 也能泛化到分布外(unseen)的評估指標,顯示了最優的泛化性和魯棒性。

圖片

(3)EvoSearch 在人類評估上也達到最優勝率。這得益于他高的生成多樣性,平衡了 exploration 和 exploitation。

圖片

(4)下面是更多的可視化結果:

圖片

圖片

圖片

更多細節請見原論文和項目網站。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-05-27 15:19:52

GPUMetaGPT-4o

2025-05-26 09:05:00

2025-05-16 09:08:00

2025-04-07 00:00:00

OpenAIGPT-4o圖像

2025-03-31 08:50:00

AI生成模型

2025-04-11 09:10:00

模型開源AI

2024-06-27 12:45:30

2025-04-15 08:01:12

2025-03-27 09:24:16

2025-06-25 09:14:00

2024-10-17 13:30:00

2025-06-09 08:40:00

2025-04-16 09:15:00

AI模型數據

2025-04-03 09:34:36

2024-11-22 13:30:00

2025-04-09 09:08:34

2024-12-23 09:38:00

2025-05-26 02:15:00

2025-05-12 08:50:00

2025-04-16 15:28:31

模型AI數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人伊人网 | 免费一级做a爰片久久毛片潮喷 | 三级黄视频在线观看 | 中文字幕高清av | 男女羞羞视频在线免费观看 | 超碰97免费观看 | 久国产 | 免费一区二区三区 | 激情六月丁香 | 免费看啪啪网站 | 精品一区二区三区日本 | 欧美大片黄 | 欧美中文字幕一区二区三区亚洲 | 久久九 | 一区二区三区视频在线 | 日韩激情在线 | 日韩欧美在线免费观看视频 | 欧美aaa级 | 亚洲精品欧美一区二区三区 | 日韩精品中文字幕一区二区三区 | av毛片| 国产精品小视频在线观看 | 6080亚洲精品一区二区 | 免费观看一级毛片 | 国产区第一页 | 久久久久亚洲 | av色站 | 日韩免费av | 热久久免费视频 | 人人99| 在线观看国产视频 | 亚洲高清在线观看 | 亚洲欧美国产毛片在线 | 国产欧美日韩在线观看 | 国产精品揄拍一区二区 | 中文天堂在线一区 | 超碰网址| 欧美国产视频一区二区 | 美女人人操 | 日韩电影免费观看中文字幕 | 精品欧美黑人一区二区三区 |