比肩可靈視頻生模型;改善視覺Tokenizer性能;高壓縮潛在表示;像素空間擴(kuò)散生成
Seaweed7B:CostEffectiveTrainingofVideoGenerationFoundationModel20250411|ByteDance,ByteDanceSeed??83??http:arxiv.orgabs2504.08685v1??????https:huggingface.copapers2504.08685??????https:seaweed.video??研究背景與意義Seaweed7B是一種中等規(guī)模的視頻生成基礎(chǔ)模型,參數(shù)量約為70億。該研究的核心目標(biāo)是探索一種成本高效的訓(xùn)練策略,在計(jì)算資源有限的情況下實(shí)現(xiàn)與大規(guī)模模型相媲美的性能。視頻生成領(lǐng)...