多模態終極大一統!字節開源BAGEL爆火:圖文生成理解雙冠王,竟能預測未來畫面?
社區頭條 論文鏈接:https:arxiv.orgpdf2505.14683項目鏈接:https:bagelai.org模型地址:https:huggingface.coByteDanceSeedBAGEL7BMoT亮點直擊可擴展生成認知模型(ScalableGenerativeCognitiveModel,BAGEL),一個開源的多模態基礎模型,具有7B活躍參數(總計14B),在大規模交錯多模態數據上訓練。BAGEL在標準多模態理解排行榜上超越了當前頂級的開源視覺語言模型(VLMs),并且在文本到圖像質量方面,與領先的公開生成器如SD3和FLU...