成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<cite id="ggaoe"><acronym id="ggaoe"></acronym></cite>

<abbr id="ggaoe"></abbr>

<sup id="ggaoe"><input id="ggaoe"></input></sup>

<tfoot id="ggaoe"></tfoot>

<li id="ggaoe"><input id="ggaoe"></input></li>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

麻省理工創(chuàng)新模型：用2D視頻擴(kuò)散，生成 3D 視頻精華

發(fā)布于 2024-9-18 10:50

瀏覽

0收藏

傳統(tǒng)的3D 視頻生成主要有兩種方法，一種是通過2D 視頻模型和靜態(tài) 3D 場景模型的分類器指導(dǎo)來優(yōu)化動態(tài)3D 視頻場景表示，不過這種對算力的需求極大，生成一個 3D 視頻需要數(shù)小時；

另一種是通過變形初始 3D 場景表示來實現(xiàn)，但需要嚴(yán)格的時間結(jié)構(gòu)并且需調(diào)整復(fù)雜的參數(shù)。

為了解決這些難題，麻省理工、Databricks 馬賽克科研所和康奈爾大學(xué)聯(lián)合推出了創(chuàng)新模型Vid3D。該模型假設(shè)無需明確建模 3D 時間動態(tài)，通過生成2D視頻的時序動態(tài)輪廓，然后獨立地為視頻中的每一幀生成3D表示，而無需考慮前后幀之間的時間連貫性。

論文地址：https://arxiv.org/abs/2406.11196

麻省理工創(chuàng)新模型：用2D視頻擴(kuò)散，生成 3D 視頻-AI.x社區(qū)

麻省理工創(chuàng)新模型：用2D視頻擴(kuò)散，生成 3D 視頻-AI.x社區(qū)

簡單來說，就像在制作動畫電影時，先繪制故事板，然后每個關(guān)鍵幀單獨創(chuàng)建3D模型，而不是試圖在三維空間中模擬整個場景的連續(xù)變化，這不僅節(jié)省算力復(fù)雜度也大幅度降低。

例如，我們想要生成一個貓在花園里玩耍的動態(tài)3D場景，Vid3D通過將生成任務(wù)分解為生成場景的2D時間動態(tài)和為每個時間步生成3D表示兩個部分，極大降低了生成時間并簡化了生成流程。

Vid3D先從一張參考圖像開始，生成該場景的2D視頻種子，也稱為“時序播種”，旨在捕捉場景隨時間變化的動態(tài)特征。再通過查詢一個2D視頻模型并輸入?yún)⒖紙D像，Vid3D能夠獲得動態(tài)渲染的對象，盡管此時只限于單一視角。這一步類似于在制作動畫前先繪制出關(guān)鍵幀的故事板，為后續(xù)步驟提供了動態(tài)變化的基礎(chǔ)框架。

麻省理工創(chuàng)新模型：用2D視頻擴(kuò)散，生成 3D 視頻-AI.x社區(qū)

在多視圖合成階段，Vid3D針對種子視頻中的每個時間步，獨立生成多個視圖來豐富場景的細(xì)節(jié)，并增強3D表示的準(zhǔn)確性。

Vid3D使用了高斯濺射方法來生成3D場景的連續(xù)表示。高斯濺射是一種基于點云的方法，它通過在3D空間中散布大量的點，并為每個點分配一個高斯權(quán)重來表示場景的表面。這些點的集合，以及它們的高斯權(quán)重，共同定義了場景的3D形狀和外觀。

麻省理工創(chuàng)新模型：用2D視頻擴(kuò)散，生成 3D 視頻-AI.x社區(qū)

在Vid3D中，每個時間步的多視角視圖被用來訓(xùn)練一個高斯濺射模型，該過程涉及到優(yōu)化每個點的位置和權(quán)重，以便它們能夠最好地表示從不同視角觀察到的場景。這些訓(xùn)練好的高斯濺射模型序列定義了一個動態(tài)的3D視頻，其中每個模型對應(yīng)視頻中的一個時間步。

最后在3D視頻合成階段，Vid3D將每個時間步的多視圖集合轉(zhuǎn)化為3D表示。這里使用的是Gaussian Splatting技術(shù)，這是一種能夠?qū)?D圖像轉(zhuǎn)換為3D幾何結(jié)構(gòu)的有效手段。通過訓(xùn)練一個Gaussian Splatting模型，Vid3D能夠基于先前生成的多視圖集合，構(gòu)建出每個時間步的3D場景。

麻省理工創(chuàng)新模型：用2D視頻擴(kuò)散，生成 3D 視頻-AI.x社區(qū)

同時在種子視頻的每一個時間步重復(fù)進(jìn)行，最終形成了一個由一系列獨立3D表示組成的動態(tài)3D視頻。

為了評估Vid3D的性能，研究人員使用了最新評估基準(zhǔn)。在評估過程中，為了測試每個 3D 視頻的質(zhì)量，從十個不同的均勻采樣相機角度渲染 10 個 2D 視頻，并使用 CLIP - I 分?jǐn)?shù)作為定量評估指標(biāo)。

麻省理工創(chuàng)新模型：用2D視頻擴(kuò)散，生成 3D 視頻-AI.x社區(qū)

結(jié)果顯示，Vid3D在生成動態(tài) 3D 視頻場景方面非常出色，例如，Vid3D 的 CLIP - I 分?jǐn)?shù)為0.8946高于Animate124 的 0.8544。此外，研究人員還對Vid3D中每個時間步生成的視圖數(shù)量進(jìn)行了消融實驗。隨著視圖數(shù)量的減少，CLIP - I分?jǐn)?shù)也開始降低，從18幀減少到9幀時，分?jǐn)?shù)僅下降了0.0067，性能幾乎沒有變化。

本文轉(zhuǎn)自 AIGC開放社區(qū) ，作者：AIGC開放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/z7Enh8IHAOoU46B3nvwIVw??

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

大連理工盧湖川、賈旭團(tuán)隊提出可插入圖像/視頻/3D生成的StableIdentity

angel ? 2681瀏覽 ? 0回復(fù)
文本直接生成多視角3D圖像，Meta推出創(chuàng)新模型

Aceryt ? 2584瀏覽 ? 0回復(fù)
3D生成競技場來了！比拼360°環(huán)繞視頻，最強模型由你pick

Crystalcxt ? 2847瀏覽 ? 0回復(fù)
無需3D數(shù)據(jù)也能訓(xùn)練，港科&港中文聯(lián)手華為推出3D自動駕駛場景生成模型

Crystalcxt ? 3119瀏覽 ? 0回復(fù)
2D頭像生成3D虛擬人開視頻會，谷歌新作讓人難繃

輕薄滴假象 ? 2432瀏覽 ? 0回復(fù)
DreamTech聯(lián)合南大和牛津發(fā)布最強3D內(nèi)容生成大模型——Direct3D

angel ? 3323瀏覽 ? 0回復(fù)
3D版"裁縫"開源來襲！Tailor3D:自定義3D編輯和資產(chǎn)生成（港大&上海AI-Lab&港中文）

angel ? 2728瀏覽 ? 0回復(fù)
開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻

Aceryt ? 3183瀏覽 ? 0回復(fù)
Lumina-T2X: 一款集成圖像、視頻、音頻和3D生成的多模態(tài)擴(kuò)散模型

sword_hero ? 3035瀏覽 ? 0回復(fù)
可提示 3D 分割研究里程碑！SAM2Point：SAM2加持泛化任意3D場景、任意提示！

angel ? 2685瀏覽 ? 0回復(fù)
精準(zhǔn)可控新視角視頻生成+場景級3D生成！北大&港中文&騰訊等開源ViewCrafter

angel ? 2902瀏覽 ? 0回復(fù)
一文詳解3D內(nèi)容生成算法（樸素/2D先驗/混合型）

angel ? 4503瀏覽 ? 0回復(fù)
3D生成基礎(chǔ)模型來了！只需5秒，高質(zhì)量3D資產(chǎn)規(guī)模化生成！南洋理工等重磅開源3DTopia-XL

angel ? 2681瀏覽 ? 0回復(fù)
生成任意3D和4D場景！GenXD：通用3D-4D聯(lián)合生成框架 | 新加坡國立&微軟

angel ? 2515瀏覽 ? 0回復(fù)
革新3D材質(zhì)生成！Material Anything：端到端打造任意3D物體的高質(zhì)量材質(zhì)！

angel ? 3008瀏覽 ? 0回復(fù)
從2D到3D：北大等開源Lift3D，助力精準(zhǔn)具身智能操作！

angel ? 2970瀏覽 ? 0回復(fù)
彌補2D拖拽缺陷！南大&螞蟻等重磅開源LeviTor：首次引入3D目標(biāo)軌跡控制，效果驚艷

angel ? 2215瀏覽 ? 0回復(fù)
PartGen：基于多視圖擴(kuò)散模型的多模態(tài)部件級3D生成和重建！

angel ? 2382瀏覽 ? 0回復(fù)
首篇2D/視頻/3D/4D統(tǒng)一生成框架全景綜述(港科大&中山等)

angel ? 2370瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強吉卜力版本來啦 2025-04-24 09:57:36發(fā)布
字節(jié)跳動開源多模態(tài)AI Agent—UI-TARS-1.5 2025-04-23 11:55:00發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 1回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實測：真·超DS！ 1回復(fù)

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當(dāng)，實測來了 0回復(fù)

上一篇：剛剛，OpenAI發(fā)布史上最強模型-o1，推理能力超人類博士！

下一篇：阿里史上最大規(guī)模開源發(fā)布，超GPT-4o 、Llama-3.1！

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板： 91亚洲一区 | 亚洲欧美一区二区三区1000 | 国产精品一区二区三区四区 | 欧美一区2区三区4区公司二百 | 国产精品一区二区在线观看 | 亚洲美女视频 | 日韩精品1区2区3区成人黄页在线观看 | 久久精品91久久久久久再现 | 日本一区二区不卡 | h片免费看 | 一级黄色毛片免费 | 一区二区免费在线观看 | 亚洲三级在线观看 | 国产一区二 | 日本精品视频一区二区 | 欧美综合视频在线 | 91av在线免费观看 | av免费在线观看网站 | 伊人网站 | 国产一区二区三区在线看 | 欧美激情亚洲 | aaa在线| 日本超碰 | 亚洲综合无码一区二区 | 国产精品一区久久久 | 国产精品免费一区二区三区四区 | 久久国产一区 | 亚洲二区视频 | 欧美在线观看一区二区 | 日韩精品一区二区三区免费视频 | 国内久久| 午夜影视网 | 久草网址| 国产高清在线观看 | 久在线视频 | 97国产精品视频人人做人人爱 | 免费网站在线 | 四虎影院新网址 | 91久久久久久久久久久久久 | 中文字幕国产 | 欧美一区二区久久 |

<code id="eocwa"><xmp id="eocwa"></xmp></code>

<noscript id="eocwa"><wbr id="eocwa"></wbr></noscript>

<bdo id="eocwa"><source id="eocwa"></source></bdo>

<dl id="eocwa"><acronym id="eocwa"></acronym></dl>